安装spaCy及语言包下载安装

夏天老师

发表文章数:435

热门标签

, ,
首页 » 安装包 » 正文

spaCy是一个NLP工具包用于完成NLP领域的很多任务比如词性标注命名实体识别,依存句法分析归一化停用词判断是否词语等,支持Unix/Linux,macOS/os X和Windows操作系统,可以通过pip,conda方式安装。

spaCy的安装

安装spaCy包

方式1 : 通过pip / conda命令安装

pip:
pip install -U spacy

conda:
conda install -c conda-forge spacy

如果显示下载超时的话,可以通过指定国内镜像方式2

指定国内镜像
pip install -U spacy -i https://pypi.douban.com/simple/

方式2 : 通过离线导入

这个网站下载所需要的离线包
https://www.lfd.uci.edu/~gohlke/pythonlibs/

Ctrl+F查找对应python版本的离线包,注意安装错版本了。

安装spaCy及语言包下载安装

由于我的电脑是Win系统64位的,python是3.8
所以我选择了第二个。CP38就是3.8版本Win表示windows系统,amd64表示64位

下载到离线包后,通过cmd终端进入到下载的离线包所在的目录,然后通过pip install 离线包导入进去。

  • pip install G:\spacy-3.0.6-cp38-cp38-win_amd64.whl

安装spaCy及语言包下载安装

当显示Successful后,就表示spaCy安装成功。

安装语言模型

方式1 : 通过pip / conda命令安装

  • pip install en_core_web_sm
  • pip install zh_core_web_sm

如果下载失败的话,可通过方式2进行离线导入

方式2 : 通过离线导入

准备好安装包

中文语言包:zh_core_web_sm 3.1
– 下载地址:
https://github.com/explosion/spacy-models/releases/tag/zh_core_web_trf-3.1.0
– 网盘下载地址:https://static.hikstorage.com:8080/share/index.html?shareId=1c3f5b1eb67d198341e084a843ec0d44 密码:8402

英文语言包:en_core_web_sm 3.1
– 下载地址:
https://github.com/explosion/spacy-models/releases/tag/en_core_web_sm-3.1.0
– 网盘下载地址:
https://static.hikstorage.com:8080/share/index.html?shareId=82592fd5d48bc718b8a9da7f1aa97a0f 密码:2252

安装spaCy及语言包下载安装

常见问题

1. 版本问题

在执行spacy.load('en_core_web_md')代码时报错。

报错信息:OSError: [E053] Could not read config.cfg from C:\Users\pc\AppData\Local\Programs\Python\Python38\Li

经网上查找发现出现这个问题的原因是:
下载的en_core_web_mdspacy版本不兼容,我使用的en_core_web_md版本是2.2.5,但是安装spacy最新的版本是3.0.0。
因此我把spacy卸载后,重装spacy2.x的版本。

  • pip uninstall spacy
  • pip install -i https://pypi.douban.com/simple spacy==2.2.2

参考文档

  1. NLP工具最新版Spacy及语言包en_core_web_sm下载安装指南
  2. spaCy的简易教程

未经允许不得转载:作者:夏天老师, 转载或复制请以 超链接形式 并注明出处 拜师资源博客
原文地址:《安装spaCy及语言包下载安装》 发布于2021-08-03

分享到:
赞(0) 打赏

评论 抢沙发

评论前必须登录!

  注册



长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

Vieu3.3主题
专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录