http://blog.csdn.net/joey_su/article/details/17289621

官方下载地址

http://www.nltk.org/nltk_data/

把python自然语言处理的nltk_data打包到360云盘,然后共享给朋友们

回家前,把Python自然语言处理的nltk_data打包到360云盘,然后共享给朋友们,省的大家像我一样浪费时间。

一次性下载解压后即可使用。官方的nltk.download()老是下载失败。无数遍了。浪费了我很多很多时间。

打包下载(推荐):

http://l3.yunpan.cn/lk/QvLSuskVd6vCU?sid=305

下载后放在python/nltk_data目录下即可.

记录下错误提示,以便于朋友们搜索找到。

当时遇到的错误是:

nltk.download()

could not find maxent_treebank_pos_tagger / english .XXX

searched index:

C:\\Python27\\nltk_data\

C:\\nltk_data

D:\\nltk_data

E:\\nltk_data

然后我通过,nltk.download()下载,一直出现错误,只好到

官方下载http://nltk.org/nltk_data/

另外,也可以到nltk.code.google.com 下载,

但是又遇到了下载后,直接放在nltk_data目录,却发现还是不行,程序找不到数据集。

因此我就用nltk.download()试着下载了一个,观察他的文件位置,这才发现原来有好几个文档目录。

用tree命令的到其目录结构如下:

文件夹 PATH 列表

卷序列号为 00000200 B2F8:ED9D

├─chunkers #这一级为nltk_data下的文件夹

│ └─maxent_ne_chunker #这一级为相对应文件夹下的数据文件

├─corpora      #这一级为nltk_data下的文件夹

│ ├─abc        #这一级为相对应文件夹下的数据文件

│ ├─alpino

│ ├─basque_grammars

│ ├─biocreative_ppi

│ ├─book_grammars

│ ├─brown

│ ├─brown_tei

│ ├─cess_cat

│ ├─cess_esp

│ ├─chat80

│ ├─city_database

│ ├─cmudict

│ ├─comtrans

│ ├─conll2000

│ ├─conll2002

│ ├─conll2007

│ ├─dependency_treebank

│ ├─europarl_raw

│ │ 

│ ├─floresta

│ ├─gazetteers

│ ├─genesis

│ ├─gutenberg

│ ├─hmm_treebank_pos_tagger

│ ├─ieer

│ ├─inaugural

│ ├─indian

│ ├─jeita

│ ├─kimmo

│ ├─knbc

│ │ 

│ ├─langid

│ ├─large_grammars

│ ├─machado

│ │ 

│ ├─mac_morpho

│ ├─maxent_ne_chunker

│ ├─maxent_treebank_pos_tagger

│ ├─movie_reviews

│ │ 

│ ├─names

│ ├─nombank.1.0

│ │ 

│ ├─nps_chat

│ ├─oanc_masc

│ │ 

│ ├─paradigms

│ ├─pe08

│ ├─pil

│ ├─pl196x

│ ├─ppattach

│ ├─problem_reports

│ ├─propbank

│ │ 

│ ├─ptb

│ ├─punkt

│ ├─qc

│ ├─reuters

│ │ 

│ ├─rslp

│ ├─rte

│ ├─sample_grammars

│ ├─semcor

│ │ 

│ ├─senseval

│ ├─shakespeare

│ ├─sinica_treebank

│ ├─smultron

│ ├─spanish_grammars

│ ├─state_union

│ ├─stopwords

│ ├─swadesh

│ ├─switchboard

│ ├─tagsets

│ ├─timit

│ │

│ ├─toolbox

│ │ 

│ ├─treebank

│ │ 

│ ├─udhr

│ ├─udhr2

│ ├─unicode_samples

│ ├─verbnet

│ ├─webtext

│ ├─wordnet

│ ├─wordnet_ic

│ ├─words

│ └─ycoe

├─grammars

│ ├─basque_grammars

│ ├─book_grammars

│ ├─large_grammars

│ ├─sample_grammars

│ └─spanish_grammars

├─help

│ └─tagsets

├─stemmers

│ └─rslp

├─taggers

│ ├─hmm_treebank_pos_tagger

│ ├─maxent_ne_chunker

│ └─maxent_treebank_pos_tagger

└─tokenizers

└─punkt

nltk.download()出错解决的更多相关文章

  1. ARM64平台编译stream、netperf出错解决办法 解决办法:指定编译平台为alpha [root@localhost netperf-2.6.0]# ./configure –build=alpha

    ARM64平台编译stream.netperf出错解决办法 http://ilinuxkernel.com/?p=1738 stream编译出错信息: [root@localhost stream]# ...

  2. make menuconfig出错解决方法

     make menuconfig出错解决方法 2011-06-11 22:22:49 分类: 系统运维 错误现象: make menuconfig In file included from scri ...

  3. vs连接mysql出错解决方法

    vs连接mysql出错解决方法 先按以下的步骤配置一下: **- (1)打开VC6.0 工具栏Tools菜单下的Options选项.在Directories的标签页中右边的"Show dir ...

  4. paip.vs2010 或.net 4.0安装出错解决大法.

    paip.vs2010 或.net 4.0安装出错解决大法. 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.cs ...

  5. nltk download失败

    之前在台式机win10的系统,python 2.7,用的pycharm执行nltk download(),很顺利.然而到了我的笔记本只是换个一个win8的系统,Python的配置都是一样的,但是这时候 ...

  6. 黄聪:C#使用Application.Restart重启程序出错解决办法

    调用 Application.Restart重启程序出错 解决办法,就是给程序的.exe文件,加上下面的设置

  7. $ sudo python -m pip install pylint 出错解决方法

    问题:在unbuntu执行$ sudo python -m pip install pylint出错解决方法支行以下命令sudo pip install pylint==1.9.3这样roboware ...

  8. linux下python3离线加载nltk_data,不用nltk.download()

    在不能上网的服务器上把nltk_data关联到python3,已经安装anaconda3所以不需要安装nltk,环境是linux 首先没有nltk_data在使用nltk会报错 LookupError ...

  9. npm中npm install 始终出错解决办法

    npm中npm install 始终出错解决办法 错误信息: C:\Windows\System32>npm install -g gulp npm ERR! Windows_NT 6.1.76 ...

随机推荐

  1. python基础-内置函数详解

    一.内置函数(python3.x) 内置参数详解官方文档: https://docs.python.org/3/library/functions.html?highlight=built#ascii ...

  2. Beta版本冲刺——day1

    No Bug 031402401鲍亮 031402402曹鑫杰 031402403常松 031402412林淋 031402418汪培侨 031402426许秋鑫 站立式会议 培侨走的第4天,想他~( ...

  3. oracle主键自增

    oracle主键自增 1建立数据表 create table Test_Increase(            userid number(10) primary key,  /*主键,自动增加*/ ...

  4. 【BZOJ 2005】【NOI 2010】能量采集 数论+容斥原理

    这题设$f(i)$为$gcd(i,j)=x$的个数,根据容斥原理,我们只需减掉$f(i×2),f(i×3)\cdots$即可 那么这道题:$$ans=\sum_{i=1}^n(f(i)×((i-1)× ...

  5. android 概述 及四大组件

    目录: 概述 四大组件 UI布局 概述 android studio中,gen很bin文件夹合并为built文件夹 四大组件 包括: 活动,服务,内容提供者,广播接收者 活动是一种包含用户界面的组件 ...

  6. 大屏iPhone的适配 +iOS 图片尺寸要求

    摘自:http://blog.ibireme.com/2014/09/16/adapted_to_iphone6/ 苹果公司官网设计介绍到:Retina显示屏的超高像素密度已超过人眼能分辨的范围.Re ...

  7. bootstarp风格的toggle效果分享

    最近在写项目的时候想要一个这样的效果: 我知道这个效果在 flat-ui中有, 但是我又不想引用一整个flat-ui; 这个效果依赖html5的transition, 所以浏览器兼容成问题: 从fla ...

  8. lucene-查询query->PhraseQuery多关键字的搜索

    用户在搜索引擎中进行搜索时,常常查找的并非是一个简单的单词,很有可能是几个不同的关键字.这些关键字之间要么是紧密相联,成为一个精确的短 语,要么是可能在这几个关键字之间还插有其他无关的关键字.此时,用 ...

  9. WakeLock, AlarmManager, JobScheduler

    应用程序耗电的实质,是所启用的硬件在消耗电量. 手机的耗电单元 CPU: 应用处理器(AP)和基带处理器(BB或BP) GPU(图形处理单元) 外设:wifi,BT, GPS,LCD等 AP是ARM架 ...

  10. 【HDU 5858】Hard problem

    边长是L的正方形,然后两个半径为L的圆弧和中间半径为L的圆相交.求阴影部分面积. 以中间圆心为原点,对角线为xy轴建立直角坐标系. 然后可以联立方程解出交点. 交点是$(\frac{\sqrt{7} ...