lecture2-word2vec-七月在线nlp】的更多相关文章

nltk的全称是natural language toolkit,是一套基于python的自然语言处理工具集.自带语料库.词性分类库.自带分类分词等功能.强大社区支持.很多简单版wrapper 文本处理: preprocess -> 分词 tokenize ->make features,成为数字化表示的东西 -> ml方法产生label.targets 中文nlp - 分词 - 1.启发式:就像对着大辞典,今是一个单词吗,今天是个..,..~类似贪婪算法找拟合词  2.ml:HMM\C…
第五课主要内容有: Scrapy框架结构,组件及工作方式 单页爬取-julyedu.com 拼URL爬取-博客园 循环下页方式爬取-toscrape.com Scrapy项目相关命令-QQ新闻 1.Scrapy框架结构,组件及工作方式 2.单页爬取-julyedu.com #by 寒小阳(hanxiaoyang.ml@gmail.com)---七月在线讲师 #Python2 import scrapy class JulyeduSpider(scrapy.Spider): name = "jul…
离散表示: one-hot bag of words -- 词权重 ~不能表示顺序关系   TF-IDF (Term Frequency - Inverse Document Frequency) [0.693, 1.386, 0.693, 0.693, 1.099, 0, 0, 0, 0.693, 0.693] 词t的IDF weight N: 文档总数, nt: 含有词t的文档数 Binary weighting [1, 1, 1, 1, 1, 0, 0, 0, 1, 1]不能表示顺序关系…
第六课主要内容: 爬豆瓣文本例程 douban 图片例程 douban_imgs 1.爬豆瓣文本例程 douban 目录结构 douban --douban --spiders --__init__.py --bookspider.py --douban_comment_spider.py --doumailspider.py --__init__.py --items.py --pipelines.py --settings.py --scrapy.cfg –spiders–init.py #…
第二课主要内容如下: 代码格式 基本语法 关键字 循环判断 函数 容器 面向对象 文件读写 多线程 错误处理 代码格式 syntax基本语法 a = 1234 print(a) a = 'abcd' print(a) try: print(b) except Exception as e: print(e) a = [1, 2, 3 , 4] def func(a): a[0] = 2 func(a) print(a) try: # Python 2.x 支持 print(100, 200, 3…
ppt 参数共享终于把拿一点想清楚啦,一定要知道w是矩阵! 在传统BP中,w前后连接时是all的,辣么多w使得你给我多少图片我就能记住多少信息-->导致过拟合-->cnn当中权值共享 激励层-非线性映射--不管无关信息,过滤信息 对卷积层的理解 data中第三行第三列表示-该位置对应的神经元关注图像轮廓信息 data中第四行第六列表示-....关注图像颜色信息 物理含义无法认为理解 无需手动提取特征,因为每个神经元会自己提取特征 Googlenet--去掉全连接,换成1*1卷积:中间有两层也会…
http://blog.csdn.net/u014568921/article/details/52518587 图像相似性搜索的原理 BOW 原理及代码解析 Bag Of Visual Words 三大步 OpenCV应用----BOW篇 Bag of Word闲谈 论文提要“Visual Categorization with Bags of Keypoints” Bag of Features (BOF)图像检索算法 老司机带你检测相似图片 哈希算法:均值~.感知~(DCT).差异~ ba…
霍夫变换 http://blog.csdn.net/sudohello/article/details/51335237 http://blog.csdn.net/glouds/article/details/39002113 在参数空间相交于同一点的所有直线,在图像坐标空间都有共线的点与之对应.根据这个特性,给定图像坐标空间的一些边缘点,就可以通过Hough变换确定连接这些点的直线方程. 参数空间a−b上的细分程度决定了最终找到直线上点的共线精度.上述的二维累加数组A也被称为Hough矩阵.…
除了知乎,还有这些网站与offer/内推/秋招/春招相关. 其中HelloWorld114更是囊括许多IT知识. 当然,我们可以拓宽思考的维度,既然课堂上的老师讲不好,我们可以自己找资源啊= =>慕课网.云课堂…
链接:https://pan.baidu.com/s/1Ir5GMuDqJQBmSavHC-hDgQ 提取码:qd2e…