Python自然语言处理 - 系列四】的更多相关文章

一 如何使用形式化语法来描述无限的句子集合的结构?    --上下位无关文法       1.1 一个例子:      grammar1 = nltk.parse_cfg("""     S -> NP VP     VP -> V NP | V NP PP     PP -> P NP     V -> "saw" | "ate" | "walked"     NP -> "…
本系列教程供个人学习笔记使用,如果您要浏览可能需要其它编程语言基础(如C语言),why?因为我写得烂啊,只有我自己看得懂!! 一开始是没有打算写工具这篇的,后来发现在某些情况下会遇到一些奇怪的问题,这里记录一下. 环境基础我是用的是windows 10操作系统python版本:python2.7  地址-->https://www.python.org/downloads/ Sublime Text3:地址-->https://www.sublimetext.com/ 安装python的坑:直…
一:python基础,自然语言概念 from nltk.book import * 1,text1.concordance("monstrous")      用语索引 2,text1.similar("best") 3,text2.common_contexts(["monstrous", "very"]) 4,text4.dispersion_plot(["citizens", "democr…
1.基本概念 模拟退火算法(Simulated Annealing,SA)是一种模拟固体降温过程的最优化算法.其模拟的过程是首先将固体加温至某一温度,固体内部的粒子随温度上升慢慢变为无序的状态,内能增大,然后让其慢慢冷却,温度下降时,内部的粒子慢慢趋于有序,达到一种平衡态,最后达到常温时成为基态,此时内能减为最小,算法模拟这样一个过程期望能达到最优化的目的. 模拟退火算法最早是由kirkpatrick等人应用于组合优化领域,它是基于Monte-Carlo迭代求解策略的一种随机寻优算法.算法从某一…
词典或者词典资源是一个词和/或短语及其相关信息的集合,例如:词性和词意定义等相关信息.词典资源附属于文本,而且通常在文本的基础上创建和丰富.下面列举几种nltk中的词典资源. 1. 词汇列表语料库 nltk中包括了一些仅仅包含词汇列表的语料库.词汇语料库是UNIX中的/usr/dict/words文件,被一些拼写检查程序所使用.我们可以用它来寻找文本语料中不常见的或拼写错误的词汇. 1)过滤词汇 >>> def unusual_words(text): ... text_vocab=se…
有监督分类过程 ![enter image description here][1]例子:涉及一个特征器,给定一个姓名分析出是男性名字还是女性名字 分析:男性和女性的名字有一些鲜明的特点.以a,e 和i 结尾的很可能是女性,而以k,o,r,s 结尾的很可能是男性.让我们建立一个分类器更精确地模拟这些差异. 特征提取器:名字最后一个字母 ![enter image description here][2] 数据准备: ![enter image description here][3] 特征抽取,…
本系列教程供个人学习笔记使用,如果您要浏览可能需要其它编程语言基础(如C语言),why?因为我写得烂啊,只有我自己看得懂!! 标准输入输出一.输入 在sublime中这个时候需要安装SublimeREPL插件. Ctrl+shift+p 键入 install packages,再继续键入 SublimeREPL 安装即可然后每次编译运行的操作是:tools->sublimeREPL->python->python-Run current file.点击之后会出现新的页面*REPL*[py…
本系列教程供个人学习笔记使用,如果您要浏览可能需要其它编程语言基础(如C语言),why?因为我写得烂啊,只有我自己看得懂!! 工具基础(Windows系统下)传送门:Python基础笔记系列四:工具的安装与配置 数据类型比较简单.了解就行.后面涉及深入再做探究. python的算术表达式包括加减乘除.取模取余.取负以及乘方运算.大部分与其它语言差不多,其中乘方运算用两个“**”号表示,比如,3的9次方,在python中可表示为3**9,如图所示: python的关系表达式关系表达式是一种布尔表达…
# -*- coding: utf- -*- import redis r =redis.Redis(host=,password="ZBHRwlb1608") 1. Lpush 命令将一个或多个值插入到列表头部. 如果 key 不存在,一个空列表会被创建并执行 LPUSH 操作. 当 key 存在但不是列表类型时,返回一个错误.执行 LPUSH 命令后,列表的长度. ",1) #输出的结果是1 ",1) #输出的结果是2 ",2,3,4) #输出的结果是…
# -*- coding: utf-8 -*- import redis #这个redis不能用,请根据自己的需要修改 r =redis.Redis(host=") 1. Hset 命令用于为哈希表中的字段赋值 .如果哈希表不存在,一个新的哈希表被创建并进行 HSET 操作.如果字段已经存在于哈希表中,旧值将被覆盖.如果字段是哈希表中的一个新建字段,并且值设置成功,返回 1 . 如果哈希表中域字段已经存在且旧值已被新值覆盖,返回 0 . print r.hset(name="name&…