1. LTP介绍和安装

LTP语言云官网  在线演示 | 语言云(语言技术平台云 LTP-Cloud)

安装LTP的python接口包

  1. $ sudo pip install pyltp

模型文件下载

LTP 3.3 文档 百度云

2. 使用LTP的python接口进行语言分析

  1. #!/usr/bin/env python
  2. # coding=utf-8
  3.  
  4. import sys
  5. reload(sys)
  6. sys.setdefaultencoding('utf8')
  7. import os
  8. from pyltp import Segmentor, Postagger, Parser
  9.  
  10. class LtpLanguageAnalysis(object):
  11. def __init__(self, model_dir="/home/xxx/ltp-3.4.0/ltp_data/"):
  12. self.segmentor = Segmentor()
  13. self.segmentor.load(os.path.join(model_dir, "cws.model"))
  14. self.postagger = Postagger()
  15. self.postagger.load(os.path.join(model_dir, "pos.model"))
  16. self.parser = Parser()
  17. self.parser.load(os.path.join(model_dir, "parser.model"))
  18.  
  19. def analyze(self, text):
  20. # 分词
  21. words = self.segmentor.segment(text)
  22. print '\t'.join(words)
  23.  
  24. # 词性标注
  25. postags = self.postagger.postag(words)
  26. print '\t'.join(postags)
  27.  
  28. # 句法分析
  29. arcs = self.parser.parse(words, postags)
  30. print "\t".join("%d:%s" % (arc.head, arc.relation) for arc in arcs)
  31.  
  32. def release_model(self):
  33. # 释放模型
  34. self.segmentor.release()
  35. self.postagger.release()
  36. self.parser.release()
  37.  
  38. if __name__ == '__main__':
  39. ltp = LtpLanguageAnalysis()
  40. ltp.analyze("元芳你怎么看")
  41. ltp.release_model()

输出结果:

  1. 元芳 怎么
  2. nh r r v
  3. 4:SBV 4:SBV 4:ADV 0:HED

通过LTP的在线演示demo可以看到对应的图结构如下:

(参考:pyltp 0.2.0 文档 )

哈工大LTP语言分析:分词、词性标注、句法分析等的更多相关文章

  1. 哈工大LTP基本使用-分词、词性标注、依存句法分析、命名实体识别、角色标注

    代码 import os from pprint import pprint from pyltp import Segmentor, Postagger, Parser, NamedEntityRe ...

  2. 哈工大LTP进阶使用-三元组事件抽取

    哈工大LTP基本使用-分词.词性标注.依存句法分析.命名实体识别.角色标注 上一节我们讲了LTP的基本使用,接下来我们使用其进行事件抽取. 参考代码:https://github.com/liuhua ...

  3. 使用哈工大LTP进行句法分析

    作者注:本教程旨在对哈工大LTP在github上的LTP4J(LTP的java版本)教程的补充,请结合以下参考网站一起食用. 参考网站: [1]哈工大语言技术平台云官网--LTP使用文档 http:/ ...

  4. ZH奶酪:哈工大LTP云平台标记含义及性能

    从官网搬过来的 囧rz 哈工大讯飞语言云 由哈工大 和科大讯飞 联合研发的中文自然语言处理云服务平台.结合了哈工大“语言技术平台——LTP” 高效.精准的自然语言处理核心技术和讯飞公司在全国性大规模云 ...

  5. 3. 哈工大LTP解析

    1. 通俗易懂解释知识图谱(Knowledge Graph) 2. 知识图谱-命名实体识别(NER)详解 3. 哈工大LTP解析 1. 前言 哈工大语言技术平台Language Technology ...

  6. ZH奶酪:自然语言处理工具LTP语言云调用方法

    前言 LTP语言云平台 不支持离线调用: 支持分词.词性标注.命名实体识别.依存句法分析.语义角色标注: 不支持自定义词表,但是你可以先用其他支持自定义分词的工具(例如中科院的NLPIR)把文本进行分 ...

  7. R语言中文分词包jiebaR

    R语言中文分词包jiebaR R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大. R语言作为统计学一门语言,一直在小众领域闪耀着光芒.直到大数据 ...

  8. 哈工大LTP

    http://ltp.ai/ http://pyltp.readthedocs.io/zh_CN/latest/ http://www.cnblogs.com/Denise-hzf/p/6612886 ...

  9. 第四期coding_group笔记_用CRF实现分词-词性标注

    一.背景知识 1.1 什么是分词? NLP的基础任务分为三个部分,词法分析.句法分析和语义分析,其中词法分析中有一种方法叫Tokenization,对汉字以字为单位进行处理叫做分词. Example ...

随机推荐

  1. jQuery的$.each()遍历checkbox

    $("input[type='checkbox']").each(function(){ var value = $(this).val(); //获得值 $(this).attr ...

  2. 迟到的thuwc&noiwc2018总结

    已经4个多月没写博客了呢. thuwc和noiwc都炸了,接下来的一段时间都没怎么写题,靠文化课和游戏麻醉自己.这篇博客也算是向之前自闭.颓废的自己告别吧.. 先写一发游记: thuwc:Day1炸, ...

  3. vue编译环境和线上环境url切换

    新建一个配置js,导入到接口请求管理类,可以自动根据环境切换if (process.env.NODE_ENV == 'development') { baseUrl = ''; }else{ base ...

  4. 商品详情页,banner滚动点击加载效果,js,jquary

    <script language="javascript">       $(document).ready(function () {   //purchase   ...

  5. 测试php语句执行时间

    $start = microtime(true); $elapsed = microtime(true) - $start; echo "That took $elapsed seconds ...

  6. JQuery获取指定元素中的checkbox选中状态的一些属性

    项目中用户上传病例数据,每一次上传自动生成一个病例文件夹,数据保存到后台,前端显示文件夹,现在的需求是勾选想要删除的文件夹的chenckbox,点击删除后,数据库和前端都相应的更新. 如果是静态页面, ...

  7. 前端项目,引入PingFang SC字体

    在仿苹果官网"垃圾桶"时, 设计出的UI使用PingFang SC 字体,在网上查了很久,特记录.如果你有更好的方法,欢迎评论留言~ 实现原理,使用@font-face将字体下载在 ...

  8. A4纸网页打印 html网页页面的宽度设置成多少

    A4纸竖向打印,html网页页面的宽度设置成多少?这个问题是我们大家所疑惑的,于是网上搜集整理下,希望可以帮助你们 最近开发项目时遇到了网页打印的问题,这是问题之二,打印宽度设置 在公制长度单位与屏幕 ...

  9. [javascript]jQuery绑定事件方法:on()

    语法: $(selector).on(event,childSelector,data,function) on(event,childSelector,data,function):在被选元素及子元 ...

  10. 配置Eclipse可以查看JDK类库源码

    一.配置方法 配置Eclipse可以查看JDK类库源码 Window->Preferences->Java->Installed JREs 若没有JRE,需要自己添加进来,有的话,点 ...