NLP标记集资料
title: 标记集
tags:
grammar_cjkRuby: true
---
LTP分词标注集
标记 | 含义 | 举例 |
---|---|---|
B | 词首 | __中__国 |
I | 词中 | 哈__工__大 |
E | 词尾 | 科__学__ |
S | 单字成词 | 的 |
LTP词性标注集
LTP 使用的是863词性标注集,其各个词性含义如下表。
Tag | Description | Example | Tag | Description | Example |
---|---|---|---|---|---|
a | adjective | 美丽 | ni | organization name | 保险公司 |
b | other noun-modifier | 大型, 西式 | nl | location noun | 城郊 |
c | conjunction | 和, 虽然 | ns | geographical name | 北京 |
d | adverb | 很 | nt | temporal noun | 近日, 明代 |
e | exclamation | 哎 | nz | other proper noun | 诺贝尔奖 |
g | morpheme | 茨, 甥 | o | onomatopoeia | 哗啦 |
h | prefix | 阿, 伪 | p | preposition | 在, 把 |
i | idiom | 百花齐放 | q | quantity | 个 |
j | abbreviation | 公检法 | r | pronoun | 我们 |
k | suffix | 界, 率 | u | auxiliary | 的, 地 |
m | number | 一, 第一 | v | verb | 跑, 学习 |
n | general noun | 苹果 | wp | punctuation | ,。! |
nd | direction noun | 右侧 | ws | foreign words | CPU |
nh | person name | 杜甫, 汤姆 | x | non-lexeme | 萄, 翱 |
LTP命名实体识别标注集
NE识别模块的标注结果采用O-S-B-I-E标注形式,其含义为
标记 | 含义 |
---|---|
O | 这个词不是NE |
S | 这个词单独构成一个NE |
B | 这个词为一个NE的开始 |
I | 这个词为一个NE的中间 |
E | 这个词位一个NE的结尾 |
LTP中的NE 模块识别三种NE,分别如下:
标记 | 含义 |
---|---|
Nh | 人名 |
Ni | 机构名 |
Ns | 地名 |
LTP依存句法关系
关系类型 | Tag | Description | Example |
---|---|---|---|
主谓关系 | SBV | subject-verb | 我送她一束花 (我 <– 送) |
动宾关系 | VOB | 直接宾语,verb-object | 我送她一束花 (送 –> 花) |
间宾关系 | IOB | 间接宾语,indirect-object | 我送她一束花 (送 –> 她) |
前置宾语 | FOB | 前置宾语,fronting-object | 他什么书都读 (书 <– 读) |
兼语 | DBL | double | 他请我吃饭 (请 –> 我) |
定中关系 | ATT | attribute | 红苹果 (红 <– 苹果) |
状中结构 | ADV | adverbial | 非常美丽 (非常 <– 美丽) |
动补结构 | CMP | complement | 做完了作业 (做 –> 完) |
并列关系 | COO | coordinate | 大山和大海 (大山 –> 大海) |
介宾关系 | POB | preposition-object | 在贸易区内 (在 –> 内) |
左附加关系 | LAD | left adjunct | 大山和大海 (和 <– 大海) |
右附加关系 | RAD | right adjunct | 孩子们 (孩子 –> 们) |
独立结构 | IS | independent structure | 两个单句在结构上彼此独立 |
核心关系 | HED | head | 指整个句子的核心 |
LTP语义角色类型
语义角色类型 | 说明 |
---|---|
ADV | adverbial, default tag ( 附加的,默认标记 ) |
BNE | beneficiary ( 受益人 ) |
CND | condition ( 条件 ) |
DIR | direction ( 方向 ) |
DGR | degree ( 程度 ) |
EXT | extent ( 扩展 ) |
FRQ | frequency ( 频率 ) |
LOC | locative ( 地点 ) |
MNR | manner ( 方式 ) |
PRP | purpose or reason ( 目的或原因 ) |
TMP | temporal ( 时间 ) |
TPC | topic ( 主题 ) |
CRD | coordinated arguments ( 并列参数 ) |
PRD | predicate ( 谓语动词 ) |
PSR | possessor ( 持有者 ) |
PSE | possessee ( 被持有 ) |
《现代汉语语料库加工规范——词语切分与词性标注》
《现代汉语语料库加工规范——词语切分与词性标注》
词性标记
代码名称 |
帮助记忆的诠释 |
例子 及 注解 |
|
1 |
Ag 形语素 |
形容词性语素。形容词代码为a,语素代码g前面置以A。 |
绿色/n 似/d 锦/Ag , |
2 |
a 形容词 |
取英语形容词adjective的第1个字母 |
[重要/a 步伐/n]NP , 美丽/a , 看似/v 抽象/a , |
3 |
ad 副形词 |
直接作状语的形容词。形容词代码a和副词代码d并在一起。 |
[积极/ad 谋求/v]V-ZZ , 幻象/n 易/ad 逝/Vg , |
4 |
an 名形词 |
具有名词功能的形容词。形容词代码a和名词代码n并在一起。 |
[外交/n 和/c 安全/an]NP-BL , |
5 |
Bg 区别语素 |
区别词性语素。区别词代码为b,语素代码g前面置以B。 |
赤/Ag 橙/Bg 黄/a 绿/a 青/a 蓝/a 紫/a |
6 |
b 区别词 |
取汉字“别”的声母。 |
女/b 司机/n, 金/b 手镯/n, 慢性/b 胃炎/n, 古/b 钱币/n, 单音节区别词和单音节名词或名语素组合,作为一个词,并标以名词词性n。 雄鸡/n, 雌象/n, 女魔/n, 古币/n 少数“单音节区别词+双音节词”的结构作为一个词。 总书记/n , |
7 |
c 连词 |
取英语连词conjunction的第1个字母。 |
合作/vn 与/c 伙伴/n |
8 |
Dg 副语素 |
副词性语素。副词代码为d,语素代码g前面置以D。 |
了解/v 甚/Dg 深/a , 煞/Dg 是/v 喜人/a , |
9 |
d 副词 |
取adverb的第2个字母,因其第1个字母已用于形容词。 |
进一步/d 发展/v , |
10 |
e 叹词 |
取英语叹词exclamation的第1个字母。 |
啊/e ,/w 那/r 金灿灿/z 的/u 麦穗/n , |
11 |
f 方位词 |
取汉字“方”。 |
军人/n 的/u 眼睛/n 里/f 不/d 是/v 没有/v |
12 |
h 前接成分 |
取英语head的第1个字母。 |
许多/m 非/h 主角/n 人物/n , 办事处/n 的/u “/w 准/h 政府/n ”/w 功能/n |
13 |
i 成语 |
取英语成语idiom的第1个字母。 |
一言一行/i , 义无反顾/i , |
14 |
j 简称略语 |
取汉字“简”的声母。 |
[德/j 外长/n]NP , 文教/j , |
15 |
k |
后接成分。 |
少年儿童/l 朋友/n 们/k , 身体/n 健康/a 者/k , |
16 |
l 习用语 |
习用语尚未成为成语,有点“临时性”,取“临”的声母。 |
少年儿童/l 朋友/n 们/k , 落到实处/l , |
17 |
Mg 数语素 |
数词性语素。数词代码为m,语素代码g前面置以M。 |
甲/Mg 减下/v 的/u 人/n 让/v 乙/Mg 背上/v 凡/d “/w 寅/Mg 年/n ”/w 中/f 出生/v |
18 |
m 数词 |
取英语numeral的第3个字母,n,u已有他用。 |
1.数量词组应切分为数词和量词。 三/m 个/q, 但少数数量词已是词典的登录单位,则不再切分。 一个/m , 一些/m , 2. 基数、序数、小数、分数、百分数一律不予切分,为一个切分单位,标注为 m 。 一百二十三/m,20万/m, 123.54/m, 一个/m, 第一/m, 第三十五/m, 3. 约数,前加副词、形容词或后加“来、多、左右”等助数词的应予分开。 约/d 一百/m 多/m 万/m,仅/d 一百/m 个/q, 四十/m 来/m 个/q,二十/m 余/m 只/q, 十几/m 个/q,三十/m 两个数词相连的及“成百”、“上千”等则不予切分。 五六/m 年/q, 七八/m 天/q,十七八/m 岁/q, 成百/m 学生/n,上千/m 4.表序关系的“数+名”结构,应予切分。 二/m 连/n , 三/m 部/n , |
19 |
Ng 名语素 |
名词性语素。名词代码为n,语素代码g前面置以N。 |
出/v 过/u 两/m 天/q 差/Ng, 理/v 了/u 一/m 次/q 发/Ng, |
20 |
n 名词 |
取英语名词noun的第1个字母。 |
(参见 动词–v) 岗位/n , 城市/n , 机会/n , 她/r 是/v 责任/n 编辑/n , |
21 |
nr 人名 |
名词代码n和“人(ren)”的声母并在一起。 |
1. 汉族人及与汉族起名方式相同的非汉族人的姓和名单独切分,并分别标注为nr。 张/nr 仁伟/nr, 欧阳/nr 修/nr, 阮/nr 志雄/nr, 朴/nr 汉族人除有单姓和复姓外,还有双姓,即有的女子出嫁后,在原来的姓上加上丈夫的姓。如:陈方安生。这种情况切分、标注为:陈 方 安生 姜氏 2. 姓名后的职务、职称或称呼要分开。 江/nr 主席/n, 小平/nr 同志/n, 江/nr 总书记/n,张/nr 3. 对人的简称、尊称等若为两个字,则合为一个切分单位,并标以nr。 老张/nr, 大李/nr, 小郝/nr, 郭老/nr, 陈总/nr 4. 明显带排行的亲属称谓要切分开,分不清楚的则不切开。 三/m 哥/n, 大婶/n, 大/a 女儿/n, 大哥/n, 5. 一些著名作者的或不易区分姓和名的笔名通常作为一个切分单位。 鲁迅/nr, 茅盾/nr, 巴金/nr, 三毛/nr, 琼瑶/nr, 白桦/nr 6. 外国人或少数民族的译名(包括日本人的姓名)不予切分,标注为nr。 克林顿/nr, 叶利钦/nr, 才旦卓玛/nr, 小林多喜二/nr, 北研二/nr, 华盛顿/nr, 爱因斯坦/nr 有些西方人的姓名中有小圆点,也不分开。 卡尔·马克思/nr |
22 |
ns 地名 |
名词代码n和处所词代码s并在一起。 |
(参见2。短语标记说明–NS) 安徽/ns,深圳/ns,杭州/ns,拉萨/ns,哈尔滨/ns, 呼和浩特/ns, 1. 国名不论长短,作为一个切分单位。 中国/ns, 中华人民共和国/ns, 日本国/ns, 美利坚合众国/ns, 美国/ns 2. 地名后有“省”、“市”、“县”、“区”、“乡”、“镇”、“村”、“旗”、“州”、“都”、“府”、“道”等单字的行政区划名称时,不切分开,作为一个切分单位。 四川省/ns, 天津市/ns,景德镇/ns沙市市/ns, 牡丹江市/ns,正定县/ns,海淀区/ns, 通州区/ns,东升乡/ns, 3. 地名后的行政区划有两个以上的汉字,则将地名同行政区划名称切开,不过要将地名同行政区划名称用方括号括起来,并标以短语NS。 [芜湖/ns 专区/n] NS, [宣城/ns 地区/n]ns, [内蒙古/ns 自治区/n]NS, [深圳/ns 特区/n]NS, [厦门/ns 经济/n 特区/n]NS, [香港/ns 特别/a 行政区/n]NS, [香港/ns 特区/n]NS, [华盛顿/ns 特区/n]NS, 4. 地名后有表示地形地貌的一个字的普通名词,如“江、河、山、洋、海、岛、峰、湖”等,不予切分。 鸭绿江/ns,亚马逊河/ns, 喜马拉雅山/ns, 珠穆朗玛峰/ns,地中海/ns,大西洋/ns,洞庭湖/ns, 塞普路斯岛/ns 5. 地名后接的表示地形地貌的普通名词若有两个以上汉字,则应切开。然后将地名同该普通名词标成短语NS。 [台湾/ns 海峡/n]NS,[华北/ns 平原/n]NS,[帕米尔/ns 高原/n]NS, 6.地名后有表示自然区划的一个字的普通名词,如“ 街,路,道,巷,里,町,庄,村,弄,堡”等,不予切分。 中关村/ns,长安街/ns,学院路/ns, 景德镇/ns, 吴家堡/ns, 庞各庄/ns, 三元里/ns,彼得堡/ns, 7.地名后接的表示自然区划的普通名词若有两个以上汉字,则应切开。然后将地名同自然区划名词标成短语NS。 [米市/ns 大街/n]NS, [蒋家/nz 胡同/n]NS , [陶然亭/ns 公园/n]NS , 8. 大小地名相连时的标注方式为: 北京市/ns 海淀区/ns 海淀镇/ns [南/f 大街/n]NS [蒋家/nz 胡同/n]NS 24/m 号/q , |
23 |
nt 机构团体 |
“团”的声母为t,名词代码n和t并在一起。 |
(参见2。短语标记说明–NT) 联合国/nt,中共中央/nt,国务院/nt, 北京大学/nt 1.大多数团体、机构、组织的专有名称一般是短语型的,较长,且含有地名或人名等专名,再组合,标注为短语NT。 [中国/ns 计算机/n 学会/n]NT, [香港/ns 钟表业/n 总会/n]NT, [烟台/ns 大学/n]NT, [香港/ns 理工大学/n]NT, [华东/ns 理工大学/n]NT, [合肥/ns 师范/n 学院/n]NT, [北京/ns 图书馆/n]NT, [富士通/nz 株式会社/n]NT, [香山/ns 植物园/n]NT, [安娜/nz 美容院/n]NT, [上海/ns 手表/n 厂/n]NT, [永和/nz 烧饼铺/n]NT, [北京/ns 国安/nz 队/n]NT, 2. 对于在国际或中国范围内的知名的唯一的团体、机构、组织的名称即使前面没有专名,也标为nt或NT。 联合国/nt,国务院/nt,外交部/nt, 财政部/nt,教育部/nt, 国防部/nt, [世界/n 贸易/n 组织/n]NT, [国家/n 教育/vn 委员会/n]NT, [信息/n 产业/n 部/n]NT, [全国/n 信息/n 技术/n 标准化/vn 委员会/n]NT, [全国/n 总/b 工会/n]NT, [全国/n 人民/n 代表/n 大会/n]NT, 美国的“国务院”,其他国家的“外交部、财政部、教育部”,必须在其所属国的国名之后出现时,才联合标注为NT。 [美国/ns 国务院/n]NT, [法国/ns 外交部/n]NT, [美/j 国会/n]NT, 日本有些政府机构名称很特别,无论是否出现在“日本”国名之后都标为nt。 [日本/ns 外务省/nt]NT, [日/j 通产省/nt]NT 通产省/nt 3. 前后相连有上下位关系的团体机构组织名称的处理方式如下: [联合国/nt 教科文/j 组织/n]NT, [中国/ns 银行/n 北京/ns [河北省/ns 正定县/ns 西平乐乡/ns 南化村/ns 党支部/n]NT, 当下位名称含有专名(如“北京/ns 分行/n”、“南化村/ns 党支部/n”、“昌平/ns 分校/n”)时,也可脱离前面的上位名称单独标注为NT。 [中国/ns 银行/n]NT [北京/ns 分行/n]NT, 北京大学/nt [昌平/ns 分校/n]NT,4. 团体、机构、组织名称中用圆括号加注简称时: [宝山/ns 钢铁/n (/w 宝钢/j )/w 总/b 公司/n]NT, [宝山/ns 钢铁/n 总/b 公司/n]NT,(/w 宝钢/j )/w |
24 |
nx 外文字符 |
外文字符。 |
A/nx 公司/n ,B/nx 先生/n ,X/nx 君/Ng 24/m K/nx 镀金/n , C/nx 是/v 光速/n , Windows98/nx , PentiumIV/nx , I LOVE THIS GAME/nx , |
25 |
nz 其他专名 |
“专”的声母的第1个字母为z,名词代码n和z并在一起。 |
(参见2。短语标记说明–NZ) 除人名、国名、地名、团体、机构、组织以外的其他专有名词都标以nz。 满族/nz,俄罗斯族/nz,汉语/nz,罗马利亚语/nz, 捷克语/nz,中文/nz, 英文/nz, 满人/nz, 哈萨克人/nz, 1.包含专有名称(或简称)的交通线,标以nz;短语型的,标为NZ。 津浦路/nz, 石太线/nz, [京/j 九/j 铁路/n]NZ, [京/j 津/j 高速/b 公路/n]NZ, 2. 历史上重要事件、运动等专有名称一般是短语型的,按短语型专有名称处理,标以NZ。 [卢沟桥/ns 事件/n]NZ, [西安/ns 事变/n]NZ,[五四/t 运动/n]NZ, 3.专有名称后接多音节的名词,如“语言”、“文学”、“文化”、“方式”、“精神”等,失去专指性,则应分开。 欧洲/ns 语言/n, 法国/ns 文学/n, 西方/ns 4. 商标(包括专名及后接的“牌”、“型”等)是专指的,标以nz,但其后所接的商品仍标以普通名词n。 康师傅/nr 方便面/n, 中华牌/nz 香烟/n, 牡丹III型/nz 电视机/n, 5. 以序号命名的名称一般不认为是专有名称。 2/m 号/q 国道/n ,十一/m 届/q 三中全会/j 如果前面有专名,合起来作为短语型专名。 [中国/ns 101/m 国道/n]NZ, [中共/j 十一/m 届/q 6. 书、报、杂志、文档、报告、协议、合同等的名称通常有书名号加以标识,不作为专有名词。由于这些名字往往较长,名字本身按常规处理。 《/w 宁波/ns 日报/n 》/w ,《/w 鲁迅/nr 全集/n 中华/nz 读书/vn 报/n, 杜甫/nr 少数书名、报刊名等专有名称,则不切分。红楼梦/nz, 人民日报/nz,儒林外史/nz 7. 当有些专名无法分辨它们是人名还是地名或机构名时,暂标以nz。 [巴黎/ns 贝尔希/nz 体育馆/n]NT, 其中“贝尔希”只好暂标为nz。 |
26 |
o 拟声词 |
取英语拟声词onomatopoeia的第1个字母。 |
哈哈/o 一/m 笑/v , 装载机/n 隆隆/o 推进/v , |
27 |
p 介词 |
取英语介词prepositional的第1个字母。 |
对/p 子孙后代/n 负责/v , 以/p 煤/n 养/v 农/Ng , 为/p 治理/v 荒山/n 服务/v , 把/p 青年/n 推/v 上/v 了/u 领导/vn 岗位/n , |
28 |
q 量词 |
取英语quantity的第1个字母。 |
(参见数词m) 首/m 批/q , 一/m 年/q , |
29 |
Rg 代语素 |
代词性语素。代词代码为r,在语素的代码g前面置以R。 |
读者/n 就/d 是/v 这/r 两/m 棵/q 小树/n |
30 |
r 代词 |
取英语代词pronoun的第2个字母,因p已用于介词。 |
单音节代词“本”、“每”、“各”、“诸”后接单音节名词时,和后接的单音节名词合为代词;当后接双音节名词时,应予切分。 本报/r, 每人/r, 本社/r, 本/r 地区/n, 各/r 部门/n |
31 |
s 处所词 |
取英语space的第1个字母。 |
家里/s 的/u 电脑/n 都/d 联通/v 了/u 国际/n 西部/s 交通/n 咽喉/n , |
32 |
Tg 时语素 |
时间词性语素。时间词代码为t,在语素的代码g前面置以T。 |
3日/t 晚/Tg 在/p 总统府/n 发表/v 声明/n , 尊重/v 现/Tg 执政/vn 当局/n 的/u 权威/n , |
33 |
t 时间词 |
取英语time的第1个字母。 |
1. 年月日时分秒,按年、月、日、时、分、秒切分,标注为t 。 1997年/t 3月/t 19日/t 下午/t 2时/t 18分/t 若数字后无表示时间的“年、月、日、时、分、秒”等的标为数词m。 1998/m 中文/n 信息/n 处理/vn 国际/n 会议/n 2. 历史朝代的名称虽然有专有名词的性质,仍标注为t。 西周/t, 秦朝/t, 东汉/t, 南北朝/t, 清代/t “牛年、虎年”等一律不予切分,标注为: 牛年/t, 虎年/t, 甲午年/t, 甲午/t 战争/n, 庚子/t |
34 |
u 助词 |
取英语助词auxiliary。 |
[[俄罗斯/ns 和/c 北约/j]NP-BL 之间/f [战略/n 伙伴/n |
35 |
Vg 动语素 |
动词性语素。动词代码为v。在语素的代码g前面置以V。 |
洗/v 了/u 一个/m 舒舒服服/z 的/u 澡/Vg |
36 |
v 动词 |
取英语动词verb的第一个字母。 |
(参见 名词–n) [[[欧盟/j 扩大/v]S 的/u [历史性/n 决定/n]NP]NP 和/c , |
37 |
vd 副动词 |
直接作状语的动词。动词和副词的代码并在一起。 |
形势/n 会/v 持续/vd 好转/v , 认为/v 是/v 电话局/n 收/v 错/vd 了/u 费/n |
38 |
vn 名动词 |
指具有名词功能的动词。动词和名词的代码并在一起。 |
引起/v 人们/n 的/u 关注/vn 和/c 思考/vn , 收费/vn 电话/n 的/u 号码/n , |
39 |
w 标点符号 |
”/w :/w |
|
40 |
x 非语素字 |
非语素字只是一个符号,字母x通常用于代表未知数、符号。 |
|
41 |
Yg 语气语素 |
语气词性语素。语气词代码为y。在语素的代码g前面置以Y。 |
唯/d 大力/d 者/k 能/v 致/v 之/u 耳/Yg |
42 |
y 语气词 |
取汉字“语”的声母。 |
会/v 泄露/v 用户/n 隐私/n 吗/y , 又/d 何在/v 呢/y ? |
43 |
z 状态词 |
取汉字“状”的声母的前一个字母。 |
取得/v 扎扎实实/z 的/u 突破性/n 进展/vn , 四季/n 常青/z 的/u 热带/n 树木/n , 短短/z 几/m 年/q 间, |
作者:Jadepeng
出处:jqpeng的技术记事本--http://www.cnblogs.com/xiaoqi
您的支持是对博主最大的鼓励,感谢您的认真阅读。
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
NLP标记集资料的更多相关文章
- NLP | 算法 学习资料整理
UPDATE TIME: 2019-12-12 17:06:32 NLP: 对话系统: [ ] https://www.cnblogs.com/jiangxinyang/p/10789512.html ...
- NLP项目
GitHub NLP项目:自然语言处理项目的相关干货整理 自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域.本文作者为自然语言处理NLP初学者整理了 ...
- NLP(一)
“自然语言处理”(Natural Language Processing 简称 NLP)包含所有用计算机对自然语言进行的操作. 自然语言工具包(NLTK) 语言处理任务与相应 NLTK 模块以及功能描 ...
- 结巴分词标注兼容_ICTCLAS2008汉语词性标注集
计算所汉语词性标记集Version 3.0制订人:刘群 张华平 张浩计算所汉语词性标记集... 10. 说明... 11. 名词 (1个一类,7个二类,5个三类) 22. 时间词(1个一类,1个二类) ...
- NLP相关资源
一 NLP相关资源站点 Rouchester大学NLP/CL会议列表 一个非常好的会议时间信息网站,将自然语言处理和计算语言学领域的会议,按照时间月份顺序列出. NLPerJP 一个日本友好人士维护的 ...
- HTTP1.1协议-RFC2616-中文版课前资料收集
1.http rfc大致讲了什么? 2.解决了什么问题? HTTP协议描述的是发送方与接收方的通信协议 协议功能: HTTP协议(HyperText Transfer Protocol,超文本传输协议 ...
- 使用Akka构建集群(一)
概述 Akka提供的非常吸引人的特性之一就是轻松构建自定义集群,这也是我要选择Akka的最基本原因之一.如果你不想敲太多代码,也可以通过简单的配置构建一个非常简单的集群.本文为说明Akka集群构建的学 ...
- ZH奶酪:哈工大LTP云平台标记含义及性能
从官网搬过来的 囧rz 哈工大讯飞语言云 由哈工大 和科大讯飞 联合研发的中文自然语言处理云服务平台.结合了哈工大“语言技术平台——LTP” 高效.精准的自然语言处理核心技术和讯飞公司在全国性大规模云 ...
- nlp 总结 分词,词义消歧,词性标注,命名体识别,依存句法分析,语义角色标注
分词 中文分词 (Word Segmentation, WS) 指的是将汉字序列切分成词序列. 因为在汉语中,词是承载语义的最基本的单元.分词是信息检索.文本分类.情感分析等多项中文自然语言处理任务的 ...
随机推荐
- Socket模拟SSH
Socket模拟SSH 主要思路 客户端发送相关命令到服务端,服务端执行命令(通过subprocess模块实现)然后将结果返回给客户端 小知识 Linux中可以发送空数据,服务端能接受到空数据 win ...
- 与karma、angular的第一次亲密接触
首先要了解什么是karma,karma干嘛用的,它的好朋友jasmine又是啥?这些文章可以帮助你: karma干嘛的? angular与karma1 angular与karma2 看了以上几篇文章之 ...
- 【原创】004 | 搭上SpringBoot事务诡异事件分析专车
前言 如果这是你第二次看到师长,说明你在觊觎我的美色! 点赞+关注再看,养成习惯 没别的意思,就是需要你的窥屏^_^ 本专车系列文章 目前连载到第四篇,本专题是深入讲解Springboot源码,毕竟是 ...
- native-base中Input,Textarea等组件在ios平台下不能输入中文
在上文react-native中TextInput在ios平台下不能输入中文已经解决. 但是在native-base中Input和Textarea都存在这样的问题.为了不要写多个组件,封装以下代码: ...
- [TimLinux] MySQL 入门指导
1. 说明 本部分内容参考MySQL参考手册第三章:Chapter 3 Tutorial. 2. 版本 下载安装:https://dev.mysql.com/get/Downloads/MySQL-5 ...
- UESTC-1964命运石之门(类似SPFA的BFS)
命运石之门 Time Limit: 1000 MS Memory Limit: 256 MB Submit Status "这一切都是命运石之门的选择!" 凶真博士发明了能 ...
- 【系列专题】JavaScript设计模式 重温系列(9篇全)
JavaScript 设计模式 [JS]164-JavaScript设计模式--单体模式 [JS]165-JavaScript设计模式--工厂模式 [JS]166-JavaScript设计模式--迭代 ...
- 【Html JS】使用问题记录
[Html JS]使用问题记录 ================================================================ 1.td 文字换行 2.正则表达式 = ...
- Visual Studio2019及.NET CORE3.0的安装教程
看到很多开发.net core的初学者在安装的时候就陷入问题了,不知道安装那些东西,好吧,既然要分享知识那么就尽量做得精细一点吧,我决定从零开始为大家讲解.net core,同时有.net core工 ...
- django----orm查询优化 MTV与MVC模型 choice参数 ajax serializers
目录 orm查询优化 only defer select_related 与 prefetch_related MTV 与 MVC 模型 choice参数 Ajax 前端代码 后端代码 前后端传输数据 ...