并查集的模板题: #include<iostream> #include<cstdio> using namespace std; ; int fa[maxn]; int find(int x) { return fa[x] == x ? x : fa[x] = find(fa[x]); } void unite(int x, int y) { int x1 = find(x); int y1 = find(y); if (x1 != y1)fa[x1] = y1; } int m…
Distant Supervision for relation extraction without labeled data 远程监督:使用未标注语料做关系抽取 1. 背景: 关系抽取(某个人是否属于某个组织等) 关系抽取中使用的3种方法: a) 监督学习 优点:准确率很高 缺点:1.手工标注金标语料代价昂贵,时间金钱上需要很大的开销,并且数量受限,得不到大量的训练数据; 2.领域受限,标注都是在一个特定的语料中,训练的系统受限于那个领域 b) 无监督学习 优点:可以使用大规模的数据…