整理了NLP领域的比赛、数据集、模型

比赛	网站	主办方(作者)
decaNLP	http://decanlp.com/	Salesforce
CLUE	https://github.com/CLUEbenchmark/CLUE	中文任务基准
GLUE	https://gluebenchmark.com/tasks
BioBERT	https://github.com/dmis-lab/biobert	生物医学领域的NLP任务
ERNIE	https://github.com/PaddlePaddle/ERNIE	百度飞桨
ALBERT

decaNLP

自然语言十项全能多任务挑战

Natural Language Decathlon (decaNLP) 是一个新的基准，要求单独的系统能够完成10项独立的自然语言任务。

问答 Stanford Question Answering Dataset (SQuAD 1.1)
机器翻译 International Workshop on Spoken Language Translation (IWSLT),
自动摘要 CNN/DailyMail (CNN/DM) corpus.
自然语言推理 Multi-Genre Natural Language Inference Corpus (MNLI).
情感分析 Stanford Sentiment Treebank (SST),
语义标签标注 QA-SRL 1.0.
关系抽取 QA-ZRE,
面向全域的对话 Wizard of Oz (WOZ)
语义解析 WikiSQL 【Seq2SQL，https://github.com/salesforce/WikiSQL】
常识推理 Modified Winograd Schema Challenge, MWSC)

评测-GLUE

CoLA、 SST-2、 MRPC、 STS-B、 QQP、 MNLI-m、 QNLI、 RTE

评测-CLUE

中文任务基准评测CLUE
AFQMC:蚂蚁语义相似度(Acc)；
TNEWS:文本分类(Acc)；
IFLYTEK:长文本分类(Acc);
CMNLI: 自然语言推理中文版;
COPA: 因果推断;
WSC: Winograd模式挑战中文版;
CSL: 中国科学文献数据集;

模型-BioBERT

https://github.com/dmis-lab/biobert

NER
命名实体识别
RE
关系抽取
QA
问答

模型-ERNIE

https://github.com/PaddlePaddle/ERNIE/blob/develop/README.zh.md

自然语言推断 XNLI
阅读理解 DuReader、CMRC2018、DRCD
命名实体识别 MSRA-NER(SIGHAN2006)
情感分析 ChnSentiCorp
问答任务 NLPCC2016-DBQA
语义相似度 LCQMC、BQ Corpus

模型-ALBERT

模型-TinyBERT

NLP的比赛和数据集的更多相关文章

NLP+VS︱深度学习数据集标注工具、方法摘录，欢迎补充~~
~~因为不太会使用opencv.matlab工具,所以在找一些比较简单的工具. . . 一.NLP标注工具BRAT BRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的 ...
如何在nlp问题中定义自己的数据集
我之前大致写了一篇在pytorch中如何自己定义数据集合,在这里如何自定义数据集不过这个例子使用的是image,也就是图像.如果我们用到的是文本呢,处理的是NLP问题呢? 在解决这个问题的时候,我在 ...
自然语言处理(NLP)入门学习资源清单
Melanie Tosik目前就职于旅游搜索公司WayBlazer,她的工作内容是通过自然语言请求来生产个性化旅游推荐路线.回顾她的学习历程,她为期望入门自然语言处理的初学者列出了一份学习资源清单. ...
微软名人数据集 ms_celeb_1m 处理（MsCelebV1-Faces-Aligned.tsv）python脚本
本文主要介绍了如何对MsCelebV1-Faces-Aligned.tsv文件进行提取原创by南山南北秋悲欢迎引用!请注明原地址 http://www.cnblogs.com/hwd9654/p/ ...
自然语言处理(NLP)
苹果语音助手Siri的工作流程: 听懂思考组织语言回答这其中每一步骤涉及的流程为: 语音识别自然语言处理 - 语义分析逻辑分析 - 结合业务场景与上下文自然语言处理 - 分析结果生成自 ...
卷积神经网络(CNN)在句子建模上的应用
之前的博文已经介绍了CNN的基本原理,本文将大概总结一下最近CNN在NLP中的句子建模(或者句子表示)方面的应用情况,主要阅读了以下的文献: Kim Y. Convolutional neural n ...
转：netflix推荐系统竞赛
原文链接:Netflix recommendations: beyond the 5 stars (Part 1), (Part 2) 原文作者:Xavier Amatriain and Justin ...
基于hadoop的图书推荐
根据在炼数成金上的学习,将部分代码总结一下在需要的时候可以多加温习.首先根据原理作简要分析.一般推荐系统使用的协同过滤推荐模型:分别是基于ItemCF的推荐模型或者是基于UserCF的推荐模型:首先分 ...
ms_celeb_1m数据提取（MsCelebV1-Faces-Aligned.tsv）python脚本
本文主要介绍了如何对MsCelebV1-Faces-Aligned.tsv文件进行提取原创by南山南北秋悲欢迎引用!请注明原地址 http://www.cnblogs.com/hwd9654/p/ ...

随机推荐

pycharm中的搜索快捷键
‘\0’的ASCII码
1.'\0'的ASCII码为0 2.用串口发送字符串时,可以通过'\0'判断字符串是否结束,但发送数字数组的时候不能通过'\0'判断数组是否结束,因为数字0与'\0'的ASCII码值相同.
操作word
package com.gwt.flow.task; import java.io.File; import java.io.FileInputStream; import java.io.FileN ...
【代码学习】PYTHON装饰器
一.装饰器对原代码不修改的基础上完善代码写代码要遵循开放封闭原则,虽然在这个原则是用的面向对象开发,但是也适用于函数式编程,简单来说,它规定已经实现的功能代码不允许被修改,但可以被扩展,即: 封闭 ...
GTA5整合包
链接:https://pan.baidu.com/s/1WUvLMyTcQYsw3wi6OfJfJA 提取码:jcpm
ubuntu16.04/ubuntu18.04安装网易云音乐
一.下载1.0版本下载地址:http://s1.music.126.net/download/pc/netease-cloud-music_1.0.0_amd64_ubuntu16.04.deb 下 ...
centos 6.5 防火墙通过 80 和 3306 端口
vim /etc/sysconfig/iptables -A INPUT -m state --state NEW -m tcp -p tcp --dport 22 -j ACCEPT -A INPU ...
Java常用API——Arrays工具类
介绍:Arrays工具类提供了一些可以直接操作数组的方法,以下是一些常用方法: int binarySearch(type[] a, type key):要求数组a元素升序排列,使用二分法搜索key的 ...
Python - 协议和鸭子类型
参考: Fluent_Python - P430 wiki 这里说的协议是什么?是让Python这种动态类型语言实现多态的方式. 在面向对象编程中,协议是非正式的接口,是一组方法,但只是一种文档,语言 ...
[BUUCTF 2018]Online Tool
进入页面贴出源码 <?php if (isset($_SERVER['HTTP_X_FORWARDED_FOR'])) { $_SERVER['REMOTE_ADDR'] = $_SERVER ...

NLP的比赛和数据集

decaNLP

评测-GLUE

评测-CLUE

模型-BioBERT

模型-ERNIE

模型-ALBERT

模型-TinyBERT

NLP的比赛和数据集的更多相关文章

随机推荐

热门专题