引言 我之前参加了一个中文文本智能校对大赛,拿了17名,虽然没什么奖金但好歹也是自己solo拿的第一个比较好的名次吧,期间也学到了一些BERT应用的新视角和新的预训练方法,感觉还挺有趣的,所以在这里记录一下这期间学到的知识,分享一下自己的比赛过程.这个赛题任务大概就是,选择网络文本作为输入,从中检测并纠正错误,实现中文文本校对系统.即给定一段文本,校对系统从中检测出错误字词.错误类型,并进行纠正. 任务定义 系统/模型的输入为原始序列\(X=(x1,x2,..,xn)\),输出为纠错后的序列 \…