这两天,XLNet貌似也引起了NLP圈的极大关注,从实验数据看,在某些场景下,确实XLNet相对Bert有很大幅度的提升.就像我们之前说的,感觉Bert打开两阶段模式的魔法盒开关后,在这条路上,会有越来越多的同行者,而XLNet就是其中比较引人注目的一位. 当然,我估计很快我们会看到更多的这个模式下的新工作.未来两年,在两阶段新模式(预训练+Finetuning)下,应该会有更多的好工作涌现出来.根本原因在于:这个模式的潜力还没有被充分挖掘,貌似还有很大的提升空间.当然,这也意味着NLP在未来两…