众所周知,微博中的内容以短文本居多,文本内容随意性极强,这给建模增加了很大的难度.针对这一问题,这里分享一下fastText在微博短文本的应用. 任务目标简单介绍一下整个任务的目标:给微博内容打上标签,例如美妆.宠物用品等.这类问题可以转化为经典的多分类问题.然而微博内容较短,并且文字随意性极强,这给整个建模任务增加了难度.考虑到文本分类是一类偏线性的问题,本次建模使用了fastText.另外,值得注意的是,fastText能够产生词向量,它可以帮助我们理解数据. 标注在真实场景下,监督学习是文…