论文地址:https://arxiv.org/abs/1809.05350v1 二. 实现 我们从Kaggle[6]中获取了TED演讲数据集,其中包括2400个TED演讲的数据,包括标题.演讲者.标签.文字记录等等.从数据集中,我们主要使用平均有3000字的转录本. Step1:我们使用Mechanical Turk (labMT)[7]进行语言评估,从转录本中得到正和负的分数.分数越高,代表内容越积极,说明视频内容对观众有积极的情感影响 Step2:我们使用TF-IDF分析来确定哪些单词代表…