在深度学习中,文本分类的主要原型:Text label,坐边是输入端“X”,右边是输出端“Y”.行业baseline:用BoW(bag of words)表示sentences(如何将文本表达成一个数字的形式),然后用LR或者SVM做回归.中英文做自然语言处理主要区别,中文需要分词(启发式Heuristic, 机器学习.统计方法HMM.CRF))深度学习:从端到端的方式,以不掺和人为的计算,从X到Y暴力粗暴的学习.通过很隐层(包含大量线性和非线性的计算)试图模拟数据的内在结构.新手推荐用kr…