原文链接:http://www.cnblogs.com/appler/archive/2012/02/02/2335886.html 原始英文链接:http://www.puffinwarellc.com/index.php/news-and-articles/articles/33.html 潜语义分析LSA介绍 Latent Semantic Analysis (LSA), also known as Latent Semantic Indexing (LSI) literally mean
主要参考维基百科Bag of Word 在DLP领域里,bow(bag of word)是一个稀疏的向量,向量的每个元素记录词的出现次数,相当于对每篇文章都关于词典做词的直方图统计.同样的道理用在computer vision领域,图像由一些基础的特征构成,每幅图像就是对这些特征的一个统计分布,在做图像分类时会假设相似图像他们的特征统计分布也符合一定的模型.于是从这句话里就可以把以bow模型的图像分类问题分解成以下几步: 1.1 特征检测: 1.2 特征描述:1.3 码本生成(bow向量) 2
paip.语义分析--单字词形容词表180个 INSERT INTO t (word) SELECT DISTINCT word FROM `word_main` where tsisin is not null and tsisin like '%adj%' and LENGTH(word)=3 order by CONVERT(word USING gbk) ASC limit 10000 mysq按照拼音排序 排除重复 select * from t_n where wo
paip.语义分析--单字动词表.txt 排除重复 select * from t where word in (SELECT word from t_a) or word in (SELECT word from t_n) total 386 爱,按,扒,拔,掰,摆,拜,搬,拌,绊,绑,傍,抱,绷,蹦,逼,编,扁,变,憋,濒,播,擦,猜,采,踩,测,蹭,插,查,搽,拆,搀,缠,尝,唱,抄,吵,炒,扯,撤,闯,撑,乘,吃,抽,瞅,锄,揣,踹,穿,喘,吹,捶,刺,促,窜,催,