使用Boltzmann distribution还是Gibbs distribution作为题目纠结了一阵子,选择前者可能只是因为听起来“高大上”一些.本章将会聊一些关于信息.能量这方面的东西,体会“交叉学科”的魅力. In statistical mechanics and mathematics, a Boltzmann distribution (also called Gibbs distribution) is a probability distribution, probabili
场景:上次回答word2vec相关的问题,回答的是先验概率和后验概率,没有回答到关键点. 词袋模型(Bag of Words, BOW)与词向量(Word Embedding)模型 词袋模型就是将句子分词,然后对每个词进行编码,常见的有one-hot.TF-IDF.Huffman编码,假设词与词之间没有先后关系. 词向量模型是用词向量在空间坐标中定位,然后计算cos距离可以判断词于词之间的相似性. 先验概率和后验概率 先验概率和后验证概率是基于词向量模型.首先一段话由五个词组成: A B C D