count = count1+count2-count_unimportant_union*10 这个10需要调参.因为我们TOPN取的是10,所以如果两个词完全相同,正常情况下会有22个非0值.( 计算基础相似度,用来平衡长句子与短句子之间匹配的时候,短句子本身占有巨大的优势.基础相似度代表了:如果两个句子,他们进行ONE-HOT映射之后,非零元素都不一样,且都为1,他们依然会有一个基本的相似度.这时的欧氏距离就是(count1+count2)开根号,再进行相似度计算.对于一些不重要的词,再用…