1. 搜索 ES 计算文本相似度用的 BM25,参数默认,不适合电商场景,可调整 BM25 参数使其适用于电商短文本场景 2. k1.b.tf.L.tfScore 的关系如下图红框内所示(注:这里的 tf 即上式中的 f(qi,D)). 3. k1 用来控制公式对词项频率 tf 的敏感程度.((k1 + 1) * tf) / (k1 + tf) 的上限是 (k1+1),也即饱和值.当 k1=0 时,不管 tf 如何变化,BM25 后一项都是 1:随着 k1 不断增大,虽然上限值依然是 (k1+1