最近一直在做相关推荐方面的研究与应用工作,召回率与准确率这两个概念偶尔会遇到,知道意思,但是有时候要很清晰地向同学介绍则有点转不过弯来. 召回率和准确率是数据挖掘中预测.互联网中的搜索引擎等经常涉及的两个概念和指标. 召回率:Recall,又称“查全率”——还是查全率好记,也更能体现其实质意义. 准确率:Precision,又称“精度”.“正确率”. 以检索为例,可以把搜索情况用下图表示: 相关 不相关 检索到 A B 未检索到 C D A:检索到的,相关的(搜到的也想要的) B:检索到的,…
import numpy as np import pandas as pd from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.linear_model.logistic import LogisticRegression from sklearn.model_selection import train_test_split, cross_val_score from sklearn.metrics…
准确率和召回率是数据挖掘中预测,互联网中得搜索引擎等经常涉及的两个概念和指标. 准确率:又称“精度”,“正确率” 召回率:又称“查全率” 以检索为例,可以把搜索情况用下图表示: 相关 不相关 检索到 A B 未检索到 C D A:检索到的,相关的 B:检索到的,但是不相关的 C:未检索到的,但却是相关的 D:未检索到的,也不相关的 1.召回率:被检索到的内容越多越好,即R=A/(A+C) 2.准确率:检索到的文档中,真正想要的越多越好,即P=A/(A+B) 在不同的场合中需要自己判断希望P比…