推荐算法之 slope one 算法

1.示例引入

多个吃货在某美团的某家饭馆点餐，如下两道菜：

可乐鸡翅：

红烧肉：

顾客吃过后，会有相关的星级评分。假设评分如下：
评分可乐鸡翅红烧肉
小明 4 5
小红 4 3
小伟 2 3
小芳 3 ？
问题：请猜测一下小芳可能会给“红烧肉”打多少分？
思路：把两道菜的平均差值求出来，可乐鸡翅减去红烧肉的平均偏差：[（4-5）+（4-3）+（2-3）]/3=-0.333。一个新客户比如小芳，只吃了可乐鸡翅评分为3分，那么可以猜测她对红烧肉的评分为：3-（-0.333）=3.333

这就是slope one 算法的基本思路，非常非常的简单。

2.slope one 算法思想

Slope One 算法是由 Daniel Lemire 教授在 2005 年提出的一个Item-Based 的协同过滤推荐算法。和其它类似算法相比, 它的最大优点在于算法很简单, 易于实现, 执行效率高, 同时推荐的准确性相对较高。
Slope One算法是基于不同物品之间的评分差的线性算法，预测用户对物品评分的个性化算法。主要两步：
Step1:计算物品之间的评分差的均值，记为物品间的评分偏差(两物品同时被评分)；

Step2:根据物品间的评分偏差和用户的历史评分，预测用户对未评分的物品的评分。

Step3:将预测评分排序，取topN对应的物品推荐给用户。

举例：
假设有100个人对物品A和物品B打分了，R(AB)表示这100个人对A和B打分的平均偏差;有1000个人对物品B和物品C打分了， R(CB)表示这1000个人对C和B打分的平均偏差；

3.python实现

def loadData():

    items={'A':{1:5,2:3},

           'B':{1:3,2:4,3:2},

           'C':{1:2,3:5}}

    users={1:{'A':5,'B':3,'C':2},

           2:{'A':3,'B':4},

           3:{'B':2,'C':5}}

    return items,users

3.2物品间评分偏差

#***计算物品之间的评分差
#items:从物品角度，考虑评分
#users:从用户角度，考虑评分

    for itemId in items:

        for otherItemId in items:

            average=0.0 #物品间的评分偏差均值

            userRatingPairCount=0 #两件物品均评过分的用户数

            if itemId!=otherItemId: #若无不同的物品项

                for userId in users: #遍历用户-物品评分数

                    userRatings=users[userId] #每条数据为用户对物品的评分

                    #当前物品项在用户的评分数据中，且用户也对其他物品由评分

                    if itemId in userRatings and otherItemId in userRatings:

                        #两件物品均评过分的用户数加1

                        userRatingPairCount+=1

                        #评分偏差为每项当前物品评分-其他物品评分求和

                        average+=(userRatings[otherItemId]-userRatings[itemId])

                averages[(itemId,otherItemId)]=average/userRatingPairCount

3.3预估评分

#***预测评分
#users:用户对物品的评分数据
#items：物品由哪些用户评分的数据
#averages：计算的评分偏差
#targetUserId：被推荐的用户
#targetItemId：被推荐的物品

def suggestedRating(users,items,averages,targetUserId,targetItemId):

runningRatingCount=0 #预测评分的分母

weightedRatingTotal=0.0 #分子

for i in users[targetUserId]:

#物品i和物品targetItemId共同评分的用户数

ratingCount=userWhoRatedBoth(users,i,targetItemId)

#分子

weightedRatingTotal+=(users[targetUserId][i]-averages[(targetItemId,i)])\

*ratingCount

#分母

runningRatingCount+=ratingCount

#返回预测评分

return weightedRatingTotal/runningRatingCount

统计两物品共同评分的用户数

# 物品itemId1与itemId2共同有多少用户评分

def userWhoRatedBoth(users,itemId1,itemId2):

    count=0

    #用户-物品评分数据

    for userId in users:

        #用户对物品itemId1与itemId2都评过分则计数加1

        if itemId1 in users[userId] and itemId2 in users[userId]:

            count+=1

    return count

3.4测试结果:

if __name__=='__main__':

    items,users=loadData()

    averages={}

    #计算物品之间的评分差

    buildAverageDiffs(items,users,averages)

    #预测评分:用户2对物品C的评分

    predictRating=suggestedRating(users,items,averages,2,'C')

    print 'Guess the user will rate the score :',predictRating

结果：用户2对物品C的预测分值为
Guess the user will rate the score : 3.33333333333

4.slopeOne使用场景

该算法适用于物品更新不频繁，数量相对较稳定并且物品数目明显小于用户数的场景。依赖用户的用户行为日志和物品偏好的相关内容。
优点：
1.算法简单，易于实现，执行效率高；
2.可以发现用户潜在的兴趣爱好；
缺点：
依赖用户行为，存在冷启动问题和稀疏性问题。

随机推荐

《Ubuntu标准教程》学习总结
第6章 Shell Shell就是一个命令解释器,负责完成用户与内核之间的交互. 目前流行电Shell主要有:Bourne Shell( sh ).Bourne Again Shell( Bash ) ...
数学整合新（LUOGU）
1.卡特兰数(P2532) 递推式:h(n)=C(2n,n)/(n+1) (n=0,1,2,...) 前十项(从零开始):1, 1, 2, 5, 14, 42, 132, 429, 1430, 486 ...
ubuntu 设置静态ip地址不生效问题
出现了一个问题是,配置了静态ip地址之后,重启网络服务,查看ip地址是生效的,过会再看就不生效了,查看网上说是由于 network-manager 管理ip地址时候出现的冲突,将network-ma ...
c:param 标签后不要写注释。否则报错 Encountered illegal body of tag "c:import" tag, given its attributes
c:param 标签后不要写注释 .否则报错 Encountered illegal body of tag "c:import" tag, given its attribu ...
着重基础之—构建工具—Maven的依赖管理
着重基础之—构建工具—Maven的依赖管理项目构建利器Maven给我们开发人员带来了极大的便利,从繁琐的jar包管理中脱身的程序员终于可以有时间再进入另一个坑了. 我今天要给大家分享的内容是我在实际 ...
web前端技术合集
视频课程包含: 微服务精品课程包含:Ajax和Jquery基础入门视频.ajax教程.css视频教程.JQuery视频教程.MUI快速混合APP开发-视频.vuejs教程.极客学院HTML5全套教程. ...
Tensorflow currently has no official prebuild for your CUDA, cuDNN combination.
INFO CUDA version: 10. ERROR cuDNN not found. See https://github.com/deepfakes/faceswap/blob/master/ ...
《Forward团队-爬虫豆瓣top250项目-代码设计规范》
成员:马壮,李志宇,刘子轩,年光宇,邢云淇,张良 1.缩进采用一个Tab键 2.大括号:如: if (条件){ 语句: } 3.分行:不把多条语句放在同一行 4.变量命名:统一用英文 5.注释:注释前 ...
CDialog类
CDilalog包含三个关键函数:OnInitDialog.OnOK和OnCancel,可以覆盖这三个函数初始化对话框.响应点击OK和Cancel按钮.尽管每个函数都响应一条对话框消息,但是不需要你提 ...
Useful Field of View (UFOV)
IE8不支持canvas,使用excanvas.js,js代码需要放在window.onload=function(){...}内,$(docuemnt).ready(function(){...}) ...

推荐算法之 slope one 算法

推荐算法之 slope one 算法的更多相关文章

随机推荐

热门专题