java和python实现一个加权SlopeOne推荐算法

一.加权SlopeOne算法公式：

(1).求得所有item之间的评分偏差

上式中分子部分为项目j与项目i的偏差和，分母部分为所有同时对项目j与项目i评分的用户数

(2).加权预测评分

项目j与项目i

上式中表示用户u对项目j的评分预测，分子为项目j对项目i的偏差加上用户对项目i的评分，cji表示同时对项目j与项目i评分的用户数

二.python实现

 #!/usr/bin/python

 # -*- coding: utf-8 -*-

 user_data = {"小明": {"张学友": 4, "周杰伦": 3, "刘德华": 4},

           "小海": {"张学友": 5, "周杰伦": 2},

           "李梅": {"周杰伦": 3.5, "刘德华": 4},

           "李磊": {"张学友": 5, "刘德华": 3}}

 class recommender:

     def __init__(self,data):

         self.frequency={}

         self.deviation={}

         self.data=data

     #计算所有item之间评分偏差

     def computeDeviation(self):

         for ratings in self.data.values():

             for item,rating in ratings.items():

                 self.frequency.setdefault(item,{})

                 self.deviation.setdefault(item,{})

                 for item2,rating2 in ratings.items():

                     if item!=item2:

                         self.frequency[item].setdefault(item2,0)

                         self.deviation[item].setdefault(item2,0.0)

                         self.frequency[item][item2]+=1#两个项目的用户数

                         self.deviation[item][item2]+=(rating-rating2)#累加两个评分差值

         for item,ratings in self.deviation.items():

             for item2 in ratings:

                 ratings[item2]/=self.frequency[item][item2]

     #评分预测

     def predictRating(self,userRatings,k):

         recommendations={}

         frequencies={}

         for item,rating in userRatings.items():

             for diffItem,diffRating in self.deviation.items():

                 if diffItem not in userRatings and item in self.deviation[diffItem]:

                     fre=self.frequency[diffItem][item]

                     recommendations.setdefault(diffItem,0.0)

                     frequencies.setdefault(diffItem,0)

                     #分子部分

                     recommendations[diffItem]+=(diffRating[item]+rating)*fre

                     #分母部分

                     frequencies[diffItem]+=fre

         recommendations=[(k,v/frequencies[k]) for (k,v) in recommendations.items()]

         #排序返回前k个

         recommendations.sort(key=lambda a_tuple:a_tuple[1],reverse=True)

         return recommendations[:k]

 if __name__=='__main__':

     r=recommender(user_data)

     r.computeDeviation()

     u=user_data['李磊']

     print(r.predictRating(u,5))

三.java实现

 import java.util.HashMap;

 import java.util.Map;

 import java.util.List;

 import java.util.ArrayList;

 import java.util.Comparator;

 import java.util.Collections;

 /**

  * Created by  on 2016/12/8.ShiYan

  * 一.计算所有物品对的偏差

  * 二.利用偏差进行预测

  */

 public class SlopeOne {

     Map<String,Map<String,Integer>> frequency=null;

     Map<String,Map<String,Double>> deviation=null;

     Map<String,Map<String,Integer>> user_rating=null;

     public SlopeOne( Map<String,Map<String,Integer>> user_rating){

         frequency=new HashMap<String,Map<String,Integer>>();

         deviation=new HashMap<String,Map<String,Double>>();

         this.user_rating=user_rating;

     }

     /**

      * 所有有item间的评分偏差

      */

     public void computeDeviation(){

         for(Map.Entry<String,Map<String,Integer>> ratingsEntry:user_rating.entrySet()){

             for(Map.Entry<String,Integer> ratingEntry:ratingsEntry.getValue().entrySet()){

                 String item=ratingEntry.getKey();

                 int rating=ratingEntry.getValue();

                 Map<String,Integer> itemFrequency=null;

                 if(!frequency.containsKey(item)){

                     itemFrequency=new HashMap<String, Integer>();

                     frequency.put(item,itemFrequency);

                 }else{

                     itemFrequency=frequency.get(item);

                 }

                 Map<String,Double> itemDeviation=null;

                 if(!deviation.containsKey(item)){

                     itemDeviation=new HashMap<String, Double>();

                     deviation.put(item,itemDeviation);

                 }else{

                     itemDeviation=deviation.get(item);

                 }

                 for(Map.Entry<String,Integer> ratingEntry2:ratingsEntry.getValue().entrySet()){

                     String item2=ratingEntry2.getKey();

                     int rating2=ratingEntry2.getValue();

                     if(!item.equals(item2)){

                         //两个项目的用户数

                         itemFrequency.put(item2,itemFrequency.containsKey(item2)?itemFrequency.get(item2)+1:0);

                         //两个项目的评分偏差，累加

                         itemDeviation.put(item2,itemDeviation.containsKey(item2)?itemDeviation.get(item2)+(rating-rating2):0.0);

                     }

                 }

             }

         }

         for(Map.Entry<String,Map<String,Double>> itemsDeviation:deviation.entrySet()){

             String item=itemsDeviation.getKey();

             Map<String,Double> itemDev=itemsDeviation.getValue();

             Map<String,Integer> itemFre=frequency.get(item);

             for(String itemName:itemDev.keySet()){

                 itemDev.put(itemName,itemDev.get(itemName)/itemFre.get(itemName));

             }

         }

     }

     /**

      * 评分预测

      * @param userRating 目标用户的评分

      * @param k 返回前k个

      * @return

      */

     public  List<Map.Entry<String,Double>> predictRating(Map<String,Integer> userRating,int k){

         Map<String,Double> recommendations=new HashMap<String,Double>();

         Map<String,Integer> frequencies=new HashMap<String, Integer>();

         for(Map.Entry<String,Integer> userEntry:userRating.entrySet()){

             String userItem=userEntry.getKey();

             double rating=userEntry.getValue();

             for(Map.Entry<String,Map<String,Double>> deviationEntry:deviation.entrySet()){

                 String item=deviationEntry.getKey();

                 Map<String,Double> itemDeviation=deviationEntry.getValue();

                 Map<String,Integer> itemFrequency=frequency.get(item);

                 if(!userRating.containsKey(item) && itemDeviation.containsKey(userItem)){

                     int fre=itemFrequency.get(userItem);

                     if(!recommendations.containsKey(item))

                         recommendations.put(item,0.0);

                     if(!frequencies.containsKey(item))

                         frequencies.put(item,0);

                     //分子部分

                     recommendations.put(item,recommendations.get(item)+(itemDeviation.get(userItem)+rating)*fre);

                     //分母部分

                     frequencies.put(item,frequencies.get(item)+fre);

                 }

             }

         }

         for(Map.Entry<String,Double> recoEntry:recommendations.entrySet()){

             String key=recoEntry.getKey();

             double value=recoEntry.getValue()/frequencies.get(key);

             recommendations.put(key,value);

         }

         //排序，这里还可以使用优先队列返回top_k

         List<Map.Entry<String,Double>> list_map=new ArrayList<Map.Entry<String,Double>>(recommendations.entrySet());

         Collections.sort(list_map,new Comparator<Map.Entry<String,Double>>(){

                     @Override

                     public int compare(Map.Entry<String, Double> o1, Map.Entry<String, Double> o2) {

                         if(o2.getValue()>o1.getValue())

                             return 1;

                         else if(o2.getValue()<o1.getValue())

                             return -1;

                         else

                             return 0;

                     }

                 }

         );

         List<Map.Entry<String,Double>> top_k=new ArrayList<Map.Entry<String, Double>>();

         if(list_map.size()<k) k=list_map.size();

         for(int i=0;i<k;i++){

             top_k.add(list_map.get(i));

         }

         return top_k;

     }

     public static void main(String[] args){

         Map<String,Map<String,Integer>> userRatings=new HashMap<String, Map<String, Integer>>();

         Map<String,Integer> xiMingRating=new HashMap<String, Integer>();

         xiMingRating.put("张学友",4);

         xiMingRating.put("周杰伦",3);

         xiMingRating.put("刘德华",4);

         Map<String,Integer> xiHaiRating=new HashMap<String, Integer>();

         xiHaiRating.put("张学友",5);

         xiHaiRating.put("周杰伦",2);

         Map<String,Integer> liMeiRating=new HashMap<String, Integer>();

         liMeiRating.put("周杰伦",3);

         liMeiRating.put( "刘德华",4);

         Map<String,Integer> liLeiRating=new HashMap<String, Integer>();

         liLeiRating.put("张学友",5);

         liLeiRating.put("刘德华",3);

         userRatings.put("xiMing",xiMingRating);

         userRatings.put("xiHai",xiHaiRating);

         userRatings.put("liMei", liMeiRating);

         userRatings.put("liLei",liLeiRating);

         SlopeOne slopOne=new SlopeOne(userRatings);

         slopOne.computeDeviation();

         List<Map.Entry<String,Double>> top_k=slopOne.predictRating(userRatings.get("liLei"),5);

         for(Map.Entry<String,Double> item:top_k){

             System.out.println(item.getKey()+"   "+item.getValue());

         }

     }

 }

java和python实现一个加权SlopeOne推荐算法的更多相关文章

SlopeOne推荐算法
Slope One 算法是一种基于评分的预测算法, 本质上也是一种基于项目的算法.与一般的基于项目的算法不同, 该算法不计算项目之间的相似度, 而是用一种简单的线性回归模型进行预测(可 ...
从分类,排序,top-k多个方面对推荐算法稳定性的评价
介绍论文名: "classification, ranking, and top-k stability of recommendation algorithms". 本文讲述比 ...
一起学Hadoop——使用IDEA编写第一个MapReduce程序(Java和Python)
上一篇我们学习了MapReduce的原理,今天我们使用代码来加深对MapReduce原理的理解. wordcount是Hadoop入门的经典例子,我们也不能免俗,也使用这个例子作为学习Hadoop的第 ...
黑马基础阶段测试题：创建一个存储字符串的集合list，向list中添加以下字符串：”C++”、”Java”、” Python”、”大数据与云计算”。遍历集合，将长度小于5的字符串从集合中删除，删除成功后，打印集合中的所有元素
package com.swift; import java.util.ArrayList; import java.util.List; import java.util.ListIterator; ...
Python开发一个csv比较功能相关知识点汇总及demo
Python 2.7 csv.reader(csvfile, dialect='excel', **fmtparams)的一个坑:csvfile被csv.reader生成的iterator,在遍历每二 ...
算法：时间复杂度+二分查找法(Java/Go/Python)实现
导读曾几何时学好数据结构与算法是我们从事计算机相关工作的基本前提,然而现在很多程序员从事的工作都是在用高级程序设计语言(如Java)开发业务代码,久而久之,对于数据结构和算法就变得有些陌生了,由于长 ...
Java or Python？测试开发工程师如何选择合适的编程语言？
很多测试开发工程师尤其是刚入行的同学对编程语言和技术栈选择问题特别关注,毕竟掌握一门编程语言要花不少时间成本,也直接关系到未来的面试和就业(不同企业/项目对技术栈要求也不一样),根据自身情况做一个相对 ...
Java VS Python 应该先学哪个？
http://blog.segmentfault.com/hlcfan/1190000000361407 http://www.tuicool.com/articles/fqAzqi Java 和 P ...
6月份最新语言排行：Java，Python我更看好谁？
文章首发于终端研发部,转载,请标明原文链接今天的主题是:探讨一下6月份语言排行还有我的最新展望! 最近,编程语言排行榜前几天发布更新了,在最新的TIOBE编程语言排行榜中,Java依旧位居第一,但前 ...

随机推荐

最大矩阵覆盖权值--(静态连续最大子段 (线段树) )-HDU(6638)Snowy Smile
这题是杭电多校2019第六场的题目题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=6638 题意:给你平面上n个点,每个点都有权值(有负权),让你计算一 ...
python网络编程——使用UDP、TCP协议收发信息
UDP UDP是面向无连接的通讯协议,UDP数据包括目的端口号和源端口号信息,由于通讯不需要连接,所以可以实现广播发送. UDP传输数据时有大小限制,每个被传输的数据报必须限定在64KB之内. UDP ...
Hive 教程(二)-认知hive
在大数据领域,hive 的位置非常重要,排名前三的大数据工具为 spark.hive.kafka 什么是hive 在大数据领域有 3 种需求场景:传输.存储.计算: hive 是一个处理海量的结构化数 ...
linux增加swap大小
参考自:https://blog.csdn.net/ssrmygod/article/details/70157716 我在centos6.5上照着操作成功了首先查一下目前swap的大小: [root ...
最新省市区地区数据sql版本（2019年1月）
版本统计标准2017版来源 http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/ 建表 CREATE TABLE `area` ( `id` varc ...
redis 学习（14）-- HyperLogLog
HyperLogLog 什么是 HyperLogLog HyperLogLog 是基于 HyperLogLog 算法的一种数据结构,该算法可以在极小空间完成独立数量统计. 在本质上还是字符串类型. 重 ...
spring boot jpa criteria api是如何生成JPQL的
当我们使用entityManager.createQuery(query)时,我们发现entityManager的注入对象如下: 也就是它:org.springframework.orm.jpa.Lo ...
Oracle VM VirtualBox 安装 Centos7 并配置静态IP
新建虚拟电脑选择类型和版本设置内存大小现在创建虚拟硬盘选择VDI 硬盘足够就选择固定大小选择虚拟硬盘存储位置不要放在默认的C盘下,设置大小为30G 等待创建虚拟硬盘虚拟硬盘创建成果之后 ...
Python多线程异步任务队列
原文地址 python的多线程异步常用到queue和threading模块 #!/usr/bin/env python # -*- coding: UTF-8 -*- import logging i ...
复选框实现单选效果js/jq
方法一: <input type="checkbox" name="test" onclick="checkedThis(this);" ...

java和python实现一个加权SlopeOne推荐算法

java和python实现一个加权SlopeOne推荐算法的更多相关文章

随机推荐

热门专题