week_9(推荐系统)】的更多相关文章

Andrew Ng 机器学习笔记 ---By Orangestar Week_9(推荐系统) 1. Problem Formulation 这节就仅仅简单地介绍了一下 推荐系统的应用和实例.完全可以略.只需要清楚如何表示 评分还有未评分 2. Content Based Recommendations 上节课谈到的电影评分推荐机制是 由用户已评分过的电影来预测用户未评分过的电影 这节课我们来学习 "基于内容的推荐" 我们首先用x_1,x_2来表示一部电影是属于爱情电影还是动作电影的比率…
很多文章说到奇异值分解的时候总是大概罗列下它的功能,并没有对功能及物理意义进行过多的阐述,现在我来对奇异值进行整理一下. 一 奇异值分解 对任意的矩阵A∈Fmn,rank(A)=r(矩阵的秩),总可以取A的如下分解:,其中U和V是正交矩阵.分别为左右奇异值向量. U是m×m阶酉矩阵:Σ是m×n阶非负实数对角矩阵:而V*,即V的共轭转置,是n×n阶酉矩阵.这样的分解就称作M的奇异值分解.Σ对角线上的元素Σii即为M的奇异值. V的列(columns)组成一套对M的正交"输入"或"…
上回说到用F#来写爬虫,这只是F#学习第一阶段的第一步.最开始,就对第一阶段做了这样的安排: 1.爬虫爬取AV数据 2.数据处理和挖掘 3.数据可视化(使用ECharts) 4.推荐系统 第一步很快就搞完了,整个爬虫下载.解析和格式处理的代码,加起来几百行,爬了两个晚上.最终的数据是20G左右的图片和一份极简的data(大约50M).包含三万多女优信息,八万多AV信息,以及各种分类.出品商.导演什么的. 数据分析有一个很重要的点:不要为了分析而分析.所以,第二步和第三步简单玩下就过了. 重点是第…
1 集体智慧和协同过滤 1.1 什么是集体智慧(社会计算)? 集体智慧 (Collective Intelligence) 并不是 Web2.0 时代特有的,只是在 Web2.0 时代,大家在 Web 应用中利用集体智慧构建更加有趣的应用或者得到更好的用户体验.集体智慧是指在大量的人群的行为和数据中收集答案,帮助你对整个人群得到统计意义上的结论,这些结论是我们在单个个体上无法得到的,它往往是某种趋势或者人群中共性的部分. Wikipedia 和 Google 是两个典型的利用集体智慧的 Web…
总的来说,信息爆炸,产生了信息过载.解决的方法主要有两类:检索和推荐.检索是主动的有目的的.意图明确,推荐是非主动的.意图不明确. 推荐方面最经典的,就是协同过滤推荐了.我博客这里有两篇,一篇偏理论,一篇讲ALS实战. <协同过滤 CF & ALS 及在Spark上的实现> <协同过滤 & Spark机器学习实战> 其他的还有一些典型推荐的算法,如下: 典型推荐特征,如下: 典型推荐系统框架,如下:…
对于推荐系统的推出有两个条件:1.信息过载 ,2用户没有明确的需求 推荐系统算法中常见的有基于内容推荐,协同过滤推荐,协同过滤还可以分为基于人的协同过滤,基于内容协同过滤:社会推荐等 如何理解这些推荐呢. 举个例子,如果你需要看电影,问下你的朋友最近有什么电影好看的,或者在微博发个帖子问.这种推荐可以理解为社会推荐. 如果你觉得朋友A跟你看电影品味相似,问A喜欢看电影选择你没看过的电影进行观看,这种可以理解为基于朋友的协同过滤.如果 如果你看过周星驰的电影,都很喜欢周星驰电影,在豆瓣搜周星驰,选…
本文引自http://blog.csdn.net/fwing/article/details/4942886 现在的推荐系统特别火啊.做得最好的应该是Amazon了. 上面是Amazon的图书推荐. 用的就是著名的 协同过滤(Collaborative filtering)算法. 我们用一个简单的例子来说明. 下面是一个用户购买的书籍的表格. 计算机网络 算法导论 人工智能 数据库系统实现 概率统计 GRE 词汇手册 小明 1 0 1 0 1 0 小张 0 1 1 0 1 0 小李 1 1 0…
今天大部分时间都在写业务代码,然后算是从无到有的配置了下spring与mybatis的集成. SpringMVC+Mybatis Web开发流程 配置数据源 在applicationContext.xml中引入数据源的配置: <context:component-scan base-package="com.test" ></context:component-scan> <context:property-placeholder location=&qu…
原文链接:Netflix recommendations: beyond the 5 stars (Part 1), (Part 2) 原文作者:Xavier Amatriain and Justin Basilico 翻译:大魁 前言 Nexflix是一家提供在线视频流媒体服务和DVD租赁业务的公司,也是著名的Netflix大奖赛的发起者.如果读者希望进一步了解Netflix,建议读一下和讯上的一篇文章: Netflix:从传统DVD租赁向流媒体华丽转身 以及爱范儿上的: Netflix成功的…
1.推荐系统中的算法: 协同过滤: 基于用户 user-cf 基于内容 item –cf slop one 关联规则 (Apriori 算法,啤酒与尿布) 2.slope one 算法 slope one 算法是基于不同物品之间的评分差的线性算法,预测用户对物品评分的个性化算法.slope one 算法是由daniel 教授在2005年提出.主要分为2步 1. 计算物品之间评分差的平均值,记为物品间的评分偏差: 2.根据物品间的评分偏差和用户的历史评分,给用户生成预测评分高的推荐物品列表. 实例…