基于Spark的电影推荐系统(电影网站)
第一部分-电影网站:
软件架构: SpringBoot+Mybatis+JSP
项目描述:主要实现电影网站的展现 和 用户的所有动作的地方
技术选型:
| 技术 | 名称 | 官网 |
|---|---|---|
| Spring Boot | 容器 | https://projects.spring.io/spring-boot/ |
| Spring MVC | MVC框架 | http://docs.spring.io/spring/docs/current/spring-framework-reference/htmlsingle/#mvc |
| MyBatis | ORM框架 | http://www.mybatis.org/mybatis-3/zh/index.html |
| MyBatis Generator | 代码生成 | http://www.mybatis.org/generator/index.html |
| PageHelper | MyBatis物理分页插件 | http://git.oschina.net/free/Mybatis_PageHelper |
| Druid | 数据库连接池 | https://github.com/alibaba/druid |
| Redis (后期) | 分布式缓存数据库 | https://redis.io/ |
| Elasticsearch(后期) | 分布式全文搜索引擎 | http://lucene.apache.org/solr/ https://www.elastic.co/ |
| Logback | 日志组件 | https://logback.qos.ch/ |
| Swagger2 | 接口测试框架 | http://swagger.io/ |
| Maven | 项目构建管理 | http://maven.apache.org/ |
主要开发工具:
- MySql: 数据库
- Tomcat: 应用服务器
- Git: 版本管理
- IntelliJ IDEA: 开发IDE
开发环境
- JDK 1.8+
- Maven 3.3.9
- Mysql 5.7.20+
- Lombok , 需要开发环境(IDEA或eclipse)支持
项目架构
项目流程图
数据表设计
ps:推荐指的是spark推荐模型进行处理的表
- alstab 个人用户的推荐强度表 推荐 ps:用户登陆后,选取用户id关联的电影id 进行电影推荐
- similartab 相似的电影 推荐*
- topdefaultmovies 默认电影
- rectab 用户评价的时候将相似的电影写入此表
- browse 1. 新用户注册时喜欢的电影 2. 点击喜欢按钮的电影
- review 评价过的电影
所有数据表
admin 管理员表
id name password role
role 0代表超级管理员,1代表普通
alstab 强度表===推荐系统得到
userid movieid rating(评分)
browse 浏览表
id userid movieids browsetime (浏览时间)
category 电影类型
id category
movie 电影详情 50581条数据
movieid
moviename 电影名称
showyear上映时间
nation 国家
director 导演
leadactors 主演
screenwriter 编剧
picture 电影海报
averating 平均评分
numrating 多少人看过
description 描述
typelist 电影类型
backpost 电影背景图片
moviecategory 电影所属类型 88870条数据
id
movieid
categoryid
rectab
userid
movieids
review 用户对电影的评分,和评价
id
userid
movieid
content
star
reviewtime
similartab 类似度 68908条数据
itemid1
itemid2
similar
topdefaultmovies 默认的top
id
movieid
moviename
user 用户表
userid
username
password
email
registertime
lastlogintime
用户流程分析
步骤1:
开始直接从topdefaultmovies表中取出前五部电影
- 使用top表的movieid去关联查询movie表的数据
步骤2:
登录:
- 从ALS强度表中查询推荐强度8以上的电影
(这个是每个用户来说的,也就是说,带上userid去查询的强度表的)
更多文章:基于Spark的电影推荐系统:https://blog.csdn.net/liuge36/column/info/29285
基于Spark的电影推荐系统(电影网站)的更多相关文章
- 基于Spark的电影推荐系统(实战简介)
写在前面 一直不知道这个专栏该如何开始写,思来想去,还是暂时把自己对这个项目的一些想法 和大家分享 的形式来展现.有什么问题,欢迎大家一起留言讨论. 这个项目的源代码是在https://github. ...
- 基于Spark Mllib,SparkSQL的电影推荐系统
本文测试的Spark版本是1.3.1 本文将在Spark集群上搭建一个简单的小型的电影推荐系统,以为之后的完整项目做铺垫和知识积累 整个系统的工作流程描述如下: 1.某电影网站拥有可观的电影资源和用户 ...
- 基于Spark的电影推荐系统(推荐系统~2)
第四部分-推荐系统-数据ETL 本模块完成数据清洗,并将清洗后的数据load到Hive数据表里面去 前置准备: spark +hive vim $SPARK_HOME/conf/hive-site.x ...
- 基于Spark的电影推荐系统(推荐系统~4)
第四部分-推荐系统-模型训练 本模块基于第3节 数据加工得到的训练集和测试集数据 做模型训练,最后得到一系列的模型,进而做 预测. 训练多个模型,取其中最好,即取RMSE(均方根误差)值最小的模型 说 ...
- 基于Spark的电影推荐系统(推荐系统~7)
基于Spark的电影推荐系统(推荐系统~7) 22/100 发布文章 liuge36 第四部分-推荐系统-实时推荐 本模块基于第4节得到的模型,开始为用户做实时推荐,推荐用户最有可能喜爱的5部电影. ...
- 基于Spark的电影推荐系统(推荐系统~1)
第四部分-推荐系统-项目介绍 行业背景: 快速:Apache Spark以内存计算为核心 通用 :一站式解决各个问题,ADHOC SQL查询,流计算,数据挖掘,图计算 完整的生态圈 只要掌握Spark ...
- 基于Mahout的电影推荐系统
基于Mahout的电影推荐系统 1.Mahout 简介 Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域 ...
- 基于pytorch的电影推荐系统
本文介绍一个基于pytorch的电影推荐系统. 代码移植自https://github.com/chengstone/movie_recommender. 原作者用了tf1.0实现了这个基于movie ...
- 基于卷积神经网络CNN的电影推荐系统
本项目使用文本卷积神经网络,并使用MovieLens数据集完成电影推荐的任务. 推荐系统在日常的网络应用中无处不在,比如网上购物.网上买书.新闻app.社交网络.音乐网站.电影网站等等等等,有人的地方 ...
随机推荐
- junit单元测试框架
一般我们写代码总想对方法测试一下结果,就存在这些问题: 1.如果方法需要测试,都需要在main方法上调用 2.目前的结果都需要我们人工对比 所以就需要用到 junit 进行测试: 1·下载 junit ...
- JAVA 获取时间段内的每一天
public class day { public static void main(String[] args) { // TODO Auto-generated method stub Strin ...
- unity之初级必备知识
C#中有两种常见类型:值类型,引用类型.值类型存放在内存中栈里,引用类型在内存中栈里存放引用,实际存放在内存中的堆里.值类型继承自System.ValueType.System.ValueType继承 ...
- SPOJ - VFMUL - Very Fast Multiplication FFT加速高精度乘法
SPOJ - VFMUL:https://vjudge.net/problem/SPOJ-VFMUL 这是一道FFT求高精度的模板题. 参考:https://www.cnblogs.com/Rabbi ...
- Codeforces 729C Road to Cinema(二分)
题目链接 http://codeforces.com/problemset/problem/729/C 题意:n个价格c[i],油量v[i]的汽车,求最便宜的一辆使得能在t时间内到达s,路途中有k个位 ...
- hdu 3966 Aragorn's Story(树链剖分+区间修改+单点查询)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=3966 题意:给一棵树,并给定各个点权的值,然后有3种操作: I C1 C2 K: 把C1与C2的路径上 ...
- POJ 2230 Watchcow 欧拉图
Watchcow Time Limit: 3000MS Memory Limit: 65536K Total Submissions: 8800 Accepted: 3832 Specia ...
- 简单粗暴详细讲解javascript实现函数柯里化
函数柯里化(黑人问号脸)???Currying(黑人问号脸)???妥妥的中式翻译既视感:下面来一起看看究竟什么是函数柯里化: 维基百科的解释是:把接收多个参数的函数变换成接收一个单一参数(最初函数的第 ...
- 虚IP解决AlWaysON读库服务器过保替换
公司核心交易数据库,使用SQL 2012 AlWaysON的1主4从,有2台(8.14,8.15)从库服务器,已经使用3年多,过保替换,新买的2台服务器已经安装好,一开始方案如下: 服务器(8.14) ...
- 【Offer】[29] 【顺时针打印矩阵】
题目描述 思路分析 测试用例 Java代码 代码链接 题目描述 输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个数字. 例如,如果输入如下矩阵:  则依次打印出数字1,2,3,4,8,12, ...