掌握Spark机器学习库(课程目录)
第1章 初识机器学习
在本章中将带领大家概要了解什么是机器学习、机器学习在当前有哪些典型应用、机器学习的核心思想、常用的框架有哪些,该如何进行选型等相关问题。
- 1-1 导学
- 1-2 机器学习概述
- 1-3 机器学习核心思想
- 1-4 机器学习的框架与选型..
第2章 初识MLlib
本章中,将介绍Spark的机器学习库,对比Spark当前两种机器学习库(MLLib/ML)的区别,同时介绍Spark机器学习库的应用场景以及行业应用优势。
- 2-1 MLlib概述
- 2-2 MLlib的数据结构
- 2-3 MLlib与ml
- 2-4 MLlib的应用场景
第3章 实战环境搭建
本章中,将介绍如何进行实战环境搭建。包括如何完成Spark环境安装配置、如何通过Spark Shell进行编程,并通过 Wordcount 入门程序,完成部署和测试。
- 3-1 Spark环境安装
- 3-2 Spark配置若干要点
- 3-3 学习Spark shell
- 3-4 实战Wordcount
第4章 数据可视化
本章中,将对数据可视化进行介绍,告诉大家什么是数据可视化,我们通过数据可视化能对大数据系统起到怎样的作用,并结合 Echars 介绍了如何实现常见的数据可视化图表(折线图、柱状图、散点图)。
- 4-1 数据可视化的作用及常用方法
- 4-2 初识Echarts
- 4-3 通过Echarts实现图表化数据展示
第5章 Spark的矩阵与向量
本章中,将讲解矩阵与向量的一些基本运算,并介绍Spark的矩阵与向量的操作,帮助数据基础薄弱的同学补齐短板。
- 5-1 矩阵与向量介绍
- 5-2 Spark中实践向量的使用
- 5-3 Spark中实践矩阵的使用
第6章 Spark基础统计模块
本章中,将概要介绍Spark的基础统计模块、简单的统计学知识、相关系数以及假设检验的知识,拓展大家的技术视野。
- 6-1 基础统计模块及常用统计学知识介绍
- 6-2 实战统计汇总
- 6-3 学习相关系数
- 6-4 学习假设检验
第7章 Spark实现回归算法
本章中,将讲解几种常见的回归算法,并以预测房价模型为例,教大家如何使用回归算法来实现简单的预测。
- 7-1 回归分析概述
- 7-2 线性回归算法概述
- 7-3 线性回归算法原理
- 7-4 最小二乘法
- 7-5 随机梯度下降
- 7-6 实战Spark预测房价---项目展示及代码概览
- 7-7 实战Spark预测房价---数据加载及转换
- 7-8 实战Spark预测房价--训练与预测
- 7-9 逻辑回归算法及原理概述
- 7-10 正则化原理
- 7-11 实战Spark逻辑回归
- 7-12 保序回归算法概述
- 7-13 保序回归算法原理
- 7-14 实战一个保序回归数据分析
第8章 Spark实现分类算法
本章中,将几种常见的分类算法,并结合鸢尾花数据集为例,讲解分类算法在Spark上的实践。同时,比较各种分类算法的区别,使大家能够合理选择应该使用的算法。
- 8-1 朴素贝叶斯算法及原理概述
- 8-2 实战朴素贝叶斯的分类
- 8-3 支持向量机概述
- 8-4 实战基于SVM的分类
- 8-5 决策树算法及原理概述
- 8-6 实战基于决策树的分类--案例1
- 8-7 实战基于决策树的分类--案例2
- 8-8 本章小结
- 8-9 关于数据归一化的介绍
第9章 Spark实现聚类算法
本章中,将介绍聚类算法,并通过比较聚类算法与分类算法的区别,帮助大家了解聚类算法的内在含义。此处,仍然使用鸢尾花数据集应用聚类算法进行分析,便于大家对比发现聚类算法与分类算法的区别与联系,以便于后期灵活运用。...
- 9-1 Kmeans算法概述
- 9-2 Kmeans算法原理
- 9-3 Kmeans算法实战
- 9-4 LDA算法概述
- 9-5 LDA算法原理
- 9-6 LDA算法实践
- 9-7 本章小结
第10章 Spark实现降维
本章中,将通过讲解PCA算法的原理,使大家明白降维算法的大致原理,以及能够实现怎么样的功能。结合应用降维算法在分类算法使用之前进行预处理的实践,帮助大家体会算法的作用。
- 10-1 PCA算法及原理概述
- 10-2 实战PCA算法实现降维
- 10-3 本章小结
第11章 Spark实践文本情感分类
本章中,将结合前述知识进行综合实战,以达到所学即所用。文本情感分类这个项目会将分类算法、文本特征提取算法等进行关联,使大家能够对Spark的具体应用有一个整体的感知与了解。
- 11-1 项目总体概况
- 11-2 数据集概述
- 11-3 数据预处理
- 11-4 文本特征提取
- 11-5 训练分类模型
- 11-6 本章小结
第12章 Spark实践推荐系统
本章中,将结合前述知识进行综合实战,以达到所学即所用。在推荐系统项目中,讲解了推荐系统基本原理以及实现推荐系统的架构思路,有其他相关研发经验基础的同学可以结合以往的经验,实现自己的推荐系统。
掌握Spark机器学习库(课程目录)的更多相关文章
- Spark机器学习库(MLlib)官方指南手册中文版
中文https://blog.csdn.net/liulingyuan6/article/details/53582300 https://yq.aliyun.com/articles/608083 ...
- 掌握Spark机器学习库-07.6-线性回归实现房价预测
数据集 house.csv 数据概览 代码 package org.apache.spark.examples.examplesforml import org.apache.spark.ml.fea ...
- 掌握Spark机器学习库-09.6-LDA算法
数据集 iris.data 数据集概览 代码 package org.apache.spark.examples.examplesforml import org.apache.spark.ml.cl ...
- 掌握Spark机器学习库-09.3-kmeans算法实现分类
数据集 iris.data 数据集概览 代码 package org.apache.spark.examples.hust.hml.examplesforml import org.apache.s ...
- 掌握Spark机器学习库-08.7-决策树算法实现分类
数据集 iris.data 数据集概览 代码 package org.apache.spark.examples.examplesforml import org.apache.spark.Spark ...
- 掌握Spark机器学习库-08.2-朴素贝叶斯算法
数据集 iris.data 数据集概览 代码 import org.apache.spark.SparkConf import org.apache.spark.ml.classification.{ ...
- 掌握Spark机器学习库-07.14-保序回归算法实现房价预测
数据集 house.csv 数据集概览 代码 package org.apache.spark.examples.examplesforml import org.apache.spark.ml.cl ...
- 掌握Spark机器学习库-07-回归算法原理
1)机器学习模型理解 统计学习,神经网络 2)预测结果的衡量 代价函数(cost function).损失函数(loss function) 3)线性回归是监督学习
- 掌握Spark机器学习库-07-回归分析概述
1)回归与分类算法的区别 回归的预测结果是连续的,分类的预测结果是离散的. 2)spark实现的回归算法有: 3)通过相关系数衡量线性关系的程度
随机推荐
- [思考]我们应该怎样建设企业IT
从人员架构上来看,要不要企业自己的IT团队?如果要,应该有什么样的架构?运维,开发,管理,项目? 从是否外包角度看,要不要外包?如果外包,如何建立外包流程? 从业务角度看,企业IT的发展应该是围绕业务 ...
- [IT新应用]无线投影技术
会议室内投影时,经常会有笔记本与投影仪之间因兼容性等无法切换的现象. 了解了下,无线投影方案的厂家大致如下: 1.http://www.taco.net.cn/ 2.巴可无线投影 https://ww ...
- envoy
微服务意味着网络更加依赖于服务抽象边界. 随着相互依赖的服务数量日渐增长,系统100%没问题的时间会变少,整个系统经常有部分功能处于降级状态.
- DBENV->open
https://stuff.mit.edu/afs/sipb/project/sandbox/golem/db-3.0.55/docs/api_c/env_open.html #include < ...
- lua 与 c 的相互调用
Lua是一个嵌入式的语言,意味着Lua不仅可以是一个独立运行的程序包也可以是一个用来嵌入其他应用的程序库. Lua可以作为程序库用来扩展应用的功能,也就是Lua可以作为扩展性语言的原因所在.同时,Lu ...
- 12_传智播客iOS视频教程_注释和函数的定义和调用
OC的注释和C语言的注释一模一样.它也分单行注释和多行注释. OC程序里面当然可以定义一个函数.并且定义的方式方法和调用的方式方法和我们C语言是一模一样的.OC有什么好学的?一样还学个什么呢? 重点是 ...
- VS2010 AnkhSvn
有时候打开别的项目用的是 TFS等 造成 VS本来用的AnkhSvn失效了 .工具---选项----插件选择---
- [Swift]库函数atoi:将字符串内容转换为整数
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★➤微信公众号:山青咏芝(shanqingyongzhi)➤博客园地址:山青咏芝(https://www.cnblogs. ...
- Veeam对于新病毒防御的建议
Veeam对于新病毒防御的建议 前言 勒索软件GandCrab 上周末,在我们大家晒娃和欢度六一的时候.勒索软件分发平台 GandCrab 宣布将在一个月内关闭其RaaS(勒索软件即服务)业务平台.据 ...
- spring-retry简单demo(附完整代码)
重试 最近项目要用到重试.开始想自己写,后来想用RetryTemplate,最后想到既然项目用了springboot,还是直接集成spring-retry把. 代码 Application packa ...