Alexander的Python机器学习 之目录分析。
无聊,顺应一下潮流,学习一下python机器学习吧。
买了一本书,首先分析一下目录吧。
1.第一章是 Python机器学习的生态系统。
1.1.数据科学或机器学习的工作流程。
然后又分成6点进行详细说明:获取,检查和探索,清理和准备,建模,评估,部署。
1.2.讲解了Python库和相应的功能。
这里也分成5个点进行详细说明:获取,检查,准备,建模和评估,部署。
1.3.设置机器学习的环境。
1.4.最后来一个总结。
2.第二章就来一个案例吧,构建应用程序,来挖掘低价的公寓。
2.1.首先来获取公寓房源的数据吧。这里将使用import.io方法来抓取房源数据。
2.2.然后就是检查和准备数据呢。分为两个点,首先分析数据,然后就是可视化数据。
2.3.然后就是对数据进行建模。这里又分为两个点,首先是预测,然后就是扩展模型。
2.4.最后来一个总结吧。
3.第三章来一个机票的案例吧,同样来挖掘一下低价的机票。
3.1.首先肯定是要获取机票价格数据嘛。
3.2.这里是一个学习点:使用高级的网络爬虫技术来检索票价数据。
3.3.获取到数据之后就是解析了,这里通过聚类技术来识别一个异常的票价,也是一个学习点。
3.4.然后就是意义所在之处了,通过使用IFTTT来发送实时提醒,这个就可以为人民服务了吧。
3.5.学习了这些分散的知识点,通过这个项目简单整合一下吧。
3.6.最后来一个总结吧。这个总结性价比极高的哟。
4.来点厉害的,使用逻辑回归来预测IPO市场,IPO市场就类似炒股了。
4.1.首先介绍一下什么是IPO,这个不用说了,就是一些有商业头脑的人通过公众来投资公司攒大钱。
4.2.讲解特征工程,这个厉害了。
4.3.然后讲解二元分类,貌似很高大上呢。
4.4.分析一下特征的重要性,同样也是预测IPO市场的重要部分吧。
4.5.最后来个小结。
5.创建自定义的新闻源,这个我喜欢。
5.1.使用Pocket应用程序,来创建一个监督训练的集合。原来训练就是这个意思,之前公司老是听到那些牛人说什么训练训练的。
5.2.第二步就是获取到数据源了,这里使用embed.ly的API来下载故事的内容。
5.3.然后就是讲解自然语言的一些处理基础了,这个是个难点。
5.4.然后就是讲解如何使用向量机,这个同样非常关键,对于训练是非常有必要的。
5.5.然后就是讲解IFTTT与文章源,Google表达和电子邮件的集成,这里涉及的概念有点多。
5.6.然后就是根据自己爱好,设置每日个性化的简报,就是得出结果了吧。
5.7.最后来一个小结吧。
6.来点有意思的东西,预测你的内容是否会广为流传。这个意思就是你火了。
6.1.讲解了一个病毒的案例,说明它是怎么火的。
6.2.统计火的程度,即获取分享的数量和内容。
6.3.探索是怎么火起来的,即探索传播性的特征。
6.4.然后就是构建一个自己的内容的预测模型,看看会不会火。
6.5.最后来一个小结吧。
7.之前使用逻辑回归方法预测IPO市场,这里用机器学习来预测股票市场。
7.1.首先要针对分析的类型研究一下,股票市场会有很多不同的类型嘛。
7.2.然后就是我们能够从股票市场上学到一些东西,当然这是多方面的。
7.3.这里动真刀了,教你如何开发一个交易策略。
分为几个点吧,首先是延迟分析的周期,不然你分析完后时间已经过了,则得不偿失。
然后是使用支持向量回归,来构建一个模型。
最后来建模吧,再教你一个动态时间扭曲,这个名字nice啊。
7.4.最后来一个小结咯。
8.再来一个案例吧,建立一个图片相似度的引擎。
顾名思义,就是找到类似的图片。
8.1.首先当然要了解一下图像的机器学习了。
8.2.然后需要了解一下处理图像的知识。
8.3.基础了解之后,来学一下如何查找相似的图像吧,这个当然是核心内容了。
8.4.接下来就是了解深度学习了,这个应该就是深入学习图像之间的关系了。涉及到底层的操作。
8.5.然后当然就是展示成果的引擎了,构建一个图像相似度的一个系统。
8.6.最后来一个小结吧。
9.来一个聊天机器人吧。这个其实都耳熟能详了吧。
9.1.首先了解一下图灵测试吧。这个最基础的东西了。
9.2.然后就是了解一下聊天机器人历史和意义。
9.3.开始进行设计了,要怎么实现,用什么方法,现在开始想啦。
9.4.开始撸代码了,打造一个聊天机器人。
9.5.最后来一个小结吧。
10.最后同样来一个有实际意义的功能,推荐引擎。
现在大多新闻APP都基本实现按需分配了。
10.1.首先是了解一下什么是协同过滤,这里分了两种,一种基于用户,一种基于项目的过滤。
10.2.然后是了解一下什么是内容过滤,这个就是过滤的内在细节了。
10.3.讲解一下什么是混合系统,将一种复杂的东西按照用户的需求来进行筛选的一个系统。
10.4.开始撸代码了,打造一个推荐系统。
10.5.最后来一个小结。
11.最最后,来一个个人总结。
现在本人对Python和机器学习一窍不通。纯小白。
看完这本书后,不知道又是怎样的一个我。开始漫长的机器学习之路吧。我爱robot。
所以就第一章讲了一点基础,剩下的9章都是项目了,这样安排比较合理,我也很喜欢。
项目才是推动知识的发展的根本。
Alexander的Python机器学习 之目录分析。的更多相关文章
- Python机器学习中文版目录
建议Ctrl+D保存到收藏夹,方便随时查看 人工智能(AI)学习资料库 Python机器学习简介 第一章 让计算机从数据中学习 将数据转化为知识 三类机器学习算法 第二章 训练机器学习分类算法 透过人 ...
- 吴裕雄 python 机器学习——线性判断分析LinearDiscriminantAnalysis
import numpy as np import matplotlib.pyplot as plt from matplotlib import cm from mpl_toolkits.mplot ...
- 吴裕雄 python 机器学习——主成份分析PCA降维
# -*- coding: utf-8 -*- import numpy as np import matplotlib.pyplot as plt from sklearn import datas ...
- Python机器学习 (Python Machine Learning 中文版 PDF)
Python机器学习介绍(Python Machine Learning 中文版) 机器学习,如今最令人振奋的计算机领域之一.看看那些大公司,Google.Facebook.Apple.Amazon早 ...
- Python机器学习介绍(Python Machine Learning 中文版)
Python机器学习 机器学习,如今最令人振奋的计算机领域之一.看看那些大公司,Google.Facebook.Apple.Amazon早已展开了一场关于机器学习的军备竞赛.从手机上的语音助手.垃圾邮 ...
- Python机器学习:5.6 使用核PCA进行非线性映射
许多机器学习算法都有一个假设:输入数据要是线性可分的.感知机算法必须针对完全线性可分数据才能收敛.考虑到噪音,Adalien.逻辑斯蒂回归和SVM并不会要求数据完全线性可分. 但是现实生活中有大量的非 ...
- GitHub最著名的20个Python机器学习项目
GitHub最著名的20个Python机器学习项目 我们分析了GitHub上的前20名Python机器学习项目,发现scikit-Learn,PyLearn2和NuPic是贡献最积极的项目.让我们一起 ...
- python机器学习实战(一)
python机器学习实战(一) 版权声明:本文为博主原创文章,转载请指明转载地址 www.cnblogs.com/fydeblog/p/7140974.html 前言 这篇notebook是关于机器 ...
- python机器学习实战(三)
python机器学习实战(三) 版权声明:本文为博主原创文章,转载请指明转载地址 www.cnblogs.com/fydeblog/p/7277205.html 前言 这篇notebook是关于机器 ...
随机推荐
- xtrabackup在线迁移mysql并搭建为主主同步
一.背景 工作中有需求数据库需要迁移,但是不能停服,不能锁库锁表影响业务的正常运行,所以使用XtraBackup 二.环境: 操作系统:CentOS Linux release 7.4.1708 (C ...
- c# HttpWebRequest与HttpWebResponse
[转]c# HttpWebRequest与HttpWebResponse 绝技 如果你想做一些,抓取,或者是自动获取的功能,那么就跟我一起来学习一下Http请求吧. 本文章会对Http请求时的Get和 ...
- SqlParameter.Value = NULL 引发的数据库异常
摘自:http://www.cnblogs.com/ccweb/p/3403492.html using (SqlCommand cmd = new SqlCommand()) { cmd.Conne ...
- ZT sigprocmask,sigpending函数
sigprocmask,sigpending函数 分类: LINUX 2012-02-02 16:39 905人阅读 评论(0) 收藏 举报 signalredhatnulllinux [sigpro ...
- linux下如何用GDB调试c++程序
转:http://blog.csdn.net/wfdtxz/article/details/7368357 GDB 是GNU开源组织发布的一个强大的UNIX下的程序调试工具.或许,各位比较喜欢那种图形 ...
- HDU 5724 Chess(SG函数)
Chess Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others)Total Submi ...
- CPU与GPU区别大揭秘
http://blog.csdn.net/xiaolang85/article/details/51500340 有网友在网上提问:“为什么现在更多需要用的是 GPU 而不是 CPU,比如挖矿甚至破解 ...
- MyBatis(10)逆向工程
什么是逆向工程? 在学习的过程中会发现,需要我们写大量的sql语句 此时mybaatis官方为我们提供逆向工程可以针对单表自动生成的mybatis执行所需要的代码 使用方法: MyBat ...
- MyBatis动态sql语句归纳
1.删除数据(假删除)并修改时间 <!--根据id删除学生信息(多条)--> <update id="updateStuStatus" parameterType ...
- Spring(二十)之使用Log4j记录日志
日志记录,也是常用的,比如异常信息记录或者其他相关信息记录,良好的日志记录有助于当系统出现某些不是特别大的问题时,可及时通过日志信息,捕捉到异常,从而确定是那段代码的问题,避免影响其他的代码. 关于m ...