看<量化投资:以python为工具>这本书,第一部分是python的基础知识.这一部分略读了,只看我还不知道或不熟的. 定义复数 x = complex(2, 5) #2+5j 也可以直接定义 y = 3-6j 用id()可以得到变量的内存地址 python z = 3-6j print(id(y), id(z))python y和z的内存地址是一样的. 531269809744 531269809744 python可以为不可变对象分配固定的内存,减少内存占用. 当两个变量指向同一对象时,i…
年初学习量化投资,一开始想自己从头写,还是受了C/C++的影响.结果困在了计算回测数据那里,结果老也不对,就暂时放下了.最近试了一下python的各个量化投资框架,发现一个能用的——pyalgotrade,重新开始吧.这是一个事件驱动型量化交易框架. 使用pyalgotrade的一大问题是数据获取,其支持从yahoo,谷歌等途径获得数据,但要获取A股数据比较麻烦.还是用tushare获取数据比较方便.但pyalgotrade并不直接支持tushare数据格式.网上有人介绍了将tushare数据转…
北京理工大学在线课程: http://www.icourse163.org/course/BIT-1001872001 机器学习分类 监督学习 无监督学习 半监督学习 强化学习 深度学习 Scikit-learn算法分类 sklearn自带的标准数据集 sklearn的六大任务:分类.回归.聚类.降维.模型选择.数据预处理. 一.无监督学习:数据没有标签.最常用的是聚类和降维. 聚类:根据数据的相似性将数据分为多类的过程.使用样本的"距离"来估算样本的相似性,不同的距离计算方法有不同的…
聚类的实际应用,图像分割. 利用图像的特征将图像分割为多个不相重叠的区域. 常用的方法有阈值分割,边缘分割,直方图法,特定理论(基于聚类,小波分析等). 实例:利用k-means聚类算法对图像像素点颜色进行聚类以分割图像. 输出:同一聚类的点以相同颜色表示,不同聚类的像素点以不同的颜色表示. 用PIL库从图片中读取像素点的颜色,转化到[0,1]的范围内. f = open(filePath, "rb") data = [] img = image.open(f) m,n = img.s…
有监督学习 常用分类算法 KNN:K近邻分类器.通过计算待分类数据点,与已知数据中所有点的距离,取距离最小的前K个点,根据"少数服从多数"的原则,将这个数据点划分为出现次数最多的那个类别. 在sklearn中,使用sklearn.neighbors.KNeighborsClassifier创建K邻近分类器. 选取较大K值,可以减小误差,但可能导致预测错误.选取k值较小,易引起过拟合.一般倾向于选择较小的k值,并使用交叉验证法选取最优的k值. 决策树算法 是一种树形结构分类器,通过顺序询…
用分类算法进行上证指数涨跌预测. 根据今天以前的150个交易日的数据,预测今日股市涨跌. 交叉验证的思想:将数据集D划分为k个大小相似的互斥子集,每个子集都尽可能保持数据分布的一致性,即从D中通过分层抽样来得到.然后,每次用k-1个子集的并集作为训练集,余下的那个子集作为测试集.这样可以获得k组训练/测试集,从而可进行k次训练/测试,最终返回的是这k个测试结果的均值.通常称为"k者交叉验证",常用取值是10. coding:utf-8 用分类算法预测股市涨跌 import pandas…
岭回归 解决某些训练样本线性相关,导致回归结果不稳定的情况. 它是一种用于共线性数据分析的有偏估计回归方法.是一种改良的最小二乘估计法. 在sklearn中使用sklearn.linear_model.Ridge进行. 课程的实例是交通流量预测,我找不到数据文件,从网上自己找个例子吧. 用波士顿房价预测做例子. 先加载数据并放到dataframe里. 用seaborn的pairplot画图看看. 真不错,又会一招.可以看到(最后一行或最后一列)有的属性与房价有明显的关系,而有的没有明显关系. 还…
用KNN算法来进行数字识别,还是用sklearn自带的digits数据集. coding:utf-8 KNN算法实现手写识别 from sklearn import neighbors from sklearn.datasets import load_digits from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report import matplo…
机器学习实战(Machine Learning in Action)学习笔记————07.使用Apriori算法进行关联分析 关键字:Apriori.关联规则挖掘.频繁项集作者:米仓山下时间:2018-11-2机器学习实战(Machine Learning in Action,@author: Peter Harrington)源码下载地址:https://www.manning.com/books/machine-learning-in-actiongit@github.com:pbharri…
Noah的学习笔记之Python篇: 1.装饰器 2.函数“可变长参数” 3.命令行解析 注:本文全原创,作者:Noah Zhang  (http://www.cnblogs.com/noahzn/) 在Python中,对命令行的解析方式不唯一,本文将介绍两种方法:一种是用sys.argv手动设置,另一种是用argparse模块. 一.sys.argv是什么 首先看一个例子: import sys print(len(sys.argv)) for arg in sys.argv: print(a…