A histogram is an accurate representation of the distribution of numerical data. Y axis is the occurances, X axis is the % of daily return. There are three things can meature histogram 1. Standard deviation 2. Mean 3. Kurtosis : In probability theory…
Sploe = 2: means that SPY move up 1, ABC move up 2 Correlation: how close those dots close to the line. def scatter(df): plot_data(df, title="Data frame", yLabel="Time") plt.show() dr = compute_daily_return(df) plot_data(dr, title=&quo…
<Python for Data Analysis>一书由Wes Mckinney所著,中文译名是<利用Python进行数据分析>.这里记录一下学习过程,其中有些方法和书中不同,是按自己比较熟悉的方式实现的. 第三个实例:US Baby Names 1880-2010 简介: 美国社会保障总署(SSA)提供了一份从1880年到2010年的婴儿姓名频率的数据 数据地址: https://github.com/wesm/pydata-book/tree/2nd-edition/data…
# -*- coding:utf-8 -*-# <python for data analysis>第九章# 数据聚合与分组运算import pandas as pdimport numpy as npimport time # 分组运算过程 -> split-apply-combine# 拆分 应用 合并start = time.time()np.random.seed(10)# 1.GroupBy技术# 1.1.引文df = pd.DataFrame({ 'key1': ['a',…
<Python for Data Analysis>一书由Wes Mckinney所著,中文译名是<利用Python进行数据分析>.这里记录一下学习过程,其中有些方法和书中不同,是按自己比较熟悉的方式实现的. 第四个实例:USDA Food Database 简介:美国农业部(USDA)制作了一份有关食物营养信息的数据 数据下载地址: https://github.com/wesm/pydata-book/tree/2nd-edition/datasets/usda_food 准备…
<Python for Data Analysis>一书由Wes Mckinney所著,中文译名是<利用Python进行数据分析>.这里记录一下学习过程,其中有些方法和书中不同,是按自己比较熟悉的方式实现的. 第二个实例:MovieLens 1M Data Set 简介: GroupLens Research提供了从MovieLens用户那里收集来的一系列对90年代电影评分的数据 数据地址:http://files.grouplens.org/datasets/movielens/…
<Python for Data Analysis>一书由Wes Mckinney所著,中文译名是<利用Python进行数据分析>.这里记录一下学习过程,其中有些方法和书中不同,是按自己比较熟悉的方式实现的. 第一个实例:1.usa.gov data from bit.ly 简介:2011年,URL缩短服务bit.ly和美国政府网站usa.gov合作,提供了一份从生成.gov或.mil短链接用户那里收集来的匿名数据 数据下载地址:https://github.com/wesm/py…
< python for data analysis >一书的第十章例程, 主要介绍时间序列(time series)数据的处理.label:1. datetime object.timestamp object.period object2. pandas的Series和DataFrame object的两种特殊索引:DatetimeIndex 和 PeriodIndex3. 时区的表达与处理4. imestamp object.period object的频率概念,及其频率转换5. 两种频…
<利用Python进行数据分析>第七章的代码. # -*- coding:utf-8 -*-# <python for data analysis>第七章, 数据规整化 import pandas as pdimport numpy as npimport time start = time.time()# 1.合并数据集,有merge.join.concat三种方式# 1.1.数据库风格的dataframe合并(merge & join)# merge函数将两个dataf…
<利用python进行数据分析>一书的第五章源码与读书笔记 直接上代码 # -*- coding:utf-8 -*-# <python for data analysis>第五章, pandas基础# 高级数据结构与操作工具 import pandas as pdimport numpy as npimport time start = time.time()# pandas的数据结构, series and dataframe# 1.series,类似一维数据, 一个字典,建立了…