A histogram is an accurate representation of the distribution of numerical data. Y axis is the occurances, X axis is the % of daily return. There are three things can meature histogram 1. Standard deviation 2. Mean 3. Kurtosis : In probability theory…
Sploe = 2: means that SPY move up 1, ABC move up 2 Correlation: how close those dots close to the line. def scatter(df): plot_data(df, title="Data frame", yLabel="Time") plt.show() dr = compute_daily_return(df) plot_data(dr, title=&quo…
<Python for Data Analysis>一书由Wes Mckinney所著,中文译名是<利用Python进行数据分析>.这里记录一下学习过程,其中有些方法和书中不同,是按自己比较熟悉的方式实现的. 第二个实例:MovieLens 1M Data Set 简介: GroupLens Research提供了从MovieLens用户那里收集来的一系列对90年代电影评分的数据 数据地址:http://files.grouplens.org/datasets/movielens/…
<Python for Data Analysis>一书由Wes Mckinney所著,中文译名是<利用Python进行数据分析>.这里记录一下学习过程,其中有些方法和书中不同,是按自己比较熟悉的方式实现的. 第一个实例:1.usa.gov data from bit.ly 简介:2011年,URL缩短服务bit.ly和美国政府网站usa.gov合作,提供了一份从生成.gov或.mil短链接用户那里收集来的匿名数据 数据下载地址:https://github.com/wesm/py…
<利用python进行数据分析>一书的第五章源码与读书笔记 直接上代码 # -*- coding:utf-8 -*-# <python for data analysis>第五章, pandas基础# 高级数据结构与操作工具 import pandas as pdimport numpy as npimport time start = time.time()# pandas的数据结构, series and dataframe# 1.series,类似一维数据, 一个字典,建立了…