<利用python进行数据分析>第二章的姓名例子,代码.整个例子的所有代码集成到了一个文件中,导致有些对象名如year同时作为了列名与行名,会打印warning,可分不同的part依次运行.所有的作图代码均已注释,按需取消注释即可.用的工具.函数比较多,但是解释不多,后面各章再深入介绍.代码中仅保留了98年-08年的数据,更多数据-https://github.com/wesm/pydata-book # -*- coding:utf-8 -*-# names data set import…
<利用python进行数据分析>一书的第五章源码与读书笔记 直接上代码 # -*- coding:utf-8 -*-# <python for data analysis>第五章, pandas基础# 高级数据结构与操作工具 import pandas as pdimport numpy as npimport time start = time.time()# pandas的数据结构, series and dataframe# 1.series,类似一维数据, 一个字典,建立了…
<利用python进行数据分析>第四章的程序,介绍了numpy的基本使用方法.(第三章为Ipython的基本使用) 科学计算.常用函数.数组处理.线性代数运算.随机模块…… # -*- coding:utf-8 -*-# <python for data analysis>第四章, numpy基础# 数组与矢量计算import numpy as npimport time # 开始计时start = time.time() # 创建一个arraydata = np.array([[…
# -*- coding:utf-8 -*-# <python for data analysis>第九章# 数据聚合与分组运算import pandas as pdimport numpy as npimport time # 分组运算过程 -> split-apply-combine# 拆分 应用 合并start = time.time()np.random.seed(10)# 1.GroupBy技术# 1.1.引文df = pd.DataFrame({ 'key1': ['a',…
<利用Python进行数据分析>第七章的代码. # -*- coding:utf-8 -*-# <python for data analysis>第七章, 数据规整化 import pandas as pdimport numpy as npimport time start = time.time()# 1.合并数据集,有merge.join.concat三种方式# 1.1.数据库风格的dataframe合并(merge & join)# merge函数将两个dataf…
<Python for Data Analysis>一书由Wes Mckinney所著,中文译名是<利用Python进行数据分析>.这里记录一下学习过程,其中有些方法和书中不同,是按自己比较熟悉的方式实现的. 第三个实例:US Baby Names 1880-2010 简介: 美国社会保障总署(SSA)提供了一份从1880年到2010年的婴儿姓名频率的数据 数据地址: https://github.com/wesm/pydata-book/tree/2nd-edition/data…
<Python for Data Analysis>一书由Wes Mckinney所著,中文译名是<利用Python进行数据分析>.这里记录一下学习过程,其中有些方法和书中不同,是按自己比较熟悉的方式实现的. 第四个实例:USDA Food Database 简介:美国农业部(USDA)制作了一份有关食物营养信息的数据 数据下载地址: https://github.com/wesm/pydata-book/tree/2nd-edition/datasets/usda_food 准备…
<Python for Data Analysis>一书由Wes Mckinney所著,中文译名是<利用Python进行数据分析>.这里记录一下学习过程,其中有些方法和书中不同,是按自己比较熟悉的方式实现的. 第二个实例:MovieLens 1M Data Set 简介: GroupLens Research提供了从MovieLens用户那里收集来的一系列对90年代电影评分的数据 数据地址:http://files.grouplens.org/datasets/movielens/…
<Python for Data Analysis>一书由Wes Mckinney所著,中文译名是<利用Python进行数据分析>.这里记录一下学习过程,其中有些方法和书中不同,是按自己比较熟悉的方式实现的. 第一个实例:1.usa.gov data from bit.ly 简介:2011年,URL缩短服务bit.ly和美国政府网站usa.gov合作,提供了一份从生成.gov或.mil短链接用户那里收集来的匿名数据 数据下载地址:https://github.com/wesm/py…
一.简介 Python for Data Analysis这本书的特点是将numpy和pandas这两个工具介绍的很详细,这两个工具是使用Python做数据分析非常重要的一环,numpy主要是做矩阵的运算,pandas主要是做数据的预处理,另外本书还教了其他数据分析相关的工具,比如matplotlib用来作图,iPython用来测试.调试代码.本书着重在工具介绍,所以在阅读前最好要对数据分析的理论有一定的了解. 二.Jupyter和Python的介绍 Jupyter是结合代码输入.运行到结果显示…