"利用python进行数据分析"学习记录 --day01 08/02 与书相关的资料在 http://github.com/wesm/pydata-book pandas 的2名字来源是 pannel data 安装python的包 conda install package_name pip install package_name 更新python的包 conda update package_name pip install --upgraade package_name 我觉得…
-----15:18 2016/10/14----- 1. import numpy as np;import pandas as pd values = pd.Series(np.random.normal(0,1,size=2000)) #Series可看作一个定长的有序字典. 高斯分布对应的概率密度函数对应于numpy中: np.random.normal(loc=mu, scale=sigma, size=Non) 标准的正态分布(mu=0,sigma=1) np.random.norm…
解决方案: 读写文本格式的数据: pandas 提供了一些用于将表格型数据读取为DataFrame对象的函数 pandas 中的解析函数 函数的选项可以划分为以下几个大类 索引:将一个或多个列当做返回的DataFrame处理,以及是否从文件.用户获取列名 类型推断和数据转换:包括用户定义值的转换.缺失值标记列表等. 日期解析:包括组合功能,比如 将分散在多个列的日期信息组合成结果中的单个列 迭代:支持对大文件进行逐块迭代 不规整数据问题:跳过一些行.页脚.注释或其他一些不重要的东西 类型推断:…
写在前面的话: 实例中的所有数据都是在GitHub上下载的,打包下载即可. 地址是:http://github.com/pydata/pydata-book 还有一定要说明的: 我使用的是Python2.7,书中的代码有一些有错误,我使用自己的2.7版本调通. # coding: utf-8 from pandas import Series, DataFrame import pandas as pd import numpy as np df = pd.read_csv('D:\Source…
写在前面的话: 实例中的所有数据都是在GitHub上下载的,打包下载即可. 地址是:http://github.com/pydata/pydata-book 还有一定要说明的: 我使用的是Python2.7,书中的代码有一些有错误,我使用自己的2.7版本调通. # coding: utf-8 from pandas import Series, DataFrame import pandas as pd import numpy as np obj = Series([4,7,-9,7]) ob…
写在前面的话: 实例中的所有数据都是在GitHub上下载的,打包下载即可. 地址是:http://github.com/pydata/pydata-book 还有一定要说明的: 我使用的是Python2.7,书中的代码有一些有错误,我使用自己的2.7版本调通. # coding: utf-8 import numpy as np data1 = [6.,7.5,8.,0.,1.] arr1 = np.array(data1) arr1 data2 = [[1,2,3,4],[5,6,7,8]]…
写在前面的话: 实例中的所有数据都是在GitHub上下载的,打包下载即可. 地址是:http://github.com/pydata/pydata-book 还有一定要说明的: 我使用的是Python2.7,书中的代码有一些有错误,我使用自己的2.7版本调通. # coding: utf-8 import pandas as pd import numpy as np names1880 = pd.read_csv('D:\Source Code\pydata-book-master\ch02\…
写在前面的话: 实例中的所有数据都是在GitHub上下载的,打包下载即可. 地址是:http://github.com/pydata/pydata-book 还有一定要说明的: 我使用的是Python2.7,书中的代码有一些有错误,我使用自己的2.7版本调通. # coding: utf-8 import pandas as pd unames = ['user_id','gender','age','occupation','zip'] users = pd.read_table('D:\So…
写在前面的话: 实例中的所有数据都是在GitHub上下载的,打包下载即可. 地址是:http://github.com/pydata/pydata-book 还有一定要说明的: 我使用的是Python2.7,书中的代码有一些有错误,我使用自己的2.7版本调通. # coding: utf-8 import json path = 'D:\Source Code\pydata-book-master\ch02\usagov_bitly_data2012-03-16-1331923249.txt'…
[第三章]ipython C-a 到行首 C-e 到行尾 %timeit 测量语句时间,%time是一次,%timeit是多次. %pdb是自动调试的开关. %debug中,可以用b 12在第12行设置断点,n是执行当前行并进入下一行, set_trace和debug函数也比较好用. from IPython.core.debugger import Pdb 逐行分析函数性能:基于line_profiler的应用!在~/.ipython/profile_default/ipython_confi…