Pandas 练习题】的更多相关文章

无论是数据分析还是机器学习,数据的预处理必不可少. 其中最常用.最基础的Python库非numpy和pandas莫属,很多初学者可能看了很多教程,但是很快就把用法忘光了. 光看不练假把式,今天向大家推荐三套感觉不错的练习题,感兴趣的同学可以练练手. 每套题都分四个Level的难度 Difficulty Level: L1 Q. Extract all odd numbers from arr Input: arr = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]…
1. 使用 pandas 中的函数,下载上证综指过去一段时间的数据,进行数据探索. 上证综指,全称是上海证券综合指数,是以上证所挂牌上市的全部股票为计算范围,以发行量为权数的加权综合股价指数.这一指数自1991年7月15日起开始实时发布,基日定为1990年12月19日,基日指数定为100点. 以上证综指等为核心的上证指数体系,科学表征上海证券市场层次丰富.行业广泛.品种拓展的市场结构和变化特征,便于市场参与者的多维度分析,增强样本企业知名度,引导市场资金的合理配置. 因为上综指包括全部上海证券交…
教你十分钟学会使用pandas. pandas是python数据分析的一个最重要的工具. 基本使用 # 一般以pd作为pandas的缩写 import pandas as pd # 读取文件 df = pd.read_csv('file.csv') # 返回数据的大小 df.shape # 显示数据的一些对象信息和内存使用 df.info() # 显示数据的统计量信息 df.describe() 花式索引 我们的主要数据结构就是DataFrame了,DataFrame有两部分构成,一个是列(co…
[导读] 本文由知名开源平台,AI技术平台以及领域专家:Datawhale,ApacheCN,AI有道和黄海广博士联合整理贡献,内容涵盖AI入门基础知识.数据分析挖掘.机器学习.深度学习.强化学习.前沿Paper和五大AI理论应用领域:自然语言处理,计算机视觉,推荐系统,风控模型和知识图谱.是你学习AI从入门到专家必备的学习路线和优质学习资源. 基础知识 1.数学 数学是学不完的,也没有几个人能像博士一样扎实地学好数学基础,入门人工智能领域,其实只需要掌握必要的基础知识就好.AI的数学基础最主要…
更多函数查阅http://pandas.pydata.org/pandas-docs/stable/10min.htmlimport pandas as pd#两种数据结构from pandas import Series,DataFrame #Series由一组数据和一组索引组成# obj=Series([2,3,5,7,3,1])# print(obj) #建立Series的时候指定索引# obj2=Series([1,2,3,4,5],index=['a','b','c','d','e']…
Pandas针对字符串配备的一套方法,使其易于对数组的每个元素(字符串)进行操作. 1.通过str访问,且自动排除丢失/ NA值 # 通过str访问,且自动排除丢失/ NA值 s = pd.Series([',np.nan,'hj']) df = pd.DataFrame({'key1':list('abcdef'), ',np.nan]}) print(s) print(df) print('-----') print(s.str.count('b')) #对字符b进行计数 print(df[…
Datatime 是 Python 中一种时间数据类型,对于不同时间格式之间的转换是比较方便的,而在 Pandas 中也同样支持 DataTime 数据机制,可以借助它实现许多有用的功能,例如 1,函数to_datetime() 将数据列表中的 Series 列转化为 datetime 类型, #Convert the type to datetime apple.Date = pd.to_datetime(apple.Date) apple['Date'].head() # 0 2014-07…
作者:耿远昊.Datawhale团队 寄语:Pandas 是基于Numpy的一种工具,是为了解决数据分析任务而创建的,其纳入了大量库和一些标准的数据模型,提供了大量能使我们快速便捷地处理数据的函数和方法. Datawhale又一开源项目来了!Joyful-Pandas(顾名思义:快乐学习Pandas)由Datawhale成员耿远昊发起,作者结合了三份经典教材的学习经验,历时2个多月时间,结合最新的Pandas版本,编写了这套关于Pandas的开源教程,梳理了Pandas的主线内容. 本项目从Pa…
今日内容概要 pandas补充知识(2) matplotlib补充知识 今日内容详细 pandas补充 数据汇总 # 数据透视表 pd.pivot_table(data,values-None,index=None,columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='All') data:指定需要构造透视表的数据集 values:指定需要拉入"数值"框的字段列表 inde…
今日内容概要 时间序列 针对表格数据的分组与聚合操作 其他函数补充(apply) 练习题(为了加深对DataFrame操作的印象) mataplotlib画图模块 今日内容详细 时间序列处理 时间序列类型 1.时间戳 2.具体日期 3.时间间隔 # 灵活处理时间对象dateutil包 import dateutil dateutil.parser.parse("2020 May 2nd") # 这中间的时间格式一定要是英文格式 运行结果: datetime.datetime(2020,…