DateFrame】的更多相关文章

Pandas中DateFrame修改列名 在做数据挖掘的时候,想改一个DataFrame的column名称,所以就查了一下,总结如下: 数据如下: >>>import pandas as pd >>>a = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]}) >>> a A B C 0 1 4 7 1 2 5 8 2 3 6 9 方法一:暴力方法 >>>a.columns = […
DateFrame 早期叫作SchemaRDD是存放Row 对象的RDD,每个Row 对象代表一行记录. SchemaRDD 还包含记录的结构信息(即数据字段).SchemaRDD 看起来和普通的RDD 很像, 但是在内部,SchemaRDD 可以利用结构信息更加高效地存储数据. 此外,SchemaRDD 还支持RDD 上所没有的一些新操作,比如运行SQL 查询.SchemaRDD 可以 从外部数据源创建,也可以从查询结果或普通RDD 中创建. spark dataframe 的几个关键点: 分…
Outline 前几天,数据清洗时有用到pandas去过滤大量数据中的“负值”: 把过滤出来的“负值”替换为“NaN”或者指定的值. 故做个小记录. 读取CSV文件 代码: import pandas as pd import numpy as np df = pd.read_csv('D:\All_Kinds_Stock_Data\windpy_filter_after\SH600036.csv') df # 开发环境: ipython notebook 下 读取本地csv文件,输出结果如下:…
数据分析04 /基于pandas的DateFrame进行股票分析.双均线策略制定 目录 数据分析04 /基于pandas的DateFrame进行股票分析.双均线策略制定 需求1:对茅台股票分析 需求2:双均线策略制定 需求1:对茅台股票分析 茅台股票分析 使用tushare包获取某股票的历史行情数据. tushare:财经数据接口包 pip install tushare 输出该股票所有收盘比开盘上涨3%以上的日期. 输出该股票所有开盘比前日收盘跌幅超过2%的日期. 假如我从2010年1月1日开…
for indexs in df.index: rowData = df.loc[indexs].values[0:7] rowData = rowData.tolist() #print(rowData) sheet1.append(rowData) #逐行写入excel的sheet1…
目的:有时需对数据进行到出到Excel,直观的给别人参阅,或从Excel中读取数据进行操作和分析依赖库 pandas 可简单的读出和写入 1,根据Excel读取( 需安装xlrd库) import numpy as np import pandas as pd pd.read_excel("test.xlsx",'sheet1') 2, 到出Excel文件(需安装openpyxl库) import numpy as np import pandas as pd df.to_excel(…
import numpy as npimport pandas as pd## x1=[1,2,3,4]# x2=[4,5,6,7]# x3=[7,8,9,10]# df=pd.DataFrame(# { 'x1':x1,# 'x2':x2,# 'x3':x3# }# )# print(df)# print(df['x1'])# print(type(df['x1']))#<class 'pandas.core.series.Series'>#不含列名# print(df['x1'].valu…
# XLS转CSV df = pd.read_excel(r'列表.xls') df2 = pd.DataFrame()df2 = df2.append(list(df['列名']), ignore_index=True) df2.dropna(inplace=True) print(df2)df2.to_csv(r'output.csv', index=False, header=False, encoding='UTF-8') # TXT转CSVdf = pd.read_csv(r'infi…
ar = np.array(list("ABCDEFG")) # array只是Convert,默认会copy源值.asarray也是Convert,如果源值是array则不copy.print(ar)ar = np.full((2,4), 3, np.int32) # 创建一个指定初始值的数组print(ar)zero_ar = np.zeros(10, np.int32) # 创建一个初始值为0的数组print(zero_ar) df = pd.DataFrame(np.arang…
float_df = pd.DataFrame((0.45*np.arange(1,9)).reshape(4,2), index=[1,2,3,4], columns=['col_one', 'col_two'], dtype=float)# print(float_df.round({'col_one': 2}))# print(float_df.round({'col_one': 1, 'col_two': 2}))# print(float_df.T) # 行列互换 转置for col…