python pandas dataframe 操作记录】的更多相关文章

从数据看select出数据后如何转换为dataframe df = DataFrame(cur.fetchall()) 如何更改列名,选取列,进行groupby操作 df.columns = ['member_id', 'poi', 'num'] df = df[['member_id','num']] grouped = df.groupby('member_id') df = grouped.aggregate(lambda x: sorted(list(x),reverse=True))…
1. 从字典创建Dataframe >>> import pandas as pd >>> dict1 = {'col1':[1,2,5,7],'col2':['a','b','c','d']} >>> df = pd.DataFrame(dict1) >>> df col1 col2 0 1 a 1 2 b 2 5 c 3 7 d 2. 从列表创建Dataframe (先把列表转化为字典,再把字典转化为DataFrame) >…
1. 从字典创建DataFrame >>> import pandas >>> dict_a = {'],'mark_date':['2017-03-07','2017-03-07','2017-03-07']} >>> df = pandas.DataFrame(dict_a) # 从字典创建DataFrame >>> df # 创建好的df列名默认按首字母顺序排序,和字典中的先后顺序并不一样,字典中是'user_id','book…
pandas.DataFrame class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)[source] Two-dimensional size-mutable, potentially heterogeneous tabular data structure with labeled axes (rows and columns). Arithmetic operations al…
今天遇到了一个问题,很是奇怪,自己也想了一个另类的方法将其解决了,现在将详细过程经过记录如下: 我在处理完一个dataframe之后,需要将其写回到数据库.这个dataframe比较大,共有53列,72609行,使用下述代码尝试将其写入mysql数据库. pd.io.sql.to_sql(df,'xxx',zh_con,flavor='mysql',if_exists='append',index=False) 然后就报错了,错误如下: Traceback (most recent call l…
dsoft2 = data1.loc[(data1['程'] == "轻") | (data1['程'] == "中")]设置x下标plt.xticks(np.arange(24)) 特定列 排序 print(data.sort_values(axis = 0,ascending = True,by = '停留时间')) plt.savefig(name+".jpg") #中文myfont = FontProperties(fname=r'C:\…
先手工生出一个数据框吧 import numpy as np import pandas as pd df = pd.DataFrame(np.arange(0,60,2).reshape(10,3),columns=list('abc')) df 是这样子滴 那么这三种选取数据的方式该怎么选择呢? 一.当每列已有column name时,用 df [ 'a' ] 就能选取出一整列数据.如果你知道column names 和index,且两者都很好输入,可以选择 .loc df.loc[0, '…
DataFrame的创建 >>> import pandas as pd >>> from pandas import DataFrame #define a dict >>> dic = {'Name':['Jeff','Lucy','Evan'],'Age':[28,26,27],'Sex':['Male','Female','Male']} Load the dict to the dataframe >>> df = Data…
1.使用append首先要注意的是,你要合并两个DataFrame的columns即列名是否是相同的,不相同的就会报错. 2.我们会发现DataFrame的列名是不能够重复的,而行名(index)是可以重复的. 3.DataFrame的append是按列拓展的,换句话说就是向下拓展. 主要参数: 1.ignore_index: 布尔值 如果是True,会将忽略原来DataFrame的index,重新排列index(0, 1, 2, 3, ...) 如果是False,会沿用原来DataFrame的…
refer to: http://www.cnblogs.com/harvey888/p/6006200.html…