今天遇到了一个问题,很是奇怪,自己也想了一个另类的方法将其解决了,现在将详细过程经过记录如下: 我在处理完一个dataframe之后,需要将其写回到数据库.这个dataframe比较大,共有53列,72609行,使用下述代码尝试将其写入mysql数据库. pd.io.sql.to_sql(df,'xxx',zh_con,flavor='mysql',if_exists='append',index=False) 然后就报错了,错误如下: Traceback (most recent call l…
业务团队近期提出一个需求: 希望在接口调用之前先批量插入Excel中的数据作为数据预置 这个需求以前已经开发完成 本来以为可以很快调试完毕 没成想遭遇一个难关 DataFrame.to_sql方法在执行过程中报ORA-01861 文字与字符串不匹配(着急解决问题,并没有来得及截图) 搞了一个下午+睡前一小时+今天上午一小时 终于弄清楚原因 业务方提供的数据格式不正确 看起来像是日期没有问题,但是是左对齐的日期,python会将其作为文本来处理 截图如下: 另外在dtype字段也做了简单处理 代码…
1. 从字典创建Dataframe >>> import pandas as pd >>> dict1 = {'col1':[1,2,5,7],'col2':['a','b','c','d']} >>> df = pd.DataFrame(dict1) >>> df col1 col2 0 1 a 1 2 b 2 5 c 3 7 d 2. 从列表创建Dataframe (先把列表转化为字典,再把字典转化为DataFrame) >…
1. 从字典创建DataFrame >>> import pandas >>> dict_a = {'],'mark_date':['2017-03-07','2017-03-07','2017-03-07']} >>> df = pandas.DataFrame(dict_a) # 从字典创建DataFrame >>> df # 创建好的df列名默认按首字母顺序排序,和字典中的先后顺序并不一样,字典中是'user_id','book…
pandas.DataFrame class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)[source] Two-dimensional size-mutable, potentially heterogeneous tabular data structure with labeled axes (rows and columns). Arithmetic operations al…
(1):如何添加python第三方库(方法一): File ->> Settings... ->> Project Interpreter (2):如何添加python第三方库(方法二): 步骤: 1.Win键+R ,输入“cmd” 调出命令窗口: 2.输入:python -m pip install --upgrade pip 先升级一下pip安装命令,否则可能会安装第三方库和插件时失败: 3.安装你需要的第三方库,例如:pywin32.   输入:pip install pyw…
先手工生出一个数据框吧 import numpy as np import pandas as pd df = pd.DataFrame(np.arange(0,60,2).reshape(10,3),columns=list('abc')) df 是这样子滴 那么这三种选取数据的方式该怎么选择呢? 一.当每列已有column name时,用 df [ 'a' ] 就能选取出一整列数据.如果你知道column names 和index,且两者都很好输入,可以选择 .loc df.loc[0, '…
​ 前言 在我们写代码的过程中,我们开发的脚本一般都会用到一些第三方包,可能别人也需要用到我们的脚本,如果我们将我们的xx.py文件发给他,他是不能直接用的,他还需要安装python解释器,甚至还要安装我们用的那些第三方包,是不是有点小麻烦?但是我们都知道,PC是可以直接运行exe文件的,这就为我们提供了一个便捷的方式.所以,从看了这个教程以后,这都将成为过去式,打成exe之后,分享即可用. PS: 如果打包为exe的话,版本尽量选择python3.6+32位版本,因为win64位系统向下兼容3…
1.使用append首先要注意的是,你要合并两个DataFrame的columns即列名是否是相同的,不相同的就会报错. 2.我们会发现DataFrame的列名是不能够重复的,而行名(index)是可以重复的. 3.DataFrame的append是按列拓展的,换句话说就是向下拓展. 主要参数: 1.ignore_index: 布尔值 如果是True,会将忽略原来DataFrame的index,重新排列index(0, 1, 2, 3, ...) 如果是False,会沿用原来DataFrame的…
从数据看select出数据后如何转换为dataframe df = DataFrame(cur.fetchall()) 如何更改列名,选取列,进行groupby操作 df.columns = ['member_id', 'poi', 'num'] df = df[['member_id','num']] grouped = df.groupby('member_id') df = grouped.aggregate(lambda x: sorted(list(x),reverse=True))…