pandas函数get_dummies的坑】的更多相关文章

转载:https://blog.csdn.net/mvpboss1004/article/details/79188190 pandas中的get_dummies得到的one-hot编码数据类型是uint8,进行数值计算时会溢出!!! import pandas as pd import numpy as np a = [1, 2, 3, 1] one_hot = pd.get_dummies(a) print(one_hot.dtypes) print(one_hot) print(-one_…
def add(a=3,b): print a,b add(4) 这样写的话,运行的话就会报错:SyntaxError: non-default argument follows default argument 意思就是默认赋值的参数必须在没有赋值的参数的后面 def add(a,b=3),函数这样定义的话下面调用的时候就不会报错了. 这也是在学习的过程中没有注意到的,在使用中才发现有这么一个坑.…
之前写了这么一条sql语句,目的是取出表中itemid最大的那一条数据. SELECT date, MAX(itemid) AS itemid, group FROM mytable GROUP BY group 但是返回来的数据有点出乎意料. 问题是: date的值并不对应max(itemid)所在行数的值. 比如2016-02-02取到最大的itemid,但是返回来的值确实表中的第一条数据的date值,即2016-01-01. 具体原因跟数据库和max函数的机理有关. 据说是mysql的于处…
1,nan替换为0df = df(np.nan, 0, regex=True)2.inf替换为0df= df(np.inf, 0.0, regex=True)3.从数据库读取数据到dataframeinfo_detail = pd.read_sql(sql_detail+"'"+version+"'", pyodbc.connect(CONFIG_IN_LCD))4.从dataframe中取其中需要的几列info = info_detail.loc[:,['vers…
1.管道函数 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/5/24 15:03 # @Author : zhang chao # @File : s.py #pipe管道函数的应用 import pandas as pd import numpy as np def adder(ele1,ele2): return ele1+ele2 df = pd.DataFrame(np.random.randn(5,3),col…
这个一直都想写,但是因为这个点比较小,所以一直懒得动手.不过还是补上吧,留着早晚是个祸害. round函数很简单,对浮点数进行近似取值,保留几位小数.比如 >>> round(10.0/3, 2) 3.33 >>> round(20/7) 3 第一个参数是一个浮点数,第二个参数是保留的小数位数,可选,如果不写的话默认保留到整数. 这么简单的函数,能有什么坑呢? 1.round的结果跟python版本有关 我们来看看python2和python3中有什么不同: $ pyt…
今天在复习UNIX文件系统,用到那个read函数,但是无意中却掉到一个坑里了,用了一个多小时才找到问题根源,这里记录一下. 问题是这样的:我需要使用read和write函数把键盘输入的信息复制到输出.所以我写了如下程序: #include<stdio.h> #define MAXSIZE 10 int main(void) { char c; char buf[MAXSIZE]; int n; ,buf,MAXSIZE)) > )// 海燕高尔基在苍茫的大海上狂风卷积 write(,bu…
本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入.数据清洗.预处理,以及最常见的数据分类,数据筛选,分类汇总,透视等最常见的操作. 生成数据表 常见的生成数据表的方法有两种,第一种是导入外部数据,第二 种是直接写入数据.Excel中的"文件"菜单中提供了获取外部数据的功能,支持数据库和文本文件和页面的多种数据源导入. Python支持从多种类型的数据导入.在开始使用Python进行数据 导入前需要先导入pandas库,为了方便起见,我们也同时导入numpy…
一.处理丢失数据 有两种丢失数据: None np.nan(NaN) 1. None None是Python自带的,其类型为python object.因此,None不能参与到任何计算中. #查看None的数据类型 None + 1 2. np.nan(NaN) np.nan是浮点类型,能参与到计算中.但计算的结果总是NaN. #查看np.nan的数据类型 np.nan + 1 nan 3. pandas中的None与NaN 1) pandas中None与np.nan都视作np.nan 创建Da…
一.Pandas的数据结构 1.Series Series是一种类似与一维数组的对象,由下面两个部分组成: values:一组数据(ndarray类型) index:相关的数据索引标签 1)Series的创建 两种创建方式: (1) 由列表或numpy数组创建 默认索引为0到N-1的整数型索引 import pandas as pd from pandas import Series,DataFrame import numpy as np #使用列表创建Series Series(data=[…