pandas-pd.read_csv
read_csv()接受以下常见参数:
参数 | 中文名 | 参数类型 | 默认参数 | 参数功能 | 说明 |
filepath_or_buffer | various |
:文件路径、URL、或者 是read()函数返回的对象 |
|||
sep | 指定分隔符 | str | 默认是',' | ||
delimiter | 定界符 | str | 默认是None | 指定该参数,sep失效 | |
delim_whitespace | boolean | 默认是False | 指定空格或者'\t'是否作为分隔符使用 | 如果该参数指定为True,则delimiter失效 | |
header | 指定行号用于列名,默认指定是第0行作为列名。如果没有列名,则显式指定header = None | ||||
names | 默认是None | 如果表格中没有列名,就显式指定header = None,然后由names= ["xx","xx"]指定列名。 | |||
index_col | int or sequence or False | 默认是None | 用作行索引的列编号或者列名 | 当设定index_col = False时,强制pandas不使用第一个列作为行名 | |
usecols | list-like 或者callable | 默认是None | 返回列的子集,就是你可以指定哪些列返回,比如usecols = [1,3,5]或者usecols = [' xx','xx'] xx是列名 | 输入0、1这种数字则顺序就没了,若想保留列的顺序,就输入列名。 | |
squeeze | boolean | 默认是False | 如果只包含一列,则设置为True,会返回一个Series. | ||
prefix | str | 默认是None | 在没有列标题时,用来给列添加前缀。 | 比如prefix = 'xx',则列名就是xx0,xx1,xx2.... | |
mangle_dupe_cols | boolean | 默认是True | 将列名重复的列,更名为X.0,X.1,X.2.. | 如果设置为False,则覆盖所有重名列。 | |
dtype | type | 默认是None | 指定每列数据的类型 | dtype = {‘a’:np.float64,'b':np.int32} | |
skiprows | list-like或者interger | 默认是None | 跳过指定的行 | skiprows = [1,2,3,4] or skiprows = lambda x :x%2 !=0 | |
skipfooter | int | 默认是0 | 从底部跳过的行 | skiprows = [1,2,3]从尾部忽略123行 | |
nrows | int | 默认是None | 需要读取的行数 | nrows = [1,2,3]从头部读取123行 | |
na_values | scalar或者str或者list-like | 默认是NOne | 用于替换NA/NaN的值 | ||
memory_map | boolean | 默认是False | 如果filepath是filepath_or_buffer,则直接将其映射到内存 | ||
keep_default_na | boolearn | 默认是True | 与na_values搭配使用, | ||
na_values | |||||
na_filter | boolean | 默认是True | 如果设置为False,则不检查有无空值,提高速度 | ||
verbose | boolean | 默认是False | 指示替代非数字列的NA的数量 | ||
skip_blank_lines | boolean | 默认是True | 如果是True则跳过空白行,为False则空白行用NaN替代。 | ||
encoding | str | 默认是None | encoding = 'utf-8' | ||
参考网址:https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html#io-read-csv-table
建议还是看英文介绍,详细
pandas-pd.read_csv的更多相关文章
- pd.read_csv() 、to_csv() 之 常用参数
本文简单介绍一下read_csv()和 to_csv()的参数,最常用的拿出来讲,较少用的请转到官方文档看. 一.pd.read_csv() 作用:将csv文件读入并转化为数据框形式. pd.read ...
- pandas的read_csv函数
pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, ...
- pd.read_csv的header用法
默认Header = 0: In [3]: import pandas as pd In [4]: t_user = pd.read_csv(r'C:\Users\Song\Desktop\jdd_d ...
- [Python Study Notes]pd.read_csv()函数读取csv文件绘图
''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''' ...
- pd.read_csv参数解析
对pd.read_csv参数做如下解释: pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', n ...
- (转)pd.read_csv之OSError: Initializing from file failed的解决方案
转:https://blog.csdn.net/funnyPython/article/details/78532102 rides = pd.read_csv(data_path)1 # OSErr ...
- pandas的read_csv踩到的坑
read_csv要注意,如果没有设置index_col时,读出来的会在索引上方加上Unnamed:0.可以通过设置index_col来解决这个问题. import pandas as pd impor ...
- 使用read、readline、readlines和pd.read_csv、pd.read_table、pd.read_fwf、pd.read_excel获取数据
从文本文件读取数据 法一: 使用read.readline.readlines读取数据 read([size]):从文件读取指定的字节数.如果未给定或为负值,则去取全部.返回数据类型为字符串(将所有行 ...
- 详解pandas的read_csv方法
楔子 使用pandas做数据处理的第一步就是读取数据,数据源可以来自于各种地方,csv文件便是其中之一.而读取csv文件,pandas也提供了非常强力的支持,参数有四五十个.这些参数中,有的很容易被忽 ...
- pd.read_csv操作读取分隔符csv和text文件
pandas.read_csv可以读取CSV(逗号分割)文件.文本类型的文件text.log类型到DataFrame 1. pandas.read_csv常用参数整理 也支持文件的部分导入和选择迭代 ...
随机推荐
- rpcbind服务没法开启问题
昨天下午有部分生产机器无法启动nfs服务:报错很是奇怪.于是一路顺藤摸瓜发现是rpcbind没能正常启动导致的nfs没能起来. 后来总结了两种办法:主要是ipv6的问题所导致的. 措施一: 报错内容 ...
- Spring学习笔记(8)——依赖注入
spring依赖注入使用构造器注入使用属性setter方法注入使用Field注入(用于注解方式) 注入依赖对象可以采用手工装配或自动装配,在实际应用中建议使用手工装配,因为自动装配会产生未知情况,开发 ...
- CSS和jQuery分别实现图片无缝滚动效果
一.效果图 二.使用CSS实现 <!DOCTYPE html> <html> <head> <meta charset="utf-8"&g ...
- 【转载】vue install报错run `npm audit fix` to fix them, or `npm audit` for details html
原链接https://www.jianshu.com/p/60591cfc6952 执行npm install 出现如下提醒 added 253 packages from 162 contribut ...
- 【Jquery对象】jquery与dom对象的区别
最近工作有很多判断的代码,用到了jquery与dom对象的地方比较多,写在这里加强下基本概念: 1.判断是否存在时候,要用dom对象,因为jQuery在获得对象的时候,无论要获得的对象是否存在,都会返 ...
- PHP-在排序数组中查找元素的第一个和最后一个位置
给定一个按照升序排列的整数数组 nums,和一个目标值 target.找出给定目标值在数组中的开始位置和结束位置. 你的算法时间复杂度必须是 O(log n) 级别. 如果数组中不存在目标值,返回 [ ...
- Django过滤器之safe
safe除了将html生成安全的文本外,还有将整型转为字符串: {% for user in user_list %} {% if user.id|safe == uid %} <li clas ...
- Java——异常的分类
2.异常的分类 异常主要分为:错误.一般性异常(受控异常).运行期异常(非受控异常) 错误:Java虚拟机无法解决的严重问题.如:JVM系统内部错误.资源耗尽等严重情况.一般不编写针对性的代码进行处理 ...
- Android onActivityResult()运行时刻的问题
今天在开发过程中遇到一个很是怪异的问题,就是方法onActivityResult的执行问题,问题是当我从当前的Activity跳转的时候,尚未做任何动作,onActivityResult()就已经执行 ...
- linux python3 venv 虚拟环境报错 [-Im', 'ensurepip', '--upgrade', '--default-pip']' returned non-zero exit status 2.
解决办法: 先创建没有pip的虚拟环境,然后启动虚拟环境后,再安装pip 办法一: 亲测失败了... python3 -m venv --without-pip py36env 办法二 sudo ap ...