Pandas系列-读取csv/txt/excel/mysql数据

本代码演示：

pandas读取纯文本文件

读取csv文件
读取txt文件

pandas读取xlsx格式excel文件
pandas读取mysql数据表

import pandas as pd

1、读取纯文本文件

1.1 读取CSV，使用默认的标题行、逗号分隔符

fpath = "./datas/ml-latest-small/ratings.csv"

# 使用pd.read_csv读取数据

ratings = pd.read_csv(fpath)

# 查看前几行数据

ratings.head()

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

.dataframe tbody tr th {

    vertical-align: top;

}

.dataframe thead th {

    text-align: right;

}

	userId	movieId	rating	timestamp
0	1	1	4.0	964982703
1	1	3	4.0	964981247
2	1	6	4.0	964982224
3	1	47	5.0	964983815
4	1	50	5.0	964982931

# 查看数据的形状，返回(行数、列数)

ratings.shape

(100836, 4)

# 查看列名列表

ratings.columns

Index(['userId', 'movieId', 'rating', 'timestamp'], dtype='object')

# 查看索引列

ratings.index

RangeIndex(start=0, stop=100836, step=1)

# 查看每列的数据类型

ratings.dtypes

userId         int64

movieId        int64

rating       float64

timestamp      int64

dtype: object

1.2 读取txt文件，自己指定分隔符、列名

fpath = "./datas/crazyant/access_pvuv.txt"

pvuv = pd.read_csv(

    fpath,

    sep="\t",

    header=None,

    names=['pdate', 'pv', 'uv']

)

pvuv

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

.dataframe tbody tr th {

    vertical-align: top;

}

.dataframe thead th {

    text-align: right;

}

	pdate	pv	uv
0	2019-09-10	139	92
1	2019-09-09	185	153
2	2019-09-08	123	59
3	2019-09-07	65	40
4	2019-09-06	157	98
5	2019-09-05	205	151
6	2019-09-04	196	167
7	2019-09-03	216	176
8	2019-09-02	227	148
9	2019-09-01	105	61

2、读取excel文件

fpath = "./datas/crazyant/access_pvuv.xlsx"

pvuv = pd.read_excel(fpath)

pvuv

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

.dataframe tbody tr th {

    vertical-align: top;

}

.dataframe thead th {

    text-align: right;

}

	日期	PV	UV
0	2019-09-10	139	92
1	2019-09-09	185	153
2	2019-09-08	123	59
3	2019-09-07	65	40
4	2019-09-06	157	98
5	2019-09-05	205	151
6	2019-09-04	196	167
7	2019-09-03	216	176
8	2019-09-02	227	148
9	2019-09-01	105	61

3、读取MySQL数据库

import pymysql

conn = pymysql.connect(

        host='127.0.0.1',

        user='root',

        password='12345678',

        database='test',

        charset='utf8'

    )

mysql_page = pd.read_sql("select * from crazyant_pvuv", con=conn)

mysql_page

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

.dataframe tbody tr th {

    vertical-align: top;

}

.dataframe thead th {

    text-align: right;

}

	pdate	pv	uv
0	2019-09-10	139	92
1	2019-09-09	185	153
2	2019-09-08	123	59
3	2019-09-07	65	40
4	2019-09-06	157	98
5	2019-09-05	205	151
6	2019-09-04	196	167
7	2019-09-03	216	176
8	2019-09-02	227	148
9	2019-09-01	105	61

本文的代码地址：https://github.com/peiss/ant-learn-pandas

Pandas系列-读取csv/txt/excel/mysql数据的更多相关文章

C# 读取CSV和EXCEL文件示例
我们习惯了直接连到数据库上面读取数据表的数据内容: 如果有一天我们需要读取CSV,EXCEL文件的内容的时候,可不可以也像读数据表的方式一样呢?当然可以,使用OleDB ADO.NET是很简单的事情 ...
csv,txt,excel文件之间的转换,perl脚本
最近接触一些需要csv,txt,excel文件之间的转换,根据一些网上搜索加上自己的改动,实现自己想要的结果为主要目的,代码的出处已经找不到了,还请见谅,以下主要是针对csv&excel 和t ...
R—读取数据（导入csv,txt,excel文件）
导入CSV.TXT文件 read.table函数:read.table函数以数据框的格式读入数据,所以适合读取混合模式的数据,但是要求每列的数据数据类型相同. read.table读取数据非常方便,通 ...
python读取csv、excel、mysql内容
前提:导入扩展包 import pandas as pd import pymysql ①读取csv文件 fpath='/test.csv'ratings=pd.read_csv(fpath)prin ...
【Python】通过python代码实现demo_test环境的登录，通过csv/txt/excel文件批量添加课程并开启课程操作--（刚开始项目页面模块元素这种鸟被称作pageobject 等这些搞完然后把你的定位器、数据和脚本在分离就是传说中那个叫数据驱动的鸟）
一.1.通过csv文件批量导入数据 1 from selenium import webdriver from time import ctime,sleep import csv #循环读取每一行每 ...
Pandas——读取csv,txt文件
""" 读取csv文件该文本中的分割符既有空格又有制表符(‘/t’),sep参数用‘/s+’,可以匹配任何空格. """ import p ...
python读取csv，Excel，Txt，Yaml 文件
1.数据 1.Csv login.csv文件: byhy,88888888 ReadCsv.py文件 import csv #导入csv包 class ReadCsv(): def csv(self) ...
Unity 读取CSV与Excel
前几天看到我们在游戏中需要动态加载某些角色的游戏策划值,关于这个问题怎么解决呢?其实办法很多种,归根到底,就是数据的读取.我们可以想到的存储数据的载体有很多.例如:txt,xml,csv,excel. ...
R|批量循环处理同一格式文件-csv,txt,excel
本文首发于“生信补给站”微信公众号,https://mp.weixin.qq.com/s/8IfMrSr9xc8_1Y2_9Ne6hg 在一个文件夹下有很多字段一致,格式统一的数据文件(csv,txt ...

随机推荐

两个table合并
1.两个一样的table合并用Merge函数即可合并(但要求table要有主键id) DataTable1.Merge(DataTable2); 2.没写完,以后继续补充(只有经过笔者验证,能用的才会 ...
威布尔weibull distribution
data = wblrnd(0.5,0.8,100,1); 生成威布尔随机函数,尺寸参数为0.5,形状参数为0.8,生成数列100行,一列: parmhat = wblfit(data) 对data的 ...
Unix、Linux、Windows操作系统的区别
1.操作区别原文地址: https://blog.csdn.net/qq_41026740/article/details/96018808 linux区分大小写,windows在dos界面命令下不 ...
费用流模板（带权二分图匹配）——hdu1533
/* 带权二分图匹配用费用流求,增加源点s 和汇点t */ #include<bits/stdc++.h> using namespace std; #define maxn 1000 ...
SpringBoot2.0+ 使用Log4j2日志输出
据说Log4j2相比log4j效率有很大提升. pom.xml导入 <dependency> <groupId>org.springframework.boot</gro ...
判断MDI窗体的子窗体是否存在
//***************************************************************************//函数名: CreateForm//返回 ...
洛谷 P2114 [NOI2014]起床困难综合症
题目描述 21世纪,许多人得了一种奇怪的病:起床困难综合症,其临床表现为:起床难,起床后精神不佳.作为一名青春阳光好少年,atm一直坚持与起床困难综合症作斗争.通过研究相关文献,他找到了该病的发病原因 ...
python和go对比字符串的链式处理
一.什么是链式处理对数据的操作进行多步骤的处理称为链式处理,链式处理器是一种常见的编程设计,链式处理的开发思想将数据和操作拆分,解耦,让开发者可以根据自己的技术优势和需求,进行系统开发,同时将自己的 ...
tomcat下文件路径
第一种:复制要访问的文件a.txt至tomcat安装路径下的webapps/ROOT文件夹下: 访问路径为:localhost:8080/a.txt 或者在webapps文件夹下新建一个文件夹(tes ...
[JZOJ 5788] 餐馆
思路: 考虑树形dp. 我们设\(dp[i][j][0/1]\)表示在\(i\)为根的子树中花费\(j\)单位时间,最终回到/不必回到\(i\)的最大收益. 转移三种: \(dp[x][j][0] = ...

Pandas系列-读取csv/txt/excel/mysql数据

1、读取纯文本文件

1.1 读取CSV，使用默认的标题行、逗号分隔符

1.2 读取txt文件，自己指定分隔符、列名

2、读取excel文件

3、读取MySQL数据库

Pandas系列-读取csv/txt/excel/mysql数据的更多相关文章

随机推荐

热门专题