pandas 存取数据小笔记

import pandas as pd

1. 读取和保存 csv文件

#读

df = pd.read_csv(read_file_path, header=0)

# 其中read_file_path 为字符串，为读的文件所在路径

# 比如 "../cj_data/query_result.csv"

# header=0 意思是第一行包含字段名，可以通过df.columns 取到列名

#保存

df.to_csv(save_file_path)

2. pandas如何根据字段进行过滤

df = df[                                              # [] 为读取操作符

           (df['course_id'] == course_id)         # == 等于

        & (df['member_id'] == str(member_id))    # & 来关联多个筛选条件，

          ]

3. python脚本运行日志保存

import logging

dt = time.strftime("%Y%m%d")

# 读取当前日期

logfile = project_folder + "log/log_" + str(dt) + ".txt"

logging.basicConfig(filename=logfile, filemode='a', level=logging.INFO)

# 设置日志级别，开始写入日志



logger = logging.getLogger(__name__)

logger.info('write_member_result ...')

logger.info(str(time.strftime("%Y-%m-%d %H:%M:%S")))

#日志内容全靠logger.info

#类似于print，但是可以保存日志文件，来帮助定位问题

4. 排序，生成序列号

    df = df.sort_values(by='lesson_start_time', ascending=True)

    # 函数是pandas的sort_values

    df['lesson_order'] = range(df.shape[0])

    # 生成序号是从0开始的

    df['lesson_order'] = [i+1 for i in df['lesson_order']]

    # 序列号+1，变成从1开始

5. join操作

df3 = pd.merge(df, df2, how='left', on=['member_id', 'lesson_id'])

# 两个dataframe根据主键进行join

6. dataframe 某个字段的类型转化

df['col2'] = df['col2'].astype('float64')

print '-----------'

print df.dtypes

7. spark 和python的 Data Frame之间互相转换

8. python 对hive读和写

pandas 存取数据小笔记的更多相关文章

pandas之数据IO笔记
pandas在进行数据存储与输出时会做一些相应的操作 1.*索引:将一个列或多个列读取出来构成DataFrame,其中涉及是否从文件中读取索引以及列名 2 *类型推断和数据转换:包括用户自定义的转换以 ...
【笔记】Pandas分类数据详解
[笔记]Pandas分类数据详解 Pandas Pandas分类数据详解|轻松玩转Pandas(5) 参考:Pandas分类数据详解|轻松玩转Pandas(5)
关于 linux中TCP数据包(SKB)序列号的小笔记
关于 SKB序列号的小笔记为了修改TCP协议,现在遇到了要改动tcp分组的序列号,但是只是在tcp_sendmsg函数中找到了SKB的end_seq 一直没有找到seq 不清楚在那里初始化了,就 ...
使用SharePreferences存取数据（慕课笔记）
0.视频地址:http://www.imooc.com/video/3265 1.使用SharePreferences存取数据: public class MainActivity extends A ...
【转载】使用Pandas对数据进行筛选和排序
使用Pandas对数据进行筛选和排序本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas对数据进行筛选和排序目录: sort() 对单列数据进行排序对多列数据进行排序获取金额最小前10项 ...
【转载】使用Pandas进行数据提取
使用Pandas进行数据提取本文转载自:蓝鲸的网站分析笔记原文链接:使用python进行数据提取目录 set_index() ix 按行提取信息按列提取信息按行与列提取信息提取特定日期的信 ...
【转载】使用Pandas进行数据匹配
使用Pandas进行数据匹配本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas进行数据匹配目录 merge()介绍 inner模式匹配 lefg模式匹配 right模式匹配 outer模式 ...
【转载】使用Pandas创建数据透视表
使用Pandas创建数据透视表本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas创建数据透视表目录 pandas.pivot_table() 创建简单的数据透视表增加一个行维度(inde ...
转：【iOS开发每日小笔记（十一）】iOS8更新留下的“坑” NSAttributedString设置下划线 NSUnderlineStyleAttributeName 属性必须为NSNumber
http://www.bubuko.com/infodetail-382485.html 标签:des class style 代码 html 使用问题文件数据 ...

随机推荐

Python测试框架之Unittest梳理
1. 2.
SpringBoot无法书写主启动类的情况之一
首先需要引入 spring-boot-starter-web 依赖[springboot web 项目启动器 jar包]: 如果使用镜像请确保镜像路径正确,可参看笔者博客园m-yb的maven 安装 ...
JAVA学习笔记系列2-Java程序的运行机制
计算机高级语言的类型主要有编译型和解释型两种,而java语言是两种类型的结合. java首先利用文本编辑器编写java源程序,源文件后缀名为.java,再利用编译器(javac)将源程序编译成字节码文 ...
echarts地图散点高亮弹框制作
效果图如下: 实现大致思路: 引入echarts最新版本,还有china.json,以及地级市坐标,(因为产品需求中不考虑省份,只考虑各个地级市),echarts官网已经不让下载地图了,网上很多地级市 ...
ffmpeg 视频转 gif
将视频 MP4 转化为 GIF ffmpeg -i small.mp4 small.gif 转化视频中的一部分为 GIF ffmpeg -t -ss :: -i small.webm small-cl ...
nodejs----初期学习笔记
//一回调函数 //require---命令//Node 使用了大量的回调函数,Node 所有 API 都支持回调函数.//例如,我们可以一边读取文件,一边执行其他命令,在文件读取完成后,我们将文件 ...
exe4j使用说明
1:首先下载exe4j,软件根据电脑的版本下载(32bit or 64bit,本人的电脑是64bit),我下载的是没显示电脑版本的exe4j,有本地导入的选项和联网下载的选项,安装jre后才能进入-图 ...
go 调用windows dll 的方法
go 调用windows dll 的方法 ,代码如下: package main import ( "fmt" "syscall" "time&quo ...
git grep的一些用法
https://www.kernel.org/pub/software/scm/git/docs/git-grep.html 把所有本地分支包含某个字符的行列出来,把含有master的列出来 gi ...
SVN远程管理
1.使用远程桌面连接工具,分别填写连接地址和用户名进行连接 2.紧接着进行安全登录. 3.打开VisualSVN Server Manager工具进行显示已经拥有的项目和分配好的群组管理. 这样子就可 ...

pandas 存取数据小笔记

1. 读取和保存 csv文件

2. pandas如何根据字段进行过滤

3. python脚本运行日志保存

4. 排序，生成序列号

5. join操作

6. dataframe 某个字段的类型转化

7. spark 和python的 Data Frame之间互相转换

8. python 对hive读和写

pandas 存取数据小笔记的更多相关文章

随机推荐

热门专题