三分钟教会你Python数据分析—数据导入,小白基础入门必看内容
前言
文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
作者:小白
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://t.cn/A6Zvjdun
今天我们来学习数据导入,需要使用到Pandas模块。
模块相当于是一个文件夹,它能够用于存放同个主题相关的Python代码段,包括定义函数、类和变量。
例如将数据处理相关的函数都存放在一个模块里,将数据分析相关的函数都存放在一个模块里,将数据可视化相关的函数都存放在一个模块里。这样就可以在其他有需要的地方进行调用,在编写程序的时候,经常需要引用其它模块。
你可以将Excel菜单中的每个选项卡 看成是一个模块,例如数据选项卡下就包含了数据获取和转换、连接、排序和筛选、数据工具等功能。只是它以图形界面的方式供我们选择使用。
而Python中的模块一般看不见摸不着,需要在使用的时候进行导入使用,所以对初学者来说不算太友好,这也是大家认为Python难学的原因之一。
另外Python中模块的概念,在 Java 中称之为包(package),而在 C\C++中则称之为库(library),Java和C\C++都是程序员常用的编程语言,所以有些程序员就会把Python 中的模块混淆称之为包和库,你只要明白它们说的是一回事即可。
原来是这么回事,那Pandas模块又是什么?
Pandas模块是Python的一个数据分析模块,它最初被用作金融数据分析工具而开发出来,所以Pandas为时间序列分析提供了很好的支持。
为了提供高效操作大型数据集的工具,Pandas提出了一套类似Excel的标准数据应用框架,包含了类似Excel表格的数据框DataFrame,以及快速便捷地处理数据的函数和方法,让数据分析整个过程变得快速、简单。可以毫不夸张地说,Pandas是Python中进行数据分析的最好工具。
Pandas模块怎么使用呢?它在哪呢?
在安装Anaconda的时候,都已经一起安装好了,我们只需把它导入就可以使用了,主要有两种使用方法:
第一种是使用import语句进行导入。
import 模块名
这是模块导入最常使用的方法,模块导入后,就可以通过使用 模块名.变量名调用模块中的变量,使用 模块名.函数名 调用模块中的函数。
第二种是使用 from import 语句进行导入。
from 模块名 import 函数名
这种情况就是明 确知道要导入哪个模块哪个函数或变量的时候使用。使用这种导入的方式,在使用函 数或变量的时候,就不用在前面加上对应的模块名了。
那我们是不是可以导入Pandas模块了?
可以,不过不用那么急,我们先来看我们要导入的数据data.csv,先使用Notepad++打开查看数据是什么样子的:
这份数据是一份用户数据,记录了用户的id,注册日期reg_date,用户的身份证号id_num,性别gender,生日birthday,年龄age六个字段数据,每个字段使用英文逗号分隔。
还有一个很重要的信息,就是这份数据采用UTF-8的编码格式记录数据。
UTF-8是互联网上使用最广的一种unicode的实现方式,为传输而设计的编码,最大的特点是统一无国界,可以显示全世界上所有文化的字符。
现在我们可以来导入数据了,打开spyder,输入以下代码
我给代码加上对应的注释,使用#来添加注释,这样解析器就不会执行注释所在的行的内容。你再看看。
在变量浏览窗口中就可以看到刚导入的data变量了,双击打开data变量,就可以得到下面这张表。
导入TXT与EXCEL数据文件
首先是导入TXT数据文件,使用的是Pandas模块中的read_table函数,数据还是与昨天一样,只是存为了TXT文件。有了昨天CSV数据文件的导入经验,导入TXT数据文件就轻车熟路了,打开spyder,输入以下代码
这个比导入CSV文件多了个参数SEP,是设置列分隔符的意思吧?
同样我给代码加上对应的注释,使用#来添加注释,这样解析器就不会执行注释所在的行的内容。
在变量浏览窗口中就可以看到刚导入的data变量了,双击打开data变量,就可以得到下面这张表。
接下来是导入EXCEL数据文件,使用的是Pandas模块中的read_excel函数,输入以下代码
在变量浏览窗口中就可以看到刚导入的data变量了,双击打开data变量,就可以得到下面这张表。
你发现没有,id、age这两列都有不同颜色标识。
因为这两列数据类型为整数型,你看打开的这个数据框最下面有一个 Background color选项被勾选上,这个功能相当于Excel条件格式中的色阶功能,它仅对整数型、浮点型有效,对其他数据类型无效。
我们可以使用下列命令查看下每列的数据类型
可以看到只有id、age是int64型,其他都是object类型
今天就到这,下次我们继续学习其他操作,回去要多多练习,多敲代码。
2020年最新Python教程:
如果你处于想学Python或者正在学习Python,Python的教程不少了吧,但是是最新的吗?
说不定你学了可能是两年前人家就学过的内容,在这小编分享一波2020最新的Python教程。
以上这些教程小编已经为大家打包准备好了,希望对正在学习的你有所帮助!
获取方式,私信小编 “ 资料 ”,即可免费获取哦!
三分钟教会你Python数据分析—数据导入,小白基础入门必看内容的更多相关文章
- python数据分析-数据导入
1.导入CSV格式数据 import pandas data = pandas.read_csv("C:\\Users\\zhaosai\\Desktop\\进击的DBA\\谁说菜鸟不会数据 ...
- python数据分析数据标准化及离散化详解
python数据分析数据标准化及离散化详解 本文为大家分享了python数据分析数据标准化及离散化的具体内容,供大家参考,具体内容如下 标准化 1.离差标准化 是对原始数据的线性变换,使结果映射到[0 ...
- 云小课|DGC数据开发之基础入门篇
阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说).深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云.更多精彩内容请单击此处. 摘要:欢迎来到DGC数据 ...
- [新手必备]Python 基础入门必学知识点笔记
Python 作为近几年越来越流行的语言,吸引了大量的学员开始学习,为了方便新手小白在学习过程中,更加快捷方便的查漏补缺.根据网上各种乱七八糟的资料以及实验楼的 Python 基础内容整理了一份极度适 ...
- python 读写、创建 文件的方法(必看)
python 读写.创建 文件的方法(必看) 更新时间:2016年09月12日 10:26:41 投稿:jingxian 我要评论下面小编就为大家带来一篇python 读写.创建 文件的方法(必看). ...
- 转载 Python 安装setuptools和pip工具操作方法(必看)
本文章转载自 脚本之家 http://www.jb51.net 感谢! setuptools模块和pip模块是python进行第三方库扩展的极重要工具,例如我们在需要安装一些爬虫或者数据分析的包时就 ...
- 【Python教程】《零基础入门学习Python》(小甲鱼)
[Python教程]<零基础入门学习Python>(小甲鱼) 讲解通俗易懂,诙谐. 哈哈哈. https://www.bilibili.com/video/av27789609
- 三十一.MySQL存储引擎 、 数据导入导出 管理表记录 匹配条件
1.MySQL存储引擎的配置 查看服务支持的存储引擎 查看默认存储类型 更改表的存储引擎 设置数据库服务默认使用的存储引擎 1.1 查看存储引擎信息 mysql> SHOW ENGINES\G ...
- 10个步骤教你如何安装Anaconda安装,Python数据分析入门必看
前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:小白 PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行 ...
随机推荐
- Js遍历数组总结
Js遍历数组总结 遍历数组的主要方法为for.forEach.map.for in.for of for var arr = [1,2,3,4,5]; var n = arr.length; // 直 ...
- wr720n v4 折腾笔记(五):终篇-编译安装openwrt附带njit
前言: 由于没有多余的U盘,所以想直接压缩生成一个带njit-client的openwrt固件.其中按照网上的教程走,遇到了一些问题,这里前面的步骤来源于网络.后面给出处理问题的方法. 一.准备工作 ...
- 动态规划-不连续最大子序列和-打家劫舍系列-1388. 3n 块披萨
2020-03-24 17:49:58 198. 打家劫舍 问题描述: 你是一个专业的小偷,计划偷窃沿街的房屋.每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统, ...
- HDU 1847-Good Luck in CET-4 Everybody!-博弈SG函数模板
Problem Description 大学英语四级考试就要来临了,你是不是在紧张的复习?也许紧张得连短学期的ACM都没工夫练习了,反正我知道的Kiki和Cici都是如此.当然,作为在考场浸润了十几载 ...
- 汉诺塔Java实现
public class Hanoi { public static void main(String[] args ) { Hanoi hanoi = new Hanoi(); hanoi.hano ...
- Nature重磅:华裔科学家成功解码脑电波,AI直接从大脑中合成语音
[导读]Nature发表华裔作者论文:通过解码大脑活动提升语音的清晰度,使用深度学习方法直接从大脑信号中产生口语句子,达到150个单词,接近正常人水平. 大脑活动能够解码成语音了. 说话似乎是一项毫不 ...
- spring boot 源码赏析之事件监听
使用spring Boot已经快1年多了,期间一直想点开springboot源码查看,但由于种种原因一直未能如愿(主要是人类的惰性...),今天就拿springboot 的监听事件祭刀. spring ...
- [codevs2370]小机房的树<LCA>
题目链接:http://codevs.cn/problem/2370/ 这题我还是做了比较久了,因为有人告诉我这是用tarjan离线做 好吧算我是蒟蒻,真心不懂tarjan怎么做,最后还是用倍增做的 ...
- JQuery主要内容
一.什么是JQuery jquery全称javaScript Query,是js的一个框架,本质上仍然是js 二.jQuery的特点 支持各种主流浏览器 使用特别简单 拥有丰富的插件和边界的插件扩展机 ...
- 牛客寒假基础集训营 | Day1 G-eli和字符串
G-eli和字符串 题目描述 eli拿到了一个仅由小写字母组成的字符串. 她想截取一段连续子串,这个子串包含至少 kkkkkkkkk 个相同的某个字母. 她想知道,子串的长度最小值是多少? 注:所谓连 ...