首先我们看下数据

接下来数据分析操作

  1. import numpy as np
  2. import pandas as pd
  3. from matplotlib import pyplot as plt
  4.  
  5. if __name__ == "__main__":
  6. #读取数据
  7. df = pd.read_excel('tips.xlsx','sheet1')
  8. # print(df)
  9.  
  10. #绘制散点图 证明推论,消费随着总账单的递增而递增
  11. # df.plot(kind='scatter',x='tip',y='total_bill',color='red',label='bill_tip')
  12. # plt.show()
  13.  
  14. #计算消费占总帐单的百分比 .
  15. df['pct'] = df.tip / df.total_bill * 100
  16.  
  17. #打印出消费占比高于30%的人群
  18. # print(df[df.pct>30])
  19. # print(df[df.pct>30].index)
  20.  
  21. #过滤异常数据 默认axis=0 行级删除
  22. df = df.drop('tip',axis=1)
  23. print(df)
  24.  
  25. #计算小费占比分布 箱型图
  26. # df.pct.plot(kind='box',label='tips pct%')
  27. # plt.show()
  28.  
  29. #调查推论消费占比是否和性别有关
  30. # df[['pct','sex']].boxplot(by='sex')
  31. # plt.show()
  32.  
  33. #调查推论,小费占比是否和工作日休息日有关
  34. # df[['pct','day']].boxplot(by='day')
  35.  
  36. #调查推论,小费占比是否和吸烟有关
  37. # df[['pct','smoker']].boxplot(by='smoker')
  38.  
  39. #按男女分组
  40. df_m = df[df.sex=='Male']
  41. df_f = df[df.sex=='Female']
  42. df_m[['pct','smoker']].boxplot(by='smoker')
  43. df_f[['pct','smoker']].boxplot(by='smoker')
  44.  
  45. #查询消费比例与用餐时段关系
  46. # df[['pct','time']].boxplot(by='time')
  47. plt.show()

pandas 读取excel文件对数据简单清洗并用matplotlib 将数据展示的更多相关文章

  1. 用python的pandas读取excel文件中的数据

    一.读取Excel文件   使用pandas的read_excel()方法,可通过文件路径直接读取.注意到,在一个excel文件中有多个sheet,因此,对excel文件的读取实际上是读取指定文件.并 ...

  2. pandas读取Excel文件

    In [7]: import pandas as pd filname = 'ch02数据导入\\student.xlsx' data = pd.read_excel(filname) data Ou ...

  3. 深入理解pandas读取excel,txt,csv文件等命令

    pandas读取文件官方提供的文档 在使用pandas读取文件之前,必备的内容,必然属于官方文档,官方文档查阅地址 http://pandas.pydata.org/pandas-docs/versi ...

  4. 机器学习之数据预处理,Pandas读取excel数据

    Python读写excel的工具库很多,比如最耳熟能详的xlrd.xlwt,xlutils,openpyxl等.其中xlrd和xlwt库通常配合使用,一个用于读,一个用于写excel.xlutils结 ...

  5. pandas read excel文件碰到的一个小问题

    今天利用pandas读取excel时,爆出如下错误: 代码为: import pandas as pd db_eua=pd.read_excel('db_eua.xlsx',sheetname='EU ...

  6. .Net读取Excel文件时丢失数据的问题 (转载)

    相信很多人都试过通过OleDB读取Excel文件,这种方法效率十分高,只是有一点会让人十分头痛,就是当一列中既有混合型数据,又有纯数据时,往往容易丢失数据. 百度过后,改连接字符串 “HDR=YES; ...

  7. JAVA使用POI读取EXCEL文件的简单model

    一.JAVA使用POI读取EXCEL文件的简单model 1.所需要的jar commons-codec-1.10.jarcommons-logging-1.2.jarjunit-4.12.jarlo ...

  8. 项目一:第四天 1、快递员的条件分页查询-noSession,条件查询 2、快递员删除(逻辑删除) 3、基于Apache POI实现批量导入区域数据 a)Jquery OCUpload上传文件插件使用 b)Apache POI读取excel文件数据

    1. 快递员的条件分页查询-noSession,条件查询 2. 快递员删除(逻辑删除) 3. 基于Apache POI实现批量导入区域数据 a) Jquery OCUpload上传文件插件使用 b) ...

  9. 上传读取Excel文件数据

    /// <summary> /// 上传读取Excel文件数据 /// 来自http://www.cnblogs.com/cielwater /// </summary> // ...

随机推荐

  1. Java 多线程概述

    几乎所有的操作系统都支持同时运行多个任务,一 个任务通常就是一个程序,每个运行中的程序就是一个进程.当一个程序运行时,内部可能包含了多个顺序执行流,每个顺序执行流就是一个线程. 线程和进程 几乎所有的 ...

  2. 在JavaEE中使用Mybatis框架

    MyBatis 使用简单的 XML 或注解用于配置和原始映射,将接口和 Java 的 POJOs(Plain Old Java Objects,普通的 Java 对象)映射成数据库中的记录.每个MyB ...

  3. JS 类型检测

    typeof 适合函数对象和基本类型的判断 typeof 100instanceof 适合判断对象类型 obj instanceof Object 基于原型链判断操作符,若做操作符不是对象,则会直接返 ...

  4. Django--权限信息操作

    一 . 权限控制 表结构的设计 rbca(Role Based Access Control)  基于角色的权限控制 3个model  5张表 class User(models.Model): # ...

  5. WPF如何实现TreeView节点重命名

    我们经常看到一些软件比如酷狗音乐,在对列表右键进行重命名的时候,当前列表会泛白并且进入可编辑状态,当我们更改完成后就会并进入非编辑状态,这些具体是怎么实现的呢?下面的方法也许会提供一些思路,下面的Tr ...

  6. java 中的迭代

    package cn.zhou.com; import java.util.ArrayList; import java.util.Collection; import java.util.Itera ...

  7. ABP实践学习

    一.

  8. python排序 sorted()与list.sort() (转)

    该文章为转载:原文地址为:https://www.cnblogs.com/zuizui1204/p/6422939.html 只要是可迭代对象都可以用sorted . sorted(itrearble ...

  9. Vue入门基础

    前面的话 Vue中文文档写得很好,界面清爽,内容翔实.但文档毕竟不是教程,文档一上来出现了大量的新概念,对于新手而言,并不友好.个人还是比较喜欢类似于<JS高级程序设计>的风格,从浅入深, ...

  10. vpx

    VPX 编辑 本词条缺少名片图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧! VPX总线是VITA(VME International Trade Association, VME国际贸易协 ...