python学习 —— seaborn、matplotlib、pandas、numpy package的混合使用
这里使用了Titanic Machine learning数据集,然后通过Seaborn的函数来拟合和绘制回归线,matplotlib进行可视化。
先来一个简单的测试:
import pandas as pd
from matplotlib import pyplot as plt
import seaborn as sns df = pd.read_csv('../test.csv', index_col=0) # 读取csv表格, index_col=0表示第0列为id
print(df.head(n=5)) # 打印前5行的数据 # sns.lmplot(x='Age', y='Fare', data=df)
sns.jointplot(x='Age', y='Fare', data=df) # 去掉以下两句代码可发现原点不在最左下角
plt.ylim(0, None)
plt.xlim(0, None)
plt.show() # 可视化
运行结果:
sns.lmplot(x='Age', y='Fare', data=df):
使用sns.jointplot(x='Age', y='Fare', data=df) # 默认为条形图:
sns.jointplot(x='Age', y='Fare', data=df, kind='kde',) # 上右两边的就变为了条形:
我发现python3貌似不能用 pd + plt 实现堆积柱状图:
import pandas as pd
from matplotlib import pyplot as plt df = pd.read_csv('../train.csv', index_col=0) # 读取csv表格, index_col=0表示第0列为id
print(df.describe()) survived_0 = df.Age[df.Survived == 0].value_counts()
survived_1 = df.Age[df.Survived == 1].value_counts() print(survived_0)
print(survived_1) df = pd.DataFrame({'Death': survived_0, 'Survival': survived_1})
df.plot(kind='bar',) # 条形 plt.title('View by Age')
plt.xlabel('Age')
plt.ylabel('Density') plt.show()
运行结果:
将df.plot(kind='bar')改为
df.plot(kind='kde',) # 曲线
运行结果:
这样也不错:
g = sns.jointplot(x='Survived', y='Fare', data=df, kind='kde',) g.plot_joint(plt.scatter, c="w", s=30, linewidth=1, marker="+")
g.ax_joint.collections[0].set_alpha(0)
运行结果:
sns.load_dataset()是调用官网github网站中的数据集或者安装包时下载到本地的数据集:
不出我意料的有titanic,于是使用之:
sns.set(style="ticks", color_codes=True)
titanic = sns.load_dataset('titanic', cache=False) # 看底层代码,设置cache为False就不用联网去找了
g = sns.pairplot(titanic, hue="age",) # hue不能传入'survivde' 记得都是小写 plt.show()
数据较多 运行有点慢、有点卡 = =:
未完待续。。。
python学习 —— seaborn、matplotlib、pandas、numpy package的混合使用的更多相关文章
- Python之(matplotlib、numpy、pandas)数据分析
一.Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形. 它主要用来回事图形,用来展现一些数据,更加直观的展示,让你第一眼就只要数 ...
- 【Python学习之十一】Numpy
环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 python3.6 1.介绍NumPy(Numerical Pyt ...
- Python学习教程:Pandas中第二好用的函数
从网上看到一篇好的文章是关于如何学习python数据分析的迫不及待想要分享给大家,大家也可以点链接看原博客.希望对大家的学习有帮助. 本次的Python学习教程是关于Python数据分析实战基础相关内 ...
- Python学习-使用matplotlib画动态多图
最近常常使用matplotlib进行数学函数图的绘制,可是怎样使用matplotlib绘制动态图,以及绘制动态多图.直到今天才学会. 1.參考文字 首先感谢几篇文字的作者.帮我学会了怎样绘制.大家也能 ...
- Python学习总结 05 pandas
pandas官方网址 : http://pandas.pydata.org/ . pandas的安装比较复杂,如果想开箱即用,可以考虑下载WinPython.WinPython的官方地址是: htt ...
- 【Python学习】matplotlib的颜色
matplotlib自带的颜色 seaborn的颜色 装了seaborn扩展的话,在字典seaborn.xkcd_rgb中包含所有的xkcd crowdsourced color names. 使用的 ...
- 【Python学习笔记】Pandas库之DataFrame
1 简介 DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表. 或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matla ...
- python大数据初探--pandas,numpy代码示例
import pandas as pd import numpy as np dates = pd.date_range(',periods=6) dates import pandas as pd ...
- 2019-04-15 Python之利用matplotlib和numpy的简单绘图
环境:win10家庭版, Anocada的 Spyder 一.简单使用 使用函数 plt.polt(x,y,label,color,width) 根据x,y 数组 绘制直,曲线 import nump ...
随机推荐
- JS中for循环“全局”变量的传递
在项目中,遇到了一个问题,描述如下:我们在联动下拉框中,选中值后,会在隐藏的控件中记录一下选中值的主键(展示的是名称).但是,在取消选中的时候,没有把隐藏控件中的value值清空,导致在提交的时候,有 ...
- Nginx做代理
0 查看日志 tail -f /var/log/nginx/access.log 1 Nginx代理配置语法 1.Nginx代理配置语法 Syntax: proxy_pass URL; Default ...
- Django框架之Filters(过滤器)、母版的使用
在Django的模板语言中,通过使用 过滤器 来改变变量的显示. 过滤器的语法: {{ value|filter_name:参数 }} 使用管道符"|"来应用过滤器. 注意事项: ...
- PP Bottle Have High Cycle Times
This year, the participation of 0.1% -0.4% sorbitol nucleating agent in general PP can produce high- ...
- 对DensePose: Dense Human Pose Estimation In The Wild的理解
研究方法 通过完全卷积学习从图像像素到密集模板网格的映射.将此任务作为一个回归问题,并利用手动注释的面部标注来训练我们的网络.使用这样的标注,在三维对象模板和输入图像之间,建立密集的对应领域,然后作为 ...
- Python(四)生成器 和 杨辉三角
学习链接: http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/00143177992 ...
- 使用PIE.htc 进行IE兼容CSS3
步骤: 1.引入文件.注意PIE.htc文件和css文件要放在同一个目录下: 2.在css元素中加上 behavior:url(pie.htc); 3.可以愉快的写css hack啦 ,这时需要的圆 ...
- 「ZJOI2008」树的统计
树剖模板题啊! 这道题的话,最通(jian)俗(dan)易(cu)懂(bao)的解法应该就是树剖了. 加上线段树维护树上路径的最大权值(\(Max\))和路径和(\(sum\)). 至于\(LCT\) ...
- Jmeter调度器小记
jmeter的调度器中[持续时间(秒)]的优先级是高于[结束时间]和[启动时间]的 举例子: 前提:[循环次数]勾选[永远] 场景1:[持续时间(秒)]设置为120S,[启动时间]设置T+1min,[ ...
- DHCP原理及报文格式
DHCP原理及报文格式 DHCP(Dynamic Host Configuration Protocol,动态主机配置协议)是IETF为实现IP的自动配置而设计的协议,它可以为客户机自动分配IP地址. ...