python常见函数积累

shape()

返回数组或者数据框有多少行或者多少列

import numpy as np

x = np.array([[1,2,5],[2,3,5],[3,4,5],[2,3,6]])

#输出数组的行和列数

print x.shape  #结果： (4, 3)

#只输出行数

print x.shape[0] #结果： 4

#只输出列数

print x.shape[1] #结果： 3

因此可以用来遍历行或者列

#计算每列的均值

ex=np.array(np.mean(x[:,i]) for i in range(x.shape[1]))

reshpae()

reshape()是数组array中的方法，作用是将数据重新组织

a = np.array([[1,2,3,4],[5,6,7,8]])  #二维数组

print(a.shape[0])  #值为2，最外层矩阵有2个元素，2个元素还是矩阵。

print(a.shape[1])  #值为4，内层矩阵有4个元素。

b= np.array([1,2,3,4,5,6,7,8])

b.reshape(2,4)

print(b)

#array([[1,2,3,4],

[5,6,7,8]])

pd.Dataframe.columns

返回数据框的列名

pd.Dataframe.columns.values

返回数据框的的列值

[[]]

我之前想提取两列，哈哈，想半天，最后看了一个同学给的demo

直接pd.[["列名","列名"]]

还是见的太少了

_

就是常见的命名规则，

这里指代损失函数

# Create centroids with kmeans for 2 clusters

cluster_centers,_ = kmeans(fifa[scaled_features], 2)

unique（）

去重函数，默认是行去重

[]

# Leave this list as is

number_cols = ['HP', 'Attack', 'Defense']

# Remove the feature without variance from this list

non_number_cols = ['Name', 'Type', 'Legendary']

# Create a new dataframe by subselecting the chosen features

df_selected = pokemon_df[number_cols + non_number_cols]

<script.py> output:

       HP  Attack  Defense                   Name   Type  Legendary

    0  45      49       49              Bulbasaur  Grass      False

    1  60      62       63                Ivysaur  Grass      False

    2  80      82       83               Venusaur  Grass      False

    3  80     100      123  VenusaurMega Venusaur  Grass      False

    4  39      52       43             Charmander   Fire      False

比如这个栗子，可以用来提取子数据框

format

print("{} rows in test set vs. {} in training set. {} Features.".format(X_test.shape[0], X_train.shape[0], X_test.shape[1]))

输出保留一位百分比小数的结果

print("{0:.1%} accuracy on test set.".format(acc))

isnull()

判断是否有缺失值

返回bool

.sum()

除了求和之外还有判断个数此时等同于count

pd.isnull.sum()

.dtypes

DataFrame.dtypes

返回DataFrame中的dtypes

这将返回一个Series，其中包含每列的数据类型。结果的索引是原始DataFrame的列。具有混合类型的列与objectdtype 一起存储

1.type() 返回参数的数据类型

2.dtype 返回数组中元素的数据类型

3.astype() 对数据类型进行转换

value_counts()

value_counts()是一种查看表格某列中有多少个不同值的快捷方法，并计算每个不同值有在该列中有多少重复值。

所以就是统计

In [3]: volunteer["category_desc"].value_counts()

Out[3]:

Strengthening Communities    307

Helping Neighbors in Need    119

Education                     92

Health                        52

Environment                   32

Emergency Preparedness        15

Name: category_desc, dtype: int64

apply

我先放个栗子，后面继续补充这个函数，感觉做一些简单的处理很好用

# Create a list of the columns to average

run_columns = ["run1", "run2", "run3", "run4", "run5"]

# Use apply to create a mean column

running_times_5k["mean"] = running_times_5k.apply(lambda row: row[run_columns].mean(), axis=1)

# Take a look at the results

print(running_times_5k)

script.py> output:

          name  run1  run2  run3  run4  run5   mean

    0      Sue  20.1  18.5  19.6  20.3  18.3  19.36

    1     Mark  16.5  17.1  16.9  17.6  17.3  17.08

    2     Sean  23.5  25.1  25.2  24.6  23.9  24.46

    3     Erin  21.7  21.1  20.9  22.1  22.2  21.60

    4    Jenny  25.8  27.1  26.1  26.7  26.9  26.52

    5  Russell  30.9  29.6  31.4  30.4  29.9  30.44

python常见函数积累的更多相关文章

python常见函数以及模块调用
1.常用函数区别 print: 在python3.0中print是函数,这意味着需要编写print(A )而不是print A str()和repr()的区别 >>>print st ...
python爬虫积累（一）--------selenium+python+PhantomJS的使用（转）
阅读目录一.Selenium介绍二.爬虫为什么要用selenium? 三.PhantomJS介绍四.PhantomJS安装五.操作实战六.在此推荐虫师博客的学习资料 selenium + p ...
Python学习积累：使用help（）;打印多个变量；fileno()
1.使用篇: 1.1如何从help()退出: 直接回车即可! 2.技能篇: 2.1 如何一次性打印多个变量? 多个变量中间使用逗号隔开,且引用变量为%(变量1,变量2,变量3), 2.2fileno( ...
python爬虫积累（一）--------selenium+python+PhantomJS的使用
最近按公司要求,爬取相关网站时,发现没有找到js包的地址,我就采用selenium来爬取信息,相关实战链接:python爬虫实战(一)--------中国作物种质信息网一.Selenium介绍 Se ...
python知识积累
1. 安装requirements.txt依赖: pip install -r requirements.txt 生成requirements.txt文件: pip freeze > requi ...
Python 自学积累（二）
1. onfigParser 模块用于操作配置文件注:Parser汉译为“解析”之意. 配置文件的格式与windows ini文件类似,可以包含一个或多个节(section),每个节可以有多个参数( ...
Python 自学积累（一）
1. 当"print os.path.dirname(__file__)"所在脚本是以完整路径被运行的, 那么将输出该脚本所在的完整路径,比如: python d:/pythonS ...
python常见函数运用【一】
1.Python hasattr() 函数描述hasattr() 函数用于判断对象是否包含对应的属性. 语法 hasattr 语法: hasattr(object, name)参数object -- ...
Python 日常积累
包管理 >from ... import ... 的用法和直接import的区别直接使用import时,如果需要使用到导入模块内的属性和方法,必须使用模块名.属性和模块名.方法的方式进行调用 ...

随机推荐

HTML5与HTML4的区别-----通用的排版结构
一个网页通常分为:头部,主体内容和脚部三个部分,当然也有其他更细的划分方法. 以移动端为例, 当给一个设计图,我通常使用一下结构: <div class="container&quo ...
javascript 完全正确的数据库indexedDB
//indexedDB var dbName = 'whx', version = '1', dbTableName = 'bbg', request, db, conCls, updateKey, ...
lwip的内存管理
lwip可以不用malloc,而完全用pool,全用全局变量,没看明白怎么实现的. #if LWIP_NETCONN || LWIP_SOCKET LWIP_MEMPOOL(NETBUF, MEMP_ ...
排查 Kubernetes HPA 通过 Prometheus 获取不到 http_requests 指标的问题
部署好了 kube-prometheus 与 k8s-prometheus-adapter (详见之前的博文 k8s 安装 prometheus 过程记录),使用下面的配置文件部署 HPA(Horiz ...
[ERROR]pyodbc.ProgrammingError: ('42000', '[42000] [Microsoft][ODBC Driver 17 for SQL Server][SQL Server]SQL Server 阻止了对组件“xp_cmdshell”的过程“sys.xp_cmdshell”的访问
环境: Windows 2012 R2 SQL Server 2014 通过MSSQL查询数据库服务器时间,报错如下: pyodbc.ProgrammingError: (', '[42000] [M ...
android button的selector
实现按钮的selector <?xml version="1.0" encoding="utf-8"?> <selector xmlns:an ...
利用VS Code在Azure上构建部署静态页面
0x00 前言前一段时间,我找到了Jendrik Illner的个人网站.除了那里的精彩文章,网站的主题也吸引了我的注意力,而且我发现该网站的主题采用了Hugo的Academic主题. 然后,我认为 ...
pikachu-越权漏洞（Over Permission）
一.越权漏洞概述 1.1 概述由于没有用户权限进行严格的判断,导致低权限的账户(例如普通用户)可以去完成高权限账户(例如管理员账户)范围内的操作. 1.2 越权漏洞的分类 (1)平行越权 ...
OpenLayers 6 学习笔记2 WMS服务避坑记录
心血来潮,花1小时安装软件写代码+复习api,顺便熟悉一波wms 再次强化认知了wms获取要素的能力没有wfs强,有待考究原文链接(转载请声明@秋意正寒博客园/知乎/B站/csdn/小专栏):h ...
深入浅出 .NET C# 反射技术
反射这个词听起来就很牛逼是吧? 嗯的确,反射是比较高级的特性,只有语言基础很扎实的Dev们才应该使用它. 搞点反射,可以提高程序的灵活性.可扩展性.耦合度. 反射这东西,是为了动态地运行时加载,相比于 ...