python数据统计，总数，平均值等

一般我们进行数据统计的时候要进行数据摸查，可能是摸查整体的分布情况啊。平均值，标准差，总数，各分段的人数啊。这时候用excel或者数据库统计都不方便。

我要统计的一个文件，太大了，还得分成15个文件，结果导一个进mysql都要导很久。再mysql进行编程，执行更久，很费事。

但是用python直接统计就很方便啦。

 @author: pc

 """

 import matplotlib as mpb

 import pandas as  pd

 import pylab as pl

 import numpy as np

 #读取文件

 #mnames=[' product_type','phone_num',' flow_total',' flow_used', 'phone_total',' phone_used' ]

 mnames=['time']

 product=pd.read_table('C:\\Users\\pc\\Desktop\\time.txt',encoding='utf-8',sep='|',header=None,names=mnames)

 # print(product['product_subtotal'])

 #选取产品小计列

 time=product['time']

 #按分位数划分区间

 cats=pd.qcut(time,[0,0.2,0.4,0.6,0.8,1.0])

 # print(cats)

 # print(pd.value_counts(cats))

 # print(product_subtotal)

 count=time.value_counts()

 #写入csv文件

 count.to_csv('C:\\Users\\pc\\Desktop\\counts9.csv')

 #输出描述性统计结果

 print(time.describe())

 #根据电话号码查询某行的值

 #num=product['phone_num']

 #print(product[product['phone_num']==18948482538])

 bins=np.arange(0,5000,100)

 pl.hist(time, bins)

但是这是适合一个一个文件算，如果存在多个文件，我们可以使用python合并后计算。

#-*-coding:utf-8-*-

import codecs

import os

filepath = "E:\\workspace\\test\\source\\usebill\\" #把要合并的文件放入一个文件夹

flist = os.listdir(filepath)

fileWrite =codecs.open("../source/alluse.txt",'w+','utf-8')#编码方便

for file in flist:

    child = os.path.join('%s%s'%(filepath,file))#连接路径

    print(child)

    fh = codecs.open(child,'r','utf-8')

    for line in fh.readlines():

        fileWrite.write(line)

fileWrite.close()

import pandas as pd

product=pd.read_table('..\\source\\alluse.txt',encoding='utf-8',sep='|',header=None)

print(product[5][:10])

print(product[5].describe())

再说下编码一个小问题吧。多数的挖掘在unicode文件进行，f=open('XXXXX', 'r')
content=f.read().decode('utf-8')这是解码成unicode

参考文件(gbk, utf-8...) decode 成为 unicode 文件编码 encode- 成为文件(gbk, utf-8...)

python数据统计，总数，平均值等的更多相关文章

python数据统计出海品牌
当国内市场处于红海之中时,市场全球化已成为大势所趋.越来越多的国产品牌远走高飞,纷纷将品牌拿出来. 2019年,中国品牌十大品牌中,华为品牌力指数同比增长22%,阿里巴巴品牌力指数增长48%,小米品牌 ...
python数据统计之禅道bug统计
背景通过定期输出每条产品的 BUG 情况,以此来反馈开发解决问题.测试跟进问题的情况:钉钉群推送提醒开发及时解决以此我这边开始着手准备编写一个小工具,最终达到目的:自动定期发送统计报告,报告维度 ...
用python实现简单EXCEL数据统计的实例
用python实现简单EXCEL数据统计的实例下面小编就为大家带来一篇用python实现简单EXCEL数据统计的实例.小编觉得挺不错的,现在就分享给大家,也给大家做个参考.一起跟随小编过来看看吧任 ...
Python数据分析之双色球高频数据统计
Step1:基础数据准备(通过爬虫获取到),以下是从第一期03年双色球开奖号到今天的所有数据整理,截止目前一共2549期,balls.txt 文件内容如下 : 备注:想要现成数据的可以给我发邮件哟~ ...
Python数据可视化的四种简易方法
摘要: 本文讲述了热图.二维密度图.蜘蛛图.树形图这四种Python数据可视化方法. 数据可视化是任何数据科学或机器学习项目的一个重要组成部分.人们常常会从探索数据分析(EDA)开始,来深入了解数据, ...
python --数据可视化（一）
python --数据可视化一.python -- pyecharts库的使用 pyecharts--> 生成Echarts图标的类库 1.安装: pip install pyecharts ...
python数据统计分析
1. 常用函数库 scipy包中的stats模块和statsmodels包是python常用的数据分析工具,scipy.stats以前有一个models子模块,后来被移除了.这个模块被重写并成为了 ...
MySQL统计总数就用count(*)，别花里胡哨的《死磕MySQL系列十》
有一个问题是这样的统计数据总数用count(*).count(主键ID).count(字段).count(1)那个效率高. 先说结论,不用那么花里胡哨遇到统计总数全部使用count(*). 但是有很多 ...
有关“数据统计”的一些概念 -- PV UV VV IP跳出率等
有关"数据统计"的一些概念 -- PV UV VV IP跳出率等版权声明:本文为博主原创文章,未经博主允许不得转载. 此文是本人工作中碰到的,随时记下来的零散概念,特此整理一下. ...

随机推荐

C#如何获取CPU处理器核心数量 z
有几条不同的处理器信息,您可以获得有关的信息:物理处理器数量.核心数量和逻辑处理器数量,这些可以不同.两颗双核超线程(启用)处理器的机器情况下有:2个物理处理器.4个核心和8个逻辑处理器. 逻辑处理器 ...
Android高手速成
第一部分个性化控件(View) http://www.cnblogs.com/huwei0814/p/3796659.html 第二部分工具库 http://www.cnblogs.c ...
Java中遍历Map集合的四种方法
在Java中如何遍历Map对象 How to Iterate Over a Map in Java 在java中遍历Map有不少的方法.我们看一下最常用的方法及其优缺点. 既然java中的所有map都 ...
JS toFixed 四舍六入五成双
以前一直以为toFixed就是四舍五入的方法,后来又有一段时间以为toFixed是五舍六入.今天终于写的时候,终于才知道toFixed是一个叫做四舍六入无成双的诡异的方法... 完全不明白为什么要这么 ...
java 对EXCEL表格的处理
都整蒙圈了 Cannot get a numeric value from a text cell 的处理,EXCEL表格里是数值型的处理 http://blog.csdn.net/ysughw/ar ...
JavaScript 命名规则
来源 :http://www.codelifter.com/main/tips/tip_020.shtml The following are the rules for naming JavaScr ...
怎样把excel的数据导入到sqlserver2000数据库中
在做程序的时候有时需要把excel数据导入到sqlserver2000中,以前没从外部导入过数据,今天刚做了一下导入数据,感觉还是蛮简单的,没做过之前还想着多么的复杂呢,下面就来分享一下我是如何把ex ...
查看最点CPU的语句
select c.last_execution_time,c.execution_count,c.total_logical_reads, c.total_logical_writes,c.total ...
sql2008r 收缩数据库日志log文件；删除errorlog文件的方法
1.清空log文件,以减少数据库文件log所占的空间 USE dbname1 ; GO ALTER DATABASE dbname1 SET RECOVERY SIMPLE;--设置简单恢复模式 GO ...
python 核心编程课后练习(chapter 3)
3-8 #3-8 "makeTextFile.py -- create text file" import os ls = os.linesep #get filename fna ...

python数据统计，总数，平均值等

python数据统计，总数，平均值等的更多相关文章

随机推荐

热门专题