1. # coding:utf-8
  2.  
  3. import pandas as pd
  4. import numpy as np
  5. import matplotlib.pyplot as plt
  6. from scipy.interpolate import interp1d
  7.  
  8. data = pd.read_excel('指数.xlsx',header=None,index_col=None)
  9.  
  10. # 数据信息
  11. # print(data.info())
  12.  
  13. # 查看空值
  14. isnull = data[1].isnull()
  15. # print(isnull)
  16. # print(data[1])
  17.  
  18. # 替换空值
  19. data[1] = data[1].fillna('')
  20.  
  21. # 找出索引
  22. index_ = data[isnull].index.tolist()
  23. # print(index_)
  24.  
  25. # 去除空列所在行
  26. data = data.drop(index_)
  27. # print(data)
  28.  
  29. x = data[1]
  30. y = data[0]
  31.  
  32. # 插值
  33.  
  34. f1=interp1d(x,y,kind='linear')#线性插值
  35. f2=interp1d(x,y,kind='cubic')#三次样条插值
  36. x_pred=np.arange(1,170,1)
  37. y1=f1(x_pred)
  38.  
  39. datas = pd.DataFrame([y1,x_pred])
  40. datas.to_excel('new指数.xlsx')
  41.  
  42. y2=f2(x_pred)
  43. plt.figure(figsize=[12,7])
  44. plt.scatter(x,y,s=30,c='red',label='原始指数')
  45. plt.plot(x_pred,y1,'b--',label='linear interpolation')
  46. # plt.plot(x_pred,y2,'b--',label='cubic')
  47. plt.legend(loc='upper left')
  48. font_size = {'size':13}
  49. plt.ylabel('淘宝指数',font_size)
  50. plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置字体为SimHei显示中文
  51. plt.rcParams['axes.unicode_minus'] = False # 设置正常显示符号
  52. plt.show()

pandas空值处理与插值的更多相关文章

  1. pandas 初识(三)

    Python Pandas 空值 pandas 判断指定列是否(全部)为NaN(空值) import pandas as pd import numpy as np df = pd.DataFrame ...

  2. pandas中的空值处理

    1.空值 1.1 有两种丢失数据: None: Python自带的数据类型 不能参与到任何计算中 np.nan: float类型 能参与计算,但结果总是nan # None+2 # 报错 # np.n ...

  3. pandas | DataFrame基础运算以及空值填充

    本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是pandas数据处理专题的第四篇文章,我们一起来聊聊DataFrame中的索引. 上一篇文章当中我们介绍了DataFrame数据结构当 ...

  4. pandas如何统计所有列的空值,并转化为list?

    统计所有列的空值:data.isnull().sum() 转化成list: df.isnull().sum().index.tolist() df.isnull().sum().values.toli ...

  5. pandas 如何判断指定列是否(全部)为NaN(空值)

    判断某列是否有NaN df['$open'].isnull().any() # 判断open这一列列是否有 NaN 判断某列是否全部为NaN df['$open'].isnull().all() # ...

  6. Python 数据分析包:pandas 基础

    pandas 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包 类似于 Numpy 的核心是 ndarray,pandas 也是围绕着 Series 和 DataFrame 两个核心数据 ...

  7. pandas 基础

    pandas 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包 类似于 Numpy 的核心是 ndarray,pandas 也是围绕着 Series 和 DataFrame 两个核心数据 ...

  8. 011 pandas的常见操作

    一:对索引进行操作 1.reindex重新索引 pandas提供了一个方法来创建一个适应新索引的新对象. Series通过调用reindex方法会根据新的索引顺序重新排序,如果新的索引中存在原索引不存 ...

  9. 【学习】DataFrame&Series类【pandas】

    参考链接:http://blog.csdn.net/yhb315279058/article/details/50226027 DataFrame类: DataFrame有四个重要的属性: index ...

随机推荐

  1. redis哨兵机制一(转)

    概述 Redis-Sentinel是Redis官方推荐的高可用性(HA)解决方案,当用Redis做Master-slave的高可用方案时,假如 master宕机了,Redis本身(包括它的很多客户端) ...

  2. MVC框架理解及优缺点

    MVC:模型(Model).视图(View).控制器(Control) 流程如下: 首先是视图向控制器发送请求,控制器再将业务请求发送给模型, 然后模型处理请求业务并把结果返回给控制器,控制器根据结果 ...

  3. PHP开发网站,你是如何提高其网站的安全性的?

    一.网站程序问题 很多网站的安全问题大多是由于网站程序存在漏洞,所以想要提高网站安全性,必须要选择安全的后台cms系统,若有能力可以自己去开发网站后台,这样安全性能得到极大的提高,若是从网上选择一些免 ...

  4. Redis在Windows环境下单机安装及远程访问方案

    一.下载Windows版Redis 打开https://github.com/MicrosoftArchive/redis/tags地址,找到最新版Redis安装包(Redis-x64-3.2.100 ...

  5. IE Only的userData

    上次我们提到了本地存储的一个方式,那就是Cookie,不过遗憾的是Cookie保存的数据量非常小,更详细的可以参考<在 Internet Explorer 中的 cookie 的数字和大小限制& ...

  6. Day22-Django之信号

    1. 如果往数据库中增加数据的时候,希望生成一个日志.在数据保存之前以及保存之后. Django中提供了“信号调度”,用于在框架执行操作时解耦.通俗来讲,就是一些动作发生的时候,信号允许特定的发送者去 ...

  7. 如何认识TOS----DSCP 对照表

    如何认识TOS----DSCP 对照表 最近有遇到项目中对FortiGate设置TOS的策略路由的问题,其实这问题较为简单,但是由于大家对TOS-DSCP概念不熟悉造成的,所以感觉比较难,现在不同厂商 ...

  8. MySQL 第二篇:库操作

    一 系统数据库 information_schema: 虚拟库,不占用磁盘空间,存储的是数据库启动后的一些参数,如用户表信息.列信息.权限信息.字符信息等performance_schema: MyS ...

  9. golang简单实现二叉树的数据添加和遍历

    代码实现 package tree import "fmt" type Node struct { elem interface{} left, right *Node } typ ...

  10. BZOJ 4827 循环卷积

    题意:求两个手环任意旋转对应位置的差值+c的平方最小 设b旋转到k最小,那么先将b扩张一倍构成一圈,那么答案式子就是 将这个式子展开一下,事情就变得有趣了起来 这个式子将a[ ]翻转可以化成卷积形式 ...