pandas 代码

 def get_train_data():

     df = pd.read_csv('data/train.csv', encoding='utf_8')

 #    df1 = pd.read_csv('data/test.csv', encoding='utf_8')

 #    df2 = pd.read_csv('data/count.csv', encoding='utf_8')

 #    df1['casual'] = df2['casual']

 #    df1['registered'] = df2['registered']

 #    df1['count'] = df2['count']

 #    df = pd.concat([df, df1])

     cur_time = pd.to_datetime(df['datetime'])

     df['year'] = cur_time.map(lambda x:x.year)

     df['month'] = cur_time.map(lambda x:x.month)

     df['day'] = cur_time.map(lambda x:x.day)

     df['hour'] = cur_time.map(lambda x:x.hour)

     df['dayOfWeek'] = cur_time.map(lambda x:x.isoweekday())

     df['segOfDay'] = df['hour'].apply(classfy)  

     year = pd.get_dummies(data=df.iloc[:,])

 #    df['spring'] = df['season'].map({1:1})

 #    df['summer'] = df['season'].map({2:1})

 #    df['autumn'] = df['season'].map({3:1})

 #    df['winter'] = df['season'].map({4:1})

 #    df = df.fillna(value={'spring':0,'summer':0,'autumn':0,'winter':0})

 #

 #    df['weather1'] = df['weather'].map({1:1})

 #    df['weather2'] = df['weather'].map({2:1})

 #    df['weather3'] = df['weather'].map({3:1})

 #    df['weather4'] = df['weather'].map({4:1})

 #    df = df.fillna(value={'weather1':0,'weather2':0,'weather3':0,'weather4':0})

 #

     df = df.replace({'windspeed':0}, 12.799)

     casual = df['casual']

     registered  = df['registered']

     df = df.drop(['datetime', 'season', 'weather','casual', 'registered', 'count'], axis=1)

     log_cas = casual.map(lambda x: math.log(x+1))

     log_reg = registered.map(lambda x: math.log(x+1))

     train_casual = log_cas.values

     train_registered = log_reg.values

     train_data = df.values

     return train_casual, train_registered, train_data

pandas 代码的更多相关文章

使用Pandas_UDF快速改造Pandas代码
1. Pandas_UDF介绍 PySpark和Pandas之间改进性能和互操作性的其核心思想是将Apache Arrow作为序列化格式,以减少PySpark和Pandas之间的开销. Pandas_ ...
（数据科学学习手札92）利用query()与eval()优化pandas代码
本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介利用pandas进行数据分析的过程,不仅仅是计算 ...
在pandas中使用pipe()提升代码可读性
1 简介我们在利用pandas开展数据分析时,应尽量避免过于碎片化的组织代码,尤其是创建出过多不必要的中间变量,既浪费了内存,又带来了关于变量命名的麻烦,更不利于整体分析过程代码的可读性,因此以流水 ...
Pandas初学者代码优化指南
原文:A Beginner’s Guide to Optimizing Pandas Code for Speed 作者:Sofia Heisler 翻译:无阻我飞扬摘要:Pandas 是Pytho ...
【Python发展】pandas和koalas
1.pandas介绍 Python 数据科学在过去几年中爆炸式增长, pandas 已成为生态系统的关键.当数据科学家得到一个数据集时,他们会使用 pandas 进行探索.它是数据处理和分析的终极工具 ...
python科学计算库-pandas
------------恢复内容开始------------ 1.基本概念在数据分析工作中,Pandas 的使用频率是很高的, 一方面是因为 Pandas 提供的基础数据结构 DataFrame 与 ...
相关性系数及其python实现
参考文献: 1.python 皮尔森相关系数 https://www.cnblogs.com/lxnz/p/7098954.html 2.统计学之三大相关性系数(pearson.spearman.ke ...
你确定 SQL 查询都是以 SELECT 开始的？
很多 SQL 查询都是以 SELECT 开始的. 不过,最近我跟别人解释什么是窗口函数,我在网上搜索"是否可以对窗口函数返回的结果进行过滤"这个问题,得出的结论是"窗口函 ...
增强 Jupyter Notebook的功能
增强 Jupyter Notebook的功能 Jupyter Notebook 是所有开发者共享工作的神器,它为共享 Notebooks 提供了一种便捷方式:结合文本.代码和图更快捷地将信息传达给受众 ...

随机推荐

洛谷P2812校园网络【Network of Schools加强版】
题目背景浙江省的几所$OI$强校的神犇发明了一种人工智能,可以$AC$任何题目,所以他们决定建立一个网络来共享这个软件.但是由于他们脑力劳动过多导致全身无力身体被$♂$掏$♂$空,他 ...
Java基础笔记（十一）—— 字符串与数组
字符串的声明与初始化主要两种:String s1=new String("abc"); 或 String s2="abc"; String ...
POJ1023 The Fun Number System
题目来源:http://poj.org/problem?id=1023 题目大意: 有一种有趣的数字系统.类似于我们熟知的二进制,区别是每一位的权重有正有负.(低位至高位编号0->k,第i位的权 ...
Angular学习笔记【ngx-bootstrap】中的 tabset
<tabset class="tab-container tabbable-line"> <tab heading="{{l("MobileS ...
装饰器(Decorator)模式
public interface IDoThings { public void doSomeThing(); } public class DoThings implements IDoThings ...
@Requestbody@ApiParam @PathVariable @RequestParam三者区别
一.问题描述由于项目是前后端分离,因此后台使用的是spring boot,做成微服务,只暴露接口.接口设计风格为restful的风格,在get请求下,后台接收参数的注解为RequestBody时会报 ...
两个线程分别打印 1- 100，A 打印偶数， B打印奇数
package com.demo.thread; public class PrintNumber { private static Object lock = new Object(); priva ...
(转)linux 中特殊符号用法详解
linux 中特殊符号用法详解原文:https://www.cnblogs.com/lidabo/p/4323979.html # 井号 (comments)#管理员 $普通用户脚本中 #!/b ...
让javascript加载速度倍增的方法(解决JS加载速度慢的问题)
通常我们的网站里面会加载一些js代码,统计啊,google广告啊,百度同盟啊,阿里妈妈广告代码啊,一堆,最后弄得页面加载速度很慢,很慢. 解决办法:换一个js包含的方式,让javascript加载速度 ...
boot and loader
boot and loader boot 程序的所有作用清屏将光标移到屏幕左上角显示 Start Boot 提示信息加载 loader 程序的代码到 0x10000 物理内存地址将CPU的段 ...

pandas 代码

pandas 代码的更多相关文章

随机推荐

热门专题