lend_club 全球最大的P2P平台2007~2012年贷款数据百度云下载

此文章基于R语言做简单分析。

rm(list=ls())  #清除变量
gc() #释放内存
  • step1

    考虑到后续分析

    将数据导入sqlserver,用到SSIS

    如图



**此处有坑

  • step2

    连接sqlserver,并将数据读入R。
library(RODBC)
con<-odbcConnect("LI") # LI 是本地数据库,con~connect 是本地连接 RODBC Connection 2
Details:
case=nochange
DSN=LI
UID=
Trusted_Connection=Yes
APP=RStudio
WSID=LIYI-PC lend_club1<-sqlQuery(con,"SELECT sum([Amount Requested]) as sumamount
,[Application Date] as date_1
,[year]
,substring(convert(varchar(12),[Application Date],111),6,5) as month_day
FROM [liyi_test].[dbo].[lend_club]
group by [year],substring(convert(varchar(12),[Application Date],111),6,5),[Application Date]
order by [year],[month_day]")
head(lend_club1)
sumamount date_1 year month_day
1 2000 2007-05-26 2007 05/26
2 47400 2007-05-27 2007 05/27
3 23900 2007-05-28 2007 05/28
4 121050 2007-05-29 2007 05/29
5 87500 2007-05-30 2007 05/30
6 46500 2007-05-31 2007 05/31
  • step3
library(ggplot2)

qplot(date_1,sumamount,data=lend_club1,geom="line") # 每天贷款金额的时序图

p<-qplot(month_day,sumamount,data=lend_club1)
p+facet_wrap(~year) #2007-2012 期间每日的贷款金额

library(tidyr)
library(dplyr)
lend_club2<-separate(lend_club1,date_1,c("y","m","d"),sep="-")
head(lend_club2)
sumamount y m d year month_day
1 2000 2007 05 26 2007 05/26
2 47400 2007 05 27 2007 05/27
3 23900 2007 05 28 2007 05/28
4 121050 2007 05 29 2007 05/29
5 87500 2007 05 30 2007 05/30
6 46500 2007 05 31 2007 05/31
lend_club3<-unite(lend_club2,"y_m",y,m,sep="-",remove = F)
head(lend_club3)
sumamount y_m y m d year month_day
1 2000 2007-05 2007 05 26 2007 05/26
2 47400 2007-05 2007 05 27 2007 05/27
3 23900 2007-05 2007 05 28 2007 05/28
4 121050 2007-05 2007 05 29 2007 05/29
5 87500 2007-05 2007 05 30 2007 05/30
6 46500 2007-05 2007 05 31 2007 05/31 qplot(m,sumamount,data=lend_club3,geom=c("boxplot")+facet_wrap(~year) #2007~2012年每月贷款金额的箱线图

lend_club4<- lend_club3%>%
group_by(m,y)%>%
summarise(total_m=sum(sumamount)) lend_club4
head(lend_club4)
Source: local data frame [6 x 3]
Groups: m [2] m y total_m
(chr) (chr) (dbl)
1 01 2008 32256329
2 01 2009 28523635
3 01 2010 63082946
4 01 2011 171186425
5 01 2012 297667575
6 02 2008 20596688
折线图 分面
p<-qplot(m,total_m,data=lend_club4)+geom_smooth(aes(group=y,colour=y),method = "lm")

折线图 分面

p<-qplot(m,total_m,data=lend_club4)+geom_smooth(aes(group=y,colour=y))

p+facet_wrap(~y)

lend<-read.csv("C:\\Users\\liyi\\Desktop\\lend_club.csv")
lend1<-read.csv("C:\\Users\\liyi\\Desktop\\lend_club.csv",header = F)
lend1<-lend1[-1,]
head(lend1)
lend1<-lend1[,c(1,3,9)]
myvar<-c("amount","year","employment")
names(lend1)<-myvar
head(lend1)
str(lend1)
lend1$amountnew<-as.numeric(as.character(lend1$amount)) library(sqldf) lend2<-sqldf('select sum(V1),V3,V9
from lend1
group by V3,V9')
q<-qplot(employment,amountnew,data = lend1,geom=c("boxplot"),colour=lend1$employment)+facet_wrap(~year)
q<- q+theme(axis.text.x=element_text(angle=90,hjust=1,colour="black"),legend.position='none')
q<- q+scale_y_continuous(limits = c(0, 100000))
q

R可视化lend_club 全球最大的P2P平台数据75W条的更多相关文章

  1. HTTPS加密传输数据,加强P2P平台网络安全和信任

    12月28日,银监会会同工信部.公安部.网信办等部门研究起草了<网络借贷信息中介机构业务活动管理暂行办法(征求意见稿)>(以下简称<办 法>),并向社会公开征求意见.该< ...

  2. 分享“12306 P2P平台”创业Idea

      结合云平台抢票,社区,P2P等性质,实施供求抢票平台,能有效提高和整合抢票市场,抢票优势以杜绝黄牛,给散户提供更有利的抢票途径.本在11月计划实施,后去搞比特币,故分享摘要集思广益.     背景 ...

  3. 台湾P2P平台

    2014年6月28日下午1:30,“2014两岸三地P2P网贷行业高峰论坛”在上海会展中心友谊会堂如期举行,现场高朋满座,来自全国各地的众多知名P2P网站平台的负责人参与了讨论,并就当前P2P行业的一 ...

  4. P2P平台投宝金融跑路?为什么我没有中雷!

    编者按:市场有风险,投资需谨慎.最近,安徽合肥P2P平台"投保金融"跑路倒闭了. 今天(2016年11月8日)下午,在朋友圈看到一个分享,投宝金融跑路了,新闻媒体已经传开了. 这个 ...

  5. 合规P2P平台成PE/VC新宠

    013年是互联网金融元年,余额宝.百发等掀起了大众理财的新一轮高潮.P2P平台作为互联网金融模式之一,也受到市场的重点关注-在部分平台不断爆出风险事件的同时,业内较为成熟的平台也正成为PE/VC的新宠 ...

  6. 2017各银行贷款利息表及P2P平台贷款利率比较

    银行贷款利息是多少?2017各银行贷款利息表及P2P平台贷款利率比较 发表时间: 2017-02-17 作者: 一.2017央行贷款基准率 各个银行的贷款利率是以中国银行的人民币贷款基准率为标准进行上 ...

  7. 如何推断一个P2P平台是否靠谱?

    推断一个站点,是否靠谱.是有规律可循的.P2P平台算是个新兴的电商类站点.   网上欺诈类的站点.不限于P2P,实在是太多了,真的有必要总结下最关键的几个靠谱指标.   最关键的2个   1.创始人和 ...

  8. P2P平台很赚钱么?

    最近几年,搞P2P网贷和财富投资相关的金融周边公司,多了很多,楼下门店和电梯里的贷款小广告,真是多啊. 大家都去搞一件事的时候,很可能是大家都觉得这件事有利可图.但事实是,赚钱的总是少数,看到别人搞的 ...

  9. 怎样判断一个P2P平台是否靠谱?

    判断一个网站,是否靠谱,是有规律可循的,P2P平台算是个新兴的电商类网站.   网上欺诈类的网站,不限于P2P,实在是太多了,真的有必要总结下最关键的几个靠谱指标.   最关键的2个   1.创始人和 ...

随机推荐

  1. Bootstrap 快速人门案例——前端最火的插件

    今天,我给小白们分享一下比较流行的Bootstrap框架,它在工作中得到许多公司的青睐,因此对于升职和加薪很重要.同时,我们可以快速完成开发任务,减少发开周期,有不对的地方望大家指正. 如果你想走的更 ...

  2. OpenWRT镜像爬虫搭建本地源

    网上的爬虫不能用,还是先表达谢意,不过我比较懒不喜欢重复写别人写的教程,只贴出修改,怎么用自己看教程吧. 我自己改了一版可以正常爬: #!/usr/bin/env python #coding=utf ...

  3. Windows7 忘记密码的解决办法

    由于无法使用管理员帐号进入Windows 7,辅助工具比较大,已经回不到xp时代的pe一键删除密码了,不过用Windows 7的system账户运行cmd命令可以强制修改账户密码!就拿xp+Windo ...

  4. 国际化(Internationalization)

    1:什么是国际化? 国际化(internationalization)是设计和制造容易适应不同区域要求的产品的一种方式.它要求从产品中抽离所有的与语言,国家/地区和文化相关的元素.换言之,应用程序的功 ...

  5. iOS开发中的这些权限,你搞懂了吗?

    APP开发避免不开系统权限的问题,如何在APP以更加友好的方式向用户展示系统权限,似乎也是开发过程中值得深思的一件事. 那如何提高APP获取iOS系统权限的通过率呢?有以下几种方式:1.在用户打开AP ...

  6. asp.net缓存

    copy:http://www.cnblogs.com/knowledgesea/archive/2012/06/20/2536603.html 一.缓存概念,缓存的好处.类型.            ...

  7. fail树

    前置技能:AC自动机 假设我们有了一个AC自动机,然后在上面进行字符串匹配. 上面是一个有四个字符串的AC自动机(abcde.aacdf.cdf.cde),虚线是fail指针,实线是转移. 这是上一次 ...

  8. [LeetCode] Missing Ranges 缺失区间

    Given a sorted integer array where the range of elements are [0, 99] inclusive, return its missing r ...

  9. github.com使用方法

    github.com作为一个开源的代码托管平台,非常适合创建自己的代码库,也适合从别人已有项目fork自己的私有库:如果想私有托管,需要缴费使用. 创建自己代码库 在个人主页面,点击右上角+号,选择N ...

  10. 使用UITableView的分组样式

    分组样式顾名思义是对TableView中的数据行进行分组处理,每个分组都有一个header和footer. TableView中header的英文文本是大写的,footer的英文文本是小写的.如下图浅 ...