面向函数范式编程(Functional programming)

模拟简单的随机过程

模拟一个简单的随机过程：从N~(0,1)标准正态分布中产生100个随机值，反复5次得到一个list，再以每个list的初始值作为起点后一个的值作为过程步的增量走到下一步，直到走到尽头。

先来看一下accumulate函数的作用

# Understanding the arguments .x and .y when .f

# is a lambda function

# .x is the accumulating value

2:6 %>% accumulate(~ .x) # 产生以3为起点方差为3的序列

## [1] 2 2 2 2 2

# .y is element in the list

2:6 %>% accumulate(~ .y) 

## [1] 2 3 4 5 6

#

2:6 %>% accumulate(~ .x + .y) # 产生以2为起点2：6为累加值的序列

## [1]  2  5  9 14 20

利用accumulate尝试实现一个带有漂移的随机过程

# Simulating stochastic processes with drift

## Not run: 

plotSim <- function(draft){

  rerun(5, rnorm(100)) %>% # This is a convenient way of generating sample data. It works similarly to replicate(..., simplify = FALSE).

  set_names(paste0("sim", 1:5)) %>%

  map(~ accumulate(., ~ draft + .x + .y)) %>%

  map_df(~ data_frame(value = .x, step = 1:100), .id = "simulation") %>%

  ggplot(aes(x = step, y = value)) +

    geom_line(aes(color = simulation)) +

    ggtitle("Simulations of a random walk with drift")

}

plotSim(0.001)

多数据建模

检验车辆数据集中变量单位加仑的英里数与重量之间的线性关系是否会在不同的引擎汽缸中有显出差异？

# If each element of the output is a data frame, use

# map_df to row-bind them together:

mtcars %>%

  split(.$cyl) %>%

  map(~ lm(mpg ~ wt, data = .x)) %>%

  map_df(~ as.data.frame(t(as.matrix(coef(.)))))

##   (Intercept)        wt

## 1    39.57120 -5.647025

## 2    28.40884 -2.780106

## 3    23.86803 -2.192438

对数据集中不同的数据分别进行建模，再预测：

# Split into pieces, fit model to each piece, then predict

by_cyl <- mtcars %>% split(.$cyl)

mod <- by_cyl %>% map(~ glm(mpg ~ wt, data = .))

a <- map2(mod, by_cyl, predict) %>%

  flatten_df() %>%

  t() %>%

  as.data.frame() %>%

  mutate(a=rownames(.))

mtcars %>%

  mutate(a=rownames(.)) %>%

  left_join(a) %>%

  select(a, mpg, V1) %>%

  mutate(e = abs(mpg-V1)) %>%

  ggplot(aes(a, e))+

  geom_point()+

  coord_flip()

## Joining, by = "a"

多模型预测

对单一数据集进行多个模型训练预测：

result <- mtcars %>%

  tbl_df() %>%

  nest() %>%

  mutate(mod1 = map(data, ~ glm(mpg ~ wt, data = .)),

        mod2 = map(data, ~ lm(mpg ~ wt, data = .)),

        pred1 = map2(mod1, data, predict),

        pred2 = map2(mod2, data, predict)

  )

result

## # A tibble: 1 x 5

##                 data      mod1     mod2      pred1      pred2

##               <list>    <list>   <list>     <list>     <list>

## 1 <tibble [32 x 11]> <S3: glm> <S3: lm> <dbl [32]> <dbl [32]>

产生四个数据集，分别按照一定格式的文件命名方式保存下来

# create dfs to loop over

df <- data.frame(

  a = rnorm(10),

  b = rnorm(10),

  c = rnorm(10),

  d = rnorm(10)

)

obj <- list(df1 = df, df2 = df, df3 = df, df4 = df )

# create file names to loop over

path <- getwd()

folder <- "RDa"

names <- c("df1", "df2", "df3", "df4")

if(!file.exists(folder)){

  dir.create(folder)

  fnames <- lapply(names, function(x) paste0((file.path(path, folder)), '/', x, ".RDa"))

}

fnames <- lapply(names, function(x) paste0((file.path(path, folder)), '/', x, ".RDa"))

walk2(obj, fnames, ~ save(.x, file = .y))

dir('RDa')

## [1] "df1.RDa" "df2.RDa" "df3.RDa" "df4.RDa"

用R实现范式编程的更多相关文章

SparkR(R on Spark)编程指南含 dataframe操作 2.0
SparkR(R on Spark)编程指南 Spark 2015-06-09 28155 1评论下载为PDF 为什么不允许复制关注iteblog_hadoop公众号,并在这里评论区留言 ...
SparkR(R on Spark)编程指南含 dataframe操作
SparkR(R on Spark)编程指南 Spark 2015-06-09 28155 1评论下载为PDF 为什么不允许复制关注iteblog_hadoop公众号,并在这里评论区留言 ...
C# 由范式编程==运算符引发对string内存分配的思考
今天在看C#编程指南时(类型参数的约束http://msdn.microsoft.com/zh-cn/library/d5x73970.aspx)看到一段描述: 在应用 where T : class ...
面向函数范式编程(Functional programming)
函数编程(简称FP)不只代指Haskell Scala等之类的语言,还表示一种编程思维,软件思考方式,也称面向函数编程. 编程的本质是组合,组合的本质是范畴Category,而范畴是函数的组合. 首先 ...
R语言面向对象编程：S3和R6
一.基于S3的面向对象编程基于S3的面向对象编程是一种基于泛型函数(generic function)的实现方式. 1.S3函数的创建 S3对象组成:generic(generic FUN)+met ...
R语言高性能编程，优化（一）
这段时间学习了<R高性能编程>这本书,基于这段时间做的项目实践,总结了一些自己的体会,和大家分享一.为什么R程序有时候会很慢?1.计算性能的三个限制条件 cpu ram io R代码本身 ...
R语言高性能编程（三）
一.使用并行计算加倍提升性能1.数据并行 VS 任务并行实现数据并行的算法scoket 并行性注意并行计算时间并不与执行任务的计算资源数目成正比(计算机核心),amdahl定律:并行代码的速度受限于串 ...
R语言高性能编程（二）
接着上一篇一.减少内存使用的简单方法1.重用对象而不多占用内存 y <- x 是指新变量y指向包含X的那个内存块,只有当y被修改时才会复制到新的内存块,一般来说只要向量没有被其他对象引用,就可 ...
GPU并行编程小结
http://peghoty.blog.163.com/blog/static/493464092013016113254852/ http://blog.csdn.net/augusdi/artic ...

随机推荐

P2571 [SCOI2010]传送带——hyl天梦
P2571 [SCOI2010]传送带题解----天梦如写的不好,请多见谅. 对于这道题,我首先想说,确实困惑了我好久,看网上的各种题解,却都不尽人意,思路早已明白,却不会操作.最后想想,还是觉得自 ...
[python之路]格式化显示
格式化显示格式规范微语言中文版以下整理自 python字符串格式化 *输出结果的空格在md预览中没效果(用代码块三个撇号就可以保留格式了) 一.使用格式化符来格式化字符串: Python支持的所 ...
工业狗转行AI的心路历程
2020年2月16日,晴昨晚下了一场雪,大概是晚上八九点的样子,细碎的雪花在无风的夜里直嗖嗖的往下掉,门前的轿车顶上覆了薄薄的一层.路灯下的小巷格外的寂静,裹着我的睡衣在昏黄的灯光下站了许久,冠状病 ...
Go语言实现：【剑指offer】用两个栈实现队列
该题目来源于牛客网<剑指offer>专题. 用两个栈来实现一个队列,完成队列的Push和Pop操作. 队列中的元素为int类型. Go语言实现: var list1 = list.New( ...
[redis读书笔记] 第二部分单机数据库 RDB持久化
内存中的rdb是会存为文件以做到RDB持久化的.RDB文件时一个二进制文件. 一载入与存储文件的载入是在server启动时进行的(rdbload()),因为AOF的更新频率比RDB高,所以如果AO ...
什么是JWT以及具体应用
jwt理论阮大神已经解释的很到位了 http://www.ruanyifeng.com/blog/2018/07/json_web_token-tutorial.html jwt官网收录了多种实现库, ...
k8s集群PHP环境使用
一.环境介绍 k8s版本: 1.15.2 存储: 阿里云NAS 测试代码: wordpress 二.下载wordpress和创建好数据库等 1.下载wordpress wget https://cn. ...
[RHEL8]开启BBR
# sysctl net.ipv4.tcp_congestion_control net.ipv4.tcp_congestion_control = cubic # sysctl net.ipv4.t ...
MySQL命令随手记之alter
修改表名 alter table 表名 rename 新表名; //修改table名添加.删除.修改字段 alter table 表名 add [column] 列名数据类型; //添加colum ...
Java @Deprecated Annotation（注解）
在本部分的快速指南中,我们将会查看 Java 的 deprecated API 和如何在程序中使用 @Deprecated 注解. @Deprecated Annotation(注解) 作为程序的进化 ...