博客总目录,记录学习R与数据分析的一切:http://www.cnblogs.com/weibaar/p/4507801.html

 -------

经过周末一个半天的努力,终于把这次的Assignment3做出来,然后做完Quiz4,顺利结束R Programming这门课程。

对这门课的综合吐槽就是,Roger老师的github头像好帅,动态视频更帅,视频内容还算充足,但远远不足以应付assignment。Assignment设计一个比一个精巧,难度一个比一个大,没有足够的耐性以及一定的基础,还真的很难独自应付完R Programming这门课。如果不是我买了付费证书,以及工作中确实需要R,估计学着学着就废掉了吧……

但是话说回来,这门课的assignment设计的还是颇为精巧的。

Swirl,

这个是个包,带我们了解R的大部分内容。调用library(swirl), swirl()即可。R初学者请一定学习学习!设计极好!

Assignment1,

带我们初步了解了循环,以及数据读取和rbind。精华语句是以下两段(代码已修改,以避免泄题)。在这里,初步涉及了函数的编写,循环的使用,以及数据框类型的先定义和rbind语句。同时在某个函数里通过threhold的引用,引入了if else结构。

https://github.com/derekfranks/practice_assignment/blob/master/practice_assignment.rmd

上面的github教程是我见过最好的指导教程,没有它,assignment1就跪了。

 files_list<-list.files(directory,full.names=TRUE)

#read file list & cycle reading data

dat<-data.frame()
for (i in id){
id=i
new1=sum(read.csv(files_list[i]))
dat<-rbind(dat,new1)
}

Assignment2,

这个的精华在于对词法作用域的介绍,并介绍了函数缓存值,虚拟函数,函数内变量,以及<<-的使用。不过从代码的角度来说,示例的实际应用意义不大。倒不如quiz里涉及的东西全面。但好好消化以后,会发现对词法作用域有了较深的理解,在之后用sapply, lapply, tapply等函数时,也比较敢于编程了。

        set <- function(y){
x<<-y
m<<-NULL setSolve <- function(solve) m<<-solve

Assignment3,这道题由3个部分组成,除了第二部分外,剩下两部分都要耗时4-5个小时思考……不愧是压轴的assignment,做到让人近似崩溃。但是这个也是对R知识应用最综合的题目。前面两部分要用到的函数,以及方法,在本次assignment3里都被拎出来

整理一下:

1)数据框,我们经常会用split按照某个变量拆分数据框,这样会出来一系列由data.frame组合的list。

如果用data[i],只会拿到一堆list,只有用data[[i]]才能拿到原本的data.frame格式。这是为什么以下代码可以生效的原因。

data_split<-split(data_complete,data_complete$State)

 new1<-cbind(data_order[[i]],rank)

2)数据框筛选,我们要么用==直接获得等于某个数值的数据库,要么我们可以利用!any或者all函数来判断,某个值是否在数据框里,如果不在,弹出错误信息。但是注意,这里由于循环补齐的原因,num,outcome以单个字符/数字为佳。向量要用其他方法。

final<-r[r$rank==num,]

 if (!any(colname==outcome)){
stop("invalid outcome")

3)关于numeric函数,如果一个数据里有一堆ta,1,2,3,4, not avilalbe,使用as.numeric可以快速的把非数值函数转化为NA。这样才可以加入计算。(对于取整,用as.integer效率奇佳)

 var<-as.numeric(list[colname==outcome,1])

4)利用colnames(x)<-c(ddd,ddd)可以给数据库快速命名

 colnames(final)<-c("hospital","state")

5)关于排序,先获得split的函数后,使用lapply可以快速对数据进行排序。然后用rbind,[[i]]又可以快速结合回来

data_order<-lapply(data_split,function(x) x[order(x[,3],x[,1]),])

6)关于1:length。之前在这里考死了很多回。后来发现,如果nrow()-1<-0,NA的话,用2:nrow-1会返回一个2,1,0向量。这样,在循环补齐时就会报错。而且是报很多错。然后if else, else一定要接在}后面,另起一行的话,R也很容易报错<--论良好的函数书写习惯的重要性。

 if (nrow(xx[[i]])==1) {
rank=c("a")
} else {
if (nrow(data_order[[i]])==2){
rank=c("a","d")
}else {
rank=c("a",2:(nrow(data_order[[i]])-1),"d")}}

综上,这是我在做assignment3里被踩过的若干个坑……

感谢我终于出来了

谢谢JHU贡献的这么有操作意义的R Programming的课程,接下来打算继续跟着学习cleanning data,听说assignment也很难ε(罒ω罒)з。。。。给跪

最后补充一下

当全身心投入一门课的学习时,会觉得时间过得很快,也很充实。之后不会再迷茫了。数据分析,其实就是多学,多练,多思考,多做码农。庆幸我开始的还不算太晚。

以及,因为这个月太沉迷于R,被同事吐槽说,一整天扑在编程还有R上,怪不得你没有男朋友……单身狗内牛满面……

博客总目录,记录学习R与数据分析的一切:http://www.cnblogs.com/weibaar/p/4507801.html

 

Coursera系列-R Programming-Final Week-Assignment3 & 总结的更多相关文章

  1. Coursera系列-R Programming第二周

    博客总目录,记录学习R与数据分析的一切:http://www.cnblogs.com/weibaar/p/4507801.html  --- 好久没发博客 且容我大吼一句 终于做完这周R Progra ...

  2. Coursera系列-R Programming第三周-词法作用域

    完成R Programming第三周 这周作业有点绕,更多地是通过一个缓存逆矩阵的案例,向我们示范[词法作用域 Lexical Scopping]的功效.但是作业里给出的函数有点绕口,花费了我们蛮多心 ...

  3. 让reddit/r/programming炸锅的一个帖子,还是挺有意思的

    这是原帖 http://www.reddit.com/r/programming/comments/358tnp/five_programming_problems_every_software_en ...

  4. [R] [Johns Hopkins] R Programming 作業 Week 2 - Air Pollution

    Introduction For this first programming assignment you will write three functions that are meant to ...

  5. R Programming week 3-Loop functions

    Looping on the Command Line Writing for, while loops is useful when programming but not particularly ...

  6. 从零开始系列-R语言基础学习笔记之二 数据结构(二)

    在上一篇中我们一起学习了R语言的数据结构第一部分:向量.数组和矩阵,这次我们开始学习R语言的数据结构第二部分:数据框.因子和列表. 一.数据框 类似于二维数组,但不同的列可以有不同的数据类型(每一列内 ...

  7. 从零开始系列--R语言基础学习笔记之一 环境搭建

    R是免费开源的软件,具有强大的数据处理和绘图等功能.下面是R开发环境的搭建过程. 一.点击网址 https://www.r-project.org/ ,进入"The R Project fo ...

  8. R programming, In ks.test(x, y) : p-value will be approximate in the presence of ties

    Warning message: In ks.test(x, y) : p-value will be approximate in the presence of ties   The warnin ...

  9. [R] [Johns Hopkins] R Programming -- week 3

    library(datasets) head(airquality) #按月分組 s <- split(airquality, airquality$Month) str(s) summary( ...

随机推荐

  1. linux下的守护进程daemon

    什么是守护进程?其实感觉守护进程并没有什么明确的定义,只是守护进程有一些特征,这是它需要遵循的. 守护进程的第一个特征是长时间在后台运行的程序,并且主要是为了提供某种服务,而为了能够让服务尽可能随时都 ...

  2. 【原】移动web页面支持弹性滚动的3个方案

    有段时间一直折腾移动端页面弹性滚动的各种问题,做了点研究,今天做个小分享~ 传统 pc 端中,子容器高度超出父容器高度,通常使用 overflow:auto 可出现滚动条拖动显示溢出的内容,而移动we ...

  3. Oracle 数据库基础——安装

    一.数据库基础知识 1.概念 数据库全称数据库管理系统,简称DBMS,是一种在计算机中,针对数据进行管理.存储.共享的一种技术. 2.分类 数据库的发展过程中,按逻辑模型可分为以下几种: 3.关系型数 ...

  4. 【2016-11-15】【坚持学习】【Day26】【通用的SQLHelper】

    今天看DevDemo源码时候看到一个写得很好的SQLHelper 代码 public class SqlHelper<T, Command> where T : DbConnection ...

  5. 《In Search of an Understandable Consensus Algorithm》翻译

    Abstract Raft是一种用于管理replicated log的consensus algorithm.它能和Paxos产生同样的结果,有着和Paxos同样的性能,但是结构却不同于Paxos:它 ...

  6. Hibernate第三次测试错题解析

    此题目考查的是Hibernate查询缓存适用的场合,对于经常使用的查询语句, 如果启用了查询缓存,当第一次执行查询语句时,Hibernate会把查询结果存放在第二缓存中. 以后再次执行该查询语句时,只 ...

  7. sql 首写字母查询姓名(字段)

    来自网上大神,不知道是谁,挂不上链接 /////////////////////// 1.生成方法函数 create function f_GetPy(@str nvarchar(4000)) ret ...

  8. java构造方法的作用以及简单java类

    public class TestDemo{ public static void main(String args[]){ Emp emp1 =new Emp(001,"tom" ...

  9. mybatis 使用经验小结

    一.多数据源问题 主要思路是把dataSource.sqlSesstionFactory.MapperScannerConfigurer在配置中区分开,各Mapper对应的包名.类名区分开 <? ...

  10. ReactNative新手学习之路02第一个RN项目

    开始第一个RN项目(iOS版)我的电影列表0.1版,后面做列表版 打开上一节项目 index.ios.js,android打开index.android.js.我这里使用的是Atom编辑器,你也可以使 ...