一.R软件 1.安装R:自行百度☺ 2.R控制台(R Console)和R程序脚本: 打开R软件,就会直接打开控制台,控制台可以显示程序运行的结果.错误提示等信息,也可以直接输入想要执行的操作并立即返回运行结果,箭头“>”表示等待输入. 程序脚本通过点击右上角“文件” - “新建程序脚本”来建立.如果想要长久的保存已经提交的程序代码,那么可以在程序脚本中编写,点击保存的时候会另存为一个后缀为“.R”的数据文件,如果直接在控制台编写代码,关闭软件后,已编写的代码会消失. 3.如何运行R程序脚本:…
R语言可视化学习笔记之添加p-value和显著性标记 http://www.jianshu.com/p/b7274afff14f?from=timeline   上篇文章中提了一下如何通过ggpubr包为ggplot图添加p-value以及显著性标记,本文将详细介绍.利用数据集ToothGrowth进行演示 #先加载包 library(ggpubr) #加载数据集ToothGrowth data("ToothGrowth") head(ToothGrowth) ## len supp…
R是免费开源的软件,具有强大的数据处理和绘图等功能.下面是R开发环境的搭建过程. 一.点击网址 https://www.r-project.org/ ,进入"The R Project for Statistical Computing"界面. 二.点击加粗字体的"download R",进行"CRAN Mirrors"镜像选择页面. 三.下拉滚动条,找到 从中选择镜像网址,这里点击第二项. 四.在界面下选择"Download R fo…
在上一篇中我们一起学习了R语言的数据结构第一部分:向量.数组和矩阵,这次我们开始学习R语言的数据结构第二部分:数据框.因子和列表. 一.数据框 类似于二维数组,但不同的列可以有不同的数据类型(每一列内的数据类型应当一致).创建数据框使用的关键字是data.frame,用法是: data.frame(..., row.names = NULL, check.rows = FALSE, check.names = TRUE, fix.empty.names = TRUE, stringsAsFact…
1. DATE 处理 1.1 日期格式一个是as.Date(XXX) 和strptime(XXX),前者为Date格式,后者为POSIXlt格式 1.2 用法:as.Date(XXX,"%Y/%m/%d %H:%M") ,strptime(XXX, format="%m%d%Y %H:%M") 1.3格式里的Y 为yy(i.e.: 15/01/02) , 格式里的y为yyyy(i.e.:2015/01/02) 2. 一些常用属性 2.1 输出列名:colnames(…
环境 在ANSI的任何一种实现中,存在两种不同的环境. 翻译环境:在这个环境里,源代码被转换为可执行的机器指令. 执行环境:用于实际执行代码. 翻译环境 组成一个程序的每个源文件通过编译过程分别转成目标代码 各个目标文件由链接器捆绑在一起,形成一个单一而完整的可执行程序. 链接器同时也会引入标准c函数库中的任何被改程序所用到的函数. 过程如下图所示   实际上,翻译环境本身也有几个阶段组成:   编译 预编译阶段:在这个阶段主要进行一些文本操作,如处理预处理指令,删除注释,#define宏替换,…
https://www.jianshu.com/p/b7274afff14f?from=timeline #先加载包 library(ggpubr) #加载数据集ToothGrowth data("ToothGrowth") head(ToothGrowth) ## len supp dose ## 1 4.2 VC 0.5 ## 2 11.5 VC 0.5 ## 3 7.3 VC 0.5 ## 4 5.8 VC 0.5 ## 5 6.4 VC 0.5 ## 6 10.0 VC 0.5…
转载:https://www.jianshu.com/p/678213d605a5?from=jiantop.com Hadley Wickham创建的可视化包ggplot2可以流畅地进行优美的可视化,但是如果要通过ggplot2定制一套图形,尤其是适用于杂志期刊等出版物的图形,对于那些没有深入了解ggplot2的人来说就有点困难了,ggplot2的部分语法是很晦涩的.为此Alboukadel Kassambara创建了基于ggplot2的可视化包ggpubr用于绘制符合出版物要求的图形. 安装…
古典概型的样本总量是一定的,且每种可能的可能性是相同的, 1.中位数:median(x) 2.百分位数:quantile(x)或者quantile(x,probe=seq(0,1,0.2)) #后面这个是设置参数,零到一的范围,每隔0.2算一次 不知道叫啥的很方便的函数:fivenum(x,na.rm=TRUE) #输出五个数最大值.最小值.下四分位数.上四分位数.中位数 3.协方差:用于看两组数据之间的关系,看看是不是有一定的关联性 他有一个相关系数r,r越接近1,则相关性越高,反之,越接近零…
这里来挖掘超市购物车数据. 名词: 1.挖掘数据集:购物篮数据 2.挖掘目标:关联规则 3.关联规则:牛奶=>鸡蛋[支持度=2%,置信度=60%] 4.指出度:分析中的全部事务的2%同时购买了牛奶和鸡蛋 5.置信度:购买牛奶的篮子同时也购买了鸡蛋 6.最小支持阈值和最小置信阈值:由挖掘者或领域专家设定 7.项集:由商品组成的集合 8.k-项集:k个项组成的集合 9.频繁项集:满足最小支持度的项集,频繁k-项集一般记为Lk 10.强关联规则:满足最小支持度阈值和最小置信度阈值的规则 在R里面有一个…