R语言重要数据集分析研究——R语言数据集的字段含义
R语言数据集的字段含义
作者:马文敏
选择一种数据结构来储存数据
将数据输入或导入到这个数据结构中
数据集的概念
数据集通常是有数据结构的一个矩形数组,行表示规则,列表示变量。
不同的行业对数据集的行和列的叫法不同
统计学家称他们为观测和变量
数据库分析为记录和字段
示例分析者叫他们示例
R语言可以处理的数据类型有很多种包括数据型,字符型,逻辑性,原生性。
2.数据结构
R语拥有很多用于储存数据的对象类型,包括标量,向量,矩阵,数组,数据框和列表。
向量
向量数据必须要有相同的类型和模式的数据,通过给定的元素数值可以访问向量中的元素,用函数c()可创建向量。
myymatrix<-
Matrix(vector.nrow=number
其中vector包含了矩阵的元素,nrow和ncol用于指定的行和列的维数,dimnames包含了可选的,以字符型的向量表示行名和列名,选型byrows则表明矩阵应当按行填充。
矩阵
矩阵是一个二维数组,他通过函数matrix()创建,每一个元素都拥有相同的模式(数值型,字符型,逻辑型)
提取矩阵中的元素时用[.],其中逗号前后分辨率是,行数和列数。
两行的矩阵。
X #查看矩阵内容
数组
数组和矩阵比较类似,但是维度可以大于2。但是他是一个数值型向量,可通过函数ayyay来创建,形式为myarry<-array(vector,dimensions,dimnames0000)其中vector包含了数组中的数据,dimensions是一个数值型向量,给出了各个维度下标的最大值,而dimnames是可选的,各维度名称标签的列表。
数据框

数据框是在R语中比较常见的数据结构。他的作用是当数据有多种模式而无法将这些数据放在一个矩阵中时,这时候就可以选择数据框,同一行列的数据模式必须相同,可通过data,frame()来创建。
使用¥来提取数据库中的特定元素,但是每次输入数据框名,有点麻烦。
列表
列表是R的数据类型中最为复杂的一种,列表就是一些对象的有序集合。列表允许整合若干的对象到单个对象名下。例如,某个列表中可能是若干向量,矩阵,数据框,甚至其他列表组合。可以使用函数list()创建列表。
列表是R中重要的数据结构
列表允许以一种简单的方式组织和重新调用不相干的信息
许多R函数的运行结果都是以列表的形式返回的。
3.数据输入

数据输入可以使用read.table()文本文件中导入数据。
算数表达式。他是直接输入的,输入完成之后按下回车键显示结果,如果想保存输入结果,直接将其命名一个变量即可。
样本数据输入。最常使用的是c()函数,括号内的内容可以是数字或文本,也可以是储存结果的变量,内容间用逗号分隔,如果既有文本也有数字,那么数字将会被强制转换为文本。
数据导入。当数据量较大时,使用c函数和scan函数就会不太方便,虽然scan函数也可以进行文件导输但是主要针对一维数据,当遇到复杂一些数据时,需要使用其他的函数。
参考文献:
百度---E书联盟
火狐---科普中国百科科学词条
火狐---CSDN博客
R语言重要数据集分析研究——R语言数据集的字段含义的更多相关文章
- R语言重要数据集分析研究——需要整理分析阐明理念
1.R语言重要数据集分析研究需要整理分析阐明理念? 上一节讲了R语言作图,本节来讲讲当你拿到一个数据集的时候如何下手分析,数据分析的第一步,探索性数据分析. 统计量,即统计学里面关注的数据集的几个指标 ...
- R语言重要数据集分析研究—— 数据集本身的分析技巧
数据集本身的分析技巧 作者:王立敏 文章来源:网络 1.数据集 数据集,又称为资料集.数据集合或资料集合,是一种由数据所组成的集合. Data set(或dat ...
- R语言重要数据集分析研究——搞清数据的由来
搞清数据的由来 作者:李雪丽 资料来源:百度百科
- 利用R语言打造量化分析平台
利用R语言打造量化分析平台 具体利用quantmod包实现对股票的量化分析 1.#1.API读取在线行情2.#加载quantmod包3.if(!require(quantmod)){4. instal ...
- R语言实现分层抽样(Stratified Sampling)以iris数据集为例
R语言实现分层抽样(Stratified Sampling)以iris数据集为例 1.观察数据集 head(iris) Sampling)以iris数据集为例"> 选取数据集中前6个 ...
- R语言︱SNA-社会关系网络 R语言实现专题(基础篇)(一)
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:这里所有的应用代码都来自与igrap ...
- R是用于统计分析、绘图的语言和操作环境
R是一套完整的数据处理.计算和制图软件系统.其功能包括:数据存储和处理系统:数组运算工具(其向量.矩阵运算方面功能尤其强大):完整连贯的统计分析工具:优秀的统计制图功能:简便而强大的编程语言:可操纵数 ...
- R语言中的线性判别分析_r语言 线性判别分析
R语言中的线性判别分析_r语言 线性判别分析 在R语言中,线性判别分析(Liner Discriminant Analysis,简称LDA),依靠软件包MASS中有线性判别函数lqa()来实现.该函数 ...
- R语言学习笔记:小试R环境
买了三本R语言的书,同时使用来学习R语言,粗略翻下来感觉第一本最好: <R语言编程艺术>The Art of R Programming <R语言初学者使用>A Beginne ...
随机推荐
- 谷歌广告Admob在cocos2dx上通过回调实现底部Banner
首先说明我的开发平台,以免由于平台问题造成不必要的误解: cocos2dx-3.4 ndk-r9d eclipse Admob是谷歌官方广告,已经集成在google_play_service_lib包 ...
- Reactjs vs. Vuejs
欢迎大家关注腾讯云技术社区-博客园官方主页,我们将持续在博客园为大家推荐技术精品文章哦~ 纪俊,从事Web前端开发工作,2016年加入腾讯OMG广告平台产品部,喜欢研究前端技术框架. 这里要讨论的话题 ...
- JavaScript ,Python,java,Go系列算法之选择排序
常见的内部排序算法有:插入排序.希尔排序.选择排序.冒泡排序.归并排序.快速排序.堆排序.基数排序等. 用一张图概括: 选择排序 选择排序是一种简单直观的排序算法,无论什么数据进去都是O(n2) ...
- win10 64位下装Virtual Box安装Linux(centOS)配置联网
第一步:安装VritualBox 百度"VritualBox"下载安装即可: 第二步:下载Linux镜像系统并安装 这里写出我参照的博客,很详细,我就不累赘了! 原文地址:http ...
- 微软 Build 2017 开发者大会:Azure 与 AI 的快速发展
欢迎大家持续关注葡萄城控件技术团队博客,更多更好的原创文章尽在这里~~ 一年一度的微软 Build 大会准时起航,本年度大会从旧金山移师西雅图,一个近年来凭借女神汤唯而在中国家喻户晓的美国西部海滨城市 ...
- Centos6.5_x86上Oracle11g2 32位的安装与卸载以及相关问题汇总
需要注意的问题: 1.Linux包括内核和要安装的oralce版本是否符合(这个在官方文档中有说明). 2.安装oracle一般会新建一个为oracle的账户,注意在安装的过程中的root和oracl ...
- TCP协议详解---上
TCP头格式 注意以下几点: TCP的包是没有IP地址的,那是IP层上的事.但是有源端口和目标端口. 一个TCP连接需要四个元组来表示是同一个连接(src_ip, src_port, dst_ip, ...
- SQL Server中INNER JOIN与子查询IN的性能测试
这个月碰到几个人问我关于"SQL SERVER中INNER JOIN 与 IN两种写法的性能孰优孰劣?"这个问题.其实这个概括起来就是SQL Server中INNER JOIN与子 ...
- 【JAVAWEB学习笔记】25_基础加强:类加载器、注解 @xxx和动态代理
基础加强 学习目标 案例-自定义单元测试@MyTest 案例-全局的编码的解决 一.类加载器 1.什么是类加载器,作用是什么? 类加载器就加载字节码文件(.class) 2.类加载器的种类 类加载器有 ...
- iOS 比较版本号大小的方法
比较iOS版本号大小 eg:3.2.0和3.1.0 或者 3.2.0和3.2比较 返回bool值变量YES or NO -(BOOL)compareVesionWithServerVersion:(N ...