社交网络分析的 R 基础:(二)变量与字符串
本章会从 R 语言中最基本的数据类型开始介绍,在此之后就可以开始 R 语言实践了。对社交网络分析而言,我们在处理字符串上所花费的时间要远远大于处理数字的时间,因此本章还会介绍常用的字符串处理操作。
变量
R 语言中基本的数据类型包括:
- 整型(integer):整数,如
100; - 浮点型(double):小数,如
3.14; - 字符串型(character):R 语言中的字符串可以使用
"或者'定义,如"abc",'abc'; - 逻辑型(logical):其他编程语言中常称为布尔型,在 R 语言中使用严格区分大小写的
TRUE和FALSE表示,或者使用缩写T和F。
提示
R 语言中还存在数值型 numeric,可以看作整型和浮点型的并集。
变量就是对数据类型的引用,比如有一个整型值 100,想在程序中使用它并用 a 来表示,将 100 赋值给 a 后(a <- 100),a 就称之为变量。R 语言对变量的定义并不像强类型的语言一样需要在定义变量时声明变量的数据类型。当进行赋值操作时,就定义了一个新的变量。下面这段程序就是声明了一个变量 a,并且将 100 赋值给了变量 a,这三行代码的操作是等价的:
a <- 100
a = 100
100 -> a
在 R 语言中标准的赋值符号为 <-,这其中包含两个字符 < 和 -。当然也可以使用 = 进行代替。从上面的代码也可以观察到,赋值符号 <- 是有方向性的,指向被赋值的对象。
变量的名称不是随意的,一个有效的变量名由字母开头,后面跟上任意数量的字母,数字以及下划线。下面是一些合法的变量名:a、a1、a_b、a.b。下面是一些非法的变量名称:1、1a、_a。当然,也不要使用关键字作为变量名,关键字是用于描述 R 语言的语法的。
提示
下面给出一些特殊的运算符:
| 运算符 | 描述 | 示例 | 输出 |
|---|---|---|---|
| ^ | 乘方 | 2^3 | 8 |
| %% | 求余 | 3 %% 2 | 1 |
| %/% | 整除 | 5 %/% 2 | 2 |
字符串
字符串的创建
R 语言中的字符串既可以使用双引号 " 定义,也可以使用单引号 ' 定义。但是为什么要使用两种引号定义字符串?
> '这是包含"双引号"的字符串'
[1] "这是包含\"双引号\"的字符串"
> "这是包含'单引号'的字符串"
[1] "这是包含'单引号'的字符串"
这样做的好处是可以在不转义引号的情况下,创建本身就包含引号的字符串。可以在双引号 " 定义的字符串中使用单引号 ',也可以在单引号 ' 定义的字符串中使用双引号 "。
使用 as.character() 可以将其他的数据类型转换成字符串:
> as.character(3.14)
[1] "3.14"
> as.character(T)
[1] "TRUE"
特殊字符的转义
转义是指输出具有特殊意义的字符,比如想要在双引号定义的字符串中使用双引号,或者在字符串中使用换行操作。和大多数语言一样,R 语言中使用反斜杠 \ 进行转义操作,常见的转义字符有换行符 \n,引号 \" \',以及对反斜杠本身进行转义 \\。
> writeLines("Use \"double quotation\" in a string")
Use "double quotation" in a string
> writeLines("Use line breaks\nin a string")
Use line breaks
in a string
字符串的其他常用操作
获取字符串的长度 nchar():
> nchar("Social Network")
[1] 14
字符串的拼接 paste(),sep 参数为连接的字符:
> paste("Social", "Network", sep = "-")
[1] "Social-Network"
字符串的分割 strsplit():
> strsplit("Social-Network", "-")
[[1]]
[1] "Social" "Network"
字符串的截取 substr(),要注意的是,和大多数语言不同,R 语言的索引从 1 开始:
> substr("Social Network", 1, 6)
[1] "Social"
字符串的格式化输出 sprintf(),在 R 语言中也采用类似 C 语言的风格对变量进行格式化:
%s:字符串%f:浮点型%d:整数%e:科学计数法
> sprintf("The degree of the node is %d\n", 4)
[1] "The degree of the node is 4\n"
当需要输出转义字符串时,可以在外层套用 cat():
> cat(sprintf("The degree of the node is %d\n", 4))
The degree of the node is 4
️ 练习
1. 第一章留下的问题 "a"+"b" 会输出 ab 吗,如何将"a" 和 "b" 拼接成 "ab" ;
2. 截取 "Social Network" 中的 "Network"。
参考
社交网络分析的 R 基础:(二)变量与字符串的更多相关文章
- 社交网络分析的 R 基础:(一)初探 R 语言
写在前面 3 年的硕士生涯一转眼就过去了,和社交网络也打了很长时间交道.最近突然想给自己挖个坑,想给这 3 年写个总结,画上一个句号.回想当时学习 R 语言时也是非常戏剧性的,开始科研生活时到处发邮件 ...
- 社交网络分析的 R 基础:(三)向量、矩阵与列表
在第二章介绍了 R 语言中的基本数据类型,本章会将其组装起来,构成特殊的数据结构,即向量.矩阵与列表.这些数据结构在社交网络分析中极其重要,本质上对图的分析,就是对邻接矩阵的分析,而矩阵又是由若干个向 ...
- 社交网络分析的 R 基础:(四)循环与并行
前三章中列出的大多数示例代码都很短,并没有涉及到复杂的操作.从本章开始将会把前面介绍的数据结构组合起来,构成真正的程序.大部分程序是由条件语句和循环语句控制,R 语言中的条件语句(if-else)和 ...
- 社交网络分析的 R 基础:(五)图的导入与简单分析
如何将存储在磁盘上的邻接矩阵输入到 R 程序中,是进行社交网络分析的起点.在前面的章节中已经介绍了基本的数据结构以及代码结构,本章将会面对一个实质性问题,学习如何导入一个图以及计算图的一些属性. 图的 ...
- 社交网络分析的 R 基础:(六)绘图操作
R 语言强大的可视化功能在科学研究中非常受欢迎,丰富的类库使得 R 语言可以绘制各种各样的图表.当然这些与本章内容毫无关系,因为笔者对绘制图表了解有限,仅限于能用的程度.接下来的内容无需额外安装任何包 ...
- Shell脚本之二 变量、字符串和数组
一.Shell 变量 1.1 定义变量 定义变量时,变量名不加美元符号($),如: your_name="runoob.com" 注意,变量名和等号之间不能有空格,这可能和你熟悉的 ...
- Python基础二_操作字符串常用方法、字典、文件读取
一.字符串常用方法: name.captitalize() #字符串首字母大写 name.center(50,'*') ...
- Java 基础:变量 与 字符串
变量 Java中没有初始化的变量是不能直接使用的 局部变量 String msg; System.out.print(msg); 就会提示错误,我们必须显式的为变量指定一个初值如null.刚开始学Ja ...
- python基础(变量,字符串,列表,元组)
#列表的操作list1 = ['wuqiang','lichang','changhao'] #列表的定义print(list1) #操作列表print(list1[-1]) #操作列表的最后一位li ...
随机推荐
- PLSQL到期处理
一.输入指令"regedit"打开注册表 二.指令输入完毕后,按回车键,会进入这个界面. 三.注册表里按HKEY_CURRENT_USER\Software\Allround Au ...
- 数据结构作业——P53算法设计题(6):设计一个算法,通过一趟遍历确定长度为n的单链表中值最大的结点
思路: 设单链表首个元素为最大值max 通过遍历元素,与最大值max作比较,将较大值附给max 输出最大值max 算法: /* *title:P53页程序设计第6题 *writer:weiyuexin ...
- 深入理解Java虚拟机一:运行时数据区域
根据<Java虚拟机规范(第2版)>的规定,Java虚拟机管理的内存包括下图几个运行时数据区域: 1.程序计数器 程序计数器(Program Counter Register ...
- Robust De-noising by Kernel PCA
目录 引 主要内容 Takahashi T, Kurita T. Robust De-noising by Kernel PCA[C]. international conference on art ...
- Sentry 开发者贡献指南 - SDK 开发(性能监控:Sentry SDK API 演进)
内容整理自官方开发文档 本文档的目标是将 Sentry SDK 中性能监控功能的演变置于上下文中. 我们首先总结了如何将性能监控添加到 Sentry 和 SDK, 然后我们讨论 identified ...
- Tomcat 服务器的端口会与其他的服务器端口发生冲突,此时则需要修改 Tomcat 服务器的端口
查看相关知识 查看相关练习 Tomcat 服务器的端口会与其他的服务器端口发生冲突,此时则需要修改 Tomcat 服务器的端口 实现步骤: 1.找到 Tomcat 服务器安装目录下的 conf 文件夹 ...
- CSS基础 overflow 内容溢出部分显示效果
属性:overflow 值 作用 visible 默认,内容溢出部分可见 hidden 内容溢出部分不可见 scroll 内容有无溢出,都有滚动条 auto 有内容溢出,自动显示滚动条
- httprunner2.0 概述及使用说明
一.概述 HttpRunner是一款面向 HTTP(S) 协议的通用测试框架,只需编写维护一份 YAML/JSON 脚本,即可实现自动化测试.性能测试.线上监控.持续集成等多种测试需求. 二.系统流程 ...
- 查询Oracle数据库的字符集
How do you check the Oracle database character set? SQL> select value from nls_database_parameter ...
- 第10组 Beta冲刺 (5/5)
1.1基本情况 ·队名:今晚不睡觉 ·组长博客:https://www.cnblogs.com/cpandbb/p/14018671.html ·作业博客:https://edu.cnblogs.co ...