在本篇博客中你将会学习并了解常用的文件处理任务,例如读取文件的一行文本,本博客的要点包含:

  1. Source.fromFile(...).getLines.toArray 输出文件所有行
  2. Source.fromFile(...).mkString 以字符串形式输出文件内容
  3. 将字符串转换为数字,可以使用toInt或toDouble方法
  4. 使用java的PrintWriter写入文本文件
  5. “正则”.r是一个Regex对象
  6. 若你的正则表达式包含反斜杠或者引号,请用"""..."""
  7. 正则模式包含分组,可以使用for(regex(变量1...,变量2)<- 字符串)

本篇博客要点如下:

读取行

// 读取文件所有的行,可以调用scala.io.Source对象的getLines方法:
val source = Source.fromFile("a.txt","utf-8")
val lineIterator = source.getLines
结果是迭代器可以使用for循环处理这些行
for(i <- lineIterator) println(i)
也可以使用迭代器应用toArray或toBuffer方法,将这些行放到数组力或者数组缓冲行中,若想将读取的的文件作为一个字符串,只需val conents = source.mkString
下面是简单的代码实例:读取桌面上的a.txt object ReadFile {
def main(args: Array[String]): Unit = {
val read = new ReadFile()
val resource: String = "C:\\Users\\DonnieGao\\Desktop\\a.txt"
val encode = "UTF-8"
read.readFile(resource, encode)
println(read.readFileToStr(resource, encode))
}
} class ReadFile {
/**
* 一行行读取文件的内容
*
* @param resource 文件路径
* @param code 文件编码格式
*/
def readFile(resource: String, code: String): Unit = {
var source: BufferedSource = null
try {
// 获取文件的Source对象,第一个参数是文件的路径,第二个文件的编码格式
source = Source.fromFile(resource, code)
val lineIterator = source.getLines()
while (true) {
if (lineIterator.hasNext) {
println(lineIterator.next())
} else {
return
}
}
} finally {
// 释放资源
source.close()
}
} /**
* 将文本文件所有内容作为字符串
*
* @param resource 文件路径
* @param code 文件编码格式
* @return
*/
def readFileToStr(resource: String, code: String): String = {
// 获取文件的Source对象,第一个参数是文件的路径,第二个文件的编码格式
var source: BufferedSource = null
try {
source = Source.fromFile(resource, code)
source.mkString
} finally {
source.close()
}
}
}

读取字符

要将文件中读取单个字符,可以把Source对象当作迭代器,若仅仅只是想查看字符可以调用Source对象的buffered方法。

读取词法单元和数字

读取源文件中所有空格隔开的词法单元
val tokens = source.mkString.split("\\s+")
若有个基本都是浮点型的文件,可以将其读取到数组中:
val numbers = for (w <- tokens) yield w.toDouble 或者也可
val numbers = token.map(_.toDouble)

读取二进制文件

Scala并没有提供读取二进制文件的方法,可以使用java读取二进制的方法,代码示例

val file = new File(fileName)
val in = new FileInputStream(file)
val bytes = new Array[Byte](file.length.toInt)
in.read(bytes)
in.close()

写入文本文件

Scala没有内建对写入文件的支持,可借助java进行文件写入操作例如使用java.io.PrintWriter

  /**
* Scala写入文借助java的PrintWriter
*/
def write(): Unit = {
val out = new PrintWriter("C:\\Users\\DonnieGao\\Desktop\\test.txt")
for (i <- 0 to 100) out.println(i)
out.close()
}

访问文件目录

Scala中没有直接访问某个目录下的所有文件的方式或者递归遍历有目录的类

  /**
* 使用java列举下所有的文件夹
* @param dir 文件目录路径
*/
def dir(dir:String) = {
val dirFile = new File(dir)
val arrayFile= dirFile.listFiles()
for (i <- arrayFile){println(arrayFile.toBuffer)}
}

序列化

在java中声明一个可以被序列号的类通常是下面这种:

public class Person implements java.io.Serializable {
private static final long serialVersionUID = 4436475322569107137L;
} Scala中声明一个可以被序列化的类通常是下面这种:
@SerialVersionUID(12356L) class ReadFile extends Serializable { }

正则表达式

Scala中提供了正则操作处理scala.util.matching.Regex让这件事情可以变得简单。构造一个Regex对象,用String类的r方法即可

object RegexDemo {

  def main(args: Array[String]): Unit = {
// 初始化正则对象
val numPattern = "[0-9]+".r
val regex = "13 welcome to beijing"
// findAllIn方法返回遍历所有匹配的迭代器,可以在for循环中使用
for (matchString <- numPattern.findAllIn(regex)) {
println(matchString)
}
// 查询字符串首个匹配项
println(numPattern.findFirstIn(regex))
// 检查某个字符串的开始部分能匹配,可以使用findPrefixOf
println(numPattern.findPrefixOf(regex))
}

Scala的文件读写操作与正则表达式的更多相关文章

  1. c语言文件读写操作总结

    C语言文件读写操作总结 C语言文件操作 一.标准文件的读写 1.文件的打开 fopen() 文件的打开操作表示将给用户指定的文件在内存分配一个FILE结构区,并将该结构的指针返回给用户程序,以后用户程 ...

  2. [转]Android - 文件读写操作 总结

     转自:http://blog.csdn.net/ztp800201/article/details/7322110 Android - 文件读写操作 总结 分类: Android2012-03-05 ...

  3. PHP文件读写操作之文件写入代码

    在PHP网站开发中,存储数据通常有两种方式,一种以文本文件方式存储,比如txt文件,一种是以数据库方式存储,比如Mysql,相对于数据库存储,文件存储并没有什么优势,但是文件读写操作在基本的PHP开发 ...

  4. Java 字节流实现文件读写操作(InputStream-OutputStream)

    Java 字节流实现文件读写操作(InputStream-OutputStream) 备注:字节流比字符流底层,但是效率底下. 字符流地址:http://pengyan5945.iteye.com/b ...

  5. Java 字符流实现文件读写操作(FileReader-FileWriter)

    Java 字符流实现文件读写操作(FileReader-FileWriter) 备注:字符流效率高,但是没有字节流底层 字节流地址:http://pengyan5945.iteye.com/blog/ ...

  6. python(三)一个文件读写操作的小程序

    我们要实现一个文件读写操作的小程序 首先我们有一个文件 我们要以"============"为界限,每一个角色分割成一个独立的txt文件,按照分割线走的话是分成 xiaoNa_1. ...

  7. 实现动态的XML文件读写操作

    实现动态的XML文件读写操作(依然带干货) 前言 最近由于项目需求,需要读写操作XML文件,并且存储的XML文件格式会随着导入的数据不同而随时改变(当然导入的数据还是有一定约束的),这样我们要预先定义 ...

  8. ios 简单的plist文件读写操作(Document和NSUserDefaults)

    最近遇到ios上文件读写操作的有关知识,记录下来,以便以后查阅,同时分享与大家. 一,简单介绍一下常用的plist文件. 全名是:Property List,属性列表文件,它是一种用来存储串行化后的对 ...

  9. java文件读写操作类

    借鉴了项目以前的文件写入功能,实现了对文件读写操作的封装 仅仅需要在读写方法传入路径即可(可以是绝对或相对路径) 以后使用时,可以在此基础上改进,比如: 写操作: 1,对java GUI中文本框中的内 ...

随机推荐

  1. Eclipse 配置 maven 的两个 settings 文件

    eclipse配置的settings文件名完全可以自定义,而本机maven只认识settings.xml文件. eclipse里配置maven有一个叫全局的,有一个叫用户的.这两个文件可以和本机mav ...

  2. HDFS pipeline写 -- 客户端

    上一篇说了datanode端如何处理pipeline写请求的,这里主要看DFSClient. 这里以append为例, write差不多. 创建一个pipeline用于append操作的流程: Fil ...

  3. webpack+express多页站点开发

    学习了webpack门级的教程后,觉得可能是专门为单页应用而量身打造的,比如webpack+react.webpack+vue等,都可以解决各种资源的依赖加载.打包的问题.甚至css都是打包在js里去 ...

  4. 使用GTID给Galera集群做数据库异步复制

    一.为什么要做Galera集群异步复制 Galera集群解决了数据库高可用的问题,但是存在局限性,例如耗时的事务处理可能会导致集群性能急剧下降,甚至出现阻塞现象.而不幸的是,类似报表等业务需求就需要做 ...

  5. 批处理文件(Batch Files )

    后缀是bat的文件就是批处理文件,是一种文本文件.简单的说,它的作用就是自动的连续执行多条命令,批处理文件的内容就是一条一条的命令. 新建一个批处理abc.bat,里面内容如下:@echo offec ...

  6. python常见释疑(有别于报错)(不定时更新)

    文:铁乐与猫 01.在cmd运行py脚本后,直接回到了提示符,没有任何输出,看起来像是并没有运行一样. 答:你的感觉很可能是对的,但脚本很可能己经正常运行,只是你的代码里面很可能没有给出print提示 ...

  7. 全局变量是列表list 的改变, 竟然在局部,用append 就可以了..... 不用global sth...

    lst = ["麻花藤", "刘嘉玲", "詹姆斯"]def func(): lst.append("⻢云云") # 对 ...

  8. jquery根据字符切割字符串

    var str=new String(); var arr=new Array(); str="ddd,dsd,3,dd,g,k"; //可以用字符或字符串分割 arr=str.s ...

  9. HashMap,LinkedHashMap和Hashtable类的深入剖析与理解

    上一篇文章写了一些关于HashMap以及HashMap的线程安全问题,这篇文章再来说说Map系列中HashMap,LinkedHashMap和Hashtable三者之间的差异以及该注意的地方. Has ...

  10. BZOJ1188:[HNOI2007]分裂游戏(博弈论)

    Description 聪聪和睿睿最近迷上了一款叫做分裂的游戏.该游戏的规则试:共有n个瓶子,标号为0,1,2.....n-1,第i个瓶子中装有p[i]颗巧克力豆,两个人轮流取豆子,每一轮每人选择3个 ...