Data.ByteString

String 是 [Char] 的同义词,在使用上存在List的惰性所带来的性能问题。

在处理大型二进制文件时,可以使用 ByteString 来代替 String。

ByteString 类型分为以下两种:

  • Lazy 模块 Data.ByteString.Lazy 中的 Data.ByteString.Lazy.ByteString

    Lazy 模块内部使用 chunks(64K数据块)。
  • Strict 模块 Data.ByteString 中的 Data.ByteString.ByteString
Prelude> import qualified Data.ByteString.Lazy as B
Prelude B> import qualified Data.ByteString as S
Prelude B S> B.pack [99,97,110]
"can"
Prelude B S> B.fromChunks [S.pack [40,41,42], S.pack [43,44,45], S.pack [46,47,48]]
"()*+,-./0"
Prelude B S> B.cons 85 $ B.pack [80,81,82,84]
"UPQRT"
Prelude B S> foldr B.cons' B.empty [50..60]
"23456789:;<"

Data.Text

在处理大型文本文件时,可以使用 Text 来代替 String。

Text 是一个 Unicode 友好的字符串类型。

Text 类型分为以下两种:

  • Lazy 模块 Data.Text.Lazy 中的 Data.Text.Lazy.Text

    Lazy 模块内部使用 chunks。
  • Strict 模块 Data.Text 中的 Data.Text.Text
Prelude> import qualified Data.Text.Lazy as T
Prelude T> :t T.pack "abc"
T.pack "abc" :: T.Text
Prelude T> T.replace (T.pack "a") (T.pack "b") (T.pack "aXaXaX")
"bXbXbX"
Prelude T> T.splitOn (T.pack "a") (T.pack "aXaXaX")
["","X","X","X"]
  • pack :: String -> Text

    pack 函数将 String 转换成 Text。

Data.Text.Encoding

Encoding 模块用于 ByteString 和 Text 之间类型转换。

Text 包含 Lazy 模块 Data.Text.Encoding.Lazy 和 Strict 模块 Data.Text.Encoding。

其中 Lazy 模块提供 Data.ByteString.Lazy.ByteString 和 Data.Text.Lazy.Text 之间的类型转换功能。

而 Strict 模块则提供 Data.ByteString.ByteString 和 Data.Text.Text 之间的类型转换功能。

Data.String.Conversions

$ cabal install string-conversions
Installed string-conversions-0.4.0.1
Prelude> :m +Data.String.Conversions
Prelude Data.String.Conversions>

Conversions 模块提供以下五种类型之间的类型转换功能。

  • String
  • Data.ByteString.ByteString

    缩写为 StrictByteString 或 SBS
  • Data.ByteString.Lazy.ByteString

    缩写为 LazyByteString 或 LBS
  • Data.Text.Text

    缩写为 StrictText 或 ST
  • Data.Text.Lazy.Text

    缩写为 LazyText 或 LT
Prelude Data.String.Conversions> cs "abc" :: ST
"abc"
  • ConvertibleStrings

    ConvertibleStrings 是个类型类,五种字符串类型都被定义成了 ConvertibleStrings 类型类的实例。
  • cs :: ConvertibleStrings a b => a -> b

    cs 函数根据输入输出类型自动实施五种字符串类型之间的类型转换功能。

OverloadedStrings

GHC 提供了语言扩展 OverloadedStrings。

  • 不使用这个语言扩展,所有的字符串字面量都属于 String 也就是 [Char] 类型。
  • 如果使用这个语言扩展,那么所有的字符串字面量就都属于 IsString a => a 类型。
  • String, ByteString, Text 都是 IsString 类的实例。
Module Data.String
class IsString a where
fromString :: String -> a
{-# LANGUAGE OverloadedStrings #-}
import qualified Data.Text.IO as T a :: Text
a = "Hello World" b :: ByteString
b = "Hello World" c :: String
c = "Hello World" main = do putStrLn "Hello as String!"
T.putStrLn "Hello as Text!"

Text 是 Monoid

Prelude Data.Text> ("abc" :: Text) <> ("def" :: Text)
"abcdef"

Haskell语言学习笔记(49)ByteString Text的更多相关文章

  1. Haskell语言学习笔记(88)语言扩展(1)

    ExistentialQuantification {-# LANGUAGE ExistentialQuantification #-} 存在类型专用的语言扩展 Haskell语言学习笔记(73)Ex ...

  2. Haskell语言学习笔记(79)lambda演算

    lambda演算 根据维基百科,lambda演算(英语:lambda calculus,λ-calculus)是一套从数学逻辑中发展,以变量绑定和替换的规则,来研究函数如何抽象化定义.函数如何被应用以 ...

  3. Haskell语言学习笔记(69)Yesod

    Yesod Yesod 是一个使用 Haskell 语言的 Web 框架. 安装 Yesod 首先更新 Haskell Platform 到最新版 (Yesod 依赖的库非常多,版本不一致的话很容易安 ...

  4. Haskell语言学习笔记(20)IORef, STRef

    IORef 一个在IO monad中使用变量的类型. 函数 参数 功能 newIORef 值 新建带初值的引用 readIORef 引用 读取引用的值 writeIORef 引用和值 设置引用的值 m ...

  5. Haskell语言学习笔记(39)Category

    Category class Category cat where id :: cat a a (.) :: cat b c -> cat a b -> cat a c instance ...

  6. Haskell语言学习笔记(93)Data.Text

    Data.Text.Read Prelude> :set -XOverloadedStrings Prelude> :m +Data.Text.Read Prelude Data.Text ...

  7. Haskell语言学习笔记(92)HXT

    HXT The Haskell XML Toolbox (hxt) 是一个解析 XML 的库. $ cabal install hxt Installed hxt-9.3.1.16 Prelude&g ...

  8. Haskell语言学习笔记(89)Unicode UTF8

    unicode-show $ cabal install unicode-show Installed unicode-show-0.1.0.2 Prelude> :m +Text.Show.U ...

  9. Haskell语言学习笔记(86)字符串格式化与插值

    String 的格式化 Text.Printf 这个模块用来处理字符串格式化. printf :: PrintfType r => String -> r printf 用于格式化字符串, ...

随机推荐

  1. 知识点查缺补漏贴01-进程间通讯之mmap文件共享

    引文: 个人名言:“同一条河里淹死两次的人,是傻子,淹死三次及三次以上的人是超人”.经历过上次悲催的面试,决定沉下心来,好好的补充一下基础知识点.本文是这一系列第一篇:进程间通讯之mmap. 一.概念 ...

  2. [模板] Miller_Rabin素数判断代码实现存档

    就是....存存代码吧. Miller_Rabin的最核心部分在于二次探测定理和费马小定理.后者在同余/逆元的题目里面或多或少都有提及吧.....前者也很简单. 总而言之,Miller_Rabin不算 ...

  3. bzoj1034 泡泡堂

    Description 第XXXX届NOI期间,为了加强各省选手之间的交流,组委会决定组织一场省际电子竞技大赛,每一个省的代表队由n名选手组成,比赛的项目是老少咸宜的网络游戏泡泡堂.每一场比赛前,对阵 ...

  4. unittest框架进坑系列_(含selenium数据分离的坑)

    1.测试用例的执行顺序 有默认的顺序的,不是按你自己的排列执行,注意. 进坑原因,没有先执行制造变量的测试用例,导致其他用例无法找到变量值 2.数据分离的坑 在控制层 有函数嵌套,2个函数都必须带se ...

  5. java web程序 jdbc连接数据库错误排查方法

    学习jsp.我遇到了麻烦,我总是看不懂500错误,因为每次都显示整个页面的错误,都是英文 我看不懂,后来,把他弄烦了,我也烦了,比起学习java.那个异常可以很简单的就知道.现在解决 了第一个问题,5 ...

  6. Parity 钱包启动配置

    Parity. Ethereum Client. By Wood/Paronyan/Kotewicz/Drwięga/Volf et al. Copyright 2015, 2016, 2017, 2 ...

  7. RDD之六:Action算子

    本质上在Actions算子中通过SparkContext执行提交作业的runJob操作,触发了RDD DAG的执行. 根据Action算子的输出空间将Action算子进行分类:无输出. HDFS. S ...

  8. [转]下拉按钮 C#_Winform 自定义控件

    [https://workspaces.codeproject.com/elia-sarti/splitbutton-an-xp-style-dropdown-split-button] using ...

  9. MiniDump产生工具

    1:分析程序异常等等信息,在入口处初始化即可 //生成Dump文件信息 OS:Windows #pragma once #include <windows.h> #include < ...

  10. python并发编程之多进程理论部分

    原文连接:http://www.cnblogs.com/linhaifeng/articles/7430066.html#_label4 一 什么是进程 进程:正在进行的一个过程或者说一个任务.而负责 ...