译文：二进制序列类型 --- bytes, bytearray

在进行一些内置函数调用时，会发现bytes类型的参数或返回值，这个类型老猿前面没有介绍过，在此就不单独介绍了，直接从Python官网的内容用翻译软件翻译过来稍微修改。

操作二进制数据的核心内置类型是 bytes 和 bytearray。它们由 memoryview 提供支持，该对象使用缓冲区协议来访问其他二进制对象所在内存，不需要创建对象的副本。

array 模块支持高效地存储基本数据类型，例如 32 位整数和 IEEE754 双精度浮点值。

bytes 对象

bytes 对象是由单个字节构成的不可变序列。由于许多主要二进制协议都基于 ASCII 文本编码，因此 bytes 对象提供了一些仅在处理 ASCII 兼容数据时可用，并且在许多特性上与字符串对象紧密相关的方法。

class bytes([source[, encoding[, errors]]])

首先，表示 bytes 字面值的语法与字符串字面值的大致相同，只是添加了一个 b 前缀：

单引号: b’同样允许嵌入 “双” 引号’。

双引号: b"同样允许嵌入 ‘单’ 引号"。

三重引号: b’’‘三重单引号’’’, b""“三重双引号”""

bytes 字面值中只允许 ASCII 字符（无论源代码声明的编码为何）。任何超出 127 的二进制值必须使用相应的转义序列形式加入 bytes 字面值。

像字符串字面值一样，bytes 字面值也可以使用 r 前缀来禁用转义序列处理。请参阅字符串和字节串字面值了解有关各种 bytes 字面值形式的详情，包括所支持的转义序列。

虽然 bytes 字面值和表示法是基于 ASCII 文本的，但 bytes 对象的行为实际上更像是不可变的整数序列，序列中的每个值的大小被限制为 0 <= x < 256 (如果违反此限制将引发 ValueError)。这种限制是有意设计用以强调以下事实，虽然许多二进制格式都包含基于 ASCII 的元素，可以通过某些面向文本的算法进行有用的操作，但情况对于任意二进制数据来说通常却并非如此（盲目地将文本处理算法应用于不兼容 ASCII 的二进制数据格式往往将导致数据损坏）。

除了字面值形式，bytes 对象还可以通过其他几种方式来创建：

指定长度的以零值填充的 bytes 对象: bytes(10)

通过由整数组成的可迭代对象: bytes(range(20))

通过缓冲区协议复制现有的二进制数据: bytes(obj)

另请参阅 bytes 内置类型。

由于两个十六进制数码精确对应一个字节，因此十六进制数是描述二进制数据的常用格式。相应地，bytes 类型具有从此种格式读取数据的附加类方法：

classmethod fromhex(string)

此 bytes 类方法返回一个解码给定字符串的 bytes 对象。字符串必须由表示每个字节的两个十六进制数码构成，其中的 ASCII 空白符会被忽略。

>>> bytes.fromhex('2Ef0 F1f2  ')

b'.\xf0\xf1\xf2'

在 3.7 版更改: bytes.fromhex() 现在会忽略所有 ASCII 空白符而不只是空格符。

存在一个反向转换函数，可以将 bytes 对象转换为对应的十六进制表示。

hex()

返回一个字符串对象，该对象包含实例中每个字节的两个十六进制数字。

>>> b'\xf0\xf1\xf2'.hex()

'f0f1f2'

3.5 新版功能.

由于 bytes 对象是由整数构成的序列（类似于元组），因此对于一个 bytes 对象 b，b[0] 将为一个整数，而 b[0:1] 将为一个长度为 1 的 bytes 对象。（这与文本字符串不同，索引和切片所产生的将都是一个长度为 1 的字符串）。

bytes 对象的表示使用字面值格式 (b’…’)，因为它通常都要比像 bytes([46, 46, 46]) 这样的格式更好用。你总是可以使用 list(b) 将 bytes 对象转换为一个由整数构成的列表。

注解针对 Python 2.x 用户的说明：在 Python 2.x 系列中，允许 8 位字符串（ 2.x 所提供的最接近内置二进制数据类型的对象）与 Unicode 字符串进行各种隐式转换。这是为了实现向下兼容的变通做法，以适应 Python 最初只支持 8 位文本而 Unicode 文本是后来才被加入这一事实。在 Python 3.x 中，这些隐式转换已被取消 —— 8 位二进制数据与 Unicode 文本间的转换必须显式地进行，bytes 与字符串对象的比较结果将总是不相等。

bytearray 对象

bytearray 对象是 bytes 对象的可变对应物。

class bytearray([source[, encoding[, errors]]])

bytearray 对象没有专属的字面值语法，它们总是通过调用构造器来创建：

创建一个空实例: bytearray()

创建一个指定长度的以零值填充的实例: bytearray(10)

通过由整数组成的可迭代对象: bytearray(range(20))

通过缓冲区协议复制现有的二进制数据: bytearray(b’Hi!’)

由于 bytearray 对象是可变的，该对象除了 bytes 和 bytearray 操作中所描述的 bytes 和 bytearray 共有操作之外，还支持可变序列操作。

另请参见 bytearray 内置类型。

由于两个十六进制数码精确对应一个字节，因此十六进制数是描述二进制数据的常用格式。相应地，bytearray 类型具有从此种格式读取数据的附加类方法：

classmethod fromhex(string)

bytearray 类方法返回一个解码给定字符串的 bytearray 对象。字符串必须由表示每个字节的两个十六进制数码构成，其中的 ASCII 空白符会被忽略。

>>> bytearray.fromhex('2Ef0 F1f2  ')

bytearray(b'.\xf0\xf1\xf2')

在 3.7 版更改: bytearray.fromhex() 现在会忽略所有 ASCII 空白符而不只是空格符。

存在一个反向转换函数，可以将 bytearray 对象转换为对应的十六进制表示。

hex()

返回一个字符串对象，该对象包含实例中每个字节的两个十六进制数字。

>>> bytearray(b'\xf0\xf1\xf2').hex()

'f0f1f2'

3.5 新版功能.

由于 bytearray 对象是由整数构成的序列（类似于列表），因此对于一个 bytearray 对象 b，b[0] 将为一个整数，而 b[0:1] 将为一个长度为 1 的 bytearray 对象。（这与文本字符串不同，索引和切片所产生的将都是一个长度为 1 的字符串）。

bytearray 对象的表示使用 bytes 对象字面值格式 (bytearray(b’…’))，因为它通常都要比 bytearray([46, 46, 46]) 这样的格式更好用。你总是可以使用 list(b) 将 bytearray 对象转换为一个由整数构成的列表。

bytes 和 bytearray 操作

bytes 和 bytearray 对象都支持通用序列操作。它们不仅能与相同类型的操作数，也能与任何 bytes-like object 进行互操作。由于这样的灵活性，它们可以在操作中自由地混合而不会导致错误。但是，操作结果的返回值类型可能取决于操作数的顺序。

注解 bytes 和 bytearray 对象的方法不接受字符串作为其参数，就像字符串的方法不接受 bytes 对象作为其参数一样。例如，你必须使用以下写法:

a = “abc”

b = a.replace(“a”, “f”)

和:

a = b"abc"

b = a.replace(b"a", b"f")

某些 bytes 和 bytearray 操作假定使用兼容 ASCII 的二进制格式，因此在处理任意二进数数据时应当避免使用。这些限制会在下文中说明。

注解使用这些基于 ASCII 的操作来处理未以基于 ASCII 的格式存储的二进制数据可能会导致数据损坏。

bytes 和 bytearray 对象的下列方法可以用于任意二进制数据。

bytes.count(sub[, start[, end]])

bytearray.count(sub[, start[, end]])

返回子序列 sub 在 [start, end] 范围内非重叠出现的次数。可选参数 start 与 end 会被解读为切片表示法。

要搜索的子序列可以是任意 bytes-like object 或是 0 至 255 范围内的整数。

在 3.3 版更改: 也接受 0 至 255 范围内的整数作为子序列。

bytes.decode(encoding=“utf-8”, errors=“strict”)

bytearray.decode(encoding=“utf-8”, errors=“strict”)

返回从给定 bytes 解码出来的字符串。默认编码为 ‘utf-8’。可以给出 errors 来设置不同的错误处理方案。 errors 的默认值为 ‘strict’，表示编码错误会引发 UnicodeError。其他可用的值为 ‘ignore’, ‘replace’ 以及任何其他通过 codecs.register_error() 注册的名称，请参阅 Error Handlers 小节。要查看可用的编码列表，请参阅标准编码小节。

注解将 encoding 参数传给 str 允许直接解码任何 bytes-like object，无须创建临时的 bytes 或 bytearray 对象。

在 3.1 版更改: 加入了对关键字参数的支持。

bytes.endswith(suffix[, start[, end]])

bytearray.endswith(suffix[, start[, end]])

如果二进制数据以指定的 suffix 结束则返回 True，否则返回 False。 suffix 也可以为由多个供查找的后缀构成的元组。如果有可选项 start，将从所指定位置开始检查。如果有可选项 end，将在所指定位置停止比较。

要搜索的后缀可以是任意 bytes-like object。

bytes.find(sub[, start[, end]])

bytearray.find(sub[, start[, end]])

返回子序列 sub 在数据中被找到的最小索引，sub 包含于切片 s[start:end] 之内。可选参数 start 与 end 会被解读为切片表示法。如果 sub 未被找到则返回 -1。

要搜索的子序列可以是任意 bytes-like object 或是 0 至 255 范围内的整数。

注解 find() 方法应该只在你需要知道 sub 所在位置时使用。要检查 sub 是否为子串，请使用 in 操作符:

>>>

>>> b'Py' in b'Python'

True

在 3.3 版更改: 也接受 0 至 255 范围内的整数作为子序列。

bytes.index(sub[, start[, end]])

bytearray.index(sub[, start[, end]])

类似于 find()，但在找不到子序列时会引发 ValueError。

要搜索的子序列可以是任意 bytes-like object 或是 0 至 255 范围内的整数。

在 3.3 版更改: 也接受 0 至 255 范围内的整数作为子序列。

bytes.join(iterable)

bytearray.join(iterable)

返回一个由 iterable 中的二进制数据序列拼接而成的 bytes 或 bytearray 对象。如果 iterable 中存在任何非字节类对象包括存在 str 对象值则会引发 TypeError。提供该方法的 bytes 或 bytearray 对象的内容将作为元素之间的分隔。

static bytes.maketrans(from, to)

static bytearray.maketrans(from, to)

此静态方法返回一个可用于 bytes.translate() 的转换对照表，它将把 from 中的每个字符映射为 to 中相同位置上的字符；from 与 to 必须都是字节类对象并且具有相同的长度。

3.1 新版功能.

bytes.partition(sep)

bytearray.partition(sep)

在 sep 首次出现的位置拆分序列，返回一个 3 元组，其中包含分隔符之前的部分、分隔符本身或其 bytearray 副本，以及分隔符之后的部分。如果分隔符未找到，则返回的 3 元组中包含原序列以及两个空的 bytes 或 bytearray 对象。

要搜索的分隔符可以是任意 bytes-like object。

bytes.replace(old, new[, count])

bytearray.replace(old, new[, count])

返回序列的副本，其中出现的所有子序列 old 都将被替换为 new。如果给出了可选参数 count，则只替换前 count 次出现。

要搜索的子序列及其替换序列可以是任意 bytes-like object。

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

bytes.rfind(sub[, start[, end]])

bytearray.rfind(sub[, start[, end]])

返回子序列 sub 在序列内被找到的最大（最右）索引，这样 sub 将包含在 s[start:end] 当中。可选参数 start 与 end 会被解读为切片表示法。如果未找到则返回 -1。

要搜索的子序列可以是任意 bytes-like object 或是 0 至 255 范围内的整数。

在 3.3 版更改: 也接受 0 至 255 范围内的整数作为子序列。

bytes.rindex(sub[, start[, end]])

bytearray.rindex(sub[, start[, end]])

类似于 rfind()，但在子序列 sub 未找到时会引发 ValueError。

要搜索的子序列可以是任意 bytes-like object 或是 0 至 255 范围内的整数。

在 3.3 版更改: 也接受 0 至 255 范围内的整数作为子序列。

bytes.rpartition(sep)

bytearray.rpartition(sep)

在 sep 最后一次出现的位置拆分序列，返回一个 3 元组，其中包含分隔符之前的部分，分隔符本身或其 bytearray 副本，以及分隔符之后的部分。如果分隔符未找到，则返回的 3 元组中包含两个空的 bytes 或 bytearray 对象以及原序列的副本。

要搜索的分隔符可以是任意 bytes-like object。

bytes.startswith(prefix[, start[, end]])

bytearray.startswith(prefix[, start[, end]])

如果二进制数据以指定的 prefix 开头则返回 True，否则返回 False。 prefix 也可以为由多个供查找的前缀构成的元组。如果有可选项 start，将从所指定位置开始检查。如果有可选项 end，将在所指定位置停止比较。

要搜索的前缀可以是任意 bytes-like object。

bytes.translate(table, delete=b’’)

bytearray.translate(table, delete=b’’)

返回原 bytes 或 bytearray 对象的副本，移除其中所有在可选参数 delete 中出现的 bytes，其余 bytes 将通过给定的转换表进行映射，该转换表必须是长度为 256 的 bytes 对象。

你可以使用 bytes.maketrans() 方法来创建转换表。

对于仅需移除字符的转换，请将 table 参数设为 None:

>>>

>>> b'read this short text'.translate(None, b'aeiou')

b'rd ths shrt txt'

在 3.6 版更改: 现在支持将 delete 作为关键字参数。

以下 bytes 和 bytearray 对象的方法的默认行为会假定使用兼容 ASCII 的二进制格式，但通过传入适当的参数仍然可用于任意二进制数据。请注意本小节中所有的 bytearray 方法都不是原地执行操作，而是会产生新的对象。

bytes.center(width[, fillbyte])

bytearray.center(width[, fillbyte])

返回原对象的副本，在长度为 width 的序列内居中，使用指定的 fillbyte 填充两边的空位（默认使用 ASCII 空格符）。对于 bytes 对象，如果 width 小于等于 len(s) 则返回原序列的副本。

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

bytes.ljust(width[, fillbyte])

bytearray.ljust(width[, fillbyte])

反回原对象的副本，在长度为 width 的序列中靠左对齐。使用指定的 fillbyte 填充空位（默认使用 ASCII 空格符）。对于 bytes 对象，如果 width 小于等于 len(s) 则返回原序列的副本。

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

bytes.lstrip([chars])

bytearray.lstrip([chars])

返回原序列的副本，移除指定的前导字节。 chars 参数为指定要移除字节值集合的二进制序列 —— 这个名称表明此方法通常是用于 ASCII 字符。如果省略或为 None，则 chars 参数默认移除 ASCII 空白符。 chars 参数并非指定单个前缀；而是会移除参数值的所有组合:

>>>

>>> b'   spacious   '.lstrip()

b'spacious   '

>>> b'www.example.com'.lstrip(b'cmowz.')

b'example.com'

要移除的字节值二进制序列可以是任意 bytes-like object。

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

bytes.rjust(width[, fillbyte])

bytearray.rjust(width[, fillbyte])

返回原对象的副本，在长度为 width 的序列中靠右对齐。使用指定的 fillbyte 填充空位（默认使用 ASCII 空格符）。对于 bytes 对象，如果 width 小于等于 len(s) 则返回原序列的副本。

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

bytes.rsplit(sep=None, maxsplit=-1)

bytearray.rsplit(sep=None, maxsplit=-1)

将二进制序列拆分为相同类型的子序列，使用 sep 作为分隔符。如果给出了 maxsplit，则最多进行 maxsplit 次拆分，从最右边开始。如果 sep 未指定或为 None，任何只包含 ASCII 空白符的子序列都会被作为分隔符。除了从右边开始拆分，rsplit() 的其他行为都类似于下文所述的 split()。

bytes.rstrip([chars])

bytearray.rstrip([chars])

返回原序列的副本，移除指定的末尾字节。 chars 参数为指定要移除字节值集合的二进制序列 —— 这个名称表明此方法通常是用于 ASCII 字符。如果省略或为 None，则 chars 参数默认移除 ASCII 空白符。 chars 参数并非指定单个后缀；而是会移除参数值的所有组合:

>>>

>>> b'   spacious   '.rstrip()

b'   spacious'

>>> b'mississippi'.rstrip(b'ipz')

b'mississ'

要移除的字节值二进制序列可以是任意 bytes-like object。

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

bytes.split(sep=None, maxsplit=-1)

bytearray.split(sep=None, maxsplit=-1)

将二进制序列拆分为相同类型的子序列，使用 sep 作为分隔符。如果给出了 maxsplit 且非负值，则最多进行 maxsplit 次拆分（因此，列表最多会有 maxsplit+1 个元素）。如果 maxsplit 未指定或为 -1，则不限制拆分次数（进行所有可能的拆分）。

如果给出了 sep，则连续的分隔符不会被组合在一起而是被视为分隔空子序列 (例如 b’1,2’.split(b’,’) 将返回 [b’1’, b’’, b’2’])。 sep 参数可能为一个多字节序列 (例如 b’1<>2<>3’.split(b’<>’) 将返回 [b’1’, b’2’, b’3’])。使用指定的分隔符拆分空序列将返回 [b’’] 或 [bytearray(b’’)]，具体取决于被拆分对象的类型。 sep 参数可以是任意 bytes-like object。

例如:

>>>

>>> b'1,2,3'.split(b',')

[b'1', b'2', b'3']

>>> b'1,2,3'.split(b',', maxsplit=1)

[b'1', b'2,3']

>>> b'1,2,,3,'.split(b',')

[b'1', b'2', b'', b'3', b'']

如果 sep 未指定或为 None，则会应用另一种拆分算法：连续的 ASCII 空白符会被视为单个分隔符，其结果将不包含序列开头或末尾的空白符。因此，在不指定分隔符的情况下对空序列或仅包含 ASCII 空白符的序列进行拆分将返回 []。

例如:

>>>

>>> b'1 2 3'.split()

[b'1', b'2', b'3']

>>> b'1 2 3'.split(maxsplit=1)

[b'1', b'2 3']

>>> b'   1   2   3   '.split()

[b'1', b'2', b'3']

bytes.strip([chars])

bytearray.strip([chars])

返回原序列的副本，移除指定的开头和末尾字节。 chars 参数为指定要移除字节值集合的二进制序列 —— 这个名称表明此方法通常是用于 ASCII 字符。如果省略或为 None，则 chars 参数默认移除 ASCII 空白符。 chars 参数并非指定单个前缀或后缀；而是会移除参数值的所有组合:

>>>

>>> b'   spacious   '.strip()

b'spacious'

>>> b'www.example.com'.strip(b'cmowz.')

b'example'

要移除的字节值二进制序列可以是任意 bytes-like object。

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

以下 bytes 和 bytearray 对象的方法会假定使用兼容 ASCII 的二进制格式，不应当被应用于任意二进制数据。请注意本小节中所有的 bytearray 方法都不是原地执行操作，而是会产生新的对象。

bytes.capitalize()

bytearray.capitalize()

返回原序列的副本，其中每个字节将都将被解读为一个 ASCII 字符，并且第一个字节的字符大写而其余的小写。非 ASCII 字节值将保持原样不变。

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

bytes.expandtabs(tabsize=8)

bytearray.expandtabs(tabsize=8)

返回序列的副本，其中所有的 ASCII 制表符会由一个或多个 ASCII 空格替换，具体取决于当前列位置和给定的制表符宽度。每 tabsize 个字节设为一个制表位（默认值 8 时设定的制表位在列 0, 8, 16 依次类推）。要展开序列，当前列位置将被设为零并逐一检查序列中的每个字节。如果字节为 ASCII 制表符 (b’\t’)，则并在结果中插入一个或多个空格符，直到当前列等于下一个制表位。（制表符本身不会被复制。）如果当前字节为 ASCII 换行符 (b’\n’) 或回车符 (b’\r’)，它会被复制并将当前列重设为零。任何其他字节会被不加修改地复制并将当前列加一，不论该字节值在被打印时会如何显示:

>>>

>>> b'01\t012\t0123\t01234'.expandtabs()

b'01      012     0123    01234'

>>> b'01\t012\t0123\t01234'.expandtabs(4)

b'01  012 0123    01234'

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

bytes.isalnum()

bytearray.isalnum()

如果序列中所有字节都是字母类 ASCII 字符或 ASCII 十进制数码并且序列非空则返回真值，否则返回假值。字母类 ASCII 字符就是字节值包含在序列 b’abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ’ 中的字符。 ASCII 十进制数码就是字节值包含在序列 b’0123456789’ 中的字符。

例如:

>>>

>>> b'ABCabc1'.isalnum()

True

>>> b'ABC abc1'.isalnum()

False

bytes.isalpha()

bytearray.isalpha()

如果序列中所有字节都是字母类 ASCII 字符并且序列非空则返回真值，否则返回假值。字母类 ASCII 字符就是字节值包含在序列 b’abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ’ 中的字符。

例如:

>>>

>>> b'ABCabc'.isalpha()

True

>>> b'ABCabc1'.isalpha()

False

bytes.isascii()

bytearray.isascii()

如果序列为空或序列中所有字节都是 ASCII 字节则返回真值，否则返回假值。 ASCII 字节的取值范围是 0-0x7F。

3.7 新版功能.

bytes.isdigit()

bytearray.isdigit()

如果序列中所有字节都是 ASCII 十进制数码并且序列非空则返回真值，否则返回假值。 ASCII 十进制数码就是字节值包含在序列 b’0123456789’ 中的字符。

例如:

>>>

>>> b'1234'.isdigit()

True

>>> b'1.23'.isdigit()

False

bytes.islower()

bytearray.islower()

如果序列中至少有一个小写 ASCII 字符并且没有大写 ASCII 字符则返回真值，否则返回假值。

例如:

>>>

>>> b'hello world'.islower()

True

>>> b'Hello world'.islower()

False

小写 ASCII 字符就是字节值包含在序列 b’abcdefghijklmnopqrstuvwxyz’ 中的字符。大写 ASCII 字符就是字节值包含在序列 b’ABCDEFGHIJKLMNOPQRSTUVWXYZ’ 中的字符。

bytes.isspace()

bytearray.isspace()

如果序列中所有字节都是 ASCII 空白符并且序列非空则返回真值，否则返回假值。 ASCII 空白符就是字节值包含在序列 b’ \t\n\r\x0b\f’ (空格, 制表, 换行, 回车, 垂直制表, 换页) 中的字符。

bytes.istitle()

bytearray.istitle()

如果序列为 ASCII 标题形式并且序列非空则返回真值，否则返回假值。请参阅 bytes.title() 了解有关“标题形式”的详细定义。

例如:

>>>

>>> b'Hello World'.istitle()

True

>>> b'Hello world'.istitle()

False

bytes.isupper()

bytearray.isupper()

如果序列中至少有一个大写字母 ASCII 字符并且没有小写 ASCII 字符则返回真值，否则返回假值。

例如:

>>>

>>> b'HELLO WORLD'.isupper()

True

>>> b'Hello world'.isupper()

False

小写 ASCII 字符就是字节值包含在序列 b’abcdefghijklmnopqrstuvwxyz’ 中的字符。大写 ASCII 字符就是字节值包含在序列 b’ABCDEFGHIJKLMNOPQRSTUVWXYZ’ 中的字符。

bytes.lower()

bytearray.lower()

返回原序列的副本，其所有大写 ASCII 字符均转换为对应的小写形式。

例如:

>>>

>>> b'Hello World'.lower()

b'hello world'

小写 ASCII 字符就是字节值包含在序列 b’abcdefghijklmnopqrstuvwxyz’ 中的字符。大写 ASCII 字符就是字节值包含在序列 b’ABCDEFGHIJKLMNOPQRSTUVWXYZ’ 中的字符。

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

bytes.splitlines(keepends=False)

bytearray.splitlines(keepends=False)

返回由原二进制序列中各行组成的列表，在 ASCII 行边界符的位置拆分。此方法使用 universal newlines 方式来分行。结果列表中不包含换行符，除非给出了 keepends 且为真值。

例如:

>>>

>>> b'ab c\n\nde fg\rkl\r\n'.splitlines()

[b'ab c', b'', b'de fg', b'kl']

>>> b'ab c\n\nde fg\rkl\r\n'.splitlines(keepends=True)

[b'ab c\n', b'\n', b'de fg\r', b'kl\r\n']

不同于 split()，当给出了分隔符 sep 时，对于空字符串此方法将返回一个空列表，而末尾的换行不会令结果中增加额外的行:

>>>

>>> b"".split(b'\n'), b"Two lines\n".split(b'\n')

([b''], [b'Two lines', b''])

>>> b"".splitlines(), b"One line\n".splitlines()

([], [b'One line'])

bytes.swapcase()

bytearray.swapcase()

返回原序列的副本，其所有小写 ASCII 字符均转换为对应的大写形式，反之亦反。

例如:

>>>

>>> b'Hello World'.swapcase()

b'hELLO wORLD'

小写 ASCII 字符就是字节值包含在序列 b’abcdefghijklmnopqrstuvwxyz’ 中的字符。大写 ASCII 字符就是字节值包含在序列 b’ABCDEFGHIJKLMNOPQRSTUVWXYZ’ 中的字符。

不同于 str.swapcase()，在些二进制版本下 bin.swapcase().swapcase() == bin 总是成立。大小写转换在 ASCII 中是对称的，即使其对于任意 Unicode 码位来说并不总是成立。

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

bytes.title()

bytearray.title()

返回原二进制序列的标题版本，其中每个单词以一个大写 ASCII 字符为开头，其余字母为小写。不区别大小写的字节值将保持原样不变。

例如:

>>>

>>> b'Hello world'.title()

b'Hello World'

小写 ASCII 字符就是字节值包含在序列 b’abcdefghijklmnopqrstuvwxyz’ 中的字符。大写 ASCII 字符就是字节值包含在序列 b’ABCDEFGHIJKLMNOPQRSTUVWXYZ’ 中的字符。所有其他字节值都不区分大小写。

该算法使用一种简单的与语言无关的定义，将连续的字母组合视为单词。该定义在多数情况下都很有效，但它也意味着代表缩写形式与所有格的撇号也会成为单词边界，这可能导致不希望的结果:

>>>

>>> b"they're bill's friends from the UK".title()

b"They'Re Bill'S Friends From The Uk"

可以使用正则表达式来构建针对撇号的特别处理:

>>>

>>> import re

>>> def titlecase(s):

...     return re.sub(rb"[A-Za-z]+('[A-Za-z]+)?",

...                   lambda mo: mo.group(0)[0:1].upper() +

...                              mo.group(0)[1:].lower(),

...                   s)

...

>>> titlecase(b"they're bill's friends.")

b"They're Bill's Friends."

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

bytes.upper()

bytearray.upper()

返回原序列的副本，其所有小写 ASCII 字符均转换为对应的大写形式。

例如:

>>>

>>> b'Hello World'.upper()

b'HELLO WORLD'

小写 ASCII 字符就是字节值包含在序列 b’abcdefghijklmnopqrstuvwxyz’ 中的字符。大写 ASCII 字符就是字节值包含在序列 b’ABCDEFGHIJKLMNOPQRSTUVWXYZ’ 中的字符。

注解此方法的 bytearray 版本并非原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

bytes.zfill(width)

bytearray.zfill(width)

返回原序列的副本，在左边填充 b’0’ 数码使序列长度为 width。正负值前缀 (b’+’/ b’-’) 的处理方式是在正负符号之后填充而非在之前。对于 bytes 对象，如果 width 小于等于 len(seq) 则返回原序列。

例如:

>>>

>>> b"42".zfill(5)

b'00042'

>>> b"-42".zfill(5)

b'-0042'

注解 此方法的 bytearray 版本 并非 原地操作 —— 它总是产生一个新对象，即便没有做任何改变。

printf 风格的字节串格式化

译文：二进制序列类型 --- bytes, bytearray的更多相关文章

Python数值类型和序列类型
int.float.bool这三个数值类型和常用序列类型的定义和使用数值类型的基本计算序列类型的索引取值.切片.成员运算等序列类型的通用操作 complex(复数).decimal(定点数).ma ...
Python数据类型之“序列概述与基本序列类型(Basic Sequences)”
序列是指有序的队列,重点在"有序". 一.Python中序列的分类 Python中的序列主要以下几种类型: 3种基本序列类型(Basic Sequence Types):list. ...
Python字节数组【bytes/bytearray】
bytes >>> type(b'xxxxx') <class 'bytes'> >>> type('xxxxx') <class 'str'&g ...
【转】Python数据类型之“序列概述与基本序列类型(Basic Sequences)”
[转]Python数据类型之“序列概述与基本序列类型(Basic Sequences)” 序列是指有序的队列,重点在"有序". 一.Python中序列的分类 Python中的序列主 ...
day33 序列类型，绑定方法，类方法，静态方法，封装继承和多态
Python之路,Day20 = 序列类型,绑定方法,类方法,静态方法,封装继承和多态序列是指有序的队列,重点在"有序". 一.Python中序列的分类 Python中的序列主要 ...
Fluent_Python_Part2数据结构，02-array-seq，序列类型
1. 序列数据例如字符串.列表.字节序列.元组.XML元素.数据库查询结果等,在Python中用统一的风格去处理.例如,迭代.切片.排序.拼接等. 2. 容器序列与扁平序列容器序列:容器对象包含任 ...
bytes,bytearray
1.bytes.bytearray ---Python3 引入的! bytes:不可变字节序列,bytearray:字节属组,可变都是连续的空间. 2.字符串与bytes 字符串是字符组成的有序的序 ...
python--数据类型bytes
在Python3以后,字符串和bytes类型彻底分开了.字符串是以字符为单位进行处理的,bytes类型是以字节为单位处理的. bytes数据类型在所有的操作和使用甚至内置方法上和字符串数据类型基本一样 ...
python高级（二）—— python内置序列类型
本文主要内容序列类型分类: (1)容器序列.扁平序列 (2)可变序列.不可变序列列表推导式生成器表达式元组拆包切片排序(list.sort方法和sorted函数) bisect pytho ...

随机推荐

Socket listen 简要分析
#include <sys/types.h> /* See NOTES */#include <sys/socket.h>int listen(int sockfd, int ...
双汇大数据方案选型：从棘手的InfluxDB+Redis到毫秒级查询的TDengine
双汇发展多个分厂的能源管控大数据系统主要采用两种技术栈:InfluxDB/Redis和Kafka/Redis/HBase/Flink,对于中小型研发团队来讲,无论是系统搭建,还是实施运维都非常棘手.经 ...
小程序·云开发地表最强CI利器来了
小程序CI 与 CloudBase-FrameWork 从2017年开始,微信小程序的能力也随着前端的大发展的趋势越来越多,包体积限制越来越宽松,大型微信小程序的开发团队越来越多,为了适应形式,微信小 ...
使用日志系统graylog获取Ceph集群状态
前言在看集群的配置文件的时候看到ceph里面有一个graylog的输出选择,目前看到的是可以收集mon日志和clog,osd单个的日志没有看到,Elasticsearch有整套的日志收集系统,可以很 ...
ubuntu服务器dns重启失效问题
方法一通过/etc/network/interfaces,在它的最后增加一句: dns-nameservers 8.8.8.8 8.8.8.8是Google提供的DNS服务,这里只是举一个例子,你也 ...
mysql数据库新增、修改、删除字段和修改表名
Mysql 删除,添加或修改表字段删除 ALTER TABLE testalter_tbl DROP i; 新增 ALTER TABLE testalter_tbl ADD i INT; 指定位置新 ...
好学易懂从零开始的插头DP（一）
好学易懂从零开始的插头DP(一) 写在前面这是一篇,以蒟蒻视角展开的梳理总结.更改了一些顺序,变化了一些细节.方便蒟蒻学习理解(起码本蒟蒻是这样).大佬们可以直接看其它大佬的博客,可以学的更快. ...
Nginx下关于缓存控制字段cache-control的配置说明
HTTP协议的Cache -Control指定请求和响应遵循的缓存机制.在请求消息或响应消息中设置 Cache-Control并不会影响另一个消息处理过程中的缓存处理过程.请求时的缓存指令包括: no ...
一 HTML基础入门
HTML概念 HTML是标记语言,由W3C组织提供的一套标记标签组成.其使用标记标签来描述网页,一个网页除了由大量的标签组成,还有后续要学习的css样式和JavaScript脚本组合而成. 网页与网站 ...
jQuery 第四章实例方法 DOM操作之data方法
jquery 里面的 data 方法比较重要, 所以成一个模块写: 首先, 得知道 data() 干嘛用的, 看淘宝上有自定义的属性, 为data - 什么什么, 这是为了dom 跟数据有 ...

译文：二进制序列类型 --- bytes, bytearray

译文：二进制序列类型 --- bytes, bytearray的更多相关文章

随机推荐

热门专题