前言

某些只能使用ASCII字符的场景,往往需要传输非ASCII字符的数据,这时就需要一种编码可以将数据转换成ASCII字符,而base64编码就是其中一种。

编码原理很简单,将原始数据以3字节(24比特)为一组均分成4份,每部分6比特共64种组合,每种组合转换成对应字符,最后拼接起来即可。若最后一组不够3字节则后面用0补齐,转换后补齐多少字节就用几个“=”字符表示。

上面大致描述了base64编码的场景及原理,具体细节不做探讨,本文主要描述用rust实现时涉及的rust知识点。

标准输出读取

程序的数据是从标准输入(stdin)中读取的,使用std::io::stdin()返回实现Read特性(trait)的Stdin结构体,调用Read特性read函数即可从标准输出读取数据,例子如下。

let buf: [u8; 300] = [0; 300];
let size = stdin().read(&buf).unwrap();

read使用一个u8类型数组用作从标准输入接收数据的缓存,接收到的字节数以包裹在Result中的usize类型返回,这里简单地使用unwrap()解包获取字节数。

缓存的大小是固定的但是输入数据运行时确定的,因此使用循环不断从标准输入中读取数据,直到读取数据字节数为0。

let mut buf: [u8; 300] = [0; 300];

loop {
let size = stdin().read(&mut buf).unwrap();
if size == 0 {
break;
}
// Output the buffer, and assume that buffer is utf-8 string.
print!("{}", String::from_utf8(buf.to_vec()).unwrap());
}

IO抽象模型

与Java的InputStream和OutputStream一样,rust也有IO抽象模型,那就是Read和Write特性。

Read和Write特性将输入输出抽象为read、write等一系列函数,具体细节尤其实现决定。

使用时无需知道其实现是标准输入输出、文件还是网络,例如可以实现一个输入源自动匹配函数,当指定路径的文件不存在就读取标准输入,反之就从文件中读取内容。

fn main() {
let mut buf: [u8; 300] = [0; 300]; loop {
let size = input("./input").read(&mut buf).unwrap();
if size == 0 {
break;
}
print!("{}", String::from_utf8(buf.to_vec()).unwrap())
}
} fn input(path: &'static str) -> Box<dyn Read> {
if !Path::new(path).exists() {
return Box::new(stdin());
}
Box::new(File::open(path).unwrap())
}

数组

rust数组是定长的,因此声明时必须明确长度及类型以便分配内存,长度和类型可以自动推断也可指定。

let arr: [i32; 4]; // 1. Specify type and length, the format is [Type; length].
let arr = [0, 4]; // 2. Infer type automatically.
let arr = [0, 0, 0, 0]; // 3. Infer type and length.

与其他多数语言一样也是使用下标访问元素,超出范围会直接panic。

let mut arr = [0, 0, 0, 0];
print!("{}", arr[0]); // Output is 0.
arr[0] = 1;
print!("{}", arr[0]); // Output is 1.
arr[4] = 4; // Panic here.

字符串

rust的字符串有str和String两种:

  1. str是原始类型,其实现是一种切片(Slice)类型且不可变,由于切片类型没有所有权,因此只能是以引用方式&str出现;
  2. String有所有权且可变,其使用的是堆内存,因此开销会比str大。

字符串相加是常见场景,一种方式是直接用+运算符,注意其左值必须是String类型,因为String实现了运算符重载的Add特性且由于其是可变的。

let a = String.from("a");
let b = "b";
let _ = a + b;
// Can not use variable "a" here, its ownership has been moved

注意这里作为左值的a变量在运算后不能在被使用,因为其所有权已经被移动。

另一种相加方式是String的push_str方法,其实+实现也是调用了此方法。

附录

base64编码实现完整代码如下:

use std::io::{stdin, Read};

fn main() {
let mut buf: [u8; 300] = [0; 300];
loop {
let size = stdin().read(&mut buf).unwrap();
if size == 0 {
break;
}
print!("{}", String::from_utf8(buf.to_vec()).unwrap());
print!("{}", encode(&buf, size));
}
} fn encode(bytes: &[u8], size: usize) -> String {
let mut buf = String::new();
let i = 0;
for mut i in 0..(size / 3) {
i = i * 3;
let f = bytes[i];
let s = bytes[i + 1];
let t = bytes[i + 2]; buf.push_str(&cvt((f & 0xfc) >> 2));
buf.push_str(&cvt((f & 0x03) << 4 | ((s & 0xf0) >> 4)));
buf.push_str(&cvt((s & 0x0f) << 2 | ((t & 0xc0) >> 6)));
buf.push_str(&cvt(t & 0x3f));
} let mut i = (i + 1) * 3;
i = if size < i { 0 } else { i };
let remain = size - i;
if remain == 1 {
let f = bytes[i];
buf.push_str(&cvt((f & 0xfc) >> 2));
buf.push_str(&cvt((f & 0x03) << 4 | 0));
buf.push_str("==");
} else if remain == 2 {
let f = bytes[i];
let s = bytes[i + 1];
buf.push_str(&cvt((f & 0xfc) >> 2));
buf.push_str(&cvt((f & 0x03) << 4 | ((s & 0xf0) >> 4)));
buf.push_str(&cvt((s & 0x0f) << 2 | 0));
buf.push_str("=");
}
buf
} const BASE64_TABLE: [char; 64] = [
'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S',
'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l',
'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4',
'5', '6', '7', '8', '9', '+', '/',
]; fn cvt(i: u8) -> String {
BASE64_TABLE.get(i as usize).unwrap().to_string()
}

rust实战系列-base64编码的更多相关文章

  1. Rust实战系列-基本语法

    本文是<Rust in action>学习总结系列的第二部分,更多内容请看已发布文章: 一.Rust实战系列-Rust介绍 " 主要介绍 Rust 的语法.基本类型和数据结构,通 ...

  2. rust实战系列 - 使用Iterator 迭代器实现斐波那契数列(Fibonacci )

    为什么是斐波那契数列 斐波那契数列十分适合用来实战rust的迭代器,算法也很简单,一目了然.这个例子可以用来学习Iterator的使用,十分适合刚学习了rust的迭代器章节后用来练练手. 代码实战 d ...

  3. javacpp-FFmpeg系列之3: 像素图像数据转换(BGR与BufferdImage互转,RGB与BufferdImage互转,BufferdImage转Base64编码)

    javacpp-ffmpeg系列: javacpp-FFmpeg系列之1:视频拉流解码成YUVJ420P,并保存为jpg图片 javacpp-FFmpeg系列之2:通用拉流解码器,支持视频拉流解码并转 ...

  4. SSE图像算法优化系列三十一:Base64编码和解码算法的指令集优化。

        一.基础原理 Base64是一种用64个Ascii字符来表示任意二进制数据的方法.主要用于将不可打印的字符转换成可打印字符,或者简单的说是将二进制数据编码成Ascii字符.Base64也是网络 ...

  5. .NET Core加解密实战系列之——消息摘要与数字签名算法

    目录 简介 功能依赖 消息摘要算法 MD算法 家族发展史 应用场景 代码实现 MD5 示例代码 SHA算法 应用场景 代码实现 SHA1 SHA256 示例代码 MAC算法 HMAC算法的典型应用 H ...

  6. .NET Core加解密实战系列之——对称加密算法

    简介 加解密现状,编写此系列文章的背景: 需要考虑系统环境兼容性问题(Linux.Windows) 语言互通问题(如C#.Java等)(加解密本质上没有语言之分,所以原则上不存在互通性问题) 网上资料 ...

  7. .NET Core加解密实战系列之——使用BouncyCastle制作p12(.pfx)数字证书

    简介 加解密现状,编写此系列文章的背景: 需要考虑系统环境兼容性问题(Linux.Windows) 语言互通问题(如C#.Java等)(加解密本质上没有语言之分,所以原则上不存在互通性问题) 网上资料 ...

  8. Spark入门实战系列--6.SparkSQL(上)--SparkSQL简介

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 .SparkSQL的发展历程 1.1 Hive and Shark SparkSQL的前身是 ...

  9. Spark入门实战系列--9.Spark图计算GraphX介绍及实例

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 .GraphX介绍 1.1 GraphX应用背景 Spark GraphX是一个分布式图处理 ...

随机推荐

  1. [AcWing 28] 在O(1)时间删除链表结点

    点击查看代码 /** * Definition for singly-linked list. * struct ListNode { * int val; * ListNode *next; * L ...

  2. Go Context 原理详解

    实现一个小目标 很开心的一件事,学习了一个月的后端拿到一个13k的offer,今年年底目标拿到一个30k的go方向offer. 好了回归正文,这篇文章是回答交流时一个老哥的问题,跟go的context ...

  3. Docker 日志管理最佳实践

    开源Linux 回复"读书",挑选书籍资料~ Docker-CE Server Version: 18.09.6 Storage Driver: overlay2 Kernel V ...

  4. 关键字 global和nonlocal

    globale 表示从全局把一个变量(比如a)引入局部,后面的变量全是此变量a 使用   globale 变量名 # 全局变量一般是不能随意的修改的 # a = 10 # def func(): # ...

  5. Redis 为何使用近似 LRU 算法淘汰数据,而不是真实 LRU?

    在<Redis 数据缓存满了怎么办?>我们知道 Redis 缓存满了之后能通过淘汰策略删除数据腾出空间给新数据. 淘汰策略如下所示: 设置过期时间的 key volatile-ttl.vo ...

  6. Spring 源码(13)Spring Bean 的创建过程(4)

    Spring Bean的创建过程非常的复杂,上一篇重点介绍了Spring在创建Bean的过程中,使用InstantiationBeanPostProcessor进行提前创建Bean,我们可以通过CGL ...

  7. 141. Linked List Cycle - LeetCode

    Question 141. Linked List Cycle Solution 题目大意:给一个链表,判断是否存在循环,最好不要使用额外空间 思路:定义一个假节点fakeNext,遍历这个链表,判断 ...

  8. redis高可用、redis集群、redis缓存优化

    今日内容概要 redis高可用 redis集群 redis缓存优化 内容详细 1.redis高可用 # 主从复制存在的问题: 1 主从复制,主节点发生故障,需要做故障转移,可以手动转移:让其中一个sl ...

  9. CoaXPress 时间戳 Time Stamping

    背景 在CXP2.0之前,CXP没有定义Time Stamping时间戳的概念,但是用户对Time Stamping是有实际需求的,比如我们要对比多台设备拍摄同一个物体不同角度的照片,或者记录触发完成 ...

  10. [算法学习] 换根dp

    换根dp 一般来说,我们做题的树都是默认 \(1\) 为根的.但是有些题目需要计算以每个节点为根时的内容. 朴素的暴力:以每个点 \(u\) 作为 \(root\) 暴力dfs下去,复杂度\(O(n^ ...