------ 开源软件 Tor(洋葱路由器,构建匿名网络的方案之一)源码分析——主程序入口点(二)------
——————————————————————————————————————————————————————————
第二部分仅考察下图所示的代码片段——configure_backtrace_handler() 后面的五条函数调用序列;在这些看似简洁的
逻辑背后其实蕴涵乐许多“类 UNIX”系统相关的概念,因此或需要用到整个篇幅来讲解。首先,从这些自注释的函数名称来看,
无非就是更新系统时间的估计值、tor 的线程和压缩功能初始化、日志系统初始化,以及初始化单调定时器子系统(monotime_init):
调用 UNIX 库函数 time(),把返回的当前时间(一个 time_t 结构实例,一般定义在类 UNIX 文件系统的 /user/include/time.h 头文件中)传入
update_approx_time()(\tor-0.3.1.8\src\common\util.c),后者用它来初始化全局(静态)的 cached_approx_time 变量,代表缓存当前时间的估计值,相关代码片段如下:
值得一提,tor 源码树中的“common”路径下包含一些各组件都会利用到的公共设施,比如对类 UNIX 系统机制——pthread——的
封装例程、对 OpenSSL 库的封装例程、对开源事件通知库 libevent 的封装例程。。。。等等。
由于 update_approx_time() 每秒被调用一次,cached_approx_time 也就每秒更新一次,此后就可以随时利用 approx_time() 查询最近一次 update_approx_time() 调用所
更新的 cached_approx_time。
tor 用上述逻辑实现了自己的计时体系,避免在关键路径上直接调用库函数 time(),这是一种编程诀窍(hack)!
除了前述的 Win32 平台相关代码和注册崩溃回调外,update_approx_time() 在任何 tor 组件初始化前就被调用,体现出时间参照的重要性。
——————————————————————————————————————————————————————————————————————————————————————————————
tor_threads_init()(\tor-0.3.1.8\src\common\compat_pthreads.c)设立线程使用的公共结构,然后调用
set_main_thread() -> tor_get_thread_id() -> pthread_self() 把当前线程标记为主线程(存储在全局变量 main_thread_id 内)。
事实上,compat_pthreads.c 中所有的多线程支持函数都依赖于 UNIX/Linux 平台上的 pthread 机制。
而由于本系列博文的目的是考察 tor 的原理和架构,所以我不想试图陷入系统库函数底层代码中分析,相关的代码片段如下:
上图中的 threads_initialized 是一个全局变量,它扮演着一种状态标记的角色,综观 tor 源码随处可见此类编程技巧——
这些状态起初被设置为 0,然后一些相关的例程(名称中带有 init )会通过检测这些标记来判断是否执行过初始化任务,比如
上图中,若 threads_initialized = 0 则调用 pthread 系列的函数来初始化线程用到的一些公共设施(attr_recursive、attr_detached),它们都是一些全局的结构实例,
相关的代码片段如下:
源码里的注释已经写得很清楚了:结构体 pthread_attr_t 表示一个使线程开始分离的 pthread 属性;
结构体 pthread_mutexattr_t 代表一个互斥锁属性,它被指定为“递归”性质的——在已经持有该锁的情况下还可以重新上锁。
如前所述,碰到平台相关的库函数时,如非特别重要,我一般会忽略分析,把精力集中在 tor 程序的逻辑上。
谈到 tor_threads_init() 结尾处的 set_main_thread() -> tor_get_thread_id() -> pthread_self() 调用逻辑,相关的代码片段如下:
你可以在上图看见 tor_get_thread_id() 在内部定义了一个联合(union),其中具备一个“id”字段,它最终被返回并赋给全局变量 main_thread_id 。
值得关注的另一个焦点是 tor_assert 宏(\tor-0.3.1.8\src\common\util_bug.h),它根据表达式的求值结果采取相应的措施,相关的代码片段如下:
注释中提到,tor_assert 在断言失败的情况下会发送错误消息到日志、标准错误(stderr),然后调用系统服务 abort(),终止程序,
因此用到 tor_assert 的地方想必都是一些攸关 tor 能否正常运行的检查逻辑!
——————————————————————————————————————————————————————————————————
\tor-0.3.1.8\src\common\compress.h 中定义了一些数据压缩办法、压缩级别(程度)。
其中仅有 gzip 与 zlib 明确被 tor_compress()(压缩)和 tor_uncompress()(解压)支持,相关的代码片段如下:
tor_compress_init() 函数体位于相同路径下的 compress.c 文件内:它首先调用 atomic_counter_init() 初始化一个全局变量
total_compress_allocation(一个 atomic_counter_t 结构实例),描述为压缩状态分配的总字节开销;
atomic_counter_init() 执行 memset() 将整个结构内容初始化为 0,接着调用 tor_mutex_init_nonrecursive() 处理该结构的 mutex 字段。
tor_compress_init() 还初始化了所有的压缩模块,包括 zlib,以及不常见的 lzma、zstd 等压缩办法。而实际的初始化逻辑仅仅是构建并归零为各模块状态分配的字节计数器
(都是些 atomic_counter_t 对象),相关的代码片段如下:
在分析 atomic_counter_init() 内部逻辑之前,有必要先来讨论一下 tor 首创的 atomic_counter_t 结构
(\tor-0.3.1.8\src\common\compat_threads.h)——后文简称“原子计数器”! 相关的代码片段如下:
由此可知,atomic_counter_t 是一个复合结构,其内包含了 tor_mutex_t 结构,而后者在 Win32 平台下,是对临界区(CRITICAL SECTION)的封装;
在支持 pthread 的类 UNIX 平台上,则是对 pthread_mutex_t 结构的封装。示意图如下,这种兼容各平台的设计思想确实值得学习:
而对于 Windows 特有的 CRITICAL SECTION 原生支持则通过下面的条件编译块实现:
可以从上图看到,在 Windows 平台上,tor_mutex_* 系列的函数都封装了 Windows 特有的临界区相关 API——
tor_mutex_init_nonrecursive() -> InitializeCriticalSection()
tor_mutex_uninit() -> DeleteCriticalSection()
tor_mutex_acquire() -> EnterCriticalSection()
tor_mutex_release() -> LeaveCriticalSection()
原子计数器结构内的“mutex”成员封装了系统底层的互斥锁,用来保护对母结构(亦即 atomic_counter_t)的同步/互斥访问;
而真正要保护的对象则是其内的“val”成员,它实现了计数器的功能,像 tor_compress_init() 就用该字段来记录为压缩状态分配的总字节开销;
实际上,tor 提供了专门的例程来操纵原子计数器,并且源码注释也建议程序员通过此类例程来访问它,而不要直接修改此数据结构,避免预料之外的错误操作!
这体现了面向对象编程中的“对象方法”思维,相关的代码片段如下:
如您所见,访问“val”字段前(无论是增加还是删减)都需要先获取互斥锁,修改完后再释放互斥锁。注意,此类支持例程都接收一枚原子计数器指针,
所以调用它们时,需要传入一个原子计数器结构的地址,就像在 tor_compress_init() 内那样:
atomic_counter_init(&total_compress_allocation);
同理,像 &counter->mutex 此类运算,是先通过形参 counter(原子计数器指针)引用到 mutex 成员,然后取它的地址,这样才
与它们的参数类型匹配(通过指针选择结构成员 -> 的优先级,高于取地址操作符 & 的优先级),相关的代码片段如下:
从上图可知,tor_mutex_init_nonrecursive() 的形参类型为一枚 tor_mutex_t 指针,所以 atomic_counter_init() 在调用它
时,传入了 &counter->mutex ,再次体现指针与地址的等价性。
另外我们从上图了解到:归根究底,还是要通过 pthread_mutex_init() 来初始化原子计数器内的互斥锁。。。。。
tor_compress_init() 内部的流程可以粗略总结如下图:
——————————————————————————————————————————————————————
限于篇幅,第三部分将分析剩余的两条函数调用—— init_logging() 与 monotime_init()。
------ 开源软件 Tor(洋葱路由器,构建匿名网络的方案之一)源码分析——主程序入口点(二)------的更多相关文章
- ------ Tor(洋葱路由器)匿名网络源码分析——主程序入口点(一)------
--------------------------------------------------------<概览> tor 的源码包可以从官网下载,可能需要预先利用其它FQ软件才能访 ...
- 开源网站流量统计系统Piwik源码分析——后台处理(二)
在第一篇文章中,重点介绍了脚本需要搜集的数据,而本篇主要介绍的是服务器端如何处理客户端发送过来的请求和参数. 一.设备信息检测 通过分析User-Agent请求首部(如下图红线框出的部分),可以得到相 ...
- 40 网络相关函数(八)——live555源码阅读(四)网络
40 网络相关函数(八)——live555源码阅读(四)网络 40 网络相关函数(八)——live555源码阅读(四)网络 简介 15)writeSocket向套接口写数据 TTL的概念 函数send ...
- 37 网络相关函数(五)——live555源码阅读(四)网络
37 网络相关函数(五)——live555源码阅读(四)网络 37 网络相关函数(五)——live555源码阅读(四)网络 简介 10)MAKE_SOCKADDR_IN构建sockaddr_in结构体 ...
- 33 网络相关函数(一)——live555源码阅读(四)网络
33 网络相关函数(一)——live555源码阅读(四)网络 33 网络相关函数(一)——live555源码阅读(四)网络 简介 1)IsMulticastAddress多播(组播)地址判断函数 多播 ...
- Android网络框架源码分析一---Volley
转载自 http://www.jianshu.com/p/9e17727f31a1?utm_campaign=maleskine&utm_content=note&utm_medium ...
- Java开源生鲜电商平台-购物车模块的设计与架构(源码可下载)
ava开源生鲜电商平台-购物车模块的设计与架构(源码可下载) 说明:任何一个电商无论是B2C还是B2B都有一个购物车模块,其中最重要的原因就是客户需要的东西放在一起,形成一个购物清单,确认是否有问题, ...
- Flink源码分析 - 源码构建
原文地址:https://mp.weixin.qq.com/s?__biz=MzU2Njg5Nzk0NQ==&mid=2247483692&idx=1&sn=18cddc1ee ...
- Elasticsearch源码分析 - 源码构建
原文地址:https://mp.weixin.qq.com/s?__biz=MzU2Njg5Nzk0NQ==&mid=2247483694&idx=1&sn=bd03afe5a ...
随机推荐
- 高可用的MongoDB集群
1.序言 MongoDB 是一个可扩展的高性能,开源,模式自由,面向文档的数据库. 它使用 C++编写.MongoDB 包含一下特点: l 面向集合的存储:适合存储对象及JSON形式的数据. l ...
- [翻译] 编写高性能 .NET 代码--第二章 GC -- 减少分配率, 最重要的规则,缩短对象的生命周期,减少对象层次的深度,减少对象之间的引用,避免钉住对象(Pinning)
减少分配率 这个几乎不用解释,减少了内存的使用量,自然就减少GC回收时的压力,同时降低了内存碎片与CPU的使用量.你可以用一些方法来达到这一目的,但它可能会与其它设计相冲突. 你需要在设计对象时仔细检 ...
- pro asp.net mvc 5笔记
1.Ninject条件绑定方法When(predicate)WhenClassHas<T>()WhenInj ectedInto<T>()例: kernel.Bind<I ...
- bzoj 2209 [Jsoi2011]括号序列 平衡树
2209: [Jsoi2011]括号序列 Time Limit: 20 Sec Memory Limit: 259 MBSubmit: 1404 Solved: 699[Submit][Statu ...
- 基于Jquery+Ajax+Json+存储过程 高效分页
在做后台开发中,都会有大量的列表展示,下面给大家给大家分享一套基于Jquery+Ajax+Json+存储过程高效分页列表,只需要传递几个参数即可.当然代码也有改进的地方,如果大家有更好的方法,愿留下宝 ...
- Hibernate学习(二)保存数据
package cn.lonecloud.test; import java.util.Date; import org.hibernate.HibernateException; import or ...
- Elasticsearch-深入理解索引原理
最近开始大面积使用ES,很多地方都是知其然不知其所以然,特地翻看了很多资料和大牛的文档,简单汇总一篇.内容多为摘抄,说是深入其实也是一点浅尝辄止的理解.希望大家领会精神. 首先学习要从官方开始地址如下 ...
- Mysql数据库建立索引的优缺点有哪些?
索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息. 什么是索引 数据库索引好比是一本书前面的目录,能加快数据库的查询速度. 例如这样一个查询:select * ...
- Tesseract OCR win 32位编译
https://github.com/tesseract-ocr/tesseract/wiki/Compiling 找到该标题:Develop Tesseract 按照上面的步骤执行即可,最后使用 v ...
- POJ - 3984 bfs [kuangbin带你飞]专题一
bfs搜索过程中将路径保存下即可. AC代码 #include<cstdio> #include<cstring> #include<algorithm> #inc ...