你真的很棒,已经跟着我一起从最开始初识Go语言,一步一步地走到了这里。

在这之前的几十篇文章中,我向你一点一点地介绍了很多Go语言的核心知识,以及一些最最基础的标准库代码包。我想,你已经完全有能力独立去做一些事情了。

为了激发你更多的兴趣,我还打算用几篇文章来说说Go语言的网络编程。不过,关于网络编程这个事情,恐怕早已庞大到用一两本专著都无法对它进行完整论述的地步了。

所以,我在这里说的东西只能算是个引子。只要这样能让你产生想去尝试的冲动,我就很开心了。

前导内容:socket与IPC

人们常常会使用Go语言去编写网络程序(当然了,这方面也是Go语言最为擅长的事情)。说到网络编程,我们就不得不提及socket。

socket,常被翻译为套接字,它应该算是网络编程世界中最为核心的知识之一了。关于socket,我们可以讨论的东西太多了,因此,我在这里只围绕着Go语言向你介绍一些关于它的基础知识。

所谓socket,是一种IPC方法。IPC是Inter-Process Communication的缩写,可以被翻译为进程间通信。顾名思义,IPC这个概念(或者说规范)主要定义的是多个进程之间,相互通信的方法。

这些方法主要包括:系统信号(signal)、管道(pipe)、套接字 (socket)、文件锁(file lock)、消息队列(message queue)、信号灯(semaphore,有的地方也称之为信号量)等。现存的主流操作系统大都对IPC提供了强有力的支持,尤其是socket。

你可能已经知道,Go语言对IPC也提供了一定的支持。

比如,在os代码包和os/signal代码包中就有针对系统信号的API。

又比如,os.Pipe函数可以创建命名管道,而os/exec代码包则对另一类管道(匿名管道)提供了支持。对于socket,Go语言与之相应的程序实体都在其标准库的net代码包中。

毫不夸张地说,在众多的IPC方法中,socket是最为通用和灵活的一种。与其他的IPC方法不同,利用socket进行通信的进程,可以不局限在同一台计算机当中。

实际上,通信的双方无论存在于世界上的哪个角落,只要能够通过计算机的网卡端口以及网络进行互联,就可以使用socket。

支持socket的操作系统一般都会对外提供一套API。跑在它们之上的应用程序利用这套API,就可以与互联网上的另一台计算机中的程序、同一台计算机中的其他程序,甚至同一个程序中的其他线程进行通信。

例如,在Linux操作系统中,用于创建socket实例的API,就是由一个名为socket的系统调用代表的。这个系统调用是Linux内核的一部分。

所谓的系统调用,你可以理解为特殊的C语言函数。它们是连接应用程序和操作系统内核的桥梁,也是应用程序使用操作系统功能的唯一渠道。

在Go语言标准库的syscall代码包中,有一个与这个socket系统调用相对应的函数。这两者的函数签名是基本一致的,它们都会接受三个int类型的参数,并会返回一个可以代表文件描述符的结果。

但不同的是,syscall包中的Socket函数本身是平台不相关的。在其底层,Go语言为它支持的每个操作系统都做了适配,这才使得这个函数无论在哪个平台上,总是有效的。

Go语言的net代码包中的很多程序实体,都会直接或间接地使用到syscall.Socket函数。

比如,我们在调用net.Dial函数的时候,会为它的两个参数设定值。其中的第一个参数名为network,它决定着Go程序在底层会创建什么样的socket实例,并使用什么样的协议与其他程序通信。

下面,我们就通过一个简单的问题来看看怎样正确地调用net.Dial函数。

今天的问题是:net.Dial函数的第一个参数network有哪些可选值?

这道题的典型回答是这样的。

net.Dial函数会接受两个参数,分别名为networkaddress,都是string类型的。

参数network常用的可选值一共有9个。这些值分别代表了程序底层创建的socket实例可使用的不同通信协议,罗列如下。

  • "tcp":代表TCP协议,其基于的IP协议的版本根据参数address的值自适应。
  • "tcp4":代表基于IP协议第四版的TCP协议。
  • "tcp6":代表基于IP协议第六版的TCP协议。
  • "udp":代表UDP协议,其基于的IP协议的版本根据参数address的值自适应。
  • "udp4":代表基于IP协议第四版的UDP协议。
  • "udp6":代表基于IP协议第六版的UDP协议。
  • "unix":代表Unix通信域下的一种内部socket协议,以SOCK_STREAM为socket类型。
  • "unixgram":代表Unix通信域下的一种内部socket协议,以SOCK_DGRAM为socket类型。
  • "unixpacket":代表Unix通信域下的一种内部socket协议,以SOCK_SEQPACKET为socket类型。

问题解析

为了更好地理解这些可选值的深层含义,我们需要了解一下syscall.Socket函数接受的那三个参数。

我在前面说了,这个函数接受的三个参数都是int类型的。这些参数所代表的分别是想要创建的socket实例通信域、类型以及使用的协议。

Socket的通信域主要有这样几个可选项:IPv4域、IPv6域和Unix域。

我想你应该能够猜出IPv4域、IPv6域的含义,它们对应的分别是基于IP协议第四版的网络,和基于IP协议第六版的网络。

现在的计算机网络大都是基于IP协议第四版的,但是由于现有IP地址的逐渐枯竭,网络世界也在逐步地支持IP协议第六版。

Unix域,指的是一种类Unix操作系统中特有的通信域。在装有此类操作系统的同一台计算机中,应用程序可以基于此域建立socket连接。

以上三种通信域分别可以由syscall代码包中的常量AF_INETAF_INET6AF_UNIX表示。

Socket的类型一共有4种,分别是:SOCK_DGRAMSOCK_STREAMSOCK_SEQPACKET以及SOCK_RAWsyscall代码包中也都有同名的常量与之对应。前两者更加常用一些。

SOCK_DGRAM中的“DGRAM”代表的是datagram,即数据报文。它是一种有消息边界,但没有逻辑连接的非可靠socket类型,我们熟知的基于UDP协议的网络通信就属于此类。

有消息边界的意思是,与socket相关的操作系统内核中的程序(以下简称内核程序)在发送或接收数据的时候是以消息为单位的。

你可以把消息理解为带有固定边界的一段数据。内核程序可以自动地识别和维护这种边界,并在必要的时候,把数据切割成一个一个的消息,或者把多个消息串接成连续的数据。如此一来,应用程序只需要面向消息进行处理就可以了。

所谓的有逻辑连接是指,通信双方在收发数据之前必须先建立网络连接。待连接建立好之后,双方就可以一对一地进行数据传输了。显然,基于UDP协议的网络通信并不需要这样,它是没有逻辑连接的。

只要应用程序指定好对方的网络地址,内核程序就可以立即把数据报文发送出去。这有优势,也有劣势。

优势是发送速度快,不长期占用网络资源,并且每次发送都可以指定不同的网络地址。

当然了,最后一个优势有时候也是劣势,因为这会使数据报文更长一些。其他的劣势有,无法保证传输的可靠性,不能实现数据的有序性,以及数据只能单向进行传输。

SOCK_STREAM这个socket类型,恰恰与SOCK_DGRAM相反。它没有消息边界,但有逻辑连接,能够保证传输的可靠性和数据的有序性,同时还可以实现数据的双向传输。众所周知的基于TCP协议的网络通信就属于此类。

这样的网络通信传输数据的形式是字节流,而不是数据报文。字节流是以字节为单位的。内核程序无法感知一段字节流中包含了多少个消息,以及这些消息是否完整,这完全需要应用程序自己去把控。

不过,此类网络通信中的一端,总是会忠实地按照另一端发送数据时的字节排列顺序,接收和缓存它们。所以,应用程序需要根据双方的约定去数据中查找消息边界,并按照边界切割数据,仅此而已。

syscall.Socket函数的第三个参数用于表示socket实例所使用的协议。

通常,只要明确指定了前两个参数的值,我们就无需再去确定第三个参数值了,一般把它置为0就可以了。这时,内核程序会自行选择最合适的协议。

比如,当前两个参数值分别为syscall.AF_INETsyscall.SOCK_DGRAM的时候,内核程序会选择UDP作为协议。

又比如,在前两个参数值分别为syscall.AF_INET6syscall.SOCK_STREAM时,内核程序可能会选择TCP作为协议。


(syscall.Socket函数一瞥)

不过,你也看到了,在使用net包中的高层次API的时候,我们连那前两个参数值都无需给定,只需要把前面罗列的那些字符串字面量的其中一个,作为network参数的值就好了。

当然,如果你在使用这些API的时候,能够想到我在上面说的这些基础知识的话,那么一定会对你做出正确的判断和选择有所帮助。

知识扩展

问题1:调用net.DialTimeout函数时给定的超时时间意味着什么?

简单来说,这里的超时时间,代表着函数为网络连接建立完成而等待的最长时间。这是一个相对的时间。它会由这个函数的参数timeout的值表示。

开始的时间点几乎是我们调用net.DialTimeout函数的那一刻。在这之后,时间会主要花费在“解析参数networkaddress的值”,以及“创建socket实例并建立网络连接”这两件事情上。

不论执行到哪一步,只要在绝对的超时时间达到的那一刻,网络连接还没有建立完成,该函数就会返回一个代表了I/O操作超时的错误值。

值得注意的是,在解析address的值的时候,函数会确定网络服务的IP地址、端口号等必要信息,并在需要时访问DNS服务。

另外,如果解析出的IP地址有多个,那么函数会串行或并发地尝试建立连接。但无论用什么样的方式尝试,函数总会以最先建立成功的那个连接为准。

同时,它还会根据超时前的剩余时间,去设定针对每次连接尝试的超时时间,以便让它们都有适当的时间执行。

再多说一点。在net包中还有一个名为Dialer的结构体类型。该类型有一个名叫Timeout的字段,它与上述的timeout参数的含义是完全一致的。实际上,net.DialTimeout函数正是利用了这个类型的值才得以实现功能的。

net.Dialer类型值得你好好学习一下,尤其是它的每个字段的功用以及它的DialContext方法。

总结

我们今天提及了使用Go语言进行网络编程这个主题。作为引子,我先向你介绍了关于socket的一些基础知识。socket常被翻译为套接字,它是一种IPC方法。IPC可以被翻译为进程间通信,它主要定义了多个进程之间相互通信的方法。

Socket是IPC方法中最为通用和灵活的一种。与其他的方法不同,利用socket进行通信的进程可以不局限在同一台计算机当中。

只要通信的双方能够通过计算机的网卡端口,以及网络进行互联就可以使用socket,无论它们存在于世界上的哪个角落。

支持socket的操作系统一般都会对外提供一套API。Go语言的syscall代码包中也有与之对应的程序实体。其中最重要的一个就是syscall.Socket函数。

不过,syscall包中的这些程序实体,对于普通的Go程序来说都属于底层的东西了,我们通常很少会用到。一般情况下,我们都会使用net代码包及其子包中的API去编写网络程序。

net包中一个很常用的函数,名为Dial。这个函数主要用于连接网络服务。它会接受两个参数,你需要搞明白这两个参数的值都应该怎么去设定。

尤其是network参数,它有很多的可选值,其中最常用的有9个。这些可选值的背后都代表着相应的socket属性,包括通信域、类型以及使用的协议。一旦你理解了这些socket属性,就一定会帮助你做出正确的判断和选择。

与此相关的一个函数是net.DialTimeout。我们在调用它的时候需要设定一个超时时间。这个超时时间的含义你是需要搞清楚的。

通过它,我们可以牵扯出这个函数的一大堆实现细节。另外,还有一个叫做net.Dialer的结构体类型。这个类型其实是前述两个函数的底层实现,值得你好好地学习一番。

以上,就是我今天讲的主要内容,它们都是关于怎样访问网络服务的。你可以从这里入手,进入Go语言的网络编程世界。

思考题

今天的思考题也与超时时间有关。在你调用了net.Dial等函数之后,如果成功就会得到一个代表了网络连接的net.Conn接口类型的值。我的问题是:怎样在net.Conn类型的值上正确地设定针对读操作和写操作的超时时间?

戳此查看Go语言专栏文章配套详细代码。

Go语言核心36讲48的更多相关文章

  1. Go语言核心36讲(导读)--学习笔记

    目录 开篇词 | 跟着学,你也能成为Go语言高手 导读 | 写给0基础入门的Go语言学习者 导读 | 学习专栏的正确姿势 开篇词 | 跟着学,你也能成为Go语言高手 Go 语言是由 Google 出品 ...

  2. Go语言核心36讲(Go语言进阶技术八)--学习笔记

    14 | 接口类型的合理运用 前导内容:正确使用接口的基础知识 在 Go 语言的语境中,当我们在谈论"接口"的时候,一定指的是接口类型.因为接口类型与其他数据类型不同,它是没法被实 ...

  3. Go语言核心36讲(Go语言进阶技术十六)--学习笔记

    22 | panic函数.recover函数以及defer语句(下) 我在前一篇文章提到过这样一个说法,panic 之中可以包含一个值,用于简要解释引发此 panic 的原因. 如果一个 panic ...

  4. Go语言核心36讲(Go语言实战与应用一)--学习笔记

    23 | 测试的基本规则和流程 (上) 在接下来的日子里,我将带你去学习在 Go 语言编程进阶的道路上,必须掌握的附加知识,比如:Go 程序测试.程序监测,以及 Go 语言标准库中各种常用代码包的正确 ...

  5. Go语言核心36讲(Go语言实战与应用三)--学习笔记

    25 | 更多的测试手法 在本篇文章,我会继续为你讲解更多更高级的测试方法.这会涉及testing包中更多的 API.go test命令支持的,更多标记更加复杂的测试结果,以及测试覆盖度分析等等. 前 ...

  6. Go语言核心36讲(Go语言实战与应用四)--学习笔记

    26 | sync.Mutex与sync.RWMutex 从本篇文章开始,我们将一起探讨 Go 语言自带标准库中一些比较核心的代码包.这会涉及这些代码包的标准用法.使用禁忌.背后原理以及周边的知识. ...

  7. Go语言核心36讲(Go语言实战与应用十四)--学习笔记

    36 | unicode与字符编码 在开始今天的内容之前,我先来做一个简单的总结. Go 语言经典知识总结 在数据类型方面有: 基于底层数组的切片: 用来传递数据的通道: 作为一等类型的函数: 可实现 ...

  8. Go语言核心36讲(Go语言实战与应用十八)--学习笔记

    40 | io包中的接口和工具 (上) 我们在前几篇文章中,主要讨论了strings.Builder.strings.Reader和bytes.Buffer这三个数据类型. 知识回顾 还记得吗?当时我 ...

  9. Go语言核心36讲(Go语言实战与应用二十二)--学习笔记

    44 | 使用os包中的API (上) 我们今天要讲的是os代码包中的 API.这个代码包可以让我们拥有操控计算机操作系统的能力. 前导内容:os 包中的 API 这个代码包提供的都是平台不相关的 A ...

  10. Go语言核心36讲(Go语言实战与应用二十四)--学习笔记

    46 | 访问网络服务 前导内容:socket 与 IPC 人们常常会使用 Go 语言去编写网络程序(当然了,这方面也是 Go 语言最为擅长的事情).说到网络编程,我们就不得不提及 socket. s ...

随机推荐

  1. PHP代码审计——文件操作漏洞

    梦想CMS(lmxcms)任意文件删除 1. 漏洞详情--CNVD-2020-59469   2. 漏洞描述称后台Ba***.cl***.php文件存在任意文件删除,查看cms源码,只有BackdbA ...

  2. KingbaseESV8R6 垃圾回收原理以及如何预防膨胀

    背景 KingbaseESV8R6支持snapshot too old 那么实际工作中,经常看到表又膨胀了,那么我们讨论一下导致对象膨胀的常见原因有哪些呢? 未开启autovacuum 对于未开启au ...

  3. Cluster table 与性能

    用户数据行存储在文件系统中的堆文件中,而这些行以不确定的顺序存储.如果表最初以插入/复制的顺序加载,那么以后的插入.更新和删除将导致在堆文件中以不可预测的顺序添加行.创建索引创建一个指向堆行的辅助文件 ...

  4. CentOS7_SSH_安装总结

    在使用ssh 连接自己的centos 虚拟机时,发现连接不上,于是有了这个安装过程 (以下是在root用户下执行的,没权限的话就sudo) 1.首先判断是否有这个服务 systemctl list-u ...

  5. C#:winform窗体 实现类似QQ的窗体在桌面边缘停靠和隐藏

    设计思路:1.使用定时器(Timer)来监控鼠标位置和窗体位置,并实现窗体的停靠和隐藏2.当鼠标拖动窗体时,窗体才有可能根据自身位置决定是否停靠3.如果窗体四周没有接触到屏幕边缘则不会停靠4.如果窗体 ...

  6. 百度ueditor工具栏配置大全

    toolbars: [[ 'source', // 源代码 'anchor', // 锚点 'undo', // 撤销 'redo', // 重做 'bold', // 加粗 'indent', // ...

  7. 配置git环境与项目创建

    主要用于记录上课笔记,方便以后复习 acgit的地址:https://git.acwing.com/wyw/kob1/ 1. 项目模块的包含 1.1 采用前后端分离 Web端大概框架 2. git环境 ...

  8. 使用 Elastic 技术栈构建 K8S 全栈监控 -2: 用 Metricbeat 对 Kubernetes 集群进行监控

    文章转载自:https://www.qikqiak.com/post/k8s-monitor-use-elastic-stack-2/ 操作步骤 git clone https://github.co ...

  9. CentOS无法识别NTFS格式U盘完美解决方案

    问题描述:CentOS上无法识别NTFS格式的U盘 解决方案: # 进入yum目录 cd /etc/yum.repos.d # 下载阿里的epel wget http://mirrors.aliyun ...

  10. logstash中关于Jdbc输入配置选项详解

    Setting Input type Required clean_run boolean No columns_charset hash No connection_retry_attempts n ...