介绍

​ 网络上的两个程序通过一个双向的通信连接实现数据的交换,这个连接的一端称为一个socket。

过程介绍

​ 服务器端和客户端通信过程如下所示:

![socket通信过程](http://images.cnblogs.com/cnblogs_com/helloworldcode/1414395/o_05232335-fb19fc7527e944d4845ef40831da4ec2.png)

服务端

​ 服务端的过程主要在该图的左侧部分,下面对上图的每一步进行详细的介绍。

1. 套接字对象的创建

	/*
* _domain 套接字使用的协议族信息
* _type 套接字的传输类型
* __protocol 通信协议
* */
int socket (int __domain, int __type, int __protocol) __THROW;

socket起源于UNIX,在Unix一切皆文件哲学的思想下,socket是一种"打开—读/写—关闭"模式的实现,可以将该函数类比常用的open()函数,服务器和客户端各自维护一个"文件",在建立连接打开后,可以向自己文件写入内容供对方读取或者读取对方内容,通讯结束时关闭文件。

参数介绍

第一个参数:关于协议族信息可选字段如下,只列出一般常见的字段。

地址族 含义
AF_INET IPv4网络协议中采用的地址族
AF_INET6 IPv6网络协议中采用的地址族
AF_LOCAL 本地通信中采用的UNIX协议的地址族(用的少)

第二个参数:套接字类型。常用的有SOCKET_RAW,SOCK_STREAM和SOCK_DGRAM。

套接字类型 含义
SOCKET_RAW 原始套接字(SOCKET_RAW)允许对较低层次的协议直接访问,比如IP、 ICMP协议。
SOCK_STREAM SOCK_STREAM是数据流,一般为TCP/IP协议的编程。
SOCK_DGRAM SOCK_DGRAM是数据报,一般为UDP协议的网络编程;

第三个参数:最终采用的协议。常见的协议有IPPROTO_TCP、IPPTOTO_UDP。如果第二个参数选择了SOCK_STREAM,那么采用的协议就只能是IPPROTO_TCP;如果第二个参数选择的是SOCK_DGRAM,则采用的协议就只能是IPPTOTO_UDP。

2. 向套接字分配网络地址——bind()

/*
* __fd:socket描述字,也就是socket引用
* myaddr:要绑定给sockfd的协议地址
* __len:地址的长度
*/
int bind (int __fd, const struct sockaddr* myaddr, socklen_t __len) __THROW;

第一个参数:socket文件描述符__fd即套接字创建时返回的对象,

第二个参数:myaddr则是填充了一些网络地址信息,包含通信所需要的相关信息,其结构体具体如下:

struct sockaddr
{
sa_family_t sin_family; /* Common data: address family and length. */
char sa_data[14]; /* Address data. */
};

在具体传参的时候,会用该结构体的变体sockaddr_in形式去初始化相关字段,该结构体具体形式如下,结构体sockaddr中的sa_data就保存着地址信息需要的IP地址和端口号,对应着结构体sockaddr_insin_portsin_addr字段。

struct sockaddr_in{
sa_family_t sin_family; //前面介绍的地址族
uint16_t sin_port; //16位的TCP/UDP端口号
struct in_addr sin_addr; //32位的IP地址
char sin_zero[8]; //不使用
}

in_addr 结构定义如下:

/* Internet address.  */
typedef uint32_t in_addr_t;
struct in_addr
{
in_addr_t s_addr;
};

sin_zero 无特殊的含义,只是为了与下面介绍的sockaddr结构体一致而插入的成员。因为在给套接字分配网络地址的时候会调用bind函数,其中的参数会把sockaddr_in转化为sockaddr的形式,如下:

struct sockaddr_in serv_addr;
...
bind(serv_socket, (struct sockaddr*)&serv_addr, sizeof(serv_addr);

需要注意的是s_addr是一种uint32_t类型的数据,而且在网络传输时,统一都是以大端序的网络字节序方式传输数据,而我们通常习惯的IP地址格式是点分十进制,例如:“219.228.148.169”,这个时候就会调用以下函数进行转化,将IP地址转化为32位的整数形数据,同时进行网络字节转换:

in_addr_t inet_addr (const char *__cp) __THROW;
//或者
int inet_aton (const char *__cp, struct in_addr *__inp) __THROW; //windows无此函数

如果单纯要进行网络字节序地址的转换,可以采用如下函数:

/*Functions to convert between host and network byte order.

   Please note that these functions normally take `unsigned long int' or
`unsigned short int' values as arguments and also return them. But
this was a short-sighted decision since on different systems the types
may have different representations but the values are always the same. */ // h代表主机字节序
// n代表网络字节序
// s代表short(4字节)
// l代表long(8字节)
extern uint32_t ntohl (uint32_t __netlong) __THROW __attribute__ ((__const__));
extern uint16_t ntohs (uint16_t __netshort)
__THROW __attribute__ ((__const__));
extern uint32_t htonl (uint32_t __hostlong)
__THROW __attribute__ ((__const__));
extern uint16_t htons (uint16_t __hostshort)

3. 进入等待连接请求状态

给套接字分配了所需的信息后,就可以调用listen()函数对来自客户端的连接请求进行监听(客户端此时要调用connect()函数进行连接)

/* Prepare to accept connections on socket FD.
N connection requests will be queued before further requests are refused.
Returns 0 on success, -1 for errors. */
extern int listen (int __fd, int __n) __THROW;

第一个参数:socket文件描述符__fd,分配所需的信息后的套接字。

第二个参数:连接请求的队列长度,如果为6,表示队列中最多同时有6个连接请求。

这个函数的fd(socket套接字对象)就相当于一个门卫,对连接请求做处理,决定是否把连接请求放入到server端维护的一个队列中去。

4. 受理客户端的连接请求

listen()中的sock(__fd : socket对象)发挥了服务器端接受请求的门卫作用,此时为了按序受理请求,给客户端做相应的回馈,连接到发起请求的客户端,此时就需要再次创建另一个套接字,该套接字可以用以下函数创建:

/* Await a connection on socket FD.
When a connection arrives, open a new socket to communicate with it,
set *ADDR (which is *ADDR_LEN bytes long) to the address of the connecting
peer and *ADDR_LEN to the address's actual length, and return the
new socket's descriptor, or -1 for errors. This function is a cancellation point and therefore not marked with
__THROW. */
extern int accept (int __fd, struct sockaddr *addr, socklen_t *addr_len);

函数成功执行时返回socket文件描述符,失败时返回-1。

第一个参数:socket文件描述符__fd,要注意的是这个套接字文件描述符与前面几步的套接字文件描述符不同。

第二个参数:保存发起连接的客户端的地址信息。

第三个参数: 保存该结构体的长度。

5. send/write发送信息

linux下的发送函数为:

/* Write N bytes of BUF to FD.  Return the number written, or -1.

   This function is a cancellation point and therefore not marked with
__THROW. */
ssize_t write (int __fd, const void *__buf, size_t __n) ;

而在windows下的发送函数为:

ssize_t send (int sockfd, const void *buf, size_t nbytes, int flag) ;

第四个参数是传输数据时可指定的信息,一般设置为0。

6. recv/read接受信息

linux下的接收函数为

/* Read NBYTES into BUF from FD.  Return the
number read, -1 for errors or 0 for EOF. This function is a cancellation point and therefore not marked with
__THROW. */
ssize_t read (int __fd, void *__buf, size_t __nbytes);

而在windows下的接收函数为

ssize_t recv(int sockfd, void *buf, size_t nbytes, int flag) ;

7. 关闭连接

/* Close the file descriptor FD.

   This function is a cancellation point and therefore not marked with
__THROW. */
int close (int __fd);

退出连接,此时要注意的是:调用close()函数即表示向对方发送了EOF结束标志信息


客户端

​ 服务端的socket套接字在绑定自身的IP即 及端口号后这些信息后,就开始监听端口等待客户端的连接请求,此时客户端在创建套接字后就可以按照如下步骤与server端通信,创建套接字的过程不再重复了。

1. 请求连接

/* Open a connection on socket FD to peer at ADDR (which LEN bytes long).
For connectionless socket types, just set the default address to send to
and the only address from which to accept transmissions.
Return 0 on success, -1 for errors. This function is a cancellation point and therefore not marked with
__THROW. */
int connect (int socket, struct sockaddr* servaddr, socklen_t addrlen);

几个参数的意义和前面的accept函数意义一样。要注意的是服务器端收到连接请求的时候并不是马上调用accept()函数,而是把它放入到请求信息的等待队列中。

套接字的多种可选项

可以通过如下函数对套接字可选项的参数进行获取以及设置。

/* Put the current value for socket FD's option OPTNAME at protocol level LEVEL
into OPTVAL (which is *OPTLEN bytes long), and set *OPTLEN to the value's
actual length. Returns 0 on success, -1 for errors. */
extern int getsockopt (int sock, int __level, int __optname,
void *__optval, socklen_t *optlen) __THROW; /* Set socket FD's option OPTNAME at protocol level LEVEL
to *OPTVAL (which is OPTLEN bytes long).
Returns 0 on success, -1 for errors. */
extern int setsockopt (int sock, int __level, int __optname,
const void *__optval, socklen_t __optlen) __THROW;

参数说明:

scok: 套接字的文件描述符

** __level ** :可选项的协议层,如下:

协议层 功能
SOL_SOCKET 套接字相关通用可选项的设置
IPPROTO_IP 在IP层设置套接字的相关属性
IPPROTO_TCP 在TCP层设置套接字相关属性

** __optname ** :要查看的可选项名,几个主要的选项如下

选项名 说明 数据类型 所属协议层
SO_RCVBUF 接收缓冲区大小 int SOL_SOCKET
SO_SNDBUF 发送缓冲区大小 int SOL_SOCKET
SO_RCVLOWAT 接收缓冲区下限 int SOL_SOCKET
SO_SNDLOWAT 发送缓冲区下限 int SOL_SOCKET
SO_TYPE 获得套接字类型(这个只能获取,不能设置) int SOL_SOCKET
SO_REUSEADDR 是否启用地址再分配,主要原理是操作关闭套接字的Time-wait时间等待的开启和关闭 int SOL_SOCKET
IP_HDRINCL 在数据包中包含IP首部 int IPPROTO_IP
IP_MULTICAST_TTL 生存时间(Time To Live),组播传送距离 int IPPROTO_IP
IP_ADD_MEMBERSHIP 加入组播 int IPPROTO_IP
IP_OPTINOS IP首部选项 int IPPROTO_IP
TCP_NODELAY 不使用Nagle算法 int IPPROTO_TCP
TCP_KEEPALIVE TCP保活机制开启下,设置保活包空闲发送时间间隔 int IPPROTO_TCP
TCP_KEEPINTVL TCP保活机制开启下,设置保活包无响应情况下重发时间间隔 int IPPROTO_TCP
TCP_KEEPCNT TCP保活机制开启下,设置保活包无响应情况下重复发送次数 int IPPROTO_TCP
TCP_MAXSEG TCP最大数据段的大小 int IPPROTO_TCP

** __optval ** :保存查看(get)/更改(set)的结果

** optlen ** : 传递第四个参数的字节大小

这里只对几个可选项参数进行说明:

1.设置可选项的IO缓冲区大小

参考案例如下:

int status, snd_buf;
socklen_t len = sizeof(snd_buf);
status = getsockopt(serv_socket, SOL_SOCKET, SO_SNDBUF, (void*)&snd_buf, &len);
cout << "发送缓冲区大小: " << snd_buf <<endl;

虽然可以获得的接收/发送缓冲区的大小,但是通过设置接收/发送缓冲区大小时,得到的结果会与我们期望的不一样,因为对缓冲区大小的设置是一件很谨慎的事,其自身会根据设置的值进行一定的优化。

2. 是否启用地址再分配与Time-wait时间等待

关于地址再分配问题会发生在这种情况下,首先看两种情况,假设客户端和服务器正在通讯(测试代码下载地址)。

① 在客户端的终端按Crtl + c或者其他方式断开与服务器的连接,此时客户端发送FIN消息,经过四次握手断开连接,操作系统关闭套接字,相当于close()的过程。然后在次启动客户端,顺利启动。

② 在服务端的终端按Crtl + c或者其他方式断开与客户端的连接,像①中一样,再次启动服务端,此时出现bind() error错误。

服务器端出现这种情况的原因是调用套接字分配网络地址函数bind()的时候之前使用建立连接的同一端口号还没有来得及停用(大约要过两三分钟才处于可用状态),而客户端申请连接的端口是任意指定,程序运行时会动态分配端口号。

服务器端端口没有被释放到被释放的时间状态称为Time-wait状态,这个状态的出现可以借助TCP断开连接的四次握手协议来分析,如下图:

当client端发送ACK=1 ack=k+1这个消息给服务端就立即消除套接字,若此时该消息中途传输被遗失,则这个时候server端就永远无法收到client的ACK消息了。

3. TCP_NODELAY

TCP套接字默认是使用Nagle算法的,该算法的特征是只有收到前一条数据的ACK消息后,才会发送下一条数据。

从网上找到一张图说明使用和禁用Nagle算法的区别(图片来源),如下:

设置代码如下:

#include <netinet/tcp.h> //注意要引入这个头文件

int opt_val = 1;
setsockopt(serv_socket, IPPROTO_TCP, TCP_NODELAY, (void*)&opt_val, sizeof(opt_val));

程序案例

案例的过程,在网上看到了关于read和write的发送与接受过程的图,便于理解:

![](http://images.cnblogs.com/cnblogs_com/helloworldcode/1414395/o_TCP-socket.jpg)

代码链接 github

注意以上代码都是在ubuntu下运行的,在windows的代码与此有所不同。比如要引入一个<winsock2.h>的头文件,调用WSAStartup(...)函数进行Winsock的初始化,而且它们的接受与发送函数也有所不同。

在我的github上有几个简单的demo,可供学习

参考文献

简单理解Socket

套接字

《TCP/IP网络编程》尹圣雨

socket编程(C++)的更多相关文章

  1. Linux下的C Socket编程 -- server端的继续研究

    Linux下的C Socket编程(四) 延长server的生命周期 在前面的一个个例子中,server在处理完一个连接后便会立即结束掉自己,然而这种server并不科学啊,server应该是能够一直 ...

  2. java socket编程(li)

    一.网络编程中两个主要的问题 一个是如何准确的定位网络上一台或多台主机,另一个就是找到主机后如何可靠高效的进行数据传输.在TCP/IP协议中IP层主要负责网络主机的定位,数据传输的路由,由IP地址可以 ...

  3. Python Socket 编程——聊天室示例程序

    上一篇 我们学习了简单的 Python TCP Socket 编程,通过分别写服务端和客户端的代码了解基本的 Python Socket 编程模型.本文再通过一个例子来加强一下对 Socket 编程的 ...

  4. Linux下的C Socket编程 -- server端的简单示例

    Linux下的C Socket编程(三) server端的简单示例 经过前面的client端的学习,我们已经知道了如何创建socket,所以接下来就是去绑定他到具体的一个端口上面去. 绑定socket ...

  5. Linux下的C Socket编程 -- 获取对方IP地址

    Linux下的C Socket编程(二) 获取域名对应的IP地址 经过上面的讨论,如果我们想要连接到远程的服务器,我们需要知道对方的IP地址,系统函数gethostbyname便能够实现这个目的.它能 ...

  6. Linux下的C Socket编程 -- 简介与client端的处理

    Linux下的C Socket编程(一) 介绍 Socket是进程间通信的方式之一,是进程间的通信.这里说的进程并不一定是在同一台机器上也有可能是通过网络连接的不同机器上.只要他们之间建立起了sock ...

  7. python网络编程-socket编程

     一.服务端和客户端 BS架构 (腾讯通软件:server+client) CS架构 (web网站) C/S架构与socket的关系: 我们学习socket就是为了完成C/S架构的开发 二.OSI七层 ...

  8. Socket编程实践(2) Socket API 与 简单例程

    在本篇文章中,先介绍一下Socket编程的一些API,然后利用这些API实现一个客户端-服务器模型的一个简单通信例程.该例子中,服务器接收到客户端的信息后,将信息重新发送给客户端. socket()函 ...

  9. Socket编程实践(1) 基本概念

    1. 什么是socket socket可以看成是用户进程与内核网络协议栈的编程接口.TCP/IP协议的底层部分已经被内核实现了,而应用层是用户需要实现的,这部分程序工作在用户空间.用户空间的程序需要通 ...

  10. [转]C语言SOCKET编程指南

    1.介绍 Socket编程让你沮丧吗?从man pages中很难得到有用的信息吗?你想跟上时代去编Internet相关的程序,但是为你在调用 connect() 前的bind() 的结构而不知所措?等 ...

随机推荐

  1. Python Day 9

    阅读目录: 内容回顾 内存管理 ##内容回顾 #文件处理 #1.操作文件的三步骤 -- 打开文件:硬盘的空间被操作系统持有 | 文件对象被应用程序持续 -- 操作文件:读写操作 -- 释放文件:释放操 ...

  2. JavaScript判断系统语言

    var lang= null; function language(){ var language=null; if (navigator.appName == 'Netscape'){ langua ...

  3. Web缓存和静态化

    Web缓存和静态化 目录 Web缓存基础... 1 什么是Web缓存... 1 Web缓存的类型... 1 为何要使用Web缓存... 1 重验证... 1 更新... 2 浏览器缓存... 2 工作 ...

  4. lwip协议栈移植(1)

    lwip移植分为两类: 1,只移植内核核心,用户应用程序编写只能基于raw/callback api进行 2,移植内核核心和上层API函数模块,用户可以使用所有三种API编程,即 raw/callba ...

  5. appium selenium.common.exceptions.WebDriverException: Message: Parameters were incorrect

    selenium.common.exceptions.WebDriverException: Message: Parameters were incorrect. We wanted {" ...

  6. Nginx访问控制模块

    一.Nginx访问控制模块 Nginx默认安装的模块http_access_module,可以基于来源IP进行访问控制. 1.模块安装 nginx中内置ngx_http_access_module,除 ...

  7. submit插件安装的问题与集成了插件的submit

    写在最前面,方法有二种.一种是在线安装,这种办法我尝试过,受网速和软件卡顿的问题,进行不顺利.第二种就是我下面介绍的这种,手动安装. 最精华的在后面,可以直接跳转到最后.我找了很久的,最新版的汉化,而 ...

  8. 去掉jenkins的首页警告

    有时候jenkins首页会弹出一些升级警告之类的东西,不喜欢的直接屏蔽掉就行. 类似于这样: 在  全局安全配置里 将一下项目的勾去掉就行 应用,保存.这样就清爽多了

  9. Python time库常用函数

    time模块中时间表现的格式主要有三种: timestamp 时间戳,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量 struct_time 时间元组,共有九个元素组. for ...

  10. 吴恩达机器学习笔记41-支持向量机的优化目标(Optimization Objective of Support Vector Machines)