Python开发基础-Day24socket套接字基础2

基于UDP的socket

面向无连接的不可靠数据传输，可以没有服务器端，只不过没有服务器端，发送的数据会被直接丢弃，并不能到达服务器端

 #客户端

 import socket

 ip_port=('127.0.0.1',8080)

 BUFSIZE=1024

 sock_client=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)    #SOCK_DGRAM就是UDP

 while True:

     msg=input('>>').strip()

     if not msg:continue

     sock_client.sendto(msg.encode('utf-8'),ip_port)    #UDP用的是sendto发送数据

UDP服务端+客户端

 #服务端

 import socket

 ip_port=('127.0.0.1',8080)

 BUFSIZE=1024

 sock_server=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)

 sock_server.bind(ip_port)

 #对比TCP，缺少listen侦听地址，缺少accept等待连接的代码

 while True:

     msg,addr=sock_server.recvfrom(BUFSIZE)    #UDP接收数据使用recvfrom接收

     print('recv:',msg,addr)

     sock_server.sendto(msg.upper(),addr)

 #客户端

 import socket

 ip_port=('127.0.0.1',8080)

 BUFSIZE=1024

 sock_client=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)

 while True:

     msg=input('>>').strip()

     if not msg:continue

     sock_client.sendto(msg.encode('utf-8'),ip_port)

     # back_msg,addr=sock_client.recvfrom(BUFSIZE)    #一般UDP用于广播，不会接收数据，如果没有服务端，启用该行代码会出错

     # print(back_msg.decode('utf-8'),addr)

由于UDP是面向无连接的(实际上有链接，不然通过什么去传数据去取数据)，可以使用多个客户端连接服务端，但这并不是并发访问。

注意：

1. 发消息，都是将数据发送到己端的发送缓冲中，收消息都是从己端的缓冲区中收

　　 tcp：send发消息，recv收消息

　　 udp：sendto发消息，recvfrom收消息

2. tcp是基于数据流的，而udp是基于数据报的：

　　send(bytes_data):发送数据流，数据流bytes_data若为空，自己这段的缓冲区也为空，操作系统不会控制tcp协议发空包

　　sendinto(bytes_data,ip_port)：发送数据报，bytes_data为空，还有ip_port,所有即便是发送空的bytes_data,数据报其实也不是空的，自己这端的缓冲区收到内容，操作系统就会控制udp协议发包。

3.1 tcp协议

（1）如果收消息缓冲区里的数据为空，那么recv就会阻塞（阻塞很简单，就是一直在等着收）

（2）只不过tcp协议的客户端send一个空数据就是真的空数据，客户端即使有无穷个send空，也跟没有一个样。

（3）tcp基于链接通信

基于链接，则需要listen（backlog），指定半连接池的大小
基于链接，必须先运行的服务端，然后客户端发起链接请求
对于mac系统：如果一端断开了链接，那另外一端的链接也跟着完蛋recv将不会阻塞，收到的是空(解决方法是：服务端在收消息后加上if判断，空消息就break掉通信循环)
对于windows/linux系统：如果一端断开了链接，那另外一端的链接也跟着完蛋recv将不会阻塞，收到的是空(解决方法是：服务端通信循环内加异常处理，捕捉到异常后就break掉通讯循环)

3.2 udp协议

（1）如果如果收消息缓冲区里的数据为“空”，recvfrom也会阻塞

（2）只不过udp协议的客户端sendinto一个空数据并不是真的空数据（包含：空数据+地址信息，得到的报仍然不会为空），所以客户端只要有一个sendinto（不管是否发送空数据，都不是真的空数据），服务端就可以recvfrom到数据。

（3）udp无链接

无链接，因而无需listen（backlog），更加没有什么连接池之说了
无链接，udp的sendinto不用管是否有一个正在运行的服务端，可以己端一个劲的发消息，只不过数据丢失
recvfrom收的数据小于sendinto发送的数据时，在mac和linux系统上数据直接丢失，在windows系统上发送的比接收的大直接报错
只有sendinto发送数据没有recvfrom收数据，数据丢失

粘包

对昨天ssh的客户端代码做点手脚

 import socket

 import subprocess

 ssh_server=socket.socket(socket.AF_INET,socket.SOCK_STREAM)   #生成socket实例对象

 ssh_server.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1) #重用地址，防止占用

 ssh_server.bind(('127.0.0.1',8080))

 ssh_server.listen(5)

 print('server run...')

 while True:

     conn,client_addr=ssh_server.accept()  #循环等待连接

     print('客户端: ',client_addr)

     while True: #通讯循环

         try:

             cmd=conn.recv(1024) #收消息

             res=subprocess.Popen(cmd.decode('utf-8'),       #执行命令

                              shell=True,

                              stdout=subprocess.PIPE,

                              stderr=subprocess.PIPE)

             stdout=res.stdout.read()    #标准输出

             stderr=res.stderr.read()    #标准输入

             std=stdout+stderr

             conn.sendall(std)

         except Exception:

             break

     conn.close()    #断连接，进入下一次连接等待

 ssh_server.close() #关闭程序

服务端不动代码

 #客户端动手脚

 import socket

 ssh_client=socket.socket(socket.AF_INET,socket.SOCK_STREAM)

 ssh_client.connect(('127.0.0.1',8080))

 while True: #通讯循环

     cmd=input('>>: ').strip()

     if not cmd:continue

     ssh_client.send(cmd.encode('utf-8'))

     cmd_res = ssh_client.recv(100)    #动手脚位置，将一次接收的数据大小改为100字节

     print(cmd_res.decode('gbk')) #windows

     # print(cmd_res.decode('utf-8')) #linux

 ssh_client.close()

运行服务端后，执行客户端测试：

 >>: dir

  驱动器 C 中的卷没有标签。

  卷的序列号是 5E42-F448

  C:\Users\Mr.chai\Desktop\PythonProject\笔记\

 >>: pwd

 2017.7.10\套接字_test 的目录

 2017/07/11  16:58    <DIR>          .

 2017/07/11  16:58    <DIR>

 >>: pwd

        ..

 2017/07/10  11:04                 0 __init__.py

 2017/07/11  16:58               711 客户

 >>: pwd

 端.py

 2017/07/11  16:03             1,992 服务端.py

                3 个文件          2,703 字节

 >>: pwd

               2 个目录 42,335,735,808 可用字节

 'pwd' 不是内部或外部命令，也不是可运行的程序

 或批处

 >>:

对比没动手脚之前：

 >>: dir

  驱动器 C 中的卷没有标签。

  卷的序列号是 5E42-F448

  C:\Users\Mr.chai\Desktop\PythonProject\笔记\2017.7.10\套接字_test 的目录

 2017/07/11  17:02    <DIR>          .

 2017/07/11  17:02    <DIR>          ..

 2017/07/10  11:04                 0 __init__.py

 2017/07/11  17:02               712 客户端.py

 2017/07/11  16:03             1,992 服务端.py

                3 个文件          2,704 字节

                2 个目录 42,335,076,352 可用字节

 >>: pwd

 'pwd' 不是内部或外部命令，也不是可运行的程序

 或批处理文件。

 >>:

What happened？

发生了什么事？原因是这个样子。。

首先是socket数据传送和数据接收的原理：

发送端可以是一K一K地发送数据，而接收端的应用程序可以两K两K地提走数据，当然也有可能一次提走3K或6K数据，或者一次只提走几个字节的数据，也就是说，应用程序所看到的数据是一个整体，或说是一个流（stream），一条消息有多少字节对应用程序是不可见的，因此TCP协议是面向流的协议，这也是容易出现粘包问题的原因。而UDP是面向消息的协议，每个UDP段都是一条消息，应用程序必须以消息为单位提取数据，不能一次提取任意字节的数据，这一点和TCP是很不同的。怎样定义消息呢？可以认为对方一次性write/send的数据为一个消息，需要明白的是当对方send一条信息的时候，无论底层怎样分段分片，TCP协议层会把构成整条消息的数据段排序完成后才呈现在内核缓冲区。

例如基于tcp的套接字客户端往服务端上传文件，发送时文件内容是按照一段一段的字节流发送的，在接收方看了，根本不知道该文件的字节流从何处开始，在何处结束

所谓粘包问题主要还是因为接收方不知道消息之间的界限，不知道一次性提取多少字节的数据所造成的。

此外，发送方引起的粘包是由TCP协议本身造成的，TCP为提高传输效率，发送方往往要收集到足够多的数据后才发送一个TCP段。若连续几次需要send的数据都很少，通常TCP会根据优化算法把这些数据合成一个TCP段后一次发送出去，这样接收方就收到了粘包数据。

TCP（transport control protocol，传输控制协议）是面向连接的，面向流的，提供高可靠性服务。收发两端（客户端和服务器端）都要有一一成对的socket，因此，发送端为了将多个发往接收端的包，更有效的发到对方，使用了优化方法（Nagle算法），将多次间隔较小且数据量小的数据，合并成一个大的数据块，然后进行封包。这样，接收端，就难于分辨出来了，必须提供科学的拆包机制。 即面向流的通信是无消息保护边界的。

UDP（user datagram protocol，用户数据报协议）是无连接的，面向消息的，提供高效率服务。不会使用块的合并优化算法，, 由于UDP支持的是一对多的模式，所以接收端的skbuff(套接字缓冲区）采用了链式结构来记录每一个到达的UDP包，在每个UDP包中就有了消息头（消息来源地址，端口等信息），这样，对于接收端来说，就容易进行区分处理了。 即面向消息的通信是有消息保护边界的。

tcp是基于数据流的，于是收发的消息不能为空，这就需要在客户端和服务端都添加空消息的处理机制，防止程序卡住，而udp是基于数据报的，即便是你输入的是空内容（直接回车），那也不是空消息，udp协议会帮你封装上消息头，实验略

udp的recvfrom是阻塞的，一个recvfrom(x)必须对一个一个sendinto(y),收完了x个字节的数据就算完成,若是y>x数据就丢失，这意味着udp根本不会粘包，但是会丢数据，不可靠

tcp的协议数据不会丢，没有收完包，下次接收，会继续上次继续接收，己端总是在收到ack时才会清除缓冲区内容。数据是可靠的，但是会粘包。

原理

粘包只会出现在TCP里

UDP在windows下会提示：

　　OSError: [WinError 10040] 一个在数据报套接字上发送的消息大于内部消息缓冲区或其他一些网络限制，或该用户用于接收数据报的缓冲区比数据报小

而在linux下会出现丢数据的情况：

>>aaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

AAAAAAAAAA ('192.168.1.10', 8080)

>>

问题出现在接收方，这是因为接收方不知道返回的消息之间的界限，不知道一次性提取多少字节的数据所造成的，第一次dir返回的消息远远大于100个字节，而懂了手脚后变成了一次只能从缓存中取100字节，再次取的时候会继续取缓存中没取完的数据

出现粘包的情况：

发送端需要等缓冲区满才发送出去，造成粘包（发送数据时间间隔很短，数据很小，会合到一起，产生粘包）

接收方不及时接收缓冲区的包，造成多个包接收（客户端发送了一段数据，服务端只收了一小部分，服务端下次再收的时候还是从缓冲区拿上次遗留的数据，产生粘包）

send(字节流)和recv(1024)及sendall

recv里指定的1024意思是从缓存里一次拿出1024个字节的数据

send的字节流是先放入己端缓存，然后由协议控制将缓存内容发往对端，如果待发送的字节流大小大于缓存剩余空间，那么数据丢失，用sendall就会循环调用send，数据不会丢失

send(字节流)和recv(1024)及sendall

解决粘包的lowB方法

粘包的根源是接收端不知道发送端将要传送的字节流的长度，那么接收端提前把自己要发送的字节流总大小让接收端知晓，然后接收端来一个死循环接收完所有数据

服务端

 import socket

 import subprocess

 ip_addr=('127.0.0.1',8088)

 BUFSIZE=1024

 s_server=socket.socket(socket.AF_INET,socket.SOCK_STREAM)

 s_server.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)

 s_server.bind(ip_addr)

 s_server.listen(5)

 print('run server...')

 while True:

     conn,addr=s_server.accept()

     print('客户端地址：',addr)

     while True:

         try:

             client_res=conn.recv(BUFSIZE)

             if len(client_res.decode('utf-8')) == 0:continue

             res=subprocess.Popen(client_res.decode('utf-8'),

                                  shell=True,

                                  stdout=subprocess.PIPE,

                                  stderr=subprocess.PIPE)

             stdout=res.stdout.read()

             stderr=res.stderr.read()

             std_bytes=stdout+stderr   #标准输出和标准错误组合

             std_size=len(std_bytes)   #计算总长度

             conn.send(str(std_size).encode('utf-8'))    #将总长度发给客户端，客户端收到该消息返回一个状态

             status=conn.recv(BUFSIZE).decode('utf-8')   #将返回来的状态赋值

             if status:  #如果该状态成立，那么开始发送所有数据

                 conn.send(std_bytes)

         except Exception:

             break

     conn.close()

 s_server.close()

客户端

 import socket

 ip_addr=('127.0.0.1',8088)

 BUFSIZE=100

 s_client=socket.socket(socket.AF_INET,socket.SOCK_STREAM)

 s_client.connect(ip_addr)

 while True:

     cmd=input('>>').strip()

     if not cmd:continue

     s_client.send(cmd.encode('utf-8'))

     std_size=int(s_client.recv(BUFSIZE).decode('utf-8'))    #将接收的数据总长度转换成数字

     s_client.send('True'.encode('utf-8'))   #返回给服务器端一个状态True

     res=b''

     get_size=0

     while get_size < std_size:

         if (std_size-get_size) < 100:   #如果总长度比下载的长度小于定义的100，那么就取数据的最小值，否则按100取值

             res+=s_client.recv(std_size-get_size)

         else:

             res+=s_client.recv(BUFSIZE)

         get_size+=BUFSIZE   #每取一次值加100，最后一次的值肯定大于总长度

     print(res.decode('gbk'))

 s_client.close()

解决粘包的高大上方法-自定义数据头

该方法是基于上面方法的改良，即在传输数据之前，在服务器端定一个固定长度数据头部，该数据头部封装了一系列关于该数据的信息，如数据的总长度，或者传输文件数据的用户信息、时间信息等等，客户端取得整个数据的时候，先取固定长度的数据头部读取信息，按照头部信息接收数据

待补充

Python开发基础-Day24socket套接字基础2的更多相关文章

Python开发基础-Day23try异常处理、socket套接字基础1
异常处理错误程序里的错误一般分为两种: 1.语法错误,这种错误,根本过不了python解释器的语法检测,必须在程序执行前就改正 2.逻辑错误,人为造成的错误,如数据类型错误.调用方法错误等,这些解 ...
python基础之try异常处理、socket套接字基础part1
异常处理错误程序里的错误一般分为两种: 1.语法错误,这种错误,根本过不了python解释器的语法检测,必须在程序执行前就改正 2.逻辑错误,人为造成的错误,如数据类型错误.调用方法错误等,这些解 ...
Python进阶----SOCKET套接字基础, 客户端与服务端通信, 执行远端命令.
Python进阶----SOCKET套接字基础, 客户端与服务端通信, 执行远端命令. 一丶socket套接字什么是socket套接字: 专业理解: socket是应用层与TCP/IP ...
Python网络编程——处理套接字错误
在网络应用中,经常会遇到这种情况:一方尝试连接,但另一方由于网络媒介失效或者其他原因无法响应. Python的Socket库提供了一个方法,能通过socket.error异常优雅地处理套接字错误. 1 ...
Python中利用原始套接字进行网络编程的示例
Python中利用原始套接字进行网络编程的示例在实验中需要自己构造单独的HTTP数据报文,而使用SOCK_STREAM进行发送数据包,需要进行完整的TCP交互. 因此想使用原始套接字进行编程,直接构 ...
python基础(29):网络编程(软件开发架构、网络基础、套接字初使用)
1. 软件开发架构我们了解的程序之间通讯的应用可分为两种: 第一种是应用类:qq.微信.百度网盘.腾讯视频这一类是属于需要安装的桌面应用. 第二种是web类:比如百度.知乎.博客园等使用浏览器访问就 ...
python基础之socket套接字基础part2
基于UDP的socket 面向无连接的不可靠数据传输,可以没有服务器端,只不过没有服务器端,发送的数据会被直接丢弃,并不能到达服务器端 1 #客户端 2 import socket 3 ip_port ...
［linux basic基础］----套接字
套接字是一种通信机制,凭借这种机制client/server系统的开发者既可以在本地机器上进行,也可以跨网络进行. 1,服务器应用程序用系统调用socket来创建一个套接字,他是系统分配给服务器进程的 ...
异步套接字基础：select函数以及FD_ZERO、FD_SET、FD_CLR、FD_ISSET
参考:[原创]技术系列之网络模型(三)多路复用模型 select函数 select函数: 系统提供select函数来实现多路复用输入/输出模型.原型: #include <sys/time.h ...

随机推荐

hdu5909 Tree Cutting
传送门:http://acm.hdu.edu.cn/showproblem.php?pid=5909 [题解] 设$f_{x,i}$表示以$x$节点的子树中,权值为$i$的子树个数,其中$x$必选. ...
JS中的表单验证+正则表达式
表单验证+正则表达式一.非空验证 trim:去空格(去掉前后的空格),任何字符串都可以用这个方法.写法为:if(v.trim().length==0),表示如果去掉空格后的字符串的长度为0. < ...
Machine Learning（CF940F+带修改莫队）
题目链接:http://codeforces.com/problemset/problem/940/F 题目: 题意:求次数的mex,mex的含义为某个集合(如{1,2,4,5})第一个为出现的非负数 ...
RelativeLayout相对布局中属性值
android:layout_above="@id/xxx" --将控件置于给定ID控件之上 android:layout_below="@id/xxx" ...
Python学习笔记 - day10 - 正则表达式
正则表达式字符串是编程时涉及到的最多的一种数据结构,对字符串进行操作的需求几乎无处不在.比如判断一个字符串是否是合法的Email地址,虽然可以编程提取@前后的子串,再分别判断是否是单词和域名,但这样 ...
运维开发：python websocket网页实时显示远程服务器日志信息
功能:用websocket技术,在运维工具的浏览器上实时显示远程服务器上的日志信息一般我们在运维工具部署环境的时候,需要实时展现部署过程中的信息,或者在浏览器中实时显示程序日志给开发人员看.你还在用 ...
linux中字符串转换函数 simple_strtoul【转】
转自:http://blog.csdn.net/tommy_wxie/article/details/7480087 Linux内核中提供的一些字符串转换函数: lib/vsprintf.c [htm ...
defconfig file 的位置
Platform MSM8917 MSM8937 defconfig file position Android/kernel/msm-3.18/arch/arm/configs/
看懂sh脚本
1 开头程序必须以下面的行开始(必须方在文件的第一行): #!/bin/sh 符号#!用来告诉系统它后面的参数是用来执行该文件的程序.在这个例子中我们使用/bin/sh来执行程序. 当编写脚本完成时 ...
Myeclipse实用快捷键总结
alt+shift+J 为选中的类/方法添加注释 ctrl+T 显示选中类的继承树 ctrl+shift+X/Y 将选中的字符转换为大写/小写 ctrl+shift+R 打开资源 ctrl+shift ...

Python开发基础-Day24socket套接字基础2

Python开发基础-Day24socket套接字基础2的更多相关文章

随机推荐

热门专题