1. Python 网络编程

Python 提供了两个级别访问的网络服务:

  • 低级别的网络服务支持基本的 Socket,它提供了标准的 BSD Sockets API,可以访问底层操作系统Socket接口的全部方法。
  • 高级别的网络服务模块 SocketServer, 它提供了服务器中心类,可以简化网络服务器的开发。

什么是 Socket?

Socket又称"套接字",应用程序通常通过"套接字"向网络发出请求或者应答网络请求,使主机间或者一台计算机上的进程间可以通讯。

通常我们用一个Socket表示“打开了一个网络链接”,而打开一个Socket需要知道目标计算机的IP地址和端口号,再指定协议类型即可。

2. socket()函数

Python 中,我们用 socket()函数来创建套接字,语法格式如下:

  1. socket.socket(family=AF_INET, type=SOCK_STREAM, proto=0, fileno=None)

参数

family(地址簇):

  • AF_INET(IPv4)
  • AF_INET6(IPv6)
  • AF_UNIX(unix本机进程间通信)

type(套接字类型):

  • SOCK_STREAM(面向连接的TCP协议)
  • SOCK_DGRAM(非连接的UDP协议)
  • SOCK_RAW (原始套接字,普通的套接字无法处理ICMP、IGMP等网络报文,而SOCK_RAW可以;其次,SOCK_RAW也可以处理特殊的IPv4报文;此外,利用原始套接字,可以通过IP_HDRINCL套接字选项由用户构造IP头。)
  • SOCK_RDM (是一种可靠的UDP形式,即保证交付数据报但不保证顺序。SOCK_RAM用来提供对原始协议的低级访问,在需要执行某些特殊操作时使用,如发送ICMP报文。SOCK_RAM通常仅限于高级用户或管理员运行的程序使用。)
  • SOCK_SEQPACKET(可靠的连续数据包服务,不过目前已废弃)

protocol: 一般不填默认为0

Socket 对象(内建)方法

函数 描述
服务器端套接字
s.bind() 绑定地址(host,port)到套接字,address地址的格式取决于地址族。 在AF_INET下,以元组(host,port)的形式表示地址。
s.listen() 开始TCP监听。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为1,大部分应用程序设为5就可以了。
s.accept() 被动接受TCP客户端连接,(阻塞式)等待连接的到来
客户端套接字
s.connect() 主动初始化TCP服务器连接,。一般address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。
s.connect_ex() connect()函数的扩展版本,出错时返回出错码,而不是抛出异常
公共用途的套接字函数
s.recv() 接收TCP数据,数据以字符串形式返回,bufsize指定要接收的最大数据量。flag提供有关消息的其他信息,通常可以忽略。
s.send() 发送TCP数据,将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。
s.sendall() 完整发送TCP数据,完整发送TCP数据。将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。
s.recvform() 接收UDP数据,与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。
s.sendto() 发送UDP数据,将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。
s.close() 关闭套接字
s.getpeername() 返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。
s.getsockname() 返回套接字自己的地址。通常是一个元组(ipaddr,port)
s.setsockopt(level,optname,value) 设置给定套接字选项的值。
s.getsockopt(level,optname[.buflen]) 返回套接字选项的值。
s.settimeout(timeout) 设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect())
s.gettimeout() 返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None。
s.fileno() 返回套接字的文件描述符。
s.setblocking(flag) 如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。
s.makefile() 创建一个与该套接字相关连的文件。

3. 基本Socket实例

服务端

我们使用 socket 模块的 socket 函数来创建一个 socket 对象。socket 对象可以通过调用其他函数来设置一个 socket 服务。

现在我们可以通过调用 bind(hostname, port) 函数来指定服务的 port(端口)。

完整代码如下:

  1. # SocketClient.py
  2. import socket # 导入 socket 模块
  3. server = socket.socket() # 创建 socket 对象
  4. host = socket.gethostname() # 获取本地主机名
  5. port = 9999 # 设置端口
  6. server.bind((host,port)) # 绑定ip port
  7. server.listen(5) # 开始监听,等待客户端连接
  8. while True: # 第1层loop,实现Socket多连接
  9. conn,addr = server.accept() # 接受并建立与客户端的连接,程序在此处开始阻塞,直到有客户端连接进来...
  10. while True: # 第2层loop
  11. data = conn.recv(1024) # 收消息,每次1k
  12. if not data: # 判断收到消息是否为空,为空就断开回到第一层loop,否则将会进入死循环。
  13. print("客户端已断开!")
  14. break
  15. print("收到消息:",data)
  16. conn.send(data.upper()) # 将消息转为大写后发回
  17. server.close()

客户端

接下来我们写一个简单的客户端实例连接到以上创建的服务。端口号为 9999。

socket.connect(hosname, port ) 方法打开一个 TCP 连接到主机为 hostname 端口为 port 的服务商。连接后我们就可以从服务端后期数据,记住,操作完成后需要关闭连接。

完整代码如下:

  1. # SocketClient.py
  2. import socket # 导入 socket 模块
  3. client = socket.socket() # 创建 socket 对象
  4. host = socket.gethostname() # 获取本地主机名
  5. port = 9999 # 设置端口号
  6. client.connect((host,port)) # 连接到 Server端
  7. while True: # 实现多次交互
  8. msg = input(">>:").strip()
  9. if len(msg) == 0:continue # 判断数据为空的时候继续loop
  10. client.send(msg.encode("utf-8")) # 发送数据
  11. data = client.recv(1024) # 接收数据
  12. print("来自服务器:",data)
  13. client.close() # 关闭连接

数据多次交互实现图示

4. 通过socket实现简单的ssh

光只是简单的发消息、收消息没意思,干点正事,可以做一个简单版的ssh,就是客户端连接上服务器后,让服务器执行命令,并返回结果给客户端。

服务端

  1. # Server.py
  2. import socket
  3. import os
  4. server = socket.socket() # 获得socket实例
  5. #server.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
  6. host = socket.gethostname() # 获取本地主机名
  7. port = 9998 # 设置端口号
  8. server.bind((host,port)) # 绑定ip port
  9. server.listen() # 开始监听
  10. while True: #第一层loop
  11. print("等待客户端的连接...")
  12. conn,addr = server.accept() #接受并建立与客户端的连接,程序在此处开始阻塞,只到有客户端连接进来...
  13. print("新连接:",addr )
  14. while True:
  15. data = conn.recv(1024)
  16. if not data:
  17. print("客户端断开了...")
  18. break #这里断开就会再次回到第一次外层的loop
  19. print("收到命令:",data)
  20. #res = os.popen(data.decode()).read() #py3 里socket发送的只有bytes,os.popen又只能接受str,所以要decode一下
  21. res = subprocess.Popen(data,shell=True,stdout=subprocess.PIPE).stdout.read() #跟上面那条命令的效果是一样的
  22. if len(res) == 0:
  23. res = "cmd exec success,has not output!".encode("utf-8")
  24. conn.send(str(len(res.encode())).encode("utf-8")) #发送数据之前,先告诉客户端要发多少数据给它
  25. print("等待客户ack应答...")
  26. client_final_ack = conn.recv(1024) #等待客户端响应,防止粘包
  27. print("客户应答:",client_final_ack.decode())
  28. print(type(res))
  29. conn.sendall(res) #发送端也有最大数据量限制,所以这里用sendall,相当于重复循环调用conn.send,直至数据发送完毕
  30. server.close()

客户端

  1. # Client.py
  2. import socket
  3. client = socket.socket()
  4. host = socket.gethostname() # 获取本地主机名
  5. port = 9998 # 设置端口号
  6. client.connect((host,port)) # 连接到 Server端
  7. while True:
  8. msg = input(">>:").strip()
  9. if len(msg) == 0:continue
  10. client.send( msg.encode("utf-8") )
  11. res_return_size = client.recv(1024) #接收这条命令执行结果的大小
  12. print("getting cmd result , ", res_return_size)
  13. total_rece_size = int(res_return_size)
  14. print("total size:",res_return_size)
  15. client.send("准备好接收了,发吧loser".encode("utf-8")) # 防止粘包,确认一下。
  16. received_size = 0 #已接收到的数据
  17. cmd_res = b''
  18. f = open("test_copy.html","wb")#把接收到的结果存下来,一会看看收到的数据 对不对
  19. while received_size != total_rece_size: #代表还没收完
  20. data = client.recv(1024)
  21. received_size += len(data) #为什么不是直接1024,还判断len干嘛,注意,实际收到的data有可能比1024少
  22. cmd_res += data
  23. else:
  24. print("数据收完了",received_size)
  25. #print(cmd_res.decode())
  26. f.write(cmd_res) #把接收到的结果存下来,一会看看收到的数据 对不对
  27. #print(data.decode()) #命令执行结果
  28. client.close()

这里引入了一个重要的概念:粘包, 即服务器端你调用时send 2次,但你send调用时,数据其实并没有立刻被发送给客户端,而是放到了系统的socket发送缓冲区里,等缓冲区满了、或者数据等待超时了,数据才会被send到客户端,这样就把好几次的小数据拼成一个大数据,统一发送到客户端了,这么做的目地是为了提高io利用效率,一次性发送总比连发好几次效率高嘛。

但也带来一个问题,就是“粘包”,即2次或多次的数据粘在了一起统一发送了。

那么如何解决粘包的问题呢?

  1. time.sleep(0.5),经多次测试,让服务器程序sleep 至少0.5就会造成缓冲区超时。这种方法比较low,数据实时性差,生产环境肯定不能这么玩!
  2. 通过上面的代码你应该知道了,不用sleep,服务器端每发送一个数据给客户端,就立刻等待客户端进行回应,即调用 conn.recv(1024), 由于recv在接收不到数据时是阻塞的,这样就会造成,服务器端接收不到客户端的响应,就不会执行后面的conn.sendall(命令结果)的指令,收到客户端响应后,再发送命令结果时,缓冲区就已经被清空了,因为上一次的数据已经被强制发到客户端了。

5. SocketServer模块

SocketServer内部使用 IO多路复用 以及 “多线程” 和 “多进程” ,从而实现并发处理多个客户端请求的Socket服务端。即:每个客户端请求连接到服务器时,Socket服务端都会在服务器是创建一个“线程”或者“进程” 专门负责处理当前客户端的所有请求。

ThreadingTCPServer

ThreadingTCPServer实现的Soket服务器内部会为每个client创建一个 线程,该线程用来和客户端进行交互。

1. ThreadingTCPServer基础

使用ThreadingTCPServer:

  • 创建一个继承自 SocketServer.BaseRequestHandler 的类
  • 类中必须定义一个名称为 handle 的方法
  • 启动ThreadingTCPServer

SocketServer实现服务器

  1. #!/usr/bin/env python
  2. # -*- coding:utf-8 -*-
  3. import SocketServer
  4. class MyServer(SocketServer.BaseRequestHandler):
  5. def handle(self):
  6. # print self.request,self.client_address,self.server
  7. conn = self.request
  8. conn.sendall('欢迎致电 10086,请输入1xxx,0转人工服务.'.encode("utf-8"))
  9. Flag = True
  10. while Flag:
  11. data = conn.recv(1024)
  12. if data == 'exit':
  13. Flag = False
  14. elif data == '0':
  15. conn.sendall('通过可能会被录音.balabala一大推'.encode("utf-8"))
  16. else:
  17. conn.sendall('请重新输入.'.encode("utf-8"))
  18. if __name__ == '__main__':
  19. server = SocketServer.ThreadingTCPServer(('127.0.0.1',8009),MyServer)
  20. server.serve_forever()

客户端

  1. #!/usr/bin/env python
  2. # -*- coding:utf-8 -*-
  3. import socket
  4. ip_port = ('127.0.0.1',8009)
  5. sk = socket.socket()
  6. sk.connect(ip_port)
  7. sk.settimeout(5)
  8. while True:
  9. data = sk.recv(1024)
  10. print ('receive:',data)
  11. inp = raw_input('please input:')
  12. sk.sendall(inp.encode("utf-8"))
  13. if inp == 'exit':
  14. break
  15. sk.close()

2.ThreadingTCPServer源码剖析

详情请参考武Sir博客


参考以下博客:

Alex

Mr.Seven

RUNOOB

廖雪峰

谢谢!

Python-08-Socket的更多相关文章

  1. 转:Python 的 Socket 编程教程

    这是用来快速学习 Python Socket 套接字编程的指南和教程.Python 的 Socket 编程跟 C 语言很像. Python 官方关于 Socket 的函数请看 http://docs. ...

  2. 进击的Python【第十章】:Python的socket高级应用(多进程,协程与异步)

    Python的socket高级应用(多进程,协程与异步)

  3. Python底层socket库

    Python底层socket库将Unix关于网络通信的系统调用对象化处理,是底层函数的高级封装,socket()函数返回一个套接字,它的方法实现了各种套接字系统调用.read与write与Python ...

  4. Python Udp Socket

    socket(套接字),传输层通信的端点,由IP和端口号组成(IP,Port),可以通过socket精确地找到服务器上的进程并与之通信 python2.6实现,基于AF_INET(网络套接字) 类型S ...

  5. Python Tcp Socket

    socket(套接字),传输层通信的端点,由IP和端口号组成(IP,Port),可以通过socket精确地找到服务器上的进程并与之通信 python2.6实现,基于AF_INET(网络套接字) 类型S ...

  6. Python 之socket的应用

    本节主要讲解socket编程的有关知识点,顺便也会讲解一些其它的关联性知识: 一.概述(socket.socketserver): python对于socket编程,提供了两个模块,分别是socket ...

  7. python tcp socket 多线程

    不多说,直接上代码 client.py #!/usr/bin/python import socket,sys,string host="localhost" port=8000 ...

  8. 老李分享:使用 Python 的 Socket 模块开发 UDP 扫描工具

    老李分享:使用 Python 的 Socket 模块开发 UDP 扫描工具 poptest是业内唯一的测试开发工程师培训机构,测试开发工程师主要是为测试服务开发测试工具,在工作中要求你做网络级别的安全 ...

  9. 操作系统底层原理与Python中socket解读

    目录 操作系统底层原理 网络通信原理 网络基础架构 局域网与交换机/网络常见术语 OSI七层协议 TCP/IP五层模型讲解 Python中Socket模块解读 TCP协议和UDP协议 操作系统底层原理 ...

  10. python中socket模块详解

    socket模块简介 网络上的两个程序通过一个双向的通信连接实现数据的交换,这个连接的一端称为一个socket.socket通常被叫做"套接字",用于描述IP地址和端口,是一个通信 ...

随机推荐

  1. golang中如何使用http,socket5代理

    Golang Http use socket5 proxy 因为最近想爬取一些网站上的视频,无奈网站在墙外,只能通过代理进行爬取,因此在网上搜索关于golang使用代理的方法. 功夫不负有心人,最后我 ...

  2. OData V4 系列 Ajax请求 CRUD

    OData 学习目录 上一篇已经完成了服务创建,本篇主要介绍如何通过Ajax请求Odata服务,OData操作主要有 Get.Post.Patch.Put.Delete等操作.   Post 操作 p ...

  3. #9.1课堂总结#JS基础(二)

    在程序语言中数组的重要性不言而喻,JavaScript中数组也是最常使用的对象之一,数组是值的有序集合,由于弱类型的原因,JavaScript中数组十分灵活.强大,不像是Java等强类型高级语言数组只 ...

  4. SharePoint 2013 母版页取消和HTML页关联

    前言:在新版本的SharePoint 2013上,有新的功能可以通过HTML导入母版页,然后HTML和Master页面相关联,更改HTML页的时候,Master会自动同步修改,然而,有些时候我们不需要 ...

  5. IOS开发基础知识--碎片2

    六:获得另一个控件器,并实现跳转 UIStoryboard* mainStoryboard = [UIStoryboard storyboardWithName:@"MainStoryboa ...

  6. ASP.NET MVC中Unobtrusive Ajax的妙用

    Unobtrusive Javascript有三层含义:一是在HTML代码中不会随意的插入Javsscript代码,只在标签中加一些额外的属性值,然后被引用的脚本文件识别和处理:二是通过脚本文件所增加 ...

  7. 数据仓库之启用cdc

    准备工作: 先将sqlservere 代理服务启动 USE [MyDB]; GO EXECUTE sys.sp_cdc_enable_db; --启用数据库对CDC的支持 GO -- 设置别名 @ca ...

  8. [转]PaaS平台分类

    本文转自阿朱说 大家发现没,自从我们上升到有规模的互联网架构后,咱们中国的技能能力就跟不上了,只能采取国际业界顶级大公司开源出来的而且已经经受住大规模实际应用考验的组件来搭架构,因而咱们近几年大规模网 ...

  9. SQL SERVER 2012 修改数据库默认位置不立即生效

    今天修改SQL SERVER 2012的数据库默认位置:即数据文件.日志文件默认位置时遇到一个问题,单击"服务器属性"(Server Properties)--> 数据库设置 ...

  10. mysql权限与安全

    一.MySQL权限系统通过两个阶段进行认证: (A) 对用户进行身份认证,IP地址和用户名联合, (B) 对合法用户赋予相应权限,权限表在数据库启动的时候载入内存中. 二.在权限的存取过程中,会用到& ...