Python socket编程
一、什么是socket:
socket通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求。
socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,对于文件用【打开】【读写】【关闭】模式来操作。socket就是该模式的一个实现,socket即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭)
socket和file的区别:
1.> file模块是针对某个指定文件进行【打开】【读写】【关闭】
2.>socket模块是针对 服务器端 和 客户端Socket 进行【打开】【读写】【关闭】
Python 提供了两个基本的 socket 模块。
第一个是 Socket,它提供了标准的 BSD Sockets API。
第二个是 SocketServer, 它提供了服务器中心类,可以简化网络服务器的开发。
socket Server端:
import socket s = socket.socket(socket.AF_INET,socket.SOCK_STREAM) #创建套接字,定义socket类型,网络通信,TCP s.bind(('localhost',8880)) #绑定套接字到本地IP与端口 s.listen(5) #开始监听TCP连接 while True: print "waiting....." conn,addr = s.accept() #接受TCP连接,并返回新的套接字与IP地址 print'Connected by',addr #输出客户端的IP地址 client_data = conn.recv(1024) #接收传来的数据 print client_data conn.send("hello,we are you server !!!") #发送给对方数据 conn.close() #传输完毕后,关闭套接字
socket Client端
import socket s = socket.socket() # 创建套接字 s.connect(('localhost',8880)) #连接远端地址,这里为server端的ip和端口 s.send("we are you client") #发送给server端 server_data = s.recv(1024) #接收server端信息 print server_data s.close() #关闭连接
server端 import socket ip_port = ('127.0.0.1',8888) s = socket.socket(socket.AF_INET,socket.SOCK_DGRAM,0) s.bind(ip_port) while True: data = s.recv(1024) print data ------------------------------------------------------------- #client端 import socket ip_port = ('127.0.0.1',9999) s = socket.socket(socket.AF_INET,socket.SOCK_DGRAM,0) while True: inp = raw_input('data:').strip() if inp == 'exit': break s.sendto(inp,ip_port) s.close()
使用web访问server端socket.
访问地址:http://localhost:8002
import socket def main(): # 创建socket对象 sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 监听端口 sock.bind(('127.0.0.1',8002)) # 开始监听, sock.listen(5) while True: # 阻塞,deng 。。。。 # 直到有请求连接 print '....' connection, address = sock.accept() # connection,代表客户端socket对象 # address,客户端IP地址 #handle_request(connection) buf = connection.recv(1024) print buf connection.send("HTTP/1.1 200 OK\r\n\r\n") connection.send("Hello, World") connection.close() if __name__ == '__main__': main()
二、socket常用的几种方法:
s = socket.socket(socket.AF_INET,socket.SOCK_STREAM,0)
1 参数一:地址簇 2 3 socket.AF_INET IPv4(默认) 4 socket.AF_INET6 IPv6 5 6 socket.AF_UNIX 只能够用于单一的Unix系统进程间通信 7 8 参数二:类型 9 10 socket.SOCK_STREAM 流式socket , for TCP (默认) 11 socket.SOCK_DGRAM 数据报式socket , for UDP 12 13 socket.SOCK_RAW 原始套接字,普通的套接字无法处理ICMP、IGMP等网络报文,而SOCK_RAW可以;其次,SOCK_RAW也可以处理特殊的IPv4报文;此外,利用原始套接字,可以通过IP_HDRINCL套接字选项由用户构造IP头。 14 socket.SOCK_RDM 是一种可靠的UDP形式,即保证交付数据报但不保证顺序。SOCK_RAM用来提供对原始协议的低级访问,在需要执行某些特殊操作时使用,如发送ICMP报文。SOCK_RAM通常仅限于高级用户或管理员运行的程序使用。 15 socket.SOCK_SEQPACKET 可靠的连续数据包服务 16 17 参数三:协议 18 19 0 (默认)与特定的地址家族相关的协议,如果是 0 ,则系统就会根据地址格式和套接类别,自动选择一个合适的协议
s.bind(address)
s.bind(address) 将套接字绑定到地址。address地址的格式取决于地址族。在AF_INET下,以元组(host,port)的形式表示地址。
s.listen(backlog)
开始监听传入连接。backlog指定在拒绝连接之前,可以挂起的最大连接数量.
s.setblocking(bool)
是否阻塞(默认True),如果设置False,那么accept和recv时一旦无数据,则报错。
s.accept()
接受连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据.address是连接客户端的地址。
s.connect(address)
连接到address处的套接字。一般,address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。
s.connect_ex(address)
和s.connect(address)用法相同,只不过会有返回值,连接成功时返回 0 ,连接失败时候返回编码.
s.recv(bufsize[,flag])
接受套接字的数据。数据以字符串形式返回,bufsize指定最多可以接收的数量。flag提供有关消息的其他信息,通常可以忽略。
s.send(string[,flag])
将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。
s.sendall(string[,flag])
将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。
s.close()
关闭套接字
s.getpeername()
返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。
s.getsockname()
返回套接字自己的地址。通常是一个元组(ipaddr,port)
s.gethostname()
gethostname()返回运行程序所在的计算机的主机名
s.gethostbyname(name)
尝试将给定的主机名解释为一个IP地址
s.fileno()
套接字的文件描述符
单线程聊天机器人实现:(只能同时处理一个连接和请求)
Server端:
#!/usr/bin/env python # -*- coding:utf-8 -*- import socket ip_port = ('127.0.0.1',8888) s = socket.socket() s.bind(ip_port) s.listen(5) while True: conn,address = s.accept() #阻塞,等待客户端连接 conn.sendall('welcom 10086,Plz input 1xxx,0转人工服务.') Flag = True #标志位 while Flag: #阻塞,等待客户端发送数据. data = conn.recv(1024) if data == 'exit': Flag = False elif data == '0': conn.sendall('Receive data is zero。。') else: conn.sendall('Please re-enter.') #断开与客户端的连接 conn.close()
Client端:
#!/usr/bin/env python # -*- coding:utf-8 -*- import socket ip_port = ('127.0.0.1',8005) s = socket.socket() s.connect(ip_port) s.settimeout(5) #等待超时时间 while True: data = s.recv(1024) #接收数据 print 'receive:',data inp = raw_input('please input:') sk.sendall(inp) if inp == 'exit': break s.close()
SocketServer是标准库中一个高级别的模块。用于简化网络客户与服务器的实现。模块中,已经实现了一些可供使用的类。
编写一个SocketServer需要实现以下步骤:
1.>编写一个handler类,继承BaseRequestHandler,重写handle()方法
2.>针对是TCP还是UDP,生成一个server对象
3.>调用server对象的handle_request或者serve_forever方法
Server端:
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 4 import time 5 import os 6 import SocketServer 7 8 #SocketServer 例子 服务器端 9 class MyTCPHandler(SocketServer.BaseRequestHandler): #继承SocketServer.BaseRequestHandler 类,底下必须写个handle函数. 10 11 def handle(self): 12 print "got commection from",self.client_address #打印客户端地址. 13 while True: #循环执行.不然执行接收一次数据 14 self.data = self.request.recv(1024).strip() #接收信息 15 if not self.data: 16 time.sleep(1.5) 17 break 18 print self.data 19 cmd = os.popen(self.data) 20 result = cmd.read() 21 #format_data = "\033[32;1m%s\033[0m" %self.data #格式化输出 22 self.request.sendall(result) #返回结果 23 24 if __name__ == "__main__": 25 HOST,PROT = "localhost",8000 26 27 server = SocketServer.ThreadingTCPServer((HOST,PROT),MyTCPHandler) #处理多线程连接 28 server.serve_forever() #永远执行
Clinet端:
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 4 import socket 5 6 ip_port = ('127.0.0.1',8000) 7 sk = socket.socket() 8 sk.connect(ip_port) 9 sk.settimeout(5) 10 11 while True: 12 13 INPUT = raw_input('please input command:') 14 sk.sendall(INPUT) 15 data = sk.recv(1024) 16 print 'receive:',data 17 if INPUT == "exit":break 18 19 sk.close()
ThreadingTCPServer实现的Soket服务器内部会为每个client创建一个 “线程”,该线程用来和客户端进行交互。
ThreadingTCPServer源码剖析
ThreadingTCPServer的类图关系如下:
内部调用流程为:
- 启动服务端程序
- 执行 TCPServer.__init__ 方法,创建服务端Socket对象并绑定 IP 和 端口
- 执行 BaseServer.__init__ 方法,将自定义的继承自SocketServer.BaseRequestHandler 的类 MyRequestHandle赋值给 self.RequestHandlerClass
- 执行 BaseServer.server_forever 方法,While 循环一直监听是否有客户端请求到达 ...
- 当客户端连接到达服务器
- 执行 ThreadingMixIn.process_request 方法,创建一个 “线程” 用来处理请求
- 执行 ThreadingMixIn.process_request_thread 方法
- 执行 BaseServer.finish_request 方法,执行 self.RequestHandlerClass() 即:执行 自定义 MyRequestHandler 的构造方法(自动调用基类BaseRequestHandler的构造方法,在该构造方法中又会调用 MyRequestHandler的handle方法)
SocketServer的ThreadingTCPServer之所以可以同时处理请求得益于 select 和 Threading 两个东西,其实本质上就是在服务器端为每一个客户端创建一个线程,当前线程用来处理对应客户端的请求,所以,可以支持同时n个客户端链接(长连接)。
ForkingTCPServer
ForkingTCPServer和ThreadingTCPServer的使用和执行流程基本一致,只不过在内部ForkingTCPServer为请求者建立 “进程”而ThreadingTCPServer为请求者建立“线程”。
基本使用:
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 import SocketServer 4 5 class MyServer(SocketServer.BaseRequestHandler): 6 7 def handle(self): 8 # print self.request,self.client_address,self.server 9 conn = self.request 10 conn.sendall('欢迎致电 10086,请输入1xxx,0转人工服务.') 11 Flag = True 12 while Flag: 13 data = conn.recv(1024) 14 if data == 'exit': 15 Flag = False 16 elif data == '0': 17 conn.sendall('通过可能会被录音.balabala一大推') 18 else: 19 conn.sendall('请重新输入.') 20 21 22 if __name__ == '__main__': 23 server = SocketServer.ForkingTCPServer(('127.0.0.1',8009),MyServer) 24 server.serve_forever()
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 4 import socket 5 6 7 ip_port = ('127.0.0.1',8009) 8 sk = socket.socket() 9 sk.connect(ip_port) 10 sk.settimeout(5) 11 12 while True: 13 data = sk.recv(1024) 14 print 'receive:',data 15 inp = raw_input('please input:') 16 sk.sendall(inp) 17 if inp == 'exit': 18 break 19 20 sk.close()
以上代码只是将ThreadingTCPServer替换为 ForkingTCPServer:
1 server = SocketServer.ThreadingTCPServer(('127.0.0.1',8009),MyRequestHandler) 2 3 变更为: 4 5 server = SocketServer.ForkingTCPServer(('127.0.0.1',8009),MyRequestHandler)
SocketServer的ForkingTCPServer之所以可以同时处理请求得益于 select 和 os.fork 两个东西,其实本质上就是在服务器端为每一个客户端创建一个进程,当前新创建的进程用来处理对应客户端的请求,所以,可以支持同时n个客户端链接(长连接)。
Twisted
Twisted是用Python实现的基于事件驱动的网络引擎框架,其中包含了诸多功能,例如:网络协议、线程、数据库管理、网络操作、电子邮件等。
事件驱动
简而言之,事件驱动分为二个部分:第一,注册事件;第二,触发事件。
自定义事件驱动框架
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 4 # event_drive.py 5 6 event_list = [] 7 8 9 def run(): 10 for event in event_list: 11 obj = event() 12 obj.execute() 13 14 15 class BaseHandler(object): 16 """ 17 用户必须继承该类,从而规范所有类的方法(类似于接口的功能) 18 """ 19 def execute(self): 20 raise Exception('you must overwrite execute')
程序员使用Twisted框架:
#!/usr/bin/env python # -*- coding:utf-8 -*- from source import event_drive class MyHandler(event_drive.BaseHandler): def execute(self): print 'event-drive execute MyHandler' event_drive.event_list.append(MyHandler) event_drive.run()
如上述代码,事件驱动只不过是框架规定了执行顺序,程序员在使用框架时,可以向原执行顺序中注册“事件”,从而在框架执行时可以出发已注册的“事件”。
基于事件驱动Socket
#!/usr/bin/env python # -*- coding:utf-8 -*- from twisted.internet import protocol from twisted.internet import reactor class Echo(protocol.Protocol): def dataReceived(self, data): self.transport.write(data) def main(): factory = protocol.ServerFactory() factory.protocol = Echo reactor.listenTCP(8000,factory) reactor.run() if __name__ == '__main__': main()
程序执行流程:
- 运行服务端程序
- 创建Protocol的派生类Echo
- 创建ServerFactory对象,并将Echo类封装到其protocol字段中
- 执行reactor的 listenTCP 方法,内部使用 tcp.Port 创建socket server对象,并将该对象添加到了 reactor的set类型的字段 _read 中
- 执行reactor的 run 方法,内部执行 while 循环,并通过 select 来监视 _read 中文件描述符是否有变化,循环中...
- 客户端请求到达
- 执行reactor的 _doReadOrWrite 方法,其内部通过反射调用 tcp.Port 类的 doRead 方法,内部 accept 客户端连接并创建Server对象实例(用于封装客户端socket信息)和 创建 Echo 对象实例(用于处理请求) ,然后调用 Echo 对象实例的 makeConnection 方法,创建连接。
- 执行 tcp.Server 类的 doRead 方法,读取数据,
- 执行 tcp.Server 类的 _dataReceived 方法,如果读取数据内容为空(关闭链接),否则,出发 Echo 的 dataReceived 方法
- 执行 Echo 的 dataReceived 方法
上述实例本质上使用了事件驱动的方法 和 IO多路复用的机制来进行Socket的处理
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 4 from twisted.internet import reactor, protocol 5 from twisted.web.client import getPage 6 from twisted.internet import reactor 7 import time 8 9 class Echo(protocol.Protocol): 10 11 def dataReceived(self, data): 12 deferred1 = getPage('http://cnblogs.com') 13 deferred1.addCallback(self.printContents) 14 15 deferred2 = getPage('http://baidu.com') 16 deferred2.addCallback(self.printContents) 17 18 for i in range(2): 19 time.sleep(1) 20 print 'execute ',i 21 22 23 def execute(self,data): 24 self.transport.write(data) 25 26 def printContents(self,content): 27 print len(content),content[0:100],time.time() 28 29 def main(): 30 31 factory = protocol.ServerFactory() 32 factory.protocol = Echo 33 34 reactor.listenTCP(8000,factory) 35 reactor.run() 36 37 if __name__ == '__main__': 38 main() 39 40 异步IO操作