官方解释:https://docs.python.org/2/library/socket.html
socket概述
IP socket 是在其上建立高级 Internet 协议的最低级的层:从 HTTP 到 SSL 到 POP3 到 Kerberos 再到 UDP-Time,每种 Internet 协议都建立在它的基础上。为了实现自定义的协议,或定制众所周知的协议的实现,程序员需要掌握基本的 socket 基础结构的工作知识。
网络上不同的计算机,也可以通信,那么就得使用网络套接字(socket)。socket就是在不同计算机之间进行通信的一个抽象。他工作于TCP/IP协议中应用层和传输层之间的一个抽象;对于TCP来说,TCP 把连接作为最基本的抽象;每一条 TCP 连接有两个端点;TCP 连接的端点不是主机,不是主机的IP 地址,不是应用进程,也不是运输层的协议端口。TCP 连接的端点叫做套接字(socket)或插口;端口号拼接到(contatenated with) IP 地址即构成了套接字。(socket) ;
socket接口是实际上是操作系统提供的系统调用。socket的使用并不局限于Python语言,你可以用C或者JAVA来写出同样的socket服务器,而所有语言使用socket的方式都类似(Apache就是使用C实现的服务器)。而你不能跨语言的使用框架。框架的好处在于帮你处理了一些细节,从而实现快速开发,但同时受到Python本身性能的限制。我们已经看到,许多成功的网站都是利用动态语言(比如Python, Ruby或者PHP,比如twitter和facebook)快速开发,在网站成功之后,将代码转换成诸如C和JAVA这样一些效率比较高的语言,从而让服务器能更有效率的面对每天亿万次的请求。在这样一些时间,底层的重要性,就远远超过了框架。
套接字 socket = (IP地址: 端口号)
每一条 TCP 连接唯一地被通信两端的两个端点(即两个套接字)所确定。即:
TCP 连接 ::= {socket1, socket2}
= {(IP1: port1), (IP2: port2)}

服务器通信
socket保证了不同计算机之间的通信,也就是网络通信。对于网站,通信模型是客户端服务器之间的通信。两个端都建立一个socket对象,然后通过socket对象对数据进行传输。通常服务器处于一个无线循环,等待客户端连接:

socket 通信实例
socket接口是操作系统提供的,调用操作系统的接口。当然高级语言一般也封装了好用的函数接口,下面用python代码写一个简单的socket服务端例子
#!/bin/env python # _*_ coding:utf-8 _*_ __author__ = 'jasperhsu' import socket # 创建客户端套接字,这里没写参数代表用默认的 obj = socket.socket() # 连接到服务器 obj.connect(('127.0.0.1',8341)) # 发起数据给服务器 obj.send('000000000000000') # 解释服务器返回的数据 server_data = obj.recv(1024) print server_data server_data = obj.recv(1024) print server_data obj.close()
#!/bin/env python # _*_ coding:utf-8 _*_ __author__ = 'jasperhsu' import socket def main(): # 创建socket对象 sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 绑定主机和端口 sock.bind(('127.0.0.1',8001)) # 开始socket监听, sock.listen(5) while True: # 阻塞,deng 。。。。 print '....' # 建立连接,连接为建立的时候阻塞 connection, address = sock.accept() # connection,代表客户端socket对象, # address,客户端IP地址 # andle_request(connection) # 读取数据,数据还没到来阻塞 buf = connection.recv(1024) print buf connection.send("HTTP/1.1 200 OK\r\n\r\n") connection.send("Hello, World") connection.close() if __name__ == '__main__': main()
TCP 三次握手:
python代码写套接字很简单。传说的TCP三次握手又是如何体现的呢?什么是三次握手呢?
第一握:首先客户端发送一个syn,请求连接; 第二握:服务器收到之后确认,并发送一个 syn ack应答; 第三握:客户端接收到服务器发来的应答之后再给服务器发送建立连接的确定;
这样就建立了一个TCP连接会话。如果是要断开连接,大致过程是:

上图也很清晰的表明了三次握手的socket具体过程。
- 客户端socket对象connect调用之后进行阻塞,此过程发送了一个syn。
- 服务器socket对象调用accept函数之后阻塞,直到客户端发送来的syn,然后发送syn和ack应答
- 客户端socket对象收到服务端发送的应答之后,再发送一个ack给服务器,并返回connect调用,建立连接。
- 服务器socket对象接受客户端最后一次握手确定ack返回accept函数,建立连接。
至此,客户端和服务器的socket通信连接建立完成,剩下的就是两个端的连接对象收发数据,从而完成网络通信。
Socket 类型
套接字格式:socket(family, type[,protocal]) 使用给定的套接族,套接字类型,协议编号(默认为0)来创建套接字
| socket 类型 | 描述 |
|---|---|
| 参数一:地址簇 | |
| socket.AF_UNIX | 用于同一台机器上的进程通信(既本机通信) |
| socket.AF_INET | IPV4默认 |
| socket.AF_INET6 | 基于IPV6方式的服务器与服务器之间的网络通信 |
| 参数二:类型 | |
| socket.SOCK_STREAM | 基于TCP流式socket (默认) |
| socket.SOCK_DGRAM | 基于UDP的数据报式socket |
| socket.SOCK_RAW | 原始套接字,普通的套接字无法处理ICMP、IGMP等网络报文,而SOCK_RAW可以;其次SOCK_RAW也可以处理特殊的IPV4报文;此外,利用原始套接字,可以通过IP_HDRINCL套接字选项由用户构造IP头 |
| socket.SOCK_SEQPACKET | 可靠的连续数据包服务 |
| 参数三:协议 | |
| 0 | (默认)与特定的地址家族相关的协议,如果是 0 ,系统就会根据地址格式和套接类别,自动选择一个合适的协议 |
Socket 函数
- TCP发送数据时,已建立好TCP链接,所以不需要指定地址,而UDP是面向无连接的,每次发送都需要指定发送给谁。
- 服务器与客户端不能直接发送列表,元素,字典等带有数据类型的格式,发送的内容必须是字符串数据。
服务器端 Socket 函数
| Socket 函数 | 描述 |
|---|---|
| s.bind(address) | 将套接字绑定到地址,在AF_INET下,以tuple(host, port)的方式传入,如s.bind((host, port)) |
| s.listen(backlog) | 开始监听TCP传入连接,backlog指定在拒绝链接前,操作系统可以挂起的最大连接数,该值最少为1,大部分应用程序设为5就够用了 |
| s.accpet() | 接受TCP链接并返回(conn, address),其中conn是新的套接字对象,可以用来接收和发送数据,address是链接客户端的地址。 |
客户端 Socket 函数
| Socket 函数 | 描述 |
|---|---|
| s.connect(address) | 链接到address处的套接字,一般address的格式为tuple(host, port),如果链接出错,则返回socket.error错误 |
| s.connect_ex(address) | 功能与s.connect(address)相同,但成功返回0,失败返回errno的值 |
公共 Socket 函数
| Socket 函数 | 描述 |
|---|---|
| s.recv(bufsize[, flag]) | 接受TCP套接字的数据,数据以字符串形式返回,buffsize指定要接受的最大数据量,flag提供有关消息的其他信息,通常可以忽略 |
| s.send(string[, flag]) | 发送TCP数据,将字符串中的数据发送到链接的套接字,返回值是要发送的字节数量,该数量可能小于string的字节大小 |
| s.sendall(string[, flag]) | 完整发送TCP数据,将字符串中的数据发送到链接的套接字,但在返回之前尝试发送所有数据。成功返回None,失败则抛出异常 |
| s.recvfrom(bufsize[, flag]) | 接受UDP套接字的数据u,与recv()类似,但返回值是tuple(data, address)。其中data是包含接受数据的字符串,address是发送数据的套接字地址 |
| s.sendto(string[, flag], address) | 发送UDP数据,将数据发送到套接字,address形式为tuple(ipaddr, port),指定远程地址发送,返回值是发送的字节数 |
| s.close() | 关闭套接字 |
| s.getpeername() | 返回套接字的远程地址,返回值通常是一个tuple(ipaddr, port) |
| s.getsockname() | 返回套接字自己的地址,返回值通常是一个tuple(ipaddr, port) |
| s.setsockopt(level, optname, value) | 设置给定套接字选项的值 |
| s.getsockopt(level, optname[, buflen]) | 返回套接字选项的值 |
| s.settimeout(timeout) | 设置套接字操作的超时时间,timeout是一个浮点数,单位是秒,值为None则表示永远不会超时。一般超市其应在刚创建套接字时设置,因为他们可能用于连接的操作,如s.connect() |
| s.gettimeout() | 返回当前超时值,单位是秒,如果没有设置超时则返回None |
| s.fileno() | 返回套接字的文件描述 |
| s.setblocking(flag) | 如果flag为0,则将套接字设置为非阻塞模式,否则将套接字设置为阻塞模式(默认值)。非阻塞模式下,乳沟调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。 |
| s.makefile() | 创建一个与该套接字相关的文件 |
SocketServer模块
对于默认Socket服务端处理客户端请求时,按照阻塞方式依次处理请求,SocketServer实现同事处理多个请求。
#!/bin/env python # _*_ coding:utf-8 _*_ __author__ = 'jasperhsu' import SocketServer import os class MyTCP(SocketServer.BaseRequestHandler): def handle(self): # 应该已经封装好了 不需要这层while了 可能会引起大量 close_wait conn =self.request while True: self.data=conn.recv(1024).strip() if self.data == 'quit' or not self.data: break cmd=os.popen(self.data).read() if cmd == '': cmd= self.data + ': Command not found' self.request.sendall(cmd) if __name__ == '__main__': HOST,PORT = '127.0.0.1',50007 server = SocketServer.ThreadingTCPServer((HOST,PORT),MyTCP) server.serve_forever()
import socket HOST='127.0.0.1 PORT=50007 s=socket.socket(socket.AF_INET,socket.SOCK_STREAM) s.connect((HOST,PORT)) while True: while True: cmd=raw_input('CMD:').strip() if cmd != '':break s.sendall(cmd) data=s.recv(1024).split('\n') print 'cmd:' for line in data:print line s.close()
浙公网安备 33010602011771号