网络编程
OSI模型:
物理层:发送电信号
数据链路层:定义电信号的分组方式,以太网协议,mac地址
网络层:区分子网,IP地址
传输层:TCP协议,UDP协议
物理层功能:主要是基于电器特性发送高低电压(电信号), 高电压对应数字1,低电压对应数字0 数据链路层的功能:定义了电信号的分组方式 单纯的电信号0和1没有任何意义,必须规定电信号多少位一组,每组什么意思 早期的时候各个公司都有自己的分组方式,后来形成了统一的标准,即以太网协议ethernet ethernet规定: 一组电信号构成一个数据包,叫做‘帧’ 每一数据帧分成:报头head和数据data两部分 head包含:(固定18个字节) 发送者/源地址,6个字节 接收者/目标地址,6个字节 数据类型,6个字节 data包含:(最短46字节,最长1500字节) 数据包的具体内容 head长度+data长度=最短64字节,最长1518字节,超过最大限制就分片发送 mac地址: head中包含的源和目标地址由来:ethernet规定接入internet的设备都必须具备网卡, 发送端和接收端的地址便是指网卡的地址,即mac地址 mac地址:每块网卡出厂时都被烧制上一个世界唯一的mac地址,长度为48位2进制, 通常由12位16进制数表示(前六位是厂商编号,后六位是流水线号) 有了mac地址,同一网络内的两台主机就可以通信了 (一台主机通过arp协议获取另外一台主机的mac地址) ethernet采用最原始的方式,广播的方式进行通信,即计算机通信基本靠吼 网络层: 由来:有了ethernet、mac地址、广播的发送方式,世界上的计算机就可以彼此通信了, 问题是世界范围的互联网是由一个个彼此隔离的小的局域网组成的, 那么如果所有的通信都采用以太网的广播方式,那么一台机器发送的包全世界都会收到, 功能:引入一套新的地址用来区分不同的广播域/子网,这套地址即网络地址 IP协议:网络地址由32位2进制表示 一个ip地址通常写成四段十进制数,例:172.16.10.1 子网掩码:表示子网络特征的一个参数 作用:某个IP地址划分成网络地址和主机地址两部分。 传输层: 通过ip和mac找到了一台特定的主机,如何标识这台主机上的应用程序呢? 答案就是端口,端口即应用程序与网卡关联的编号 功能:建立端口到端口的通信,端口范围0-65535,0-1023为系统占用端口 TCP协议:需要建立链接,一次请求必然有一次响应,安全性高, 缺点:效率低 UDP协议:不可靠传输,效率高
socket:
Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部。
实例:
import socket phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM) phone.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1) phone.bind(('127.0.0.1', 8083)) # 0-65535:0-1024给操作系统使用 phone.listen(5) print('starting...') while True: # 链接循环 conn, client_addr = phone.accept() print(client_addr) while True: # 通信循环 try: data = conn.recv(1024) if not data: break # 适用于linux操作系统 print('客户端的数据', data) conn.send(data.upper()) except ConnectionResetError: # 适用于windows操作系统 break conn.close() phone.close()
import socket phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM) phone.connect(('127.0.0.1', 8083)) while True: msg = input('>>: ').strip() # msg='' if not msg: continue phone.send(msg.encode('utf-8')) # phone.send(b'') # print('has send') data = phone.recv(1024) # print('has recv') print(data.decode('utf-8')) phone.close()
粘包现象:
服务端每次接收的最大字节数是有限制,但是如果客户端一次发送的数据量过大,服务端可能一次接收不完,那么客户端下次再发送数据的时候,就会跟服务端上一次没接收完的数据粘在一起。
解决:
方式1、告诉服务端每次发送的具体数据量,服务端采用循环的方式接收。
import json,struct #假设通过客户端上传1T:1073741824000的文件a.txt #为避免粘包,必须自定制报头 header={'file_size':1073741824000,'file_name':'/a/b/c/d/e/a.txt','md5':'8f6fbf8347faa4924a76856701edb0f3'} #1T数据,文件路径和md5值 #为了该报头能传送,需要序列化并且转为bytes head_bytes=bytes(json.dumps(header),encoding='utf-8') #序列化并转成bytes,用于传输 #为了让客户端知道报头的长度,用struck将报头长度这个数字转成固定长度:4个字节 head_len_bytes=struct.pack('i',len(head_bytes)) #这4个字节里只包含了一个数字,该数字是报头的长度 #客户端开始发送 conn.send(head_len_bytes) #先发报头的长度,4个bytes conn.send(head_bytes) #再发报头的字节格式 conn.sendall(文件内容) #然后发真实内容的字节格式 #服务端开始接收 head_len_bytes=s.recv(4) #先收报头4个bytes,得到报头长度的字节格式 x=struct.unpack('i',head_len_bytes)[0] #提取报头的长度 head_bytes=s.recv(x) #按照报头长度x,收取报头的bytes格式 header=json.loads(json.dumps(header)) #提取报头 #最后根据报头的内容提取真实的数据,比如 real_data_len=s.recv(header['file_size']) s.recv(real_data_len)
方式2、服务端采用循环的方式接收,直到某次接收到的数据为空时,向客服端反馈信息。