基于Tcp的socket编程
基于Tcp的socket编程
最简单的基于tcp的循环通信
'''
最简单的基于tcp的循环通信,s和c互发消息,但无法实现多个c与s通信
'''
# server端
import socket
sk = socket.socket()
sk.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1) # 避免服务器重启时报address already in use错误
sk.bind(('127.0.0.1',8081)) # (‘ip’,端口)--元组
sk.listen(5) # 监听
while True: # 链接循环
print('正在等待客户端连接')
# 连接堵塞,等待客户端连接,没有就一直卡在这。
conn, addr = sk.accept() # 接收别人的电话, conn连接,addr地址
print(f'{addr}已连接!')
while True: # 通信循环
# 通信堵塞,等待客户端发送的信息,没有就一直可在这。
ret = conn.recv(1024).decode('utf8')
if ret == 'bye':
break
print(ret)
info = input('>>>')
conn.send(info.encode('utf8'))
conn.close() # 挂电话
sk.close() # 关手机
# client端
import socket
sk = socket.socket()
sk.connect(('127.0.0.1',8081)) # 拨打别人的手机号
while True:
info = input('>>>')
sk.send(info.encode('utf8'))
ret = sk.recv(1024).decode('utf8')
print(ret)
sk.close()
subprocess模块补充
#subprocess 执行系统命令的模块
import subprocess
#执行系统dir命令,把执行的正确结果放到管道中
obj=subprocess.Popen('tasklistdd',shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE)
#拿到正确结果的管道,读出里面的内容
ss=obj.stdout.read()
err=obj.stderr.read()
print('错误信息',str(err,encoding='gbk'))
#因为windows用的gbk编码,用gbk解码
print(str(ss,encoding='gbk'))
TCP协议完成远程执行cmd命令
'''
利用TCP协议完成远程执行cmd命令
'''
# server 端
import socket
import subprocess
soc=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
soc.bind(('127.0.0.1',8001))
soc.listen(3)
while True:
print('等待客户端连接')
conn,addr=soc.accept()
print('有个客户端连接上了',addr)
while True:
try:
data=conn.recv(1024)
if len(data)==0:
break
print(data)
obj = subprocess.Popen(str(data,encoding='utf-8'), shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
#执行正确的结果 b 格式,gbk编码(windows平台)
msg=obj.stdout.read()
#把执行的结果通过网络传给c端
conn.send(msg)
except Exception:
break
# 关闭通道
conn.close()
# 关闭套接字
soc.close()
# client 端
import socket
soc=socket.socket()
soc.connect(('127.0.0.1',8001))
while True:
in_s=input('请输入要执行的命令:')
soc.send(in_s.encode('utf-8'))
data=soc.recv(1024)
print(str(data,encoding='gbk'))
#粘包:tcp会把数据量较小,时间间隔较短的数据,当做同一个包发送
粘包问题
上述远程执行cmd命令时,如果cmd命令输出结果过长,就会发生粘包现象,一次接收不完,就会分次接收,导致数据接收不完全
注意:只有TCP有粘包现象,UDP永远不会粘包,为何,且听我娓娓道来。
什么是粘包
所谓粘包问题主要还是因为接收方不知道消息之间的界限,不知道一次性提取多少字节的数据所造成的。
此外,发送方引起的粘包是由TCP协议本身造成的,TCP为提高传输效率,发送方往往要收集到足够多的数据后才发送一个TCP段。若连续几次需要send的数据都很少,通常TCP会根据优化算法把这些数据合成一个TCP段后一次发送出去,这样接收方就收到了粘包数据。
- TCP(transport control protocol,传输控制协议)是面向连接的,面向流的,提供高可靠性服务。收发两端(客户端和服务器端)都要有一一成对的socket,因此,发送端为了将多个发往接收端的包,更有效的发到对方,使用了优化方法(Nagle算法),将多次间隔较小且数据量小的数据,合并成一个大的数据块,然后进行封包。这样,接收端,就难于分辨出来了,必须提供科学的拆包机制。 即面向流的通信是无消息保护边界的。
- UDP(user datagram protocol,用户数据报协议)是无连接的,面向消息的,提供高效率服务。不会使用块的合并优化算法,, 由于UDP支持的是一对多的模式,所以接收端的skbuff(套接字缓冲区)采用了链式结构来记录每一个到达的UDP包,在每个UDP包中就有了消息头(消息来源地址,端口等信息),这样,对于接收端来说,就容易进行区分处理了。 即面向消息的通信是有消息保护边界的。
- TCP是基于数据流的,于是收发的消息不能为空,这就需要在客户端和服务端都添加空消息的处理机制,防止程序卡住,而udp是基于数据报的,即便是你输入的是空内容(直接回车),那也不是空消息,udp协议会帮你封装上消息头,实验略
udp的recvfrom是阻塞的,一个recvfrom(x)必须对唯一一个sendinto(y),收完了x个字节的数据就算完成,若是y>x数据就丢失,这意味着udp根本不会粘包,但是会丢数据,不可靠
TCP的协议数据不会丢,没有收完包,下次接收,会继续上次继续接收,己端总是在收到ack时才会清除缓冲区内容。数据是可靠的,但是会粘包。
TCP发送数据的四种情况
假设客户端分别发送了两个数据包D1和D2给服务端,由于服务端一次读取到的字节数是不确定的,故可能存在以下4种情况。
- 服务端分两次读取到了两个独立的数据包,分别是D1和D2,没有粘包和拆包;
- 服务端一次接收到了两个数据包,D1和D2粘合在一起,被称为TCP粘包;
- 服务端分两次读取到了两个数据包,第一次读取到了完整的D1包和D2包的部分内容,第二次读取到了D2包的剩余内容,这被称为TCP拆包;
- 服务端分两次读取到了两个数据包,第一次读取到了D1包的部分内容D1_1,第二次读取到了D1包的剩余内容D1_2和D2包的整包。
特例:如果此时服务端TCP接收滑窗非常小,而数据包D1和D2比较大,很有可能会发生第五种可能,即服务端分多次才能将D1和D2包接收完全,期间发生多次拆包。
为何tcp是可靠传输,udp是不可靠传输
tcp在数据传输时,发送端先把数据发送到自己的缓存中,然后协议控制将缓存中的数据发往对端,对端返回一个ack=1,发送端则清理缓存中的数据,对端返回ack=0,则重新发送数据,所以tcp是可靠的
而udp发送数据,对端是不会返回确认信息的,因此不可靠
粘包的两种情况
- 发送端需要等缓冲区满才发送出去,造成粘包(发送数据时间间隔很短,数据了很小,会合到一起,产生粘包)
- 接收方不及时接收缓冲区的包,造成多个包接收(客户端发送了一段数据,服务端只收了一小部分,服务端下次再收的时候还是从缓冲区拿上次遗留的数据,产生粘包)
struck模块补充
import struct
#把一个数字打包成固定长度的4字节
obj=struct.pack('i',1098)
print(obj) # b'J\x04\x00\x00'
print(len(obj)) # 4
l=struct.unpack('i',obj)[0]
print(l) # 1098
解决粘包的方法
- 扩大单次接收的字节数,单文件过大根本没用,很鸡肋!
- 我们可以把报头做成字典,字典里包含将要发送的真实数据的详细信息,然后json序列化,然后用struck将序列化后的数据长度打包成4个字节(4个自己足够用了)
主要讲第二个方法
发送时:
先发报头长度
再编码报头内容然后发送
最后发真实内容
接收时:
先手报头长度,用struct取出来
根据取出的长度收取报头内容,然后解码,反序列化
从反序列化的结果中取出待取数据的详细信息,然后去取真实的数据内容
# server
import socket
import subprocess
import struct
soc = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
soc.bind(('127.0.0.1', 8001))
soc.listen(3)
while True:
print('等待客户端连接')
conn, addr = soc.accept()
print('有个客户端连接上了', addr)
while True:
try:
data = conn.recv(1024)
if len(data) == 0:
break
print(data)
obj = subprocess.Popen(str(data, encoding='utf-8'), shell=True, stdout=subprocess.PIPE,
stderr=subprocess.PIPE)
# 执行正确的结果 b 格式,gbk编码(windows平台)
msg = obj.stdout.read()
# 发送的时候需要先把长度计算出来
# 头必须是固定长度
# 先发4位,头的长度
import json
dic = {'size': len(msg)}
dic_bytes = (json.dumps(dic)).encode('utf-8')
# head_count是4个字节的长度
head_count = struct.pack('i', len(dic_bytes))
conn.send(head_count)
# 发送头部内容
conn.send(dic_bytes)
# 发了内容
conn.send(msg)
except Exception:
break
conn.close()
soc.close()
# client
import socket
import struct
import json
soc = socket.socket()
soc.connect(('127.0.0.1', 8001))
while True:
in_s = input('请输入要执行的命令:')
soc.send(in_s.encode('utf-8'))
# 头部字典的长度
head_dic_len = soc.recv(4)
# 解出真正的长度
head_l = struct.unpack('i', head_dic_len)[0]
# byte 字典的长度
# 收真正的头部字典
dic_byte = soc.recv(head_l)
head = json.loads(dic_byte)
l = head['size']
count = 0
data_total = b''
while count < l:
if l < 1024: # 如果接受的数据小于1024 ,直接接受数据大小
data = soc.recv(l)
else: # 如果接受的数据大于1024
if l - count >= 1024: # 总数据长度-count(目前收到多少,count就是多少) 如果还大于1024 ,在收1024
data = soc.recv(1024)
else: # 总数据长度-count(目前收到多少,count就是多少) 如果小于1024,只收剩下的部分就可
data = soc.recv(l - count)
data_total += data
count += len(data)
print(str(data_total, encoding='gbk'))