Socket_网络编程

  Socket_套接字:

  在计算机领域,socket有多个意思。在硬件上,理解为插座上没错的,比如CPU的插座Socket 370, Socket 462, Socket AM3,这个大家都很容易理解,木有异议。让人很费解的是这货出现在软件领域(广义)时,就硬生生改名套接字了。

  然后真正将socket概念发扬光大的,是1983年4.2BSD的发布,这是伯克利推出内含TCP/IP的第一个Unix BSD版本。

 

  从这个时期起,Socket是一种进程间通信机制,提供一种供应用程序访问通信协议的操作系统调用,并且通过将socket与Unix系统文件描述符相整合,使得网络读写数据(或者服务调用)和读写本地文件一样容易(实现不同主机间的进程之间的通信,要解决网络上两台主机之间的进程通信问题,首先要唯一标识该进程,在 TCP/IP 网络协议中,就是通过 (IP地址,协议,端口号) 三元组来标识进程的,解决了进程标识问题,就有了通信的基础了)。很显然,这货已经离插座越来越远了,已经完全不再是硬件上的物件,而是一序列的“指令” ,按汉语的理解,已经具备了“套接”(建立网络通讯或进程间通讯)和“字”(可交互的有序指令串)的概念。
 
Socket  与 File模块读写的主要区别
 
  file模块是针对本地某个文件来进行 [打开、读/写、关闭]。
  socket模块是针对服务器、客户端的Socket进行的  [打开、读/写、关闭]。
 
Socket 本质上就是在2台网络互通的电脑之间,架设一个通道,两台电脑通过这个通道来实现数据的互相传递。我们知道网络通信都是基于 ip+port 方能定位到目标的具体机器上的具体服务,操作系统有0-65535个端口,每个端口都可以独立对外提供服务,如果 把一个公司比做一台电脑 ,那公司的总机号码就相当于ip地址, 每个员工的分机号就相当于端口, 你想找公司某个人,必须 先打电话到总机,然后再转分机。
而建立一个socket必须至少有2端,服务端和客户端服务端被动等待并接收请求,客户端主动发起请求, 连接建立之后,双方可以互发数据。 

Socket 客户端:

 

 

 

创建socket,需要引用Python中的 socket模块 调用其中的函数 socket()

import socket

sk = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

该函数返回socket的描述符 函数参数: family:地址簇 AF_INET(Internet进程间通信,也是默认参数) AF_UNIX(用于同一台机器进程间通信) type:套接字的类型 socket.SOCKET_STREAM(流式套接字,主要用于 TCP 协议) socket.SOCKET_DGRAM(数据报套接字,主要用于 UDP 协议) socket.SOCK_RAW 原始套接字,普通的套接字无法处理ICMP、IGMP等网络报文,而SOCK_RAW可以; 其次,SOCK_RAW也可以处理特殊的IPv4报文;此外,利用原始套接字,可以通过IP_HDRINCL套接字选项由用户构造IP头。 socket.SOCK_RDM 是一种可靠的UDP形式,即保证交付数据报但不保证顺序。 SOCK_RAM用来提供对原始协议的低级访问,在需要执行某些特殊操作时使用,如发送ICMP报文。 SOCK_RAM通常仅限于高级用户或管理员运行的程序使用。 proto:协议 (默认)与特定的地址家族相关的协议,如果是 0 ,则系统会根据地址格式和套接类别,自动选择一个合适的协议

实例:链接搜狗

# 链接-搜狗
host = 'www.sogou.com'
# HTTP 服务的默认端口
port = 80
# 这是一个 HTTP 请求网页内容的命令。这里 2.x版本中是不需要转换为字节,3.x 需要进行字节转换
message = bytes("GET / HTTP/1.1 100",encoding='utf-8')
# 来获得远程主机的 IP 地址
remote_ip = socket.gethostbyname(host)
print(host, remote_ip)
# 通过 address 来进行连接
sk.connect((remote_ip,port,))
# 向服务器发送请求命令
sk.sendall(message)
# 接收
reply = str(sk.recv(4096),encoding='utf-8')
# 打印
print(reply)
sk.close()
# 执行结果 >>>www.sogou.com
106.38.241.37 HTTP/1.1 400 Bad Request Server: nginx Date: Mon, 19 Jun 2017 03:18:20 GMT Content-Type: text/html Content-Length: 166 Connection: close <html> <head><title>400 Bad Request</title></head> <body bgcolor="white"> <center><h1>400 Bad Request</h1></center> <hr><center>nginx</center> </body> </html>

Socket 服务端:

# 创建socket
sk = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
# 绑定IP和port
sk.bind(('127.0.0.1',9999))
# 将socket 设置监听模式,参数 backlog 连接的个数。如果设为 5,那么有 5 个连接正在等待处理,此时第 6 个请求过来时将会被拒绝。
sk.listen(5)
# 建立连接
conn,address = sk.accept()
# 发送数据
conn.sendall(bytes('Hello',encoding='utf-8'))
# 接收数据
conn.recv(1024)
# 关闭连接
conn.close()
sk.close()

Socket 常用函数:

sk.bind(address)
# 将套接字绑定到地址。address 地址的格式取决于地址族。在AF_INET下,以元组(host,port,)的形式表示地址。
sk.listen(backlog)
# 开始监听传入连接。backlog指定在拒绝连接之前,可以挂起的最大连接数量。backlog等于5,表示内核已经接到了连接请求,但服务器还没有调用accept进行处理的连接个数最大为5
 这个值不能无限大,因为要在内核中维护连接队列
sk.setblocking(bool)
#是否阻塞(默认True),如果设置False,那么accept和recv时一旦无数据,则报错。
sk.accept()
# 接受连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。
# 接收TCP 客户的连接(阻塞式)等待连接的到来
sk.connect(address)
# 连接到address处的套接字。一般,address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。
sk.connect_ex(address)
# 同上,只不过会有返回值,连接成功时返回 0 ,连接失败时候返回编码,例如:10061
sk.close()
# 关闭套接字
sk.recv(bufsize[,flag])
# 接受套接字的数据。数据以字符串形式返回,bufsize指定最多可以接收的数量。flag提供有关消息的其他信息,通常可以忽略。
sk.recvfrom(bufsize[.flag])
# 与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。
sk.send(string[,flag])
# 将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。即:可能未将指定内容全部发送。
sk.sendall(string[,flag])
# 将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。
# 内部通过递归调用send,将所有内容发送出去。
sk.sendto(string[,flag],address)
# 将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。该函数主要用于UDP协议。
sk.settimeout(timeout)
# 设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如 client 连接最多等待5s )
sk.getpeername()
# 返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。
sk.getsockname()
# 返回套接字自己的地址。通常是一个元组(ipaddr,port)
sk.fileno()
# 套接字的文件描述符

 

 

 

posted @ 2017-06-19 13:12  LeeeetMe  阅读(173)  评论(0编辑  收藏  举报