网络编程基础
二.软件开发的架构
我们了解的涉及到两个程序之间通讯的应用大致可以分为两种:
第一种是应用类:qq、微信、网盘、优酷这一类是属于需要安装的桌面应用
第二种是web类:比如百度、知乎、博客园等使用浏览器访问就可以直接使用的应用
这些应用的本质其实都是两个程序之间的通讯。而这两个分类又对应了两个软件开发的架构~
1.C/S架构
C/S即:Client与Server ,中文意思:客户端与服务器端架构,这种架构也是从用户层面(也可以是物理层面)来划分的。
这里的客户端一般泛指客户端应用程序EXE,程序需要先安装后,才能运行在用户的电脑上,对用户的电脑操作系统环境依赖较大。
2.B/S架构
B/S即:Browser与Server,中文意思:浏览器端与服务器端架构,这种架构是从用户层面来划分的。
Browser浏览器,其实也是一种Client客户端,只是这个客户端不需要大家去安装什么应用程序,只需在浏览器上通过HTTP请求服务器端相关的资源(网页资源),客户端Browser浏览器就能进行增删改查。
三.网络基础
1.一个程序如何在网络上找到另一个程序?
首先,程序必须要启动,其次,必须有这台机器的地址,我们都知道我们人的地址大概就是国家\省\市\区\街道\楼\门牌号这样字。
那么每一台联网的机器在网络上也有自己的地址,它的地址是怎么表示的呢?就是使用一串数字来表示的,例如:100.4.5.6
IP地址是指互联网协议地址(英语:Internet Protocol Address,又译为网际协议地址),是IP Address的缩写。
IP地址是IP协议提供的一种统一的地址格式,它为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。 IP地址是一个32位的二进制数,通常被分割为4个“8位二进制数”(也就是4个字节)。IP地址通常用“点分十进制”表示成(a.b.c.d)的形式,
其中,a,b,c,d都是0~255之间的十进制整数。例:点分十进IP地址(100.4.5.6),实际上是32位二进制数(01100100.00000100.00000101.00000110)。
"端口"是英文port的意译,可以认为是设备与外界通讯交流的出口。
因此ip地址精确到具体的一台电脑,而端口精确到具体的程序。
2.osi七层模型
引子
须知一个完整的计算机系统是由硬件、操作系统、应用软件三者组成,具备了这三个条件,一台计算机系统就可以自己跟自己玩了(打个单机游戏,玩个扫雷啥的)
如果你要跟别人一起玩,那你就需要上网了,什么是互联网?
互联网的核心就是由一堆协议组成,协议就是标准,比如全世界人通信的标准是英语,如果把计算机比作人,互联网协议就是计算机界的英语。
所有的计算机都学会了互联网协议,那所有的计算机都就可以按照统一的标准去收发信息从而完成通信了。
osi七层模型
人们按照分工不同把互联网协议从逻辑上划分了层级:
OSI五层模型: 应用层 py文件 传输层 tcp/udp协议 网络层 ip协议 数据链路层 arp协议,网卡 物理层 网线,集线器,光纤
3.socket概念
socket层
理解socket
Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,
它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。
其实站在你的角度上看,socket就是一个模块。我们通过调用模块中已经实现的方法建立两个进程之间的连接和通信。 也有人将socket说成ip+port,因为ip是用来标识互联网中的一台主机的位置,而port是用来标识这台机器上的一个应用程序。 所以我们只要确立了ip和port就能找到一个应用程序,并且使用socket模块来与之通信。
3.套接字(socket)的发展史
套接字起源于 20 世纪 70 年代加利福尼亚大学伯克利分校版本的 Unix,即人们所说的 BSD Unix。 因此,有时人们也把套接字称为
“伯克利套接字”或“BSD 套接字”。一开始,套接字被设计用在同 一台主机上多个应用程序之间的通讯。这也被称进程间通讯或IPC。
套接字有两种(或者称为有两个种族),分别是基于文件型的和基于网络型的。
基于文件类型的套接字家族
套接字家族的名字:AF_UNIX
unix一切皆文件,基于文件的套接字调用的就是底层的文件系统来取数据,两个套接字进程运行在同一机器,可以通过访问同一个文件系统间接完成通信
基于网络类型的套接字家族
套接字家族的名字:AF_INET
(还有AF_INET6被用于ipv6,还有一些其他的地址家族,不过,他们要么是只用于某个平台,要么就是已经被废弃,或者是很少被使用,
或者是根本没有实现,所有地址家族中,AF_INET是使用最广泛的一个,python支持很多种地址家族,但是由于我们只关心网络编程,所以大部分时候我么只使用AF_INET)
4.tcp协议和udp协议
TCP(Transmission Control Protocol)可靠的、面向连接的协议(eg:打电话)、传输效率低全双工通信(发送缓存&接收缓存)、面向字节流。
使用TCP的应用:Web浏览器;电子邮件、文件传输程序。
UDP(User Datagram Protocol)不可靠的、无连接的服务,传输效率高(发送前时延小),一对一、一对多、多对一、多对多、面向报文,
尽最大努力服务,无拥塞控制。使用UDP的应用:域名系统 (DNS);视频流;IP语音(VoIP)。
我知道说这些你们也不懂,直接上图。
# C/S 架构 几乎包含了所有网络开发的架构形态 # B/S 架构 也是C/S架构,B/S 架构中的client都是browser浏览器 # B/S 架构是一种趋势,统一了所有应用的入口 # 交换机 : 同一个局域网内的机器之间的交流 # 路由器 : 跨局域网机器之间的交流,有一个路由表,记录了归它管理的所有的网段 # 网关ip : 跨局域网的机器之间不能直接通信,只能通过网关ip通信
mac地址: 物理地址 在cmd 查看命令 ipconfig -all
mac地址是12位十六进制组成 ip地址: 是一个四位点分十进制组成(ipv4) 端口: 操作系统为每一个应用程序分配一个端口号 ip + 端口号------》唯一确定某一个电脑上的某一个程序
arp协议: 通过目标ip地址,获取目标mac地址 给你一个ip地址,如何确定它是不是在你当前局域网内? 网络地址ip和子网掩码ip做按位与运算,如果结果相同 那么说明在同一个网段内 ex: ip地址 192.168.1.12 1100 0000 . 1010 1000 . 0000 0001 . 0000 1100 子网掩码 255.255.255.0
1111 1111 . 1111 1111 . 1111 1111 . 0000 0000 结果 1100 0000 . 1010 1000 . 0000 0001 . 0000 0000 ---> 192.168.1.0 网段
ip地址:127.0.0.1 回环地址:无论什么时候,都可以代表本机的ip地址(只限在本机使用)
没网的时候,自己可以和自己通信
协议 : 由多人制定的一种规则
通过socket模块去操作tcp和udp协议 TCP协议 : 安全,可靠通信方式,面向连接,慢 UDP协议 : 不安全,不可靠的通信方式,,非面向连接,快, tcp协议: 三次握手 : 注意必须是client先发起请求 1 client发送给server我想连接你,可以么 2 server回复client,可以,我也想连接你,可以吗? 3 client回复server,可以 四次挥手 : 谁先发起请求都可以 1 client发送请求:我准备断开连接了,我没有数据需要发送了, 如果你有数据可以继续发给我 2 server回复:确认接收到你的请求,我开始着手准备断开事宜 3 server回复:我准备好了,可以随时断开连接 4 client回复:断开连接吧