海康威视面试python后端题

1. 请简述三次握手和四次挥手：

　答：首先TCP是传输控制协议，提供可靠的连接服务，采用三次握手确认建立一个连接，在建立TCP连接时，需要客户端和服务器总共发送3个包。

　　　三次握手的目的是连接服务器的指定端口、建立TCP连接、同步双方的序列号和确认号、交换TCP窗口大小信息，在socket编程中，客户端在执行connect()时将触发三次握手。

　　第一次握手：建立连接时，客户端发送syn包到服务器，并进入SYN_SENT状态，等待服务器确认。 SYN：同步序列编号

　　第二次握手：服务器收到客户端的syn包，必须向客户端发送确认信号（ack ），并且向客户端页发送一个syn包，此时服务器进入SYN_RECV状态

　　第三次握手：客户端收到服务器syn+ack，向服务器发送确认包ack，此包发送完毕，客户端和服务器端进入ESTABLISHED(tcp连接成功)，完成三次握手。

　　四次挥手： TCP连接的断开需要发送四次包，所以称之为四次挥手，且Client端和服务器端均可主动发出断开请求，在socket中，任何一方执行close()操作皆可产收挥手操作。

　　·第一次挥手：Cilent端停止发送报文，并发出断开请求FIN，并将序列号置为X，此时客户端进入（终止等待1）状态。

　　·第二次挥手：Server端接收到FIN包后立即向Client端发送确认包ACK = X+1,并置序列号为Y，此时服务器进入关闭等待状态。

　　·第三次挥手：Server端在发送确认信号后也向Client端发送了关闭信号FIN和确认信号ACK，并将序列号置为Y,此时服务器进入（最后确认）状态。

　　·第四次挥手：Client端接收到服务器发来的断开请求报文后，必须发出确认信号ACK = Y, 并置序列号为Z+1, 并进入（时间等待）状态，且此时连接还没有断，客户端需要等待2MSL时间才会断开

2.　为什么握手三次且挥手四次？

　　答：因为当Server端收到Client端的SYN连接请求报文后，可以直接发送SYN+ACK报文。其中ACK报文是用来应答的，SYN报文是用来同步的。但是关闭连接时，当Server端收到FIN报文时，很可能并不会立即关闭SOCKET，

　　所以只能先回复一个ACK报文，告诉Client端，"你发的FIN报文我收到了"。只有等到我Server端所有的报文都发送完了，我才能发送FIN报文，因此不能一起发送。故需要四步握手。

3. 　为什么第四次握手后要等待2MSL(最大报文生存时间)时间才会返回close状态？

　　答：假象网络不可靠，当客户端发送ack后ack却丢失了，那么服务器端收不到确认信号，就会一直发送FIN请求，所以这时客户端不能立即关闭，必须等待2MSL时间才行(因为客户端发送ack需要MSL，服务端发送FIN也需要MSL时间)，

　　如果在2MSL时间内没收到服务器端发来的FIN，就代表服务器端已经接收到了客户端的ack，词汇客户端才会关闭。

4。get和post请求的区别？

　　答：首先定性：get和post并没有什么本质的区别。

　　　　w3schools的说法：

　　　　　　GET在浏览器回退时是无害的，而POST会再次提交请求

　　　　　　GET产生的URL地址可以被Bookmark，而POST不可以。

　　　　　　GET请求会被浏览器主动cache，而POST不会，除非手动设置。

　　　　　　GET请求只能进行url编码，而POST支持多种编码方式。

　　　　　　GET请求参数会被完整保留在浏览器历史记录里，而POST中的参数不会被保留。

　　　　　　GET请求在URL中传送的参数是有长度限制的，而POST么有。

　　　　　　对参数的数据类型，GET只接受ASCII字符，而POST没有限制。

　　　　　　GET比POST更不安全，因为参数直接暴露在URL上，所以不能用来传递敏感信息。

　　　　　　GET参数通过URL传递，POST放在Request body中。

　　然而这不是本质，本质是：

　　　　get和post是什么？他们俩是http协议中的两种请求方式。

　　　　http是什么呢？http是基于tip/ip的关于数据如何在万维网中通信的协议

　　　　http的底层是TCP/IP，那就是说get和post底层也是TCP/IP，也就是说，get和pos请求本质都是TCP连接，get请求和post请求能做的事儿是一样的。你要给get请求加上request body，给post请求带上url参数，技术上完全行得通。

　　　　但是不同的浏览器和服务器对此做出了一些限制，如url长度不超过2k个字节等等。

　　不过get和post请求还是有一个重大区别的：GET产生一个TCP数据包；POST产生两个TCP数据包。

　　　　get请求会将header和data一并发过去，服务器相应200

　　　　但是post请求：浏览器先发送header，服务器响应100 continue, 浏览器再发送data，服务器响应200.

　　　　也就是说，GET只需要汽车跑一趟就把货送到了，而POST得跑两趟，第一趟，先去和服务器打个招呼“嗨，我等下要送一批货来，你们打开门迎接我”，然后再回头把货送过去。

5. 简述python 主流web框架特性。

　　答：

　　　　Django：Python 界最全能的 web 开发框架，battery-include 各种功能完备，可维护性和开发速度一级棒。常有人说 Django 慢，其实主要慢在 Django ORM 与数据库的交互上，所以是否选用 Django，

　　取决于项目对数据库交互的要求以及各种优化。而对于 Django 的同步特性导致吞吐量小的问题，其实可以通过 Celery 等解决，倒不是一个根本问题。Django 的项目代表：Instagram，Guardian。

　　　　Tornado：天生异步，性能强悍是 Tornado 的名片，然而 Tornado 相比 Django 是较为原始的框架，诸多内容需要自己去处理。当然，随着项目越来越大，框架能够提供的功能占比越来越小，更多的内容需要团队自己实现，

　　而大项目往往需要性能的保证，这时候 Tornado 就是比较好的选择。Tornado项目代表：知乎。

　　　　Flask：微框架的典范，号称 Python 代码写得最好的项目之一。Flask 的灵活性，也是双刃剑：能用好 Flask 的，可以做成 Pinterest，用不好就是灾难（显然对任何框架都是这样）。

　　Flask 虽然是微框架，但是也可以做成规模化的 Flask。加上 Flask 可以自由选择自己的数据库交互组件（通常是 Flask-SQLAlchemy），而且加上 celery +redis 等异步特性以后，Flask 的性能相对 Tornado 也不逞多让，也许Flask 的灵活性可能是某些团队更需要的。

6. 解释GIL

　　答：(Global Interpreter Lock)全局解释器锁，是计算机程序设计语言解释器用于同步线程的一种机制，它使得任何时刻仅会有一个线程在执行，即使在多核处理器上，使用GIL的解释器也只允许同一时间执行一个程序，常见的使用GIL的解释器有CPython和Ruby MRI.

　　CPython解释器的线程使用的是操作系统的原生线程，在linux下是pthread, 在windows下是Win thread，完全由操作系统调度线程的执行。

　　在讨论普通的GIL之前，有一点要强调的是GIL只会影响到那些严重依赖CPU的程序（比如计算型的）。如果你的程序大部分只会涉及到I/O，比如网络交互，那么使用多线程就很合适，因为它们大部分时间都在等待。

　　实际上，你完全可以放心的创建几千个Python线程，现代操作系统运行这么多线程没有任何压力，没啥可担心的。

　　Python的多线程在多核CPU上，只对于IO密集型计算产生正面效果；而当有至少有一个CPU密集型线程存在，那么多线程效率会由于GIL而大幅下降。

7. 死锁的产生、避免、解决

　　答：死锁的产生原因：

　　　　　　（1）因为系统资源不足。

　　　　　　（2）进程运行推进的顺序不合适。

　　　　　　（3）资源分配不当

　　　　如果系统自资源充足，进程的请求都可以得到满足，死锁出现的可能就会非常低，否则就会因竞争有限的资源而陷入死锁，其次，进程运行推进顺序和速度不同，也会产生死锁。

　　　　产生死锁的四个必要条件：

　　　　　　（1）互斥条件：一个资源每次只能被一个进程调用。

　　　　　　（2）请求与保持条件：一个进程因请求资源而阻塞时，对已获取的资源保持不放。

　　　　　　（3）不剥夺条件：进程已获取的资源，在未使用完之前，不能强制剥夺。

　　　　　　（4）循环等待条件：若干进程之间形成一种头尾相接的循环等待资源关系。

　　　　这四个是产生死锁的必要条件，只要系统发生死锁，这些条件必然成立，而只要上述条件之一不满足，思索就不会发生。

8。redis崩溃了怎么办？

　　答：首先是避免崩溃，保证redis高可用性，主从+哨兵来避免redis全盘崩溃。

　　　　其次是redis持久化，一旦redis重启，自动从磁盘上加载数据，快速回复缓存数据。

　　ps: 缓存雪崩：存雪崩是指在我们设置缓存时采用了相同的过期时间，导致缓存在某一时刻同时失效，或者某一时间缓存大范围挂掉，导致请求全部转发到DB，DB瞬时压力过重宕掉。

　　　　缓存穿透：缓存穿透是指查询一个一定不存在的数据，由于缓存是不命中时被动写的，并且出于容错考虑，如果从存储层查不到数据则不写入缓存，这将导致这个不存在的数据每次请求都要到存储层去查询，失去了缓存的意义。

　　在流量大时，可能DB就挂掉了

9. TCP和UDP：

　　答： 1.基于连接与无连接
　　　　2.TCP要求系统资源较多，UDP较少；
　　　　3.UDP程序结构较简单
　　　　4.流模式（TCP）与数据报模式(UDP);
　　　　5.TCP保证数据正确性，UDP可能丢包
　　　　6.TCP保证数据顺序，UDP不保证

10. http的长连接和短连接：

　　推荐这篇文章：https://www.cnblogs.com/0201zcr/p/4694945.html

　　答：HTTP的长连接和短连接本质上是TCP长连接和短连接。HTTP属于应用层协议，在传输层使用TCP协议，在网络层使用IP协议。IP协议主要解决网络路由和寻址问题，TCP协议主要解决如何在IP层之上可靠的传递数据包，

　　使在网络上的另一端收到发端发出的所有包，并且顺序与发出顺序一致。TCP有可靠，面向连接的特点。

　　在HTTP/1.0中，默认使用的是短连接。也就是说，浏览器和服务器每进行一次HTTP操作，就建立一次连接，但任务结束就中断连接。如果客户端浏览器访问的某个HTML或其他类型的 Web页中包含有其他的Web资源，如JavaScript文件、图像文件、CSS文件等；当浏览器每遇到这样一个Web资源，就会建立一个HTTP会话。

但从 HTTP/1.1起，默认使用长连接，用以保持连接特性。使用长连接的HTTP协议，会在响应头有加入这行代码：Connection:keep-alive

　　在使用长连接的情况下，当一个网页打开完成后，客户端和服务器之间用于传输HTTP数据的 TCP连接不会关闭，如果客户端再次访问这个服务器上的网页，会继续使用这一条已经建立的连接。Keep-Alive不会永久保持连接，它有一个保持时间，可以在不同的服务器软件（如Apache）中设定这个时间。实现长连接要客户端和服务端都支持长连接。

HTTP协议的长连接和短连接，实质上是TCP协议的长连接和短连接。

想了解更多Python关于爬虫、数据分析的内容，获取大量爬虫爬取到的源数据，欢迎大家关注我的微信公众号：悟道Python

posted @ 2019-03-15 23:45 宋讼颂阅读(1170) 评论(0) 收藏举报

刷新页面返回顶部

宋讼颂

海康威视面试python后端题

公告