python基础及网络编程面试题

1、简述解释型和编译型编程语言？

　　解释型语言编写的程序在执行的时候需要一个专门的解释器将其翻译成机器语言，每个语句在执行的时候才会被翻译，这样执行一次就会被翻译一次，效率很低

编译型语言编写的代码在执行之前会经过一个专门编译，通过编译系统将其编译成一个可执行文件，相当于只翻译了一次，程序在执行的时候就不需要再翻译，所以编译型语言运行效率更高。

2、Python解释器种类以及特点?

Python存在的解释器大概分为五种

Cpython：基于c语言编写的解释器，也是python使用最为广泛的一种解释器。

IPython：基于CPython之上的一种交互式解释器，对其交互方式进行了增强，实现的功能和CPython一样。

PyPy：提高了程序的执行效率，采用了JIT技术对python代码进行动态编译。

JPython：运行在Java上的解释器，能够将python代码解析成Java字节码执行。

Ironpython：运行在微软.NET平台上的解释器，能够将python代码解析成.NET字节码。

3、请至少列举5个 PEP8 规范

（1）每行最大长度为79

（2）类的定义和top-level函数之间空两行，类中的函数之间空一行

（3）不要在一个import后引入多个库

（4）函数命名使用全小写的方式，可以使用下划线

（5）逗号、冒号、分号前不要加空格

4、python递归的最大层数？

python递归的最大层数默认为998，这是python专门设置的一种机制用来防止无限递归造成python溢出崩溃，python的递归深度其实也跟计算机系统堆栈的大小有关，我们可以通过sys模块的setrecursionlimit()方法来改变递归深度。

5、xrange和range的区别？

两者的用法相同，都是用于循环。

range生成的是一个序列，xrange生成的是一个生成器，xrange在性能上比range优化很多，它的数据生成一个取出一个，不用一下子开辟一片内存空间。

6、简述Python的深浅拷贝以及应用场景？

https://www.cnblogs.com/zhuifeng-mayi/p/9179647.html

7、Python垃圾回收机制？

　　Python的GC模块主要运用了“引用计数”（reference counting）来跟踪和回收垃圾。在引用计数的基础上，还可以通过“标记-清除”（mark and sweep）解决容器对象可能产生的循环引用的问题。通过“分代回收”（generation collection）以空间换取时间来进一步提高垃圾回收的效率。

引用计数：当一个对象的引用被创建或者复制时，对象的引用计数加1；当一个对象的引用被销毁时，对象的引用计数减1；当对象的引用计数减少为0时，就意味着对象已经没有被任何人使用了，可以将其所占用的内存释放了。

标记-清除：我们并不改动真实的引用计数，而是将集合中对象的引用计数复制一份副本，改动该对象引用的副本。对于副本做任何的改动，都不会影响到对象生命走起的维护。

分代回收：将系统中的所有内存块根据其存活时间划分为不同的集合，每一个集合就成为一个“代”，垃圾收集的频率随着“代”的存活时间的增大而减小。也就是说，活得越长的对象，就越不可能是垃圾，就应该减少对它的垃圾收集频率。那么如何来衡量这个存活时间：通常是利用几次垃圾收集动作来衡量，如果一个对象经过的垃圾收集次数越多，可以得出：该对象存活时间就越长。

8、logging模块的作用？以及应用场景？

logging模块定义的函数和类为应用程序和库的开发实现了一个灵活的事件日志系统。logging模块是Python的一个标准库模块，由标准库模块提供日志记录API的关键好处是所有Python模块都可以使用这个日志记录功能。所以，你的应用日志可以将你自己的日志信息与来自第三方模块的信息整合起来。

logging模块默认定义了以下几个日志等级，它允许开发人员自定义其他日志级别，但是这是不被推荐的，尤其是在开发供别人使用的库时，因为这会导致日志级别的混乱。

DEBUG　　　最详细的日志信息，典型应用场景是问题诊断　
INFO　　　　信息详细程度仅次于DEBUG，通常只记录关键节点信息，用于确认一切都是按照我们预期的那样进行工作
WARNING 当某些不期望的事情发生时记录的信息（如，磁盘可用空间较低），但是此时应用程序还是正常运行的
ERROR 由于一个更严重的问题导致某些功能不能正常运行时记录的信息
CRITICAL 当发生严重错误，导致应用程序不能继续运行时记录的信息

开发应用程序或部署开发环境时，可以使用DEBUG或INFO级别的日志获取尽可能详细的日志信息来进行开发或部署调试；应用上线或部署生产环境时，应该使用WARNING或ERROR或CRITICAL级别的日志来降低机器的I/O压力和提高获取错误日志信息的效率。日志级别的指定通常都是在应用程序的配置文件中进行指定的。

说明：

上面列表中的日志等级是从上到下依次升高的，即：DEBUG < INFO < WARNING < ERROR < CRITICAL，而日志的信息量是依次减少的；
当为某个应用程序指定一个日志级别后，应用程序会记录所有日志级别大于或等于指定日志级别的日志信息，而不是仅仅记录指定级别的日志信息，nginx、php等应用程序以及这里要提高的python的logging模块都是这样的。同样，logging模块也可以指定日志记录器的日志级别，只有级别大于或等于该指定日志级别的日志记录才会被输出，小于该等级的日志记录将会被丢弃。

9、简述生成器、迭代器、可迭代对象以及应用场景？

（1）生成器（generator）：生成器就是迭代器中的一种表现形式但是是不同的对象，而且都是可迭代对象，在执行过程中，遇到yield关键字就会中断执行，下次继续从中断位置开始执行，生成器本身并没有返回值，只返回一个生成器对象，所以从返回值本身来说，生成器表达式省内存

生成器最佳应用场景是：你不想同一时间将所有计算出来的大量结果集分配到内存当中，特别是结果集里还包含循环。比方说，循环打印1000000个数，我们一般会使用xrange()而不是range()，因为前者返回的是生成器，后者返回的是列表（列表消耗大量空间）

（2）迭代器（iterator）：表示数据流的对象。重复调用迭代器的next （）方法（会返回流中的连续项。直到没有数据可以返回时抛出StopIteration异常错误。可以把这个数据流看做一个有序序列，但我们无法提前知道这个序列的长度。同时，Iterator的计算是惰性的，只有通过next()函数时才会计算并返回下一个数据

（3）可迭代对象（iterable）：可直接用于for循环的对象统称为可迭代对象，判断是否是可迭代对象，用函数isinstance()

生成器对象即是可迭代对象，也是迭代器，因为生成器既可以用for循环求值，也可以通过next()求值，直到抛出StopIteration时无法继续生成新值
迭代器对象一定时可迭代对象，可迭代对象不一定为迭代器，因为迭代器、生成器、可迭代对象都可以用for循环迭代求值，只有生成器和迭代器可以被next()方法求值

10、简述三次握手、四次挥手的流程。

所谓三次握手（Three-Way Handshake）即建立TCP连接，就是指建立一个TCP连接时，需要客户端和服务端总共发送3个包以确认连接的建立。在socket编程中，这一过程由客户端执行connect来触发的。

位码即tcp标志位,有6种标示:SYN(synchronous建立联机) ACK(acknowledgement 确认) PSH(push传送) FIN(finish结束) RST(reset重置) URG(urgent紧急)

（1）第一次握手：Client将标志位SYN置为1，随机产生一个值seq=J，并将该数据包发送给Server，Client进入SYN_SENT状态，等待Server确认。

（2）第二次握手：Server收到数据包后由标志位SYN=1知道Client请求建立连接，Server将标志位SYN和ACK都置为1，ack=J+1，随机产生一个值seq=K，并将该数据包发送给Client以确认连接请求，Server进入SYN_RCVD状态。

（3）第三次握手：Client收到确认后，检查ack是否为J+1，ACK是否为1，如果正确则将标志位ACK置为1，ack=K+1，并将该数据包发送给Server，Server检查ack是否为K+1，ACK是否为1，如果正确则连接建立成功，Client和Server进入ESTABLISHED状态，完成三次握手，随后Client与Server之间可以开始传输数据了。

所谓四次挥手（Four-Way Wavehand）即终止TCP连接，就是指断开一个TCP连接时，需要客户端和服务端总共发送4个包以确认连接的断开。在socket编程中，这一过程由客户端或服务端任一方执行close来触发的。

由于TCP连接时全双工的，因此，每个方向都必须要单独进行关闭，这一原则是当一方完成数据发送任务后，发送一个FIN来终止这一方向的连接，收到一个FIN只是意味着这一方向上没有数据流动了，即不会再收到数据了，但是在这个TCP连接上仍然能够发送数据，直到这一方向也发送了FIN。首先进行关闭的一方将执行主动关闭，而另一方则执行被动关闭

（1）第一次挥手：Client发送一个FIN，用来关闭Client到Server的数据传送，Client进入FIN_WAIT_1状态。

（2）第二次挥手：Server收到FIN后，发送一个ACK给Client，确认序号为收到序号+1（与SYN相同，一个FIN占用一个序号），Server进入CLOSE_WAIT状态。

（3）第三次挥手：Server发送一个FIN，用来关闭Server到Client的数据传送，Server进入LAST_ACK状态。

（4）第四次挥手：Client收到FIN后，Client进入TIME_WAIT状态，接着发送一个ACK给Server，确认序号为收到序号+1，Server进入CLOSED状态，完成四次挥手。

为什么建立连接是三次握手，而关闭连接却是四次挥手呢？

　　这是因为服务端在LISTEN状态下，收到建立连接请求的SYN报文后，把ACK和SYN放在一个报文里发送给客户端。而关闭连接时，当收到对方的FIN报文时，仅仅表示对方不再发送数据了但是还能接收数据，己方也未必全部数据都发送给对方了，所以己方可以立即close，也可以发送一些数据给对方后，再发送FIN报文给对方来表示同意现在关闭连接，因此，己方ACK和FIN一般都会分开发送。

11、什么是arp协议？

arp协议，中文名地址解析协议，就是将IP地址转换成目标主机的物理地址（Mac地址） arp协议工作在OSI七层协议层的第二层，但它属于第三层。

注：ARP协议要求进行通信的主机双方必须在同一个物理网段（即局域网内）

12、什么是socket？简述基于tcp协议的套接字通信流程。

Socket含义

英文原义是“孔”或“插座”。作为BSD UNIX的进程通信机制，取后一种意思。通常也称作"套接字"，用于描述IP地址和端口，是一个通信链的句柄。在Internet上的主机一般运行了多个服务软件，同时提供几种服务。每种服务都打开一个Socket，并绑定到一个端口上，不同的端口对应于不同的服务。Socket正如其英文原意那样，像一个多孔插座。一台主机犹如布满各种插座的房间，每个插座有一个编号，有的插座提供220伏交流电，有的提供110伏交流电，有的则提供有线电视节目。客户软件将插头插到不同编号的插座，就可以得到不同的服务。

TCP Socket通信的基本流程

①服务端创建一个ServerSocket对象,指定端口号,ServerSocket对象等待客户端的连接请求。
②客户端创建一个Socket对象,指定主机地址和端口号,向服务端发出连接请求。
③服务端接收到客户端的连接请求,建立一条TCP连接,再创建一个Socket对象与客户端的Socket对象进行通信。
④服务端和客户端分别创建字节输入流和字节输出流,通过字节输入流获得对方发来的数据,通过字节输出流向对方发送数据。
⑤当一方决定结束通信时,向对方发送结束信息;另一方接收到结束信息后,双方分别关闭各自的TCP连接。
⑥ServerSocket对象停止等待客户端的连接请求。

12、什么是粘包？ socket 中造成粘包的原因是什么？粘包的处理方式。

https://blog.csdn.net/Nice07/article/details/83515660

13、IO多路复用的作用？

I/O多路复用是通过一种机制，可以监视多个描述符，一旦某个描述符就绪（一般是读就绪或者写就绪），能够通知程序进行相应的读写操作。

I/O多路复用的优势并不是对于单个连接能处理的更快，而是在于可以在单个线程/进程中处理更多的连接。

与多进程和多线程技术相比，I/O多路复用技术的最大优势是系统开销小，系统不必创建进程/线程，也不必维护这些进程/线程，从而大大减小了系统的开销。

IO复用机制可以同时监控多个描述符，当某个描述符就绪（读或写就绪），则立即通知相应程序进行读或写操作。但select，poll，epoll本质上都是同步I/O，因为他们都需要在读写事件就绪后自己负责进行读写，也就是说这个读写过程是阻塞的

14、threading.local的作用？

在多线程环境下，每个线程都有自己的数据。一个线程使用自己的局部变量比使用全局变量好，因为局部变量只有线程自己能看见，不会影响其他线程，而全局变量的修改必须加锁。

Threading.local可以创建一个全局变量,每个线程都可以对他读写属性,但不会互相影响，为每个线程创建一个独立的空间，使得线程对自己的空间中的数据进行操作（数据隔离）

15、什么是cdn？

CDN的全称是Content Delivery Network，即内容分发网络。其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节，使内容传输的更快、更稳定。通过在网络各处放置节点服务器所构成的在现有的互联网基础之上的一层智能虚拟网络，CDN系统能够实时地根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。其目的是使用户可就近取得所需内容，解决 Internet网络拥挤的状况，提高用户访问网站的响应速度。

16、什么是负载均衡？web有哪些实现负载均衡的方式？

https://www.cnblogs.com/yeyublog/p/6438373.html

17、什么是rpc及应用场景？

RPC是只远程过程调用，也就是说两台服务器A,B, 一个应用部署在A服务器上，另一个应用部署在B服务器上，A服务器上的应用想要调用B服务器上的应用提供的方法/函数，由于不在一个内存空间，不能直接调用，需要通过网络来表达调用的语意和传递调用的参数。

假如在B服务器的应用中定义了一个方法，如何在A服务器中调用？

第一，要解决通讯的问题，主要是通过在客户端和服务器之间建立TCP连接，远程调用过程中所有交换的数据都在这个连接里传输，连接可以是按需连接，调用结束后就关闭，也可以是长连接，多个远程调用共享一个连接。

第二，要解决寻址的问题，也就是说，A服务器上的应用怎么告诉底层的RPC框架，如何连接到B服务器（如主机或IP地址）以及特定的端口号，方法的名称是什么，这样才能完成调用，比如基于WEB服务协议的RPC，就要提供一个endpoint URI，或者是从UDDI服务上查找。如果是RMI调用的话，还需要一个RMI Registry来注册服务的地址。

第三，当A服务器上的应用发起远程过程调用时，方法的参数需要通过底层的网络协议如TCP传递到B服务器，由于网络协议是基于二进制的，内存中的参数的值要序列化成二进制的形式，也就是序列化（Serialize）或编组(marshal)，通过寻址和传输将序列化的二进制发送给B服务器。

第四，B服务器收到请求后，需要对参数进行反序列化（序列化的逆操作），恢复为内存中的表达方式，然后找到对应的方法（寻址的一部分）进行本地调用，然后得到返回值。

第五，返回值还要发送给A服务器上的应用，也要经过序列化的方式发送，服务器A接到后，在反序列化，恢复为内存中的表达方式，交给A服务器上的应用。

18、twisted框架的使用和应用？

https://blog.csdn.net/qq_31728311/article/details/77407280

posted on 2018-11-20 11:28 tony-lzt 阅读(219) 评论(0) 编辑收藏举报

刷新页面返回顶部