python常见面试题总结
1、大数据的文件读取
① 利用生成器generator
②迭代器进行迭代遍历:for line in file
2、迭代器和生成器的区别
1)迭代器是一个更抽象的概念,任何对象,如果它的类有next方法和iter方法返回自己本身。对于string、list、dict、tuple等这类容器对象,使用for循环遍历是很方便的。在后台for语句对容器对象调用iter()函数,iter()是python的内置函数。iter()会返回一个定义了next()方法的迭代器对象,它在容器中逐个访问容器内元素,next()也是python的内置函数。在没有后续元素时,next()会抛出一个StopIteration异常
2)生成器(Generator)是创建迭代器的简单而强大的工具。它们写起来就像是正规的函数,只是在需要返回数据的时候使用yield语句。每次next()被调用时,生成器会返回它脱离的位置(它记忆语句最后一次执行的位置和所有的数据值)
区别:生成器能做到迭代器能做的所有事,而且因为自动创建了__iter__()和next()方法,生成器显得特别简洁,而且生成器也是高效的,使用生成器表达式取代列表解析可以同时节省内存。除了创建和保存程序状态的自动方法,当发生器终结时,还会自动抛出StopIteration异常
3、简单谈下GIL:
Global Interpreter Lock(全局解释器锁)
Python代码的执行由Python 虚拟机(也叫解释器主循环,CPython版本)来控制,Python 在设计之初就考虑到要在解释器的主循环中,同时只有一个线程在执行,即在任意时刻,只有一个线程在解释器中运行。对Python 虚拟机的访问由全局解释器锁(GIL)来控制,正是这个锁能保证同一时刻只有一个线程在运行。
4、find和grep
grep命令是一种强大的文本搜索工具,grep搜索内容串可以是正则表达式,允许对文本文件进行模式查找。如果找到匹配模式,grep打印包含模式的所有行。
find通常用来再特定的目录下搜索符合条件的文件,也可以用来搜索特定用户属主的文件。
5、Python中的yield用法
yield简单说来就是一个生成器,这样函数它记住上次返 回时在函数体中的位置。对生成器第二次(或n 次)调用跳转至该函数。
6、描述数组、链表、队列、堆栈的区别?
数组与链表是数据存储方式的概念,数组在连续的空间中存储数据,而链表可以在非连续的空间中存储数据;
队列和堆栈是描述数据存取方式的概念,队列是先进先出,而堆栈是后进先出;队列和堆栈可以用数组来实现,也可以用链表实现。
7、metaclass作用?以及应用场景?
metaclass是类的产生类,而并非继承类
通过它来控制类的产生,以及类实例化的操作
8、什么是面向对象的mro
方法查找的顺序
9、异常处理写法以及如何主动跑出异常(应用场景)
try: 执行语句 except 异常类型: 触发异常后执行的语句 else: 没有触发异常执行的语句 findlly: 有没有异常都执行的语句 # 主动抛出异常 raise 异常类实例
10、json序列化时,可以处理的数据类型有哪些?如何定制支持datetime类型?
字符串、列表、字典、数字、布尔值、
None
自定义
cls
类
import json import datetime class MyEncoder(json.JSONEncoder): def default(self, o): if isinstance(o,datetime.datetime): return o.strftime('%Y-%m-%d %H:%M:%S') else: return super(MyEncoder,self).default(o)d ={'name':'petrolero','data':datetime.datetime.now()}
print(json.dumps(d,cls=MyEncoder)) # {"name": "petrolero", "data": "2018-10-17 13:01:47"}
11、json序列化时,默认遇到中文会转换成unicode,如果想要保留中文怎么办?
import json a = json.dumps({'nh':'你好'},ensure_ascii=False) print(a) # {"nh": "你好"}
12、什么是断言?应用场景?
断言条件为真时代码继续执行,否则抛出异常,这个异常通常不会去捕获他.我们设置一个断言目的就是要求必须实现某个条件
13、有用过 with statement吗?它的好处是什么?
with语句的作用是通过某种方式简化异常处理,它是所谓的上下文管理器的一种
用法举例如下:
with open('output.txt', 'w') as f: f.write('Hi there!')
当你要成对执行两个相关的操作的时候,这样就很方便,以上便是经典例子,with语句会在嵌套的代码执行之后,自动关闭文件。
这种做法的还有另一个优势就是,无论嵌套的代码是以何种方式结束的,它都关闭文件。
如果在嵌套的代码中发生异常,它能够在外部exception handler catch异常前关闭文件。如果嵌套代码有
return
/
continue
/
break
语句,它同样能够关闭文件。
我们也能够自己构造自己的上下文管理器
我们可以用contextlib中的context manager修饰器来实现,比如可以通过以下代码暂时改变当前目录然后执行一定操作后返回。
from contextlib import contextmanager import os @contextmanager def working_directory(path): current_dir = os.getcwd() os.chdir(path) try: yield finally: os.chdir(current_dir) with working_directory("data/stuff"): # do something within data/stuff # here I am back again in the original working directory
14、使用代码实现查看列举目录下的所有文件。
import os # 使用os.listdir dir_aim = input('请输入目标路径:') for filename in os.listdir(dir_aim): print(filename) # 使用os.walk递归遍历 for root,dirs,files in os.walk(dir_aim): print('root:',root) if files: print('files:') for file in files: print(file) print('') if dirs: for dir in dirs: print(dir)