levels of contents

Python2与Python3的区别

Python2与Python3的区别

1) 核心类差异

  1. Python3 对 Unicode 字符的原生支持。
    Python2 中使用 ASCII 码作为默认编码方式导致 string 有两种类型 str 和 unicode,Python3 只
    支持 unicode 的 string。Python2 和 Python3 字节和字符对应关系为:

    python2 python3 表现 转换 作用
    str bytes 字节 encode 存储
    unicode str 字符 decode 显示
  2. Python3 采用的是绝对路径的方式进行 import

  3. Python2中存在老式类和新式类的区别,Python3统一采用新式类。新式类声明要求继承object,
    必须用新式类应用多重继承

  4. Python3 使用更加严格的缩进。Python2 的缩进机制中,1 个 tab 和 8 个 space 是等价的,所
    以在缩进中可以同时允许 tab 和 space 在代码中共存。这种等价机制会导致部分 IDE 使用存在问题。
    Python3 中 1 个 tab 只能找另外一个 tab 替代,因此 tab 和 space 共存会导致报错:TabError:
    inconsistent use of tabs and spaces in indentation.


2) 废弃类差异

  1. print 语句被 Python3 废弃,统一使用 print 函数

  2. exec 语句被 python3 废弃,统一使用 exec 函数

  3. execfile 语句被 Python3 废弃,推荐使用 exec(open("./filename").read())

  4. 不相等操作符"<>"被 Python3 废弃,统一使用"!="

  5. long 整数类型被 Python3 废弃,统一使用 int

  6. xrange 函数被 Python3 废弃,统一使用 range,Python3 中 range 的机制也进行修改并提高了大数据集生成效率

  7. Python3 中这些方法再不再返回 list 对象:dictionary 关联的 keys()、values()、items(),zip(),map(),filter(),但是可以通过 list 强行转换:

    mydict = dict()
    mydict = {"a": 1, "b": 2, "c": 3}
    mydict.keys()  # <built-in method keys of dict object at 0x000000000040B4C8>
    list(mydict.keys())  # ['a', 'c', 'b']
    
  8. 迭代器 iterator 的 next()函数被 Python3 废弃,统一使用 next(iterator)

  9. raw_input 函数被 Python3 废弃,统一使用 input 函数

  10. 字典变量的 has_key 函数被 Python 废弃,统一使用 in 关键词

  11. file 函数被 Python3 废弃,统一使用 open 来处理文件,可以通过 io.IOBase 检查文件类型

  12. apply 函数被 Python3 废弃

  13. 异常 StandardError 被 Python3 废弃,统一使用 Exception


3)修改类差异

  1. 浮点数除法操作符“/”和“//”的区别
    “ / ”:
    Python2:若为两个整形数进行运算,结果为整形,但若两个数中有一个为浮点数,则结果为
    浮点数;
    Python3:为真除法,运算结果不再根据参加运算的数的类型。
    “//”:
    Python2:返回小于除法运算结果的最大整数;从类型上讲,与"/"运算符返回类型逻辑一致。
    Python3:和 Python2 运算结果一样。
  2. 异常抛出和捕捉机制区别

python2

  raise IOError, "file error"  # 抛出异常
  except NameError, err:  # 捕捉异常

python3

  raise IOError("file error")  #抛出异常
  except NameError as err: #捕捉异常
  1. for 循环中变量值区别

    Python2,for 循环会修改外部相同名称变量的值

    i = 1
    print('comprehension: ', [i for i in range(5)])
    print('after:i = ', i)  # i = 4
    

    Python3,for 循环不会修改外部相同名称变量的值

    i = 1
    print("comprehension: ", [i for i in range(5)])
    print('after: i = ', i)  # i = 1
    
  2. round 函数返回值区别

    Python2,round 函数返回 float 类型值

    isinstance(round(15.5),int)  #True
    

    Python3,round 函数返回 int 类型值

    isinstance(round(15.5),float) #True
    
  3. 比较操作符区别

    Python2 中任意两个对象都可以比较

    11 < 'test'  # True
    

    Python3 中只有同一数据类型的对象可以比较

    11 < 'test' # TypeError: unorderable types: int() < str()
    

4)第三方工具包差异

我们在pip官方下载源pypi搜索Python2.7和Python3.5的第三方工具包数可以发现,Python2.7
版本对应的第三方工具类目数量是 28523,Python3.5 版本的数量是 12457,这两个版本在第三方工具
包支持数量差距相当大。
我们从数据分析的应用角度列举了常见实用的第三方工具包(如下表),并分析这些工具包在
Python2.7 和 Python3.5 的支持情况:

分类 工具名 用途
数据收集 scrapy 网页采集,爬虫
数据收集 scrapy-redis 分布式爬虫
数据收集 selenium web 测试,仿真浏览器
数据处理 beautifulsoup 网页解释库,提供 lxml 的支持
数据处理 lxml xml 解释库
数据处理 xlrd excel 文件读取
数据处理 xlwt excel 文件写入
数据处理 xlutils excel 文件简单格式修改
数据处理 pywin32 excel 文件的读取写入及复杂格式定制
数据处理 Python-docx Word 文件的读取写入
数据分析 numpy 基于矩阵的数学计算库
数据分析 pandas 基于表格的统计分析库
数据分析 scipy 科学计算库,支持高阶抽象和复杂模型
数据分析 statsmodels 统计建模和计量经济学工具包
数据分析 scikit-learn 机器学习工具库
数据分析 gensim 自然语言处理工具库
数据分析 jieba 中文分词工具库
数据存储 MySQL-python mysql 的读写接口库
数据存储 mysqlclient mysql 的读写接口库
数据存储 SQLAlchemy 数据库的 ORM 封装
数据存储 pymsql sql server 读写接口库
数据存储 redis redis 的读写接口
数据存储 PyMongo mongodb 的读写接口
数据呈现 matplotlib 流行的数据可视化库
数据呈现 seaborn 美观的数据可是湖库,基于 matplotlib
工具辅助 chardet 字符检查工具
工具辅助 ConfigParser 配置文件读写支持
工具辅助 requests HTTP 库,用于网络访问

5)工具安装问题

windows 环境
Python2 无法安装 mysqlclient。Python3 无法安装 MySQL-python、 flup、functools32、Gooey、Pywin32 、webencodings。
matplotlib 在 python3 环境中安装报错:The following required packages can not be built:freetype, png。需要手动下载安装源码包安装解决。
scipy 在 Python3 环境中安装报错,numpy.distutils.system_info.NotFoundError,需要自己手工下载对应的安装包,依赖 numpy,pandas 必须严格根据 python 版本、操作系统、64 位与否。运行matplotlib 后发现基础包 numpy+mkl 安装失败,需要自己下载,国内暂无下载源

centos 环境下
Python2 无法安装mysql-python和 mysqlclient包,报错:EnvironmentError: mysql_config not found,解决方案是安装 mysql-devel 包解决。使用 matplotlib 报错:no module named _tkinter,安装 Tkinter、tk-devel、tc-devel 解决。
pywin32 也无法在 centos 环境下安装

posted @ 2019-06-23 11:48  panky  阅读(2283)  评论(0编辑  收藏  举报