数据框是机器学习中使用的最重要的 R 数据结构。pandas 中的数据框尽管功能很强大,但相比 python 本身的复杂,DataFrame 并非 python 中必不可少的数据结构。回忆之前读过的有关 python 机器学习或是数据挖掘的书,通篇不提 DataFrame,倒是 numpy 数组是主角。但是鉴于表格数据的普遍性和通用性,DataFrame 还是不容小视。