快到皖里来 - 博客园

2020年2月14日

摘要：本文对机器学习做一个大体概览，以便看清该学科分支的知识点分布情况，以供后续学习指明方向与道路。机器学习是什么一般的解释如下：机器学习是通过编程让计算机从数据中进行学习的科学（和艺术）。还有两位前辈对机器学习的定义如下：机器学习是让计算机具有学习的能力，无需进行明确编程。 —— 亚瑟·萨缪尔阅读全文

posted @ 2020-02-14 13:16 快到皖里来阅读(284) 评论(0) 推荐(0)

2020年2月13日

python中的“赋值与深浅拷贝”

摘要： Python中，赋值与拷贝（深/浅拷贝）之间是有差异的，这主要源于数据在内存中的存放问题，本文将对此加以探讨。 1 赋值（添加名字）赋值不会改变内存中数据存放状态，比如在内存中存在一个名为data的数据，此时若执行语句data_01 = data，则现在该份数据有了两个名称（data和data_0 阅读全文

posted @ 2020-02-13 13:43 快到皖里来阅读(386) 评论(0) 推荐(0)

浅谈python的第三方库——pandas（终）

摘要：作为pandas系列的最终章，本文引出一个数据“复制”问题。示例如下：从上图中可以看到：我们对data_pd做了删除一行的操作，但是这并没有改变变量data_pd在内存中的值，而是将删减一行后的数据放置在一块新开辟的内存区域。可以这么理解，这种机制是在复制的一份原数据上进行操作，从而保护原数据阅读全文

posted @ 2020-02-13 12:39 快到皖里来阅读(503) 评论(0) 推荐(0)

2020年2月12日

K折交叉验证

摘要：在机器学习领域，特别是涉及到模型的调参与优化部分，k折交叉验证是一个经常使用到的方法，本文就结合示例对它做一个简要介绍。该方法的基本思想就是将原训练数据分为两个互补的子集，一部分做为训练数据来训练模型，另一部分做为验证数据来评价模型。（以下将前述的两个子集的并集称为原训练集，将它的两个互补子集分别阅读全文

posted @ 2020-02-12 15:00 快到皖里来阅读(11201) 评论(0) 推荐(1)

2020年2月10日

浅谈python的第三方库——pandas（三）

摘要：令笔者对pandas印象最为深刻的一件事，就是在pandas中已经内置了很多数据导入导出方法，然而本人并不了解，在一次小项目的工作中曾手写了一个从excel表格导入数据到DataFrame的python脚本。这个糗事让笔者深感代码能力急需加强！为了让那次教训刻骨铭心，也为了避免广大读者再走类似的弯阅读全文

posted @ 2020-02-10 15:17 快到皖里来阅读(404) 评论(0) 推荐(0)

pythonfl

公告