上一页 1 ··· 7 8 9 10 11 12 13 14 下一页
摘要: 本文对机器学习做一个大体概览,以便看清该学科分支的知识点分布情况,以供后续学习指明方向与道路。 机器学习是什么 一般的解释如下: 机器学习是通过编程让计算机从数据中进行学习的科学(和艺术)。 还有两位前辈对机器学习的定义如下: 机器学习是让计算机具有学习的能力,无需进行明确编程。 —— 亚瑟·萨缪尔 阅读全文
posted @ 2020-02-14 13:16 快到皖里来 阅读(266) 评论(0) 推荐(0) 编辑
摘要: Python中,赋值与拷贝(深/浅拷贝)之间是有差异的,这主要源于数据在内存中的存放问题,本文将对此加以探讨。 1 赋值(添加名字) 赋值不会改变内存中数据存放状态,比如在内存中存在一个名为data的数据,此时若执行语句data_01 = data,则现在该份数据有了两个名称(data和data_0 阅读全文
posted @ 2020-02-13 13:43 快到皖里来 阅读(366) 评论(0) 推荐(0) 编辑
摘要: 作为pandas系列的最终章,本文引出一个数据“复制”问题。 示例如下: 从上图中可以看到:我们对data_pd做了删除一行的操作,但是这并没有改变变量data_pd在内存中的值,而是将删减一行后的数据放置在一块新开辟的内存区域。 可以这么理解,这种机制是在复制的一份原数据上进行操作,从而保护原数据 阅读全文
posted @ 2020-02-13 12:39 快到皖里来 阅读(487) 评论(0) 推荐(0) 编辑
摘要: 在机器学习领域,特别是涉及到模型的调参与优化部分,k折交叉验证是一个经常使用到的方法,本文就结合示例对它做一个简要介绍。 该方法的基本思想就是将原训练数据分为两个互补的子集,一部分做为训练数据来训练模型,另一部分做为验证数据来评价模型。(以下将前述的两个子集的并集称为原训练集,将它的两个互补子集分别 阅读全文
posted @ 2020-02-12 15:00 快到皖里来 阅读(10918) 评论(0) 推荐(1) 编辑
摘要: 令笔者对pandas印象最为深刻的一件事,就是在pandas中已经内置了很多数据导入导出方法,然而本人并不了解,在一次小项目的工作中曾手写了一个从excel表格导入数据到DataFrame的python脚本。这个糗事让笔者深感代码能力急需加强! 为了让那次教训刻骨铭心,也为了避免广大读者再走类似的弯 阅读全文
posted @ 2020-02-10 15:17 快到皖里来 阅读(392) 评论(0) 推荐(0) 编辑
上一页 1 ··· 7 8 9 10 11 12 13 14 下一页