07 2019 档案

python学习中的序列函数
摘要:1、enumerate函数 当你索引数据时,使⽤enumerate的⼀个好⽅法是计算序列(唯 ⼀的)dict映射到位置的值: 2、sorted函数 sorted函数是可以从任何一个序列的元素返回一个新的排好序的列表: 3、zip函数 zip可以将多个列表、元组或其他序列成对组合成一个元组列表: zi 阅读全文

posted @ 2019-07-30 10:34 喜欢世界的宇宙 阅读(954) 评论(0) 推荐(0)

关于python中的小知识总结
摘要:1、使用isinstance函数检查对象是什么类型的。 isinstance可以用类型元祖,检查对象的类型是否在元组中: 2、python中的引入 在python中,模块就是一个有.py扩展名、包含python代码的文件,假设有以下模块: 如果想要从同目录下的另一个文件访问some_module.p 阅读全文

posted @ 2019-07-27 17:21 喜欢世界的宇宙 阅读(325) 评论(0) 推荐(0)

python学习13之数据泄密
摘要:在本教程中,您将了解什么是数据泄漏以及如何防止数据泄漏。如果你不知道如何防止它,泄漏将经常出现,它将破坏您的模型在微妙和危险的方式。因此,对于实践数据科学家来说,这是最重要的概念之一。 1、摘要 数据泄漏(或泄漏)发生在您的训练数据包含关于目标的信息时,但是当使用模型进行预测时,将无法获得类似的数据 阅读全文

posted @ 2019-07-17 21:47 喜欢世界的宇宙 阅读(876) 评论(0) 推荐(0)

python学习12之梯度推进
摘要:在本此学习中,我们将学习如何使用梯度增强来构建和优化模型。这种方法在Kaggle的许多竞争中占据主导地位,并在各种数据集上获得了最先进的结果。 1、摘要 我们已经使用随机森林方法进行了预测,该方法仅通过对许多决策树的预测进行平均就可以获得比单个决策树更好的性能。 我们把随机森林方法称为“集成方法”。 阅读全文

posted @ 2019-07-17 21:20 喜欢世界的宇宙 阅读(241) 评论(0) 推荐(0)

python学习11之交叉验证
摘要:本次学习,我们将学习如何使用交叉验证来更好地度量模型性能。 1、介绍 机器学习是一个迭代的过程。我们将面临使用什么预测变量、使用什么类型的模型、向这些模型提供什么参数等选择。 到目前为止,通过使用验证集(或holdout)度量模型质量,我们已经以数据驱动的方式做出了这些选择。 为了看到这一点,假设您 阅读全文

posted @ 2019-07-17 19:28 喜欢世界的宇宙 阅读(492) 评论(0) 推荐(0)

python学习10之管道清理建模
摘要:在本次得学习中,我们将会学习如何使用管道清理建模代码。 1、介绍 管道是保持数据预处理和建模代码组织的简单方法。 具体来说,一个管道捆绑包预处理和建模步骤,这样您就可以像使用单个步骤一样使用整个捆绑包。 2、管道使用的好处 更简洁的代码:在预处理的每个步骤中计算数据可能会变得混乱。使用管道,我们不需 阅读全文

posted @ 2019-07-16 22:10 喜欢世界的宇宙 阅读(241) 评论(0) 推荐(0)

python学习09之分类变量
摘要:本次学习,我们将了解什么是分类变量以及处理这类数据的三种方法。 1、介绍 分类变量只接受有限数量的值。 考虑一项调查,询问你多久吃一次早餐,并提供四个选项:“从不”、“很少”、“大多数日子”或“每天”。 在本例中,数据是分类的,因为响应属于一组固定的类别。如果人们对他们所拥有的汽车品牌进行调查,他们 阅读全文

posted @ 2019-07-16 18:32 喜欢世界的宇宙 阅读(931) 评论(1) 推荐(1)

python学习08之处理缺失值
摘要:1、缺失值的处理 我们将学习三种处理缺失值的方法。然后我们将比较这些方法在实际数据集上的有效性。 缺失值的介绍: 有很多种方法可以使数据以丢失的值结束。 例如: 两居室的房子不包括第三居室大小的价值。 调查对象可选择不分享其收入。 如果尝试使用缺少值的数据构建模型,大多数机器学习库(包括SciKit 阅读全文

posted @ 2019-07-15 21:18 喜欢世界的宇宙 阅读(2140) 评论(1) 推荐(0)

python学习07之总结图
摘要:1、各类图的作用 由于不总是很容易决定如何最好地讲述数据背后的故事,因此我们将图表类型分为三大类来帮助实现这一点。 1)、趋势类 趋势被定义为一种变化模式。 sns.lineplot-折线图最适合显示一段时间内的趋势,多条线可用于显示多个组中的趋势。 2)、关系类 我们可以使用许多不同的图表类型来理 阅读全文

posted @ 2019-07-14 20:40 喜欢世界的宇宙 阅读(270) 评论(0) 推荐(0)

python学习06之柱形图
摘要:1、加载并检查数据 2、创建柱形图 代码解析: 我们使用两个额外的信息自定义命令的行为: a=选择要绘制的列(在本例中,我们选择了“花瓣长度(cm)”)。 在创建直方图时,我们总是会提供kde=False,因为省略它会创建一个稍微不同的图。 3、创建密度图 这种类型的图是内核密度估计(KDE)图。如 阅读全文

posted @ 2019-07-14 20:17 喜欢世界的宇宙 阅读(565) 评论(0) 推荐(0)

re正则表达四
摘要:1、定义: 用来简洁表达一组字符串的表达式。 通用的字符串表达框架。 针对字符串表达简洁和特征思想的工具。 判断某字符串的特征归属。 2、作用 表达文本类型的特征(病毒,入侵等) 同时查找或替换一组字符串 匹配字符串的全部或部分。 3、使用 编译:将符合正则表达式语法的字符串转换成正则表达式特征。 阅读全文

posted @ 2019-07-13 20:56 喜欢世界的宇宙 阅读(187) 评论(0) 推荐(0)

python学习05之数据可视化
摘要:1、加载和检查数据 经过前几次的学习,现在简单的代码就不注释了 加载数据: 检查数据: 2、散点图 散点图的创建只需要一行代码就可以解决: 代码解析: 我们使用sns.scatterplot()创建一个简单的散点图,首先我们要确认X轴的列名和Y轴的列名,比如这里的 例如,为了了解吸烟是如何影响BMI 阅读全文

posted @ 2019-07-12 21:18 喜欢世界的宇宙 阅读(467) 评论(1) 推荐(0)

python学习04之柱形图和热图
摘要:1、加载数据 和折线图一样,我们首先都要将csv文件中的数据加载出来(代码是来自kaggle微教程中的) 你们可能会注意到,代码比我们在折线图中使用的代码略短。因为在本例中,由于行标签(来自“Month”列)不与日期对应,所以我们不在括号中添加parse_dates=True。 但是,我们像以前一样 阅读全文

posted @ 2019-07-12 20:15 喜欢世界的宇宙 阅读(631) 评论(0) 推荐(0)

python学习03之线图表
摘要:1.加载数据(这里的文件是我本人随便找的一个文件) 2.检查数据 3.图的数据(画不出折线图) 创建折线图以及读取文件中的数据 代码解析: sns.lineplot()是告诉笔记本要创建一个折线图,data=spotify_data是将文件中的数据传输给折线图 我们也可以对折线图增加一点细节的改动, 阅读全文

posted @ 2019-07-12 19:52 喜欢世界的宇宙 阅读(392) 评论(0) 推荐(0)

python的学习02之数据处理
摘要:1、选择建模数据 我们的数据集有太多的变量,很难处理,我们需要将这些海量的数据减少到我们能理解的程度。 我们肯定要选择变量的一列来进行分析,故我们需要查看数据集中所有列的列表名,这是通过数据框架的Columns属性完成的。 以之前的墨尔本房价为例 输出结果为: 2、选择数据子集的两种方法 1)、点表 阅读全文

posted @ 2019-07-07 22:01 喜欢世界的宇宙 阅读(225) 评论(0) 推荐(0)

python的学习01之csv文件处理
摘要:1、pandas的说明 pandas最重要的部分是DataFrame。DataFrame类似于Excel中的工作表或SQL数据库中的表。 pandas有强大的方法来处理大多数你想用这种数据做的事情。 例如,我们将查看澳大利亚墨尔本的房价数据。在实践练习中,您将对一个新的数据集应用相同的过程,该数据集 阅读全文

posted @ 2019-07-06 17:29 喜欢世界的宇宙 阅读(495) 评论(0) 推荐(0)

中国大学排名实例
摘要:1、功能描述: 输入:大学排名URL链接 输出:大学排名信息的屏幕输出(排名,大学名称,总分) 技术路线:requests-bs4 定向爬虫:因为它仅对输入URL进行爬取,不扩展爬取。 2、程序的结构设计: 步骤一:从网络上获取大学排名网页内容,getHTMLText() 步骤二:提取网页内容中信息 阅读全文

posted @ 2019-07-03 21:37 喜欢世界的宇宙 阅读(197) 评论(0) 推荐(0)

基于bs4库的HTML内容查找方法
摘要:1、<>,find_all(name,attrs,recursive,string,**kwargs) 返回一个列表类型,存储查找的结果 name:对标签名称的检索字符串。 attrs:对标签属性值得检索字符串,可标注属性检索。 recursive:是否对子孙全部检索,默认True string:< 阅读全文

posted @ 2019-07-01 21:27 喜欢世界的宇宙 阅读(1163) 评论(0) 推荐(0)

导航