上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 39 下一页
  2021年4月8日
摘要: 先上一张图 偏导数:表示固定面上一点的切线斜率 偏导数 f'x(x0,y0) 表示固定面上一点对 x 轴的切线斜率;偏导数 f'y(x0,y0) 表示固定面上一点对 y 轴的切线斜率。 高阶偏导数:如果二元函数 z=f(x,y) 的偏导数 f'x(x,y) 与 f'y(x,y) 仍然可导,那么这两个 阅读全文
posted @ 2021-04-08 19:36 小小喽啰 阅读(4365) 评论(0) 推荐(0) 编辑
  2021年4月7日
摘要: 数据挖掘提分三板斧: 1.金斧-数据清洗和特征工程 2.银斧-模型参数调节 3.铜斧-模型集成 数据清洗和特征工程 一、关于数据清洗 1.缺失值处理: 2.异常值处理: 3.数据分桶: 4.数据标准化:在不同的问题中,标准化的意义不同 (1)在回归预测中,标准化是为了让特征值有均等的权重; (2)在 阅读全文
posted @ 2021-04-07 10:15 小小喽啰 阅读(195) 评论(0) 推荐(0) 编辑
  2021年4月6日
摘要: 一、标签为数值变量 一般常见于回归相关的问题。 1.1类别变量+数值标签 关于类别变量与数值标签的关系,我们一般会观察下面的结果。 每个类别情况下对应的均值,这个可以直接使用pandas进行绘制; 均值反映的信息并不十分详细,如果希望得到更加具体的分布,可以使用boxplot进行绘制。 如果不同类别 阅读全文
posted @ 2021-04-06 18:30 小小喽啰 阅读(616) 评论(0) 推荐(0) 编辑
摘要: 数据来源:https://www.kaggle.com/usdot/flight-delays 该数据集完整数据量有500多万条航班记录数据,特征有31个 感觉这个数据不是很好,如果我们将ARRIVAL_DELAY作为y值,但是后面的空气系统延误,安全延误感觉又像是延误的原因,我们首先看一下数据怎么 阅读全文
posted @ 2021-04-06 15:50 小小喽啰 阅读(1322) 评论(1) 推荐(0) 编辑
  2021年4月1日
摘要: 文章转自:http://wh.bendibao.com/ditie/linemap.shtml # -*- coding: utf-8 -*- """ Created on Thu Apr 1 17:54:34 2021 @author: Administrator """ #!/usr/bin/e 阅读全文
posted @ 2021-04-01 19:00 小小喽啰 阅读(159) 评论(0) 推荐(0) 编辑
  2021年3月30日
摘要: 总结: 我们在建模时,总要做数据清洗,包括数值型和字符串型数据,下面就介绍16种str矢量化后处理字符串字段的函数 ① cat函数:用于字符串的拼接② contains:判断某个字符串是否包含给定字符③ startswith/endswith:判断某个字符串是否以…开头/结尾④ count:计算给定 阅读全文
posted @ 2021-03-30 15:11 小小喽啰 阅读(781) 评论(0) 推荐(0) 编辑
  2021年3月29日
摘要: 网上看到一个做EDA非常方便的模块pandas_profiling,使用该函数可以快速了解我们的数据构成以及分布,下面看看具体的实现 import seaborn as sns import pandas as pd import pandas_profiling import matplotlib 阅读全文
posted @ 2021-03-29 10:50 小小喽啰 阅读(392) 评论(0) 推荐(0) 编辑
摘要: 首先我们看看API以及官网教程: https://plotly.com/python-api-reference/plotly.express.html https://plotly.com/python/plotly-express/ https://www.jianshu.com/p/41735 阅读全文
posted @ 2021-03-29 09:55 小小喽啰 阅读(500) 评论(0) 推荐(0) 编辑
  2021年3月26日
摘要: 一、pd.read_html 参数 函数参数 pandas.read_html(io, match='.+', flavor=None, header=None, index_col=None, skiprows=None, attrs=None, parse_dates=False, thousa 阅读全文
posted @ 2021-03-26 18:12 小小喽啰 阅读(4097) 评论(0) 推荐(1) 编辑
  2021年3月15日
摘要: 1. 树该怎么长 很有意思的一个事是,我们从头到尾了解了xgboost如何优化、如何计算,但树到底长啥样,我们却一直没看到。很显然,一棵树的生成是由一个节点一分为二,然后不断分裂最终形成为整棵树。那么树怎么分裂的就成为了接下来我们要探讨的关键。对于一个叶子节点如何进行分裂,XGBoost作者在其原始 阅读全文
posted @ 2021-03-15 10:59 小小喽啰 阅读(312) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 39 下一页