会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
小小喽啰
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
3
4
5
6
7
8
9
10
11
···
39
下一页
2021年4月8日
偏导数
摘要: 先上一张图 偏导数:表示固定面上一点的切线斜率 偏导数 f'x(x0,y0) 表示固定面上一点对 x 轴的切线斜率;偏导数 f'y(x0,y0) 表示固定面上一点对 y 轴的切线斜率。 高阶偏导数:如果二元函数 z=f(x,y) 的偏导数 f'x(x,y) 与 f'y(x,y) 仍然可导,那么这两个
阅读全文
posted @ 2021-04-08 19:36 小小喽啰
阅读(4365)
评论(0)
推荐(0)
编辑
2021年4月7日
数据挖掘提分三板斧-转
摘要: 数据挖掘提分三板斧: 1.金斧-数据清洗和特征工程 2.银斧-模型参数调节 3.铜斧-模型集成 数据清洗和特征工程 一、关于数据清洗 1.缺失值处理: 2.异常值处理: 3.数据分桶: 4.数据标准化:在不同的问题中,标准化的意义不同 (1)在回归预测中,标准化是为了让特征值有均等的权重; (2)在
阅读全文
posted @ 2021-04-07 10:15 小小喽啰
阅读(195)
评论(0)
推荐(0)
编辑
2021年4月6日
特征变量和y值的可视化
摘要: 一、标签为数值变量 一般常见于回归相关的问题。 1.1类别变量+数值标签 关于类别变量与数值标签的关系,我们一般会观察下面的结果。 每个类别情况下对应的均值,这个可以直接使用pandas进行绘制; 均值反映的信息并不十分详细,如果希望得到更加具体的分布,可以使用boxplot进行绘制。 如果不同类别
阅读全文
posted @ 2021-04-06 18:30 小小喽啰
阅读(616)
评论(0)
推荐(0)
编辑
kaggle 2015年航班延误
摘要: 数据来源:https://www.kaggle.com/usdot/flight-delays 该数据集完整数据量有500多万条航班记录数据,特征有31个 感觉这个数据不是很好,如果我们将ARRIVAL_DELAY作为y值,但是后面的空气系统延误,安全延误感觉又像是延误的原因,我们首先看一下数据怎么
阅读全文
posted @ 2021-04-06 15:50 小小喽啰
阅读(1322)
评论(1)
推荐(0)
编辑
2021年4月1日
基于Dijkstra算法的武汉地铁路径规划(转)
摘要: 文章转自:http://wh.bendibao.com/ditie/linemap.shtml # -*- coding: utf-8 -*- """ Created on Thu Apr 1 17:54:34 2021 @author: Administrator """ #!/usr/bin/e
阅读全文
posted @ 2021-04-01 19:00 小小喽啰
阅读(159)
评论(0)
推荐(0)
编辑
2021年3月30日
pandas的str矢量化字符串处理
摘要: 总结: 我们在建模时,总要做数据清洗,包括数值型和字符串型数据,下面就介绍16种str矢量化后处理字符串字段的函数 ① cat函数:用于字符串的拼接② contains:判断某个字符串是否包含给定字符③ startswith/endswith:判断某个字符串是否以…开头/结尾④ count:计算给定
阅读全文
posted @ 2021-03-30 15:11 小小喽啰
阅读(781)
评论(0)
推荐(0)
编辑
2021年3月29日
pandas_profiling 探索性数据分析(EDA)工具
摘要: 网上看到一个做EDA非常方便的模块pandas_profiling,使用该函数可以快速了解我们的数据构成以及分布,下面看看具体的实现 import seaborn as sns import pandas as pd import pandas_profiling import matplotlib
阅读全文
posted @ 2021-03-29 10:50 小小喽啰
阅读(392)
评论(0)
推荐(0)
编辑
plotly.express可视化神器详解
摘要: 首先我们看看API以及官网教程: https://plotly.com/python-api-reference/plotly.express.html https://plotly.com/python/plotly-express/ https://www.jianshu.com/p/41735
阅读全文
posted @ 2021-03-29 09:55 小小喽啰
阅读(500)
评论(0)
推荐(0)
编辑
2021年3月26日
pd.read_html 获取网页上的表格数据
摘要: 一、pd.read_html 参数 函数参数 pandas.read_html(io, match='.+', flavor=None, header=None, index_col=None, skiprows=None, attrs=None, parse_dates=False, thousa
阅读全文
posted @ 2021-03-26 18:12 小小喽啰
阅读(4097)
评论(0)
推荐(1)
编辑
2021年3月15日
xgboost 原理补充说明
摘要: 1. 树该怎么长 很有意思的一个事是,我们从头到尾了解了xgboost如何优化、如何计算,但树到底长啥样,我们却一直没看到。很显然,一棵树的生成是由一个节点一分为二,然后不断分裂最终形成为整棵树。那么树怎么分裂的就成为了接下来我们要探讨的关键。对于一个叶子节点如何进行分裂,XGBoost作者在其原始
阅读全文
posted @ 2021-03-15 10:59 小小喽啰
阅读(312)
评论(0)
推荐(0)
编辑
上一页
1
···
3
4
5
6
7
8
9
10
11
···
39
下一页