banshaohuan

[置顶] sklearn中的数据预处理和特征工程

摘要： sklearn中的数据预处理和特征工程 1 概述 1.1 数据预处理与特征工程想象一下未来美好的一天，你学完了 sklearn，成为一个精通各种算法和调参调库的数据挖掘工程师了。某一天你从你的同事，一位药物研究人员那里，得到了一份病人临床表现的数据。药物研究人员用前四列数据预测一下最后一数据，还说阅读全文

posted @ 2020-04-17 22:54 banshaohuan 阅读(904) 评论(0) 推荐(0)

[置顶] 博客园复制他人博客的样式

摘要：博客园复制他人博客的样式博客园是支持自定义页面样式的。在博客设置中 “页面定制 CSS 代码” 中添加自己的 CSS 代码即可改变样式。自已定义 CSS 代码要求博主能够熟练掌握 CSS ，条件比较苛刻。有没有简单点的方法呢？比如我们在阅览的时候看到一个博主的页面非常美观，想直接借用，这有办法阅读全文

posted @ 2018-10-18 11:17 banshaohuan 阅读(1959) 评论(11) 推荐(3)

2021年3月8日

Anki 导入含代码 Markdown 文档

摘要： 1 安装所需要的插件在 Anki 电脑端点击「工具」-「添加附加组件」或者使用快捷键 Ctrl+Shift+A打开，点击「获取插件」-「浏览插件」会跳转到插件库网页端。这里需要用到的插件有： Evernote Importer 代码：831016260 Markdown and KaTeX Su 阅读全文

posted @ 2021-03-08 14:54 banshaohuan 阅读(1207) 评论(0) 推荐(0)

2020年12月29日

阿里 SQL 代码编码原则和规范

摘要：阿里 SQL 代码编码原则和规范编码原则 SQL 代码的编码原则如下：代码功能完善。代码行清晰、整齐，代码行的整体层次分明、结构化强。代码编写充分考虑执行速度最优的原则。代码中需要添加必要的注释，以增强代码的可读性。规范要求并非强制性约束开发人员的代码编写行为。实际应用中，在不违反常规要阅读全文

posted @ 2020-12-29 22:28 banshaohuan 阅读(917) 评论(0) 推荐(0)

2020年9月18日

取消numpy数组默认以科学计数法显示

摘要： import numpy as np '''只要设置这句代码就可以了''' np.set_printoptions(suppress=True) 阅读全文

posted @ 2020-09-18 10:11 banshaohuan 阅读(1037) 评论(0) 推荐(0)

2020年9月11日

解决 jupyter labextension install 报错

摘要：解决 jupyter labextension install 报错 Jupyter Lab 插件安装 # 查询安装的扩展 jupyter labextension list # 命令行安装对应的扩展 jupyter labextension install @jupyterlab/git jupy 阅读全文

posted @ 2020-09-11 15:51 banshaohuan 阅读(7464) 评论(2) 推荐(1)

2020年8月28日

设置df.head方法显示多列或者显示全部

摘要：设置df.head方法显示多列或者显示全部在读取 csv 数据之后第一件事往往是调用 head 函数看看数据大致情况，有时候会碰到数据列显示不全的情况，下面是解决方法。 import pandas as pd # 设置显示10列 pd.set_option('display.max_columns 阅读全文

posted @ 2020-08-28 15:44 banshaohuan 阅读(4819) 评论(0) 推荐(0)

2020年8月27日

用 pandas 画散点图矩阵

摘要：用 pandas 画散点图矩阵散点图矩阵就是将所有特征两两结合，画出他们的散点图。用到的方法： pd.plotting.scatter_matrix() 以鸢尾花数据集为例（在 Jupyter lab 中运行）： from sklearn.datasets import load_iris im 阅读全文

posted @ 2020-08-27 20:51 banshaohuan 阅读(1647) 评论(0) 推荐(1)

matplotlib 图片坐标负号不显示解决办法

摘要：在画图之前加上下面的代码即可 from pylab import mpl mpl.rcParams['axes.unicode_minus']=False 阅读全文

posted @ 2020-08-27 20:34 banshaohuan 阅读(613) 评论(0) 推荐(0)

2020年6月21日

爬取彼岸壁纸

摘要：看到论坛上有人发，自己跟着敲了遍代码，有些地方进行了改动，学习了。 # -*- coding: utf-8 -*- # @Time : 2020/6/17 18:24 # @Author : banshaohuan # @Site : # @File : bizhi.py # @Software: 阅读全文

posted @ 2020-06-21 17:25 banshaohuan 阅读(438) 评论(0) 推荐(0)

爬取并下载「旧时光文学」小说

摘要：爬取小说全部章节，所以要在小说目录页进行爬取。只是涉及到文字，所以用 Xpath 解析。 # -*- coding: utf-8 -*- # @Time : 2020/6/21 11:09 # @Author : banshaohuan # @Site : # @File : pa_xiaoshuo 阅读全文

posted @ 2020-06-21 14:58 banshaohuan 阅读(2050) 评论(0) 推荐(0)

2020年6月17日

爬取B站up主相册原图

摘要：爬取B站up主相册原图从 Network 选项中找到 api 链接。从 Preview 选项中一层一层地剥，直到找到真实的图片链接地址。下载的图片可以达到 12MB，下载的是原图。源码： # -*- coding: utf-8 -*- # @Time : 2020/6/17 20:54 # 阅读全文

posted @ 2020-06-17 21:57 banshaohuan 阅读(1439) 评论(1) 推荐(1)

公告