会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
仰望星空-脚踏实地
人所有的痛苦都是源于对自己无能的愤怒
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
7
···
10
下一页
2020年6月10日
贝叶斯-使用贝叶斯实现拼写检查器
摘要: 基于贝叶斯实现拼写检查器 简单,容易,效果好 贝叶斯是一种常见的分类算法,通过先验概率和估计实现后验概率的计算 难点主要是,在单词错误的情况下,估计正确的单词的概率 难点是通过键盘距离可以评估出在输入正确的情况下,输错的概率分布 import re, collections # 求解 argmax
阅读全文
posted @ 2020-06-10 10:45 心远志高
阅读(415)
评论(0)
推荐(0)
编辑
2020年6月9日
泰坦尼克求胜率预测-基于随机森林实现
摘要: 泰坦尼克是一个经典的机器学习数据集,通过决策树对特征进行筛选,获得较大的特征 import pandas as pd pd.set_option('display.max_columns', None) #显示完整的列 # pd.set_option('display.max_rows', None
阅读全文
posted @ 2020-06-09 17:46 心远志高
阅读(365)
评论(0)
推荐(0)
编辑
决策树算法-Python实现
摘要: 决策树比较常用的算法模型,可以做分类也可以回归 决策树算法重点 对特征的选择,可以使用熵,也可以使用基尼系数,通过信息增益或者信息增益率选择最好的特征 决策树的剪枝,有两种策略,一种是预剪枝,一种是后剪枝,预剪枝可以通过限制树的高度,叶子节点个数,信息增益等进行,使得树边建立边剪枝,后剪枝通过增加损
阅读全文
posted @ 2020-06-09 11:09 心远志高
阅读(1128)
评论(0)
推荐(0)
编辑
2020年6月8日
SQL_牛客网60题
摘要: 1.查找最晚入职员工的所有信息,为了减轻入门难度,目前所有的数据里员工入职的日期都不是同一天 SELECT * FROM employees ORDER BY hire_date DESC LIMIT 1 2.查找入职员工时间排名倒数第三的员工所有信息,为了减轻入门难度,目前所有的数据里员工入职的日
阅读全文
posted @ 2020-06-08 18:05 心远志高
阅读(391)
评论(0)
推荐(0)
编辑
信用卡欺诈模型-逻辑回归
摘要: 信用卡欺诈的模型 难点: 数据不均衡,有两种解决方案,一种是过采样和一种是下采样 过采样是对多的数据进行筛选,使得两种数据数量相同 下采样,通过对少的数据进行数据生成,使得两种数据数量相同 import pandas as pd import matplotlib.pyplot as plt imp
阅读全文
posted @ 2020-06-08 11:10 心远志高
阅读(531)
评论(0)
推荐(0)
编辑
用python实习逻辑回归
摘要: 建立一个逻辑回归模型来预测一个学生是否被大学录取 # 三大件 import numpy as np import pandas as pd import matplotlib.pyplot as plt import os path = 'data' + os.sep + 'LogiReg_data
阅读全文
posted @ 2020-06-08 10:21 心远志高
阅读(201)
评论(0)
推荐(0)
编辑
2020年6月5日
SQL必会50题
摘要: 根据知乎进行练习, 有些还是有点难度 链接https://zhuanlan.zhihu.com/p/43289968 -- 1.查询课程编号为“01”的课程比“02”的课程成绩高的所有学生的学号(重点) USE sql_test; SELECT a.s_id, a.s_score AS '01',
阅读全文
posted @ 2020-06-05 14:51 心远志高
阅读(563)
评论(0)
推荐(0)
编辑
SQL面试必会50题-训练数据
摘要: 根据知乎面试必会50题进行练习, 这是本次的数据集 https://zhuanlan.zhihu.com/p/43289968 -- 建表 -- 学生表 CREATE DATABASE sql_test; USE sql_test; CREATE TABLE `Student`( `s_id` VA
阅读全文
posted @ 2020-06-05 14:49 心远志高
阅读(461)
评论(0)
推荐(0)
编辑
Seaborn可视化常见操作
摘要: 主要是Seaborn常见的操作 Seaborn 基础用法 import seaborn as sns import numpy as np import matplotlib.pyplot as plt def sinplot(flip=1): x = np.linspace(0, 14, 100)
阅读全文
posted @ 2020-06-05 14:46 心远志高
阅读(447)
评论(0)
推荐(0)
编辑
可视化-Matplotlib的常见用法
摘要: Matplotlib常见的用法 import pandas as pd import numpy as np unrate = pd.read_csv('UNRATE.csv') unrate['DATE'] = pd.to_datetime(unrate['DATE']) print(unrate
阅读全文
posted @ 2020-06-05 09:06 心远志高
阅读(235)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
7
···
10
下一页
公告