04 2020 档案

摘要:[toc] —————————————————————————————————————————————————————— "原文:3.3. Metrics and scoring: quantifying the quality of predictions — scikit learn 0.22. 阅读全文
posted @ 2020-04-28 18:12 LgRun 阅读(199) 评论(0) 推荐(0) 编辑
摘要:[toc] —————————————————————————————————————————————————————————— "sklearn原文:超参数的优化" 穷举法网格搜索(GridSearchCV) 基本语法 _______________________________________ 阅读全文
posted @ 2020-04-27 18:48 LgRun 阅读(882) 评论(0) 推荐(0) 编辑
摘要:[toc] ———————————————————————————————————————————————— 主要内容: "Sklearn 22.0原文:交叉验证" ———————————————————————————————————————————————————— 交叉验证流程 划分数据集 h 阅读全文
posted @ 2020-04-26 18:32 LgRun 阅读(1244) 评论(0) 推荐(0) 编辑
摘要:[toc] ________________________________________ ____________________________________ "笔记:Preprocessing data — scikit learn 0.22.2 documentation " 标准化 h 阅读全文
posted @ 2020-04-25 17:21 LgRun 阅读(490) 评论(0) 推荐(0) 编辑
摘要:链接: 1.关联规则(Association Rules)原理分析及实例python实现 2.关联规则(Association Rules)学习 3.机器学习(十八)——关联规则挖掘该篇中介绍了幸运者偏差问题. 阅读全文
posted @ 2020-04-24 11:52 LgRun 阅读(198) 评论(0) 推荐(0) 编辑
摘要:[toc] 主要算法 ID3 算法 核心思路:在决策树各个结点上应用信息增益准则选择特征,递归地构建决策树。 具体方法:(1)从根结点(root node)开始,对结点计算所有可能的特征的信息增益,然后选择信息增益最大的特征作为结点的特征,并由该特征的不同取值建立子结点;(2)再对子结点递归地调用以 阅读全文
posted @ 2020-04-24 11:16 LgRun 阅读(2365) 评论(0) 推荐(0) 编辑
摘要:决策树基本知识概览 基于特征的数据集划分指标 指标定义 信息增益 划分数据集的大原则是将无序的数据变得更加有序。 定义1:将划分前后信息发生的变化称为信息增益,且信息增益最高的特征就是最好的(特征)选择。 定义2:符号x信息的定义:l(x)=log2p(x),p(x)是选择该类的概率. 定 阅读全文
posted @ 2020-04-23 21:21 LgRun 阅读(376) 评论(0) 推荐(0) 编辑
摘要:问题背景 Py数:Py从小喜欢奇特的东西,而且天生对数字特别敏感,一次偶然的机会,他发现了一个有趣的四位数2992, 这个数,它的十进制数表示,其四位数字之和为2+9+9+2=22,它的十六进制数BB0,其四位数字之和也为22, 同时它的十二进制数表示1894,其四位数字之和也为22,啊哈,真是巧啊 阅读全文
posted @ 2020-04-22 16:22 LgRun 阅读(1161) 评论(0) 推荐(0) 编辑
摘要:题目 题目:银行在打印票据的时候,常常需要将阿拉伯数字表示的人民币金额转换为大写表示,现在请你来完成这样一个程序。 题目来源 思路 核心思想:递归 具体过程如下: 首先题目已经告诉需要转换的数字为整数,所以只需要考虑正负号即可; 构建数字:对应的中文货币字典(人民币中文符号:零壹贰叁肆伍陆柒捌玖拾佰 阅读全文
posted @ 2020-04-22 13:50 LgRun 阅读(216) 评论(0) 推荐(0) 编辑
摘要:1. 标题,使用 号可表示1 6级标题 2. 换行 3. 分割线 ———————————————————————————————————————————————————— 4. 删除线 前后加 ,如: ,显示:~~AB~~. 5. 下划线 下划线 6. 脚注 这是一个脚注 [^1]。 [^1]:整个 阅读全文
posted @ 2020-04-21 22:57 LgRun 阅读(291) 评论(1) 推荐(0) 编辑
摘要:基础知识梳理: 实现 import matplotlib.pyplot as plt import numpy as np import operator #已知分类的数据 x_data=np.array([[3,104], [2,100], [1,8], [101,10], [99,5], [81 阅读全文
posted @ 2020-04-21 21:39 LgRun 阅读(220) 评论(0) 推荐(0) 编辑
摘要:万丈高楼从地起 字典的创建. 字典的相关属性,常用的有 其他的可以通过 (万能助手) 关于键值的更新. 用 来更新键值,如果字典中没有出现要添加的新键值对,它会直接扩充原有的字典;但是,如果原有的字典中,已经存在该键值对的键,只是键值不一样,就会用当前新的键值覆盖掉原来的。 有时候更新的结果是将键值 阅读全文
posted @ 2020-04-03 17:58 LgRun 阅读(182) 评论(0) 推荐(0) 编辑
摘要:python中的axis=0和1代表什么 之前一直很疑惑axis=0和axis=1到底什么时候代表按行操作、什么时候是按列操作。记得在R中也有类似的问题(0代表行、1代表列)。 在( "caiqingfei" )的博客中提到: axis=0:表示沿着每一列或者行标签\索引值向下执行方法(垂直方向) 阅读全文
posted @ 2020-04-03 17:53 LgRun 阅读(1895) 评论(0) 推荐(0) 编辑
摘要:[toc] 3D画图 首先需要导入 ,然后利用 生成三维网格, 用来生成三维立体图形; 生成等高线; 为等高线填充背景;如果值只是单个图,可以使用以下命令: "柱状图" 的生成 这是神经网络中观察隐藏层数据分布的柱状图表示。 其中关于作图最重要的是: 有序字典 python中的字典(按照hash来存 阅读全文
posted @ 2020-04-03 17:49 LgRun 阅读(185) 评论(0) 推荐(0) 编辑
摘要:初次接触《机器学习》,只是为了寻求一种解决问题的捷径(如建模),由此带来的一连串行为:找软件、找程序包(自己徒手码,是个奇迹),找不到,就换"阵地"。虽然在当时可以解决问题,但是频繁地使用,其中不可言喻的遗憾和失望也日益强烈。之前看于剑博士书的时候,有人说,这本书是正儿八经的胡扯,什么都可以用公式或 阅读全文
posted @ 2020-04-03 17:46 LgRun 阅读(315) 评论(0) 推荐(0) 编辑
摘要:该爬虫用来实现指定关键词 以及特定时间区间的搜狗微信搜索_订阅号及文章内容的爬取.如果没有记错的话,未登录情况下,只能翻10页,想要更多,则需要基于selenium利用cookies实现模拟登录. 声明:本程序仅用于学习交流,请勿恶意使用!!! 完整程序 # -*- coding: utf-8 -* 阅读全文
posted @ 2020-04-03 17:31 LgRun 阅读(172) 评论(0) 推荐(0) 编辑
摘要:用selenium+requests进行央视网新闻抓取的时候,会出现搜索页面无法跳转的情况。 爬虫设计的思路: 爬虫在新闻搜索页面无法跳转: 可以通过: 多了一个,说明搜索成功了,只是没有跳转. 通常可以通过以下方法解决: 本文主要采用后者来解决search()的跳转问题。代码如下: 第一种:将关键 阅读全文
posted @ 2020-04-03 17:29 LgRun 阅读(579) 评论(0) 推荐(0) 编辑
摘要:网页信息提取常用的python工具包括正则表达式、CSS以及xpath. [toc] 正则表达式 叶落阁 的 "正则表达式总结" ; 以及正则表达式的 "在线测试工具" Xpath( "教程" ) XML中的节点关系包括:父(parent)、子(children)、同胞(sibling)、先辈(an 阅读全文
posted @ 2020-04-03 17:27 LgRun 阅读(431) 评论(0) 推荐(0) 编辑
摘要:中位数的数学定义 中位数的定义如下图所示: 在oracle数据查询中,当N为偶数时,一般不取平均值,因为这有可能创建出新的样例使得查询语句为空,所以通常为偶数时,一般返回最中间的一组数据。 oracle中位数查询 1.求解思路 目前常见的求解主要包括以下两种思路: 1)从数值角度出发; 先按照目标列 阅读全文
posted @ 2020-04-03 17:26 LgRun 阅读(3361) 评论(0) 推荐(0) 编辑
摘要:[toc] 函数 创建函数 查看 的基本信息 函数地定义也被存储在用户字典中,通过 进行查看 查看函数的返回值 同样,一旦函数被创建,可以像其他函数一样使用该函数; 当函数有参数传入时,参数列表必须用小括号括起来,没有参数时可以省略;当函数没有小括号时,在形式上和变量相同,那么就有可能产生变量冲突。 阅读全文
posted @ 2020-04-03 17:17 LgRun 阅读(255) 评论(0) 推荐(0) 编辑
摘要:[toc] 对象视图 Oracle中的对象任然是一个逻辑概念,虽然可以从对象中获得数据,如同数据以对象形式 存储一样。但是在对象的概念下,数据任然是存储与关系表中。 创建对象,首先要建立对象类型。 利用基础对象类型employee来创建对象视图 ov_employee标识了新视图的名称,ov表示前缀 阅读全文
posted @ 2020-04-03 17:16 LgRun 阅读(184) 评论(0) 推荐(0) 编辑
摘要:笔记 阅读全文
posted @ 2020-04-03 17:15 LgRun 阅读(104) 评论(0) 推荐(0) 编辑
摘要:问题背景 1321. 餐馆营业额变化增长 - 力扣(LeetCode) 实现思路: (1) 首先找到对应的7天之末的终点,分别是2019-01-07,2019-01-08,2019-01-09,2019-01-10. 在Oracle中可以通过lead函数实现上述效果.但是需要考虑的两种情况: 时间序 阅读全文
posted @ 2020-04-03 17:14 LgRun 阅读(419) 评论(0) 推荐(0) 编辑
摘要:"用户购买平台案例" ,涉及时间型数据.个人第一眼感觉特别简单,但是当深入处理是难成狗了.虽然在测试样例中的结果中通过,但是在最终提交过程中,却显示 .唉,还得优化呀!本文就是关于这个问题的分析和总结. [toc] 问题分析 问题及要求 要求:写一段 SQL 来查找每天 仅 使用手机端用户、仅 使用 阅读全文
posted @ 2020-04-03 17:13 LgRun 阅读(186) 评论(0) 推荐(0) 编辑
摘要:刷题过程中,受时间数据所困.为此,整理出以下关于时间操作的基本知识点,受益匪浅.真香,原来还可以这么搞⛏!!! [toc] 日期函数 系统时间: 无参数 (默认格式: ) 的加减 其它: "ORACLE时间函数(SYSDATE)深入理解 " 时间戳: 时间戳与 型数据之间的关系 日期操作 1. 函数 阅读全文
posted @ 2020-04-03 17:06 LgRun 阅读(323) 评论(0) 推荐(0) 编辑
摘要:初学oracle时,关于排序问题经常使用order by或者使用rownum进行分页,但是在TopN(N>2)时上述方法使用不是特别方便。在刷题过程中了解并学习了row_number,dense_rank,rank等函数,以下是对这几个问题的简单整理。 基础介绍 1. 基本用法 基本用法: row_ 阅读全文
posted @ 2020-04-03 17:04 LgRun 阅读(790) 评论(0) 推荐(0) 编辑
摘要:[Toc] 1. 字符和日期型数据应包含在单引号中 2. 子查询 3. 找出和经理一样工资的员工信息(经理不止一个,且工资不同) 4. 上述问题的等价形式 5. 返回部门最高的平均工资 6.查询出每个部门的编号、名称、位置、部门人数、平均工资 7. 查询行号 8. 分页 9.要求查询出每一位雇员的姓 阅读全文
posted @ 2020-04-03 17:02 LgRun 阅读(96) 评论(0) 推荐(0) 编辑
摘要:oracle学习笔记: "循环、光标、异常" [toc] 打印Hello World 第一案例:打印Hello World PLSQL是对SQL的扩展 定义基本变量 类型: 举例: 引用型变量(单行) 案例 记录型变量(多行) 记录型变量分量的赋值,emp_rec.ename:='ADAMS'; 面 阅读全文
posted @ 2020-04-03 17:01 LgRun 阅读(215) 评论(0) 推荐(0) 编辑
摘要:oracle:oracle基础知识(三): "存储过程、函数笔记,赵强老师" 对于视频中涉及java部分的章节省略; [Toc] 存储过程、存储函数 指存储在数据库中供所有用户过程调用的子程序叫存储过程、存储函数。 共同点:完成特定功能的程序 区别:是否用return 语句返回值 存储过程基本语法 阅读全文
posted @ 2020-04-03 16:59 LgRun 阅读(140) 评论(0) 推荐(0) 编辑
摘要:oracle基础知识(二)笔记: "高级查询" [toc] 分组查询 分组函数:avg,sum,min,max,count,wm_concat(行转列) 多个列的分组 抽象: 多属性分组语法: 案例: 过滤查询 where 和having 的区别: 不能在where子句中使用分组函数; 可以在hav 阅读全文
posted @ 2020-04-03 16:55 LgRun 阅读(199) 评论(0) 推荐(0) 编辑
摘要:oracle基础入门学习笔记: "视频链接" [toc] 数据库登录角色及表结构 1. 用户名称 系统用户:sys,sytem sysman:企业管理级 scott: tiger 权限顺序: 2. 用户登录 表空间 | 表空间分类 |描述 | | | | | 永久表空间 |表、视图、存储过程... 阅读全文
posted @ 2020-04-03 16:54 LgRun 阅读(188) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示