摘要: 广义线性模型(GLMs)扩展了普通线性回归模型,可以分析非正态分布的结果变量以及相应均值的函数。假设第i个观察是一个期望值为的随机变量的实现。当用线性模型来学习随机变量Y的时候,我们指明它的期望是K个未知参数以及自变量的线性组合: 这是一个线性回归模型,为了创建一个更加通用的模型,我们引入变量,与的 阅读全文
posted @ 2019-02-16 19:20 数据之魂 阅读(727) 评论(0) 推荐(0) 编辑
摘要: 在回归问题中,我们通过构建一个关于x的模型来预测y。这种问题通常可以利用线性回归(Linear Regression)来解决。 模型的目标值y是输入变量x的线性组合。表达形式为: 其中hat{y} 是预测值,向量w = (w_0,...,w_p)为模型参数,w_0为截距项,w_1...w_p为成员系 阅读全文
posted @ 2019-01-25 00:59 数据之魂 阅读(504) 评论(0) 推荐(0) 编辑
摘要: 爬虫成长之路(一)里我们介绍了如何爬取证券之星网站上所有A股数据,主要涉及网页获取和页面解析的知识。爬虫成长之路(二)里我们介绍了如何获取代理IP并验证,涉及了多线程编程和数据存储的知识。此次我们将在前两节的基础上,对证券之星全站的行情数据进行爬取。第一节的思路爬一个栏目的数据尚可,爬上百个栏目的数 阅读全文
posted @ 2018-06-20 00:11 数据之魂 阅读(1496) 评论(1) 推荐(1) 编辑
摘要: 权限是执行特殊SQL语句的权利。数据库管理员 (DBA) 是一个具有授予用户访问数据库及其对象的能力的高级用户。用户需要系统权限来访问数据库,需要对象权限来操纵数据库中对象的内容。用户也可以将被授予的权限给其它用户或者角色,角色是相关权限的命名分组。方案是对象的集合,例如,视图和序列的集合。方案被数 阅读全文
posted @ 2017-07-29 20:15 数据之魂 阅读(1192) 评论(0) 推荐(0) 编辑
摘要: 许多应用程序要求使用唯一的数字作为主键的值,你即可以在应用程序中构建代码来处理这种需求,也可以用一个序列来产生唯一的数字。如果你想要增进某些查询的性能,你应该考虑创建一个索引,你也可以用索引在列或列的集合上强制唯一性。你可以用同义词为对象提供可替代的名字。下面我们来介绍序列、索引和同义词三个数据库对 阅读全文
posted @ 2017-06-28 21:07 数据之魂 阅读(623) 评论(0) 推荐(0) 编辑
摘要: 数据定义语言 (Data Definition Language, DDL) 是SQL语言集中负责数据结构定义与数据库对象定义的语言,由CREATE、ALTER与DROP三个语法所组成。数据库对象包括表、视图、索引、同义词、序列等(TABLE/VIEW/INDEX/SYN/SEQUENCE)。我们先 阅读全文
posted @ 2017-05-01 00:01 数据之魂 阅读(1382) 评论(0) 推荐(0) 编辑
摘要: 数据操纵语言,Data manipulation language,检称DML,主要包括检索(SELECT)、插入(INSERT)、更新(UPDATE)、删除(DELETE),是SQL的一个核心部分。一条DML将开始一个事务,接下来的DML都是同一事务中的语句,直到提交(COMMIT)或回滚(ROL 阅读全文
posted @ 2017-03-31 18:17 数据之魂 阅读(1831) 评论(0) 推荐(0) 编辑
摘要: 为了从数据库中查询数据,你需要用SQL语言中使用最多的SELECT语句。我们分别介绍SELECT语句的基础语法、子查询、从多表中查询数据,然后再进行实例解析。 一、SELECT语句的基础语法 SELECT语句就像叠加在数据库表上的过滤器,即选择查询用于定位数据库特定的列和行。下面是SELECT语句的 阅读全文
posted @ 2017-03-26 15:21 数据之魂 阅读(956) 评论(0) 推荐(0) 编辑
摘要: SQL全称Structure Quety Language,是数据库的核心语言,共分为三大类:数据操纵语言DML,数据定义语言DDL,数据控制语言DCL。 一、数据操纵语言 数据操纵语言DML主要分为四种形式: 1.INSERT:插入 2.UPDATE:更新 3.DELETE:删除 4.SELECT 阅读全文
posted @ 2017-02-25 23:34 数据之魂 阅读(657) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2016-12-31 14:45 数据之魂 阅读(252) 评论(0) 推荐(0) 编辑