摘要:
逻辑回归又称logistic回归,逻辑斯谛回归,是一种广义的线性回归分析模型。 1. Sigmod函数 Sigmoid函数也是神经网络中常用的函数,用于把x从负无穷到正无穷压缩到y从0到1之间。画出来就是一条S型曲线,如下图中的蓝色曲线: 它以0点为中心... 阅读全文
摘要:
1. 说明 当我们的训练数据非常多,并且还在不断增加时,每次都用全量训练,数据过多,时间过长,此时就可以使用增量训练:用新增的数据微调校正模型。 2. 全量与增量的差异 在使用增量训练时,最关心的问题是:全量和增量的差别,从而确定增量训练的使用场景。 假... 阅读全文
摘要:
1. 调试test目录下的测试用例 在测试程序后面加入以下代码,即可启动调试程序 if __name__ == "__main__": unittest.main() 2. 显示树结构 import matplotlib.pyplot as plt f... 阅读全文
摘要:
1. 命令行使用pdb (1) 我们先写个简单的python程序a.py如下: for i in range(0,3): print(i) print("@@@@") print("###") (2) 用pdb调试 $ pdb a.py #... 阅读全文
摘要:
1. 说明: 难了不会,会了不难,你明白了,觉得这还用说?不明白,跳步之后,似懂非懂。本篇是我对论文《XGBoost: A Scalable Tree Boosting System》的阅读笔记,用大白话解释xgboost原理,学霸请跳过,懒得看公式的也请跳... 阅读全文
摘要:
1. 说明 本篇来读读Xgboost源码。其核心代码基本在src目录下,由C++实现,40几个cc文件,代码11000多行,虽然不算太多,但想把核心代码都读明白,也需要很长时间。 我觉得阅读的目的主要是:了解基本原理,流程,核心代码的位置,修改从哪儿入手,而... 阅读全文
摘要:
1. 说明 今天讨论的是自然语言中的知识抽取和知识表示,换言之,就是如何从大量的书籍文献中剥离出我们关心的所谓“知识”,并将起组织保存成简单可用的描述。 不同的知识类型需要采用不同的知识表示方式,温有奎教授总结了10种知识类型 (具体见参考部分) 。对于静... 阅读全文
摘要:
1. 说明 本文并非介绍某个成熟算法或者工具,只是个人的一点感悟,写得可能不正确,不全面,希望能给大家带来一些启发,也欢迎各位回复讨论。 2. 特征工程 大数据相关的工作可简要地归纳为:模型部分和数据部分,在模型部分,目前大家的做法主要是拿现成的模型来用,... 阅读全文
摘要:
1. 说明 先来看一个应用场景: 我写了一段功能性的程序(可能是Java的,也可能是Python的),供他人调用(调我程序可能是其它编程语言,或者直接运行,如果调用者对我使用的工具不熟悉,直接调用可能很麻烦),这个程序需要传入多个参数,需要结构化的输出,我... 阅读全文
摘要:
1. 什么是SOAP协议 SOAP 是一种简单的基于 XML 的协议,它底层通过 HTTP 来交换信息。SOAP的优点是可以传递结构化的数据。 客户生成的SOAP请求会被嵌入在一个HTTP POST请求中,发送到Web服务器。Web服务器再把这些请求转发给... 阅读全文