摘要:
关于决策树 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据 缺点:可能会产生过度匹配问题 适用数据类型:数值型和标称型 ID3 ID3的决策树中主要使用了香农熵的概念,熵表示了数据的混乱程度,熵的值越大表示混乱程度越大 熵的计算公式为 H = -∑p(xi)lo 阅读全文
摘要:
中间会把文件指针重新置到文件开始,要配合clear一起使用 阅读全文
摘要:
k邻近算法(k-nearest neighbors)是一种懒惰算法,不需要进行训练,每次对一个新的未知的数据,对所有已知的数据求欧氏距离,在小于一定距离x之内的样本进行级数,计数最多的就认为未知数据的分类。 KNN的复杂度很高,每次需要遍历所有的数据,并且将每一纬度都进行计算,而且距离x选取的不同会 阅读全文
摘要:
先存两篇觉得不错的矩阵求导链接,传送门,传送门 一般所指的向量都是列向量,x‘表示行向量(‘表示矩阵的转置,不是求导) 向量的內积后得到的是实数,a = tr(a) (tr表示矩阵的迹) 矩阵通过简单变换后(化为上三角或者下三角矩阵)非0行或者非0列的数量叫做矩阵的秩。n阶可逆矩阵的秩是n,可逆矩阵 阅读全文
摘要:
mat函数 mat可以创建一个矩阵 zeros函数 zeros函数是生成制定维数全0的数组 ones函数 ones函数用于生成一个全1的数组 eye函数 eye函数用于生成一个单位矩阵(对角线上全1) 。T方法 .T方法用于求一个矩阵的转置矩阵 tolist函数 tolist函数可以让一个mat矩阵 阅读全文
摘要:
求解线性回归我所知道的方法有两种,一种是使用梯度下降法,另一种是相当于对方程直接求导,找到最值点,这种方法比较适用与特征量较少的情况。然后直接求出所有的参数 先写好X向量以及W向量,那么答案u = XT * W,然后问题被转化为找到一个最小的Cost,(Cost表示真实值Y与预测值之间的差) 这里的 阅读全文
摘要:
这里有一篇写的很好的博客,单调我自己在手动实践的时候遇到了一些问题 (没有连接数据库,好像代码有点跑不起来,目前只简单的试了一下4个窗体) 这一步的设置是在属性的地方进行设置的,单机事件可以双击从工具栏上拉下来的东西,这样就自动创建click函数,并且声称参照 这一步的操作的确网上没有很多的资料,可 阅读全文
摘要:
from pyquery import PyQuery import requests def crawle(): url = 'https://www.qtshu.com/zetianji/' req = requests.get(url=url) req.encoding = 'utf-8' pq = PyQuery(req.content) list... 阅读全文
摘要:
HTTP1.0 与 HTTP1.1的一些区别: HTTP 与 HTTPS的一些区别 HTTPS协议需要到CA申请证书,一般免费证书很少,需要交费。 HTTP协议运行在TCP之上,所有传输的内容都是明文,HTTPS运行在SSL/TLS之上,SSL/TLS运行在TCP之上,所有传输的内容都经过加密的。 阅读全文