2018年5月10日
摘要: https://www.cnblogs.com/wangkundentisy/p/7505487.html 一. 简介 首先来看百度百科对最小二乘法的介绍:最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这 阅读全文
posted @ 2018-05-10 21:01 yuluoxingkong 阅读(406) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/arachis/p/text_dig.html 说明:本篇以实践为主,理论部分会尽量给出参考链接 摘要: 1.分词 2.关键词提取 3.词的表示形式 4.主题模型(LDA/TWE) 5.几种常用的NLP工具简介 6.文本挖掘(文本分类,文本标签化) 6 阅读全文
posted @ 2018-05-10 19:53 yuluoxingkong 阅读(2504) 评论(0) 推荐(0) 编辑
摘要: https://my.oschina.net/hunglish/blog/787596 1. 欧氏距离(Euclidean Distance) 欧氏距离是最容易直观理解的距离度量方法,我们小学、初中和高中接触到的两个点在空间中的距离一般都是指欧氏距离。 二维平面上点a(x1,y1)与b(x2,y2) 阅读全文
posted @ 2018-05-10 19:27 yuluoxingkong 阅读(485) 评论(0) 推荐(0) 编辑
摘要: 一、训练集 vs. 测试集 在模式识别(pattern recognition)与机器学习(machine learning)的相关研究中,经常会将数据集(dataset)分为训练集(training set)跟测试集(testing set)这两个子集,前者用以建立模型(model),后者则用来评 阅读全文
posted @ 2018-05-10 19:02 yuluoxingkong 阅读(1414) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/u011630575/article/details/71158656 1. 什么是欠拟合和过拟合 先看三张图片,这三张图片是线性回归模型 拟合的函数和训练集的关系 类似的,对于逻辑回归同样也存在欠拟合和过拟合问题,如下三张图 2. 如何解决欠拟合和过拟合 阅读全文
posted @ 2018-05-10 18:07 yuluoxingkong 阅读(5401) 评论(1) 推荐(0) 编辑