随笔分类 - 机器学习
摘要:介绍K-means算法是是最经典的聚类算法之一,它的优美简单、快速高效被广泛使用。它是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。图示 步骤从N个文档随机选取K个文档作...
阅读全文
摘要:一. 爬山算法 ( Hill Climbing ) 作为对比,先介绍爬山算法。爬山算法是一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解。 爬山算法实现很简单,其主要缺点是会陷入局部最优解,而不一定能搜索到全局最优解。如图1所示:假设C点为当前解,爬山算法搜索到A点这个局部最优解就会停止搜索,因为在A点无论向那个方向小幅度移动都不能得到更优的解。二. 模拟退火(SA,Simulated Annealing)思想 爬山法是完完全全的贪心法,每次都鼠目寸光的选择一个当前最优解,因此只能搜索到局部的最优值。模拟退火其实也是一种贪心算...
阅读全文
摘要:支持向量机(英语:Support Vector Machine, 简称SVM),是一种有监督学习方法,可被广泛应用于统计分类以及线性回归。Vapnik等人在多年研究统计学习理论基础上对线性分类器提出了另一种设计最佳准则。其原理也从线性可分说起,然后扩展到线性不可分的情况。甚至扩展到使用非线性函数中去,这种分类器被称为支持向量机。主要思想⑴ 它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征 空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能;举例:如下图:将1维的“线性不可分”上升到2维后
阅读全文
积分与排名
- 积分 - 1271383
- 排名 - 231
随笔分类
- c++/c(67)
- celery(1)
- Django(1)
- Docker(5)
- Effective Java(1)
- elasticsearch(2)
- ELK(2)
- Flask(3)
- Flink(2)
- gis(4)
- Git(6)
- Golang(30)
- Guava(1)
- Hadoop(9)
- java(66)
- JavaScript/Html(15)
- kafka(5)
- LeetCode(13)
- linux(54)
- maven(3)
- MongoDB(10)
- mysql(10)
- Postgresql(13)
- Python每日小灶(101)
- Redis(7)
- Spring(11)
- SpringBoot(7)
- STL(1)
- tools(33)
- 产品(1)
- 成长经历(13)
- 读书(5)
- 分布式(1)
- 服务(2)
- 互联网(1)
- 机器学习(3)
- 计算机网络(3)
- 计算机原理(8)
- 开源(2)
- 设计模式(11)
- 数学之美(3)
- 算法&&数据结构(71)
- 统计学习方法(7)
- 网络爬虫(6)
- 文学艺术(2)
- 消息队列(3)
- 英语(1)
- 运维(11)
- 职业生涯(1)
- 自然语言处理(26)
- 更多
随笔档案
- 2024年9月(1)
- 2024年6月(1)
- 2024年5月(1)
- 2023年12月(1)
- 2023年10月(5)
- 2023年8月(1)
- 2023年7月(1)
- 2023年6月(1)
- 2023年5月(2)
- 2023年3月(1)
- 2023年2月(1)
- 2023年1月(4)
- 2022年9月(2)
- 2022年7月(1)
- 2022年6月(1)
- 2022年4月(1)
- 2022年2月(8)
- 2021年12月(1)
- 2021年11月(1)
- 2021年9月(1)
- 2021年7月(1)
- 2021年5月(2)
- 2021年1月(2)
- 2020年9月(3)
- 2020年8月(2)
- 2020年7月(2)
- 2020年6月(4)
- 2020年5月(2)
- 2020年4月(8)
- 2020年3月(4)
- 2020年2月(14)
- 2020年1月(6)
- 2019年12月(1)
- 2019年11月(4)
- 2019年10月(1)
- 2019年7月(4)
- 2019年6月(3)
- 2019年5月(3)
- 2019年4月(4)
- 2019年3月(6)
- 2019年2月(4)
- 2019年1月(1)
- 2018年12月(3)
- 2018年11月(3)
- 2018年10月(9)
- 2018年9月(2)
- 2018年8月(3)
- 2018年7月(3)
- 2018年6月(2)
- 2018年5月(6)
- 2018年4月(4)
- 2018年3月(1)
- 2018年1月(4)
- 2017年12月(10)
- 2017年10月(2)
- 2017年9月(2)
- 2017年8月(2)
- 2017年7月(4)
- 2017年6月(5)
- 2017年5月(3)
- 2017年3月(16)
- 2017年2月(1)
- 2016年12月(4)
- 2016年11月(1)
- 2016年10月(4)
- 2016年9月(5)
- 2016年8月(9)
- 2016年7月(9)
- 2016年6月(1)
- 2016年5月(6)
- 2016年4月(12)
- 2016年3月(5)
- 2016年2月(13)
- 2016年1月(7)
- 2015年12月(4)
- 2015年11月(5)
- 2015年10月(2)
- 2015年9月(6)
- 2015年8月(15)
- 2015年7月(15)
- 2015年6月(12)
- 2015年5月(14)
- 2015年4月(8)
- 2015年3月(2)
- 2015年1月(13)
- 2014年12月(3)
- 2014年11月(2)
- 2014年10月(5)
- 2014年9月(19)
- 2014年8月(14)
- 2014年7月(6)
- 2014年6月(16)
- 2014年5月(12)
- 2014年4月(18)
- 2014年3月(45)
- 2014年2月(12)
- 2014年1月(12)
- 2013年12月(11)
- 2013年11月(11)
- 2013年10月(12)
- 2013年9月(5)
- 2013年8月(18)
- 2013年7月(4)
- 2013年6月(7)
- 2013年5月(11)
- 2013年4月(8)
- 2013年3月(16)
- 2013年2月(6)
- 2013年1月(8)
- 2012年12月(7)
- 2012年11月(5)
- 2012年10月(6)
- 2012年9月(3)
- 2012年8月(6)
- 2012年7月(4)
- 2012年6月(1)
- 2012年5月(1)
- 更多
最新评论
- 1. Re:git 查看、创建、删除 本地,远程 分支
- --jihite
- 2. Re:Linux系统中的load average
描述的很形象,点赞
- --MRgx
- 3. Re:linux定时执行脚本
- 流程举例 中,>~/log 是把输出记录到 log 里吗?5.几个例子中 >> /tmp/test.txt,这里为啥又用双尖括号呢?...
- --huihuitu
- 4. Re:Linux系统中的load average
我的几百好像也不卡
- --Coderon
- 5. Re:Linux系统中的load average
- 02:44:47 up 1 day, 21:27, 3 users, load average: 311.61, 289.16, 275.73 grep 'model name' /proc/cpui...
- --Coderon