随笔分类 -  机器学习

摘要:验前概率就是通常说的概率,验后概率是一种条件概率,但条件概率不一定是验后概率。贝叶斯公式是由验前概率求验后概率的公式。举一个简单的例子:一口袋里有3只红球、2只白球,采用不放回方式摸取,求:⑴ 第一次摸到红球(记作A)的概率;⑵ 第二次摸到红球(记作B)的概率;⑶ 已知第二次摸到了红球,求第一次摸到 阅读全文
posted @ 2019-10-25 20:33 andy_0212 阅读(5876) 评论(0) 推荐(0)
摘要:How to put more weight on certain features in machine learning? First of all - you should probably not do it. The whole concept of machine learning is 阅读全文
posted @ 2019-06-24 09:17 andy_0212 阅读(203) 评论(0) 推荐(0)
摘要:最近在研究sample之间的similarity,以便更好地进行clustering,一下是相关资料 TF-IDF与余弦相似性的应用(一):自动提取关键词 TF-IDF与余弦相似性的应用(二):找出相似文章 相似度(距离计算)汇总 常用的相似度计算方法原理及实现 机器学习中的相似性度量 大量短文本聚 阅读全文
posted @ 2019-06-11 10:38 andy_0212 阅读(849) 评论(0) 推荐(0)
摘要:学习方面的问题 Q1:计算机专业本科生,非ACMER。算法达到什么程度才算是合格,有什么量化手段吗? Answer:传统算法和数据结构功底扎实。比如LintCode上的题目简单和中等难度毫无压力做出,Hard难度在给了一定时间和一定提示时可以独立完成。 微积分,统计学,离散数学 Q2:成为数据挖掘工 阅读全文
posted @ 2019-04-09 15:41 andy_0212 阅读(234) 评论(0) 推荐(0)
摘要:从16年九月份开始,参加了一些公司的算法工程师/机器学习工程师岗位的校园招聘,做一些总结,希望可以给大家准备这个职位提供些信息。 一、需要的基本技能数据结构知识掌握一门编程语言,c/c++/Java/Python机器学习常用算法或者某一细分领域(推荐,自然语言处理,图像识别,语音识别等)的常用算法 阅读全文
posted @ 2019-04-08 22:05 andy_0212 阅读(752) 评论(0) 推荐(0)
摘要:摘要: 1.算法概述 2.算法推导 3.算法特性及优缺点 4.注意事项 5.实现和具体例子 内容: 1.算法概述 1.1 决策树(DT)是一种基本的分类和回归方法。在分类问题中它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布,学习思想包括ID3,C4.5,CA 阅读全文
posted @ 2019-03-31 11:19 andy_0212 阅读(1663) 评论(0) 推荐(0)
摘要:背景:本文只是对机器学习相关知识的梳理和复习用,因此顺序上可能有些随意 摘要: 1.各种算法的推导 2.各种算法的比较(或优缺点) 3.学习理论 4.特征选择方法 5.模型选择方法 6.特征工程 7.数据预处理 8.应用例子 内容: 1.各种算法的推导 线性回归(Liner Regression): 阅读全文
posted @ 2019-03-31 11:18 andy_0212 阅读(310) 评论(0) 推荐(0)
摘要:本文章部分内容基于之前的一篇专栏文章:统计学习引论 在机器学习里,通常来说我们不能将全部用于数据训练模型,否则我们将没有数据集对该模型进行验证,从而评估我们的模型的预测效果。为了解决这一问题,有如下常用的方法: 1.The Validation Set Approach 第一种是最简单的,也是很容易 阅读全文
posted @ 2019-03-25 15:10 andy_0212 阅读(3482) 评论(0) 推荐(0)
摘要:如无必要,勿增实体。 简单有限原则 阅读全文
posted @ 2019-01-07 14:56 andy_0212 阅读(341) 评论(0) 推荐(0)
摘要:上面代码执行处做,Assertion Error 解决方案: This may help for someone who is looking for For Anaconda on Windows 10 64 Bit, Environment: Windows 10 64 Bit, Python 阅读全文
posted @ 2018-12-30 11:08 andy_0212 阅读(725) 评论(0) 推荐(0)
摘要:内容导读 最近听机器学习课程时听到这三个概念一开始有点模糊。感觉没理解透,所以自己又查了点资料,消化了一下,然后做了个笔记。Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,其实Bias在股票上也有应用,也可以反映股价在波动过程中与移动平均线偏离程度(乖离率),炒股的朋友应该 阅读全文
posted @ 2018-12-14 10:25 andy_0212 阅读(987) 评论(0) 推荐(0)