摘要: 决策树也是一种分类方法。它的分类是二元的,一个值经过相应节点的测验,要么进入真分支,要么进入假分支。所以一组值经过决策树以后,就会形成从树跟到结果节点的一条唯一路径。所以它除了可以对输入进行分类之外,还能给出如此分类的解释。因此决策树常常被应用于专家系统,用于解释回答人类专家才能回答的问题。 阅读全文
posted @ 2017-09-02 15:03 如牛饮水 阅读(1721) 评论(0) 推荐(0) 编辑
摘要: PageRank是Google创始人Larry Page发明的对网页进行排名的算法。大概的思路就是被越多重要(Rank高)网页引用的网页排名越靠前。这其中还考虑在内了用户会在网页上点击某个链接去往另一个网页的概率,默认值为0.85。 计算方法是: a. 给每个网页(url)一个初始的rank值1。 阅读全文
posted @ 2017-09-02 15:02 如牛饮水 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 机器学习中的一种分类方法。被分类数据是一个n维的向量集合,即n维点集。K代表点集最终被分成K个簇,即K类。means意思是分类方式是向K个中心点聚集,即离某个中心点最近的点为一簇。 步骤: 1. 从点集中挑选K个点作为初始的中心点,最直接的是随机挑选。还有其他的选择方式,这影响着聚类迭代过程的收敛速 阅读全文
posted @ 2017-09-02 11:47 如牛饮水 阅读(731) 评论(0) 推荐(0) 编辑
摘要: MarkdownPad免费版默认设置是不支持程序设计语言的语法高亮的,需要先升级到付费版(MarkdownPad Pro)。 然后按照菜单栏Tools → Options → Markdown → MarkdownPad Processor → GitHub Flavored Markdown 设置 阅读全文
posted @ 2017-04-19 11:37 如牛饮水 阅读(970) 评论(0) 推荐(0) 编辑
摘要: MongoDB用BSON作为基础数据类型,用来存储JSON文档和在进行远程调用时的网络传输数据格式。BSON是指Binary JSON,有类似JSON的数据格式,还支持其他如Date类型,有编解码快等优点。 博主通过读资料和实验确定可行的一个MongoDB数据迁移至MySQL的方案: MongoDB 阅读全文
posted @ 2017-04-18 19:16 如牛饮水 阅读(6256) 评论(0) 推荐(1) 编辑
摘要: 一、RDD论文(Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing)阅读笔记 two kind of operations on RDD:1. transformat 阅读全文
posted @ 2017-04-14 16:49 如牛饮水 阅读(176) 评论(0) 推荐(0) 编辑