随笔分类 -  算法

摘要:标签传递算法1.对于部分样本的标记给定,而大多数样本的标记未知的情形,是半监督学习问题, 应用场景电影评论2.标签传递算法将标记样本的标记通过一定的概率传递给未知标记样本,知道最终收敛. 阅读全文
posted @ 2016-04-23 23:23 农民阿姨 阅读(653) 评论(0) 推荐(0) 编辑
摘要:K-means的步骤 输入: 含n 个样本的数据集,簇的数据K 输出: K 个簇 算法步骤: 1.初始化K个簇类中心C1,C2,-……Ck (通常随机选择) 2.repeat 步骤3,4 3,将数据集中的每个样本分配到与之最近的中心Ci所在的簇Cj ; 4. 更新聚类中心Ci,即计算各个簇的样本均值; 5.直到样本分配不在改变 上代码: import java.lang.annotation.E... 阅读全文
posted @ 2015-11-30 10:52 农民阿姨 阅读(463) 评论(0) 推荐(0) 编辑
摘要:1.项目背景 在做交通路线分析的时候,客户需要找出车辆的行车规律,我们将车辆每天的行车路线当做一个数据样本,总共有365天或是更多,从这些数据中通过聚类来获得行车路线规律统计分析。 我首先想到是K-means算法,不过它的算法思想是任选K个中心点,然后不停的迭代,在迭代的过程中需要不停的更新中心点。在我们着这个项目中,此方案不能解决,因为我们是通过编辑距离来计算两条路线的相似度。可以参考(1.交... 阅读全文
posted @ 2015-11-29 21:58 农民阿姨 阅读(1763) 评论(0) 推荐(0) 编辑
摘要:1.最近工作中要实现用户车辆的行驶路线的聚类,由于所给的数据只有用户一天中交通卡口所监视的卡口名称 :即青岛路-威海路-济阳路 。 要通过聚类实现车辆路线的规律分析,首先要解决的是相似度问题,我们知道计算相似度可以用 :空间向量距离(欧式距离,余弦相似度)等算法。可是这些在此要求中都不适应,故需要用编辑距离来解决此问题 2. 编辑距离的思想: a.是指两个字符串之间,由一个转成另一个所需的最... 阅读全文
posted @ 2015-11-29 13:07 农民阿姨 阅读(1708) 评论(0) 推荐(0) 编辑
摘要:java 实现单词计数.top N思路 先统计每个单词出现的个数 利用 TreeSet 的自动排序的功能上代码 wordcount public void wordCount() { String route = "青岛路 青岛路 济阳路口东 济南路 宴坡路 "; Map<String, Integer> map = new HashMap&... 阅读全文
posted @ 2015-11-28 14:03 农民阿姨 阅读(1683) 评论(0) 推荐(0) 编辑
摘要:/** * Created by zzy on 15/11/16. */ /** * 对于一个给定的 source 字符串和一个 target 字符串, * 你应该在 source 字符串中找出 target 字符串出现的第一个位置(从0开始)。 * 如果不存在,则返回 -1。 * * 如果 source = "source" 和 target = "target",返回 -1。 ... 阅读全文
posted @ 2015-11-21 22:28 农民阿姨 阅读(281) 评论(0) 推荐(0) 编辑
摘要:2015-10-04周日9:30 1. 阅读全文
posted @ 2015-10-04 13:27 农民阿姨 阅读(186) 评论(0) 推荐(0) 编辑
摘要:独孤九剑:总诀式:心法总纲 1.破剑式 2.破刀式 3.破枪式 4.破索式 5.破掌式 6.破箭式 7.破气式 1.二分查找的时间复杂度是O(logn) 1.算法面试中如果需要优化O(n)的时间复杂度,那么只能是O(logn)的二分法 2.Recursion or while –loop? 如果问题不复杂,能用递归就用递归。 如果问题比较复杂,那就用递归。 3.避免死循环,条件 st... 阅读全文
posted @ 2015-10-03 15:49 农民阿姨 阅读(276) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示