上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 15 下一页
摘要: 机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择大家普遍认同的算法,诸如SVM,GBDT,Adaboost,现在深度学习很火热,神经网络也是一个不错的选择。 假如你在乎精度(a 阅读全文
posted @ 2019-09-08 05:10 jingsupo 阅读(5270) 评论(0) 推荐(2) 编辑
摘要: 眼前的困难和问题,很可能是过去没有准备的结果;而现在的失败,往往是过去草率行事的结果。同样,工业大数据浪潮来了,却会发现积累了多年的数据没法用。我总结了一下,大体有三种原因: 1、数据对应不上 围绕同一个对象或过程的数据都有记录,但串不起来。比如,一个产品是某设备生产的。产品信息却无法与设备生产的时 阅读全文
posted @ 2019-09-07 08:34 jingsupo 阅读(439) 评论(0) 推荐(0) 编辑
摘要: Top-k的最小堆解决方法 问题描述:有N(N>>10000)个整数,求出其中的前K个最大的数。(称作Top k或者Top 10) 问题分析:由于(1)输入的大量数据;(2)只要前K个,对整个输入数据的保存和排序是相当的不可取的。 可以利用数据结构的最小堆来处理该问题。 最小堆如图所示,对于每个非叶 阅读全文
posted @ 2019-09-03 15:17 jingsupo 阅读(1089) 评论(0) 推荐(0) 编辑
摘要: minhash simhash SimHash的工作原理 SimHash算法工作流程图: SimHash的工作原理 SimHash算法工作流程图: 1、分词,把需要判断文本分词形成这个文章的特征单词。最后形成去掉噪音词的单词序列并为每个词加上权重,我们假设权重分为5个级别(1~5)。比如:“ 美国“ 阅读全文
posted @ 2019-03-27 15:17 jingsupo 阅读(1847) 评论(0) 推荐(0) 编辑
摘要: git 不再追踪文件改动 git 恢复追踪文件改动 git 删除被管理的文件 git 删除被管理的文件夹 阅读全文
posted @ 2019-01-16 17:20 jingsupo 阅读(501) 评论(0) 推荐(0) 编辑
摘要: 一、局部敏感哈希LSH 在很多应用领域中,我们面对和需要处理的数据往往是海量并且具有很高的维度,怎样快速地从海量的高维数据集合中找到与某个数据最相似(距离最近)的一个数据或多个数据成为了一个难点和问题。如果是低维的小数据集,我们通过线性查找(Linear Search)就可以容易解决,但如果是对一个 阅读全文
posted @ 2019-01-02 18:34 jingsupo 阅读(731) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2018-12-26 18:06 jingsupo 阅读(432) 评论(0) 推荐(0) 编辑
摘要: 1、树控件 树(tree)是一种通过层次结构展示信息的控件,如下图所示是树控件示例,左窗口中是树控件,在wxPython中树控件类是wx.TreeCtrl。 wx.TreeCtrl中一个常用的方法有: AddRoot(text, image=-1, selImage=-1, data=None)。添 阅读全文
posted @ 2018-12-24 11:31 jingsupo 阅读(1837) 评论(0) 推荐(0) 编辑
摘要: 数据库中有A B C三列,用SQL语句实现:当A列大于B列时选择A列否则选择B列,当B列大于C列时选择B列否则选择C列。 方法一: 方法二: 阅读全文
posted @ 2018-12-17 18:12 jingsupo 阅读(1733) 评论(0) 推荐(0) 编辑
摘要: 一个叫team的表,里面只有一个字段name,一共有4 条纪录,分别是a、b、c、d,对应四个球队,现在四个球队进行比赛,用一条SQL语句显示所有可能的比赛组合。 阅读全文
posted @ 2018-12-17 17:51 jingsupo 阅读(3061) 评论(1) 推荐(3) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 15 下一页

欢迎光临