yhzhou

摘要： Faiss是Facebook AI团队开源的针对聚类和相似性搜索库，为稠密向量提供高效相似度搜索和聚类，支持十亿级别向量的搜索，是目前最为成熟的近似近邻搜索库。它包含多种搜索任意大小向量集（备注：向量集大小由RAM内存决定）的算法，以及用于算法评估和参数调整的支持代码。Faiss用C++编写，并提供与Numpy完美衔接的Python接口。除此以外，对一些核心算法提供了GPU实现。本文对Faiss安装及原理进行简单说明，部分内容参考文章中引用内容。阅读全文

posted @ 2019-03-20 23:05 yhzhou 阅读(59959) 评论(0) 推荐(4) 编辑

2018年6月26日

快速排序（快排）

摘要：快速排序由C. A. R. Hoare在1962年提出。它的基本思想是：通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据都要小，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。算法处理过程（截图参考坐阅读全文

posted @ 2018-06-26 18:29 yhzhou 阅读(354) 评论(0) 推荐(0) 编辑

2018年6月8日

SSM框架整合Demo

摘要：目前项目大都开始采用SSM结构进行搭建，因为涉及项目比较多，新来的需求都是从现有项目中迁移一份出来进行修改，有的时候两个项目差别还是比较大，并不完全需要原有项目的东西，进行删减也是一项费神费时的事情，这里拉一个简单的demo，后续新的需求直接改用该项目。具体如下几个步骤，搭建一个简单的基于mave 阅读全文

posted @ 2018-06-08 16:22 yhzhou 阅读(440) 评论(0) 推荐(0) 编辑

2018年6月7日

基于Logistic回归和sigmoid函数的分类算法推导

摘要：此部分内容是对机器学习实战一书的第五章的数学推导，主要是对5.2节代码实现中，有一部分省去了相关的公式推导，这里进行了推导，后续会将算法进行java实现。此部分同样因为公式较多，采用手写推导，拍照记录的方式。第一部分推导目标函数第二部分采用梯度下降方法进行优化至此两部分就完成了对logisti 阅读全文

posted @ 2018-06-07 13:30 yhzhou 阅读(474) 评论(0) 推荐(0) 编辑

2018年6月5日

Libsvm java工程实践

摘要：在上篇文章中对libsvm的流程和简单的java代码测试做了说明，本篇简单对libsvm如何在工程中实践进行简短说明，不当的地方欢迎大家指正。第一步是对libsvm的预测函数进行调整，我是从svm_predict类中抽取部分代码组成预测防范，代码如下： /** * 对传入的文本特征根据训练好的分类阅读全文

posted @ 2018-06-05 16:01 yhzhou 阅读(746) 评论(0) 推荐(0) 编辑

2018年5月31日

LibSvm流程及java代码测试

摘要：使用libSvm实现文本分类的基本过程，此文参考使用libsvm实现文本分类对前期数据准备及后续的分类测试进行了验证，同时对文中作者的分词组件修改成hanLP分词，对数字进行过滤，仅保留长度大于1的词进行处理。转上文作者写的分类流程：文本预处理阶段，增加了基于hanLP的分词，代码如下： / 阅读全文

posted @ 2018-05-31 09:42 yhzhou 阅读(2545) 评论(0) 推荐(0) 编辑

公告