摘要:
目前算法主要是针对那些单机能够完成的任务,该架构良好的扩展性能够让你在很短的时间内完成自己想要的算法,并且用于工程之中(相信我,肯定比Weka更快更好)。该项目的另一个特色是能够很好的支持中文文本的分类、聚类等操作。
*当前版新增
加入了K-Means算法,能够对文本进行聚类
加入了基于补集的朴素贝叶斯算法,大大提升了分类的准确率,目前该算法在搜狗实验室文本分类数据中,对20000篇、8分类左右的数据的预测准确率在90%左右 阅读全文
最新评论
- 1. Re:机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用
太牛了博主
- --lllbbbbh
- 2. Re:机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent)
同求书,811180575@qq.com,谢谢啦
- --meng666
- 3. Re:TensorFlow 源代码初读感受
建模为图可不是TF的创意……至少我知道老早的Theano就是这么搞的了; TF被PyTorch超越,基本也说明这套架构是失败的
- --只读文件
- 4. Re:机器学习中的数学(4)-线性判别分析(LDA), 主成分分析(PCA)
非常感谢分享对于我这种追求数学理解的人来说,这类文章太有帮助了~~
- --姜子牙会更好
- 5. Re:也谈谈内卷化、996和程序员的发展
写得非常好,结合我以前的经历,很有感触。我自己也走了一些弯路。
- --程鑫