会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
jiahu
天行健,君子以自强不息。
博客园
管理
2021年3月2日
读《大数据——互联网大规模数据挖掘与分布式处理》
摘要: 常见概念 数据挖掘的定义与意义 定义:数据挖掘是数据模型的发现过程 模型的含义:统计建模(高斯分布等)/机器学习(贝叶斯网络/SVM/决策树等)/数据汇总(PageRank)/特征抽取(频繁项/相似项,例如协同过滤) 在大数据领域常使用非精确(统计)方法实现快速的计算 非精确过滤器:布隆过滤器;非精
阅读全文
posted @ 2021-03-02 11:25 jiahu
阅读(710)
评论(0)
推荐(0)
编辑