从小就学习不好

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2019年3月5日

摘要: 能干什么? 文章去重,语句去重,提取关键词(文章摘要,页面指纹),图片识别,语音识别 想要做一个相似度,最重要的是什么? 必须得到一个度量:计算个体之间的相似程度(分数,0-1之间,0代表完全不同,一代表完全一样) 相似度值越小,距离越大,相似度值越大,距离越小 两方面考虑: 文本角度 语义角度 例 阅读全文
posted @ 2019-03-05 20:47 从小就学习不好 阅读(619) 评论(0) 推荐(0) 编辑

摘要: 由于没具体研究过画图,以前在公司每天都用Excel,所以很多图画都是画在了Excel上再剪切的,看着可能不太舒服。 先来看一下数据走向: 这样我们就大致了解了flume是干嘛的,在什么位置了。 Flume简介: Apache Flume是一个分布式、可信任(事务性)的弹性系统,用于高效收集、汇聚和移 阅读全文
posted @ 2019-03-05 02:23 从小就学习不好 阅读(1211) 评论(0) 推荐(0) 编辑