摘要: 经常有粉丝问我该选flink和spark streaming? 业务选型对新手来说是件非常困难的事情,对于经验丰富又经常思考的人来说就很简单。 选型的时候个人准备知识: 1.深入了解框架。 2.深入了解框架的周边生态。 3.深入了解你自己的业务场景。 就拿flink和spark streaming来 阅读全文
posted @ 2019-09-05 21:39 seer1 阅读(738) 评论(0) 推荐(0) 编辑
摘要: 也还是继续昨天的话题说吧。 纯手机手打,感觉有用麻烦点个赞。 开头还是那句话,spark是以批处理起家,发展流处理,所以微批处理吞吐优先,可以选用。 flink以实时处理起家,然后去做批处理,所以更适合实时性高的场景。 那么生产中真的都要求那么高的实时性吗? 比如10wqps的数据,假如实时处理,采 阅读全文
posted @ 2019-09-05 21:33 seer1 阅读(1494) 评论(0) 推荐(0) 编辑
摘要: 知识图谱的构建技术主要有自顶向下和自底向上两种。其中自顶向下构建是指借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库里。而自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的信息,加入到知识库中。 在本文中,笔者主要想分享一下自底向 阅读全文
posted @ 2019-09-05 21:31 seer1 阅读(540) 评论(0) 推荐(0) 编辑