摘要: 1. 背景 在部门内容组织了一次K8s的培训,普及了下K8s的概念、框架、操作等,为便于后期查阅,也为了进一步深究K8s,因此开展K8s系列,周期不定… 2. 概念 (1) 含义:来自希腊语,意为”舵手”,又称K8s (2) 历史:2014年由Google创建,是十多年大规模容器管理技术Borg的开源版 (3) 功能:为容器化应用提供资源调度,即容器编排 严格意义:容器是将代码以及所有的依赖打包,... 阅读全文
posted @ 2018-11-03 22:58 mengrennwpu 阅读(502) 评论(0) 推荐(0) 编辑
摘要: 1. 背景 近日项目要求基于爬取的影视评论信息,抽取影视的关键字信息。考虑到影视评论数据量较大,因此采用Spark处理框架。关键词提取的处理主要包含分词+算法抽取两部分。目前分词工具包较为主流的,包括哈工大的LTP以及HanLP,而关键词的抽取算法较多,包括TF-IDF、TextRank、互信息等。 阅读全文
posted @ 2018-11-03 21:53 mengrennwpu 阅读(2367) 评论(1) 推荐(0) 编辑