09 2017 档案
机器学习算法与编程实践之中文文本分类
摘要:这周学习了机器学习算法与编程实践第二章——中文文本分类的部分内容。该章以文本挖掘为大背景,以文本分类算法为中心,详细介绍了中文文本分类项目的相关知识点。 一、文本挖掘与文本分类的概念 被普遍认可的文本挖掘的定义如下:文本挖掘是指从大量文本数据中抽取事先未知的、可理解的、最终可用的知识的过程,同时运用 阅读全文
posted @ 2017-09-24 22:10 junjiang3 阅读(3510) 评论(0) 推荐(0)
ElasticSearch常用结构化搜索
摘要:最近,需要用到ES的一些常用的结构化搜索命令,因此,看了一些官方的文档,学习了一下。结构化查询指的是查询那些具有内在结构的数据,比如日期、时间、数字都是结构化的。 它们都有精确的格式,我们可以对这些数据进行逻辑操作,比较常见的操作包括比较时间区间,或者获取两个数字间的较大值。 精确查询 当进行精确查 阅读全文
posted @ 2017-09-17 20:47 junjiang3 阅读(751) 评论(0) 推荐(0)
linux几种常见的文件内容查找和替换命令
摘要:作为一个以前没怎么接触过linux的小白,开始使用linux,各种不习惯,这周遇到一个文件内容测查找和替换的需求。学习了以下几种实现方式: 1、vi命令下的查找和替换 1.1 vi下的查找 /pattern<Enter> :向下查找pattern匹配字符串 ?pattern<Enter>:向上查找p 阅读全文
posted @ 2017-09-07 21:36 junjiang3 阅读(61961) 评论(0) 推荐(2)