上一页 1 ··· 3 4 5 6 7 8 9 10 下一页
摘要: 聚类##### 今天说聚类,但是必须要先理解聚类和分类的区别,很多业务人员在日常分析时候不是很严谨,混为一谈,其实二者有本质的区别。 分类其实是从特定的数据中挖掘模式,作出判断的过程。比如Gmail邮箱里有垃圾邮件分类器,一开始的时候可能什么都不过滤,在日常使用过程中,我人工对于每一封邮件点选“垃圾 阅读全文
posted @ 2020-03-21 19:14 月半大熊猫 阅读(572) 评论(0) 推荐(0) 编辑
摘要: 一. 概述 首先需要先介绍一下无监督学习,所谓无监督学习,就是训练样本中的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质以及规律。通俗得说,就是根据数据的一些内在性质,找出其内在的规律。而这一类算法,应用最为广泛的就是“聚类”。 聚类算法可以对数据进行数据归约,即在尽可能保证 阅读全文
posted @ 2020-03-21 19:03 月半大熊猫 阅读(1066) 评论(0) 推荐(1) 编辑
摘要: 在做文本分类聚类的任务时,常常需要从文本中提取特征,提取出对学习有价值的分类,而不是把所有的词都用上,那样会造成维度灾难。因此一些词对分类的作用不大,比如“的、是、在、了”等停用词。这里介绍三种常用的特征选择方法: 无监督方法: TF-IDF 感性认识:有很多不同的数学公式可以用来计算tf-idf。 阅读全文
posted @ 2020-03-21 18:57 月半大熊猫 阅读(438) 评论(0) 推荐(0) 编辑
摘要: 由于carrot2对中文的理解很不靠谱,所以参考了网络上的一些资料,现在贡献出来所有代码。 代码的思路就是找字或者词出现的频度,并进行打分,最后按照出现次数和重要性,找出重要的语汇。现在贴出来一些可用的代码。 ClusterBuilder.java /** * * @author * @versio 阅读全文
posted @ 2020-03-21 18:50 月半大熊猫 阅读(267) 评论(0) 推荐(0) 编辑
摘要: 本章主要的学习是中文分词 和两种统计词频(传统词频和TF-IDF算法 ) 的方法. 学习目的:通过N多的新闻标题 or 新闻摘要 or 新闻标签,生成基本的文本聚类,以便统计当天新闻的热点内容. 扩展:可以运用到文本分类 ,舆情分析 等. 基本的学习思路 1.准备文本 2.切词并统计词频 3.去掉极 阅读全文
posted @ 2020-03-21 18:46 月半大熊猫 阅读(598) 评论(0) 推荐(0) 编辑
摘要: 背景 前端高亮需要分词服务,nlp团队提供的分词服务需要跨域调用,而且后台数据索引使用的IK分词。综合评价,前端分词也需要基于IK分词器。IKAnalyzer服务已经停止更新,且对Lucene支持仅测试到4.x.x版本(6.x.x会出现异常),因此使用IK分词器时需要解决一些异常。 依赖 项目以及m 阅读全文
posted @ 2020-03-21 18:14 月半大熊猫 阅读(413) 评论(0) 推荐(0) 编辑
摘要: 简介 IK Analyzer是什么呢,一个很轻量的中文分词工具,是基于java开发的轻量级的中文分词工具包。它是以开源项目Luence为主体的,结合词典分词和文法分析算法的中文分词组件。IK有很多版本,在2012版本中,IK实现了简单的分词歧义排除算法。 我们为什么选择IK作为我们的分词工具呢,这里 阅读全文
posted @ 2020-03-21 18:05 月半大熊猫 阅读(3240) 评论(0) 推荐(1) 编辑
摘要: 第一步:创建一个项目 第二步:在码云上新建一个项目。[注意把使用Readme复选框取消掉] 第三步:复制gitee地址 第四步:创建本地git仓库 第五步:选择自己需要上传到码云的项目名 第六步:提交代码到本地 项目右键git--add 第七步:提交到远程 项目右键git-- Commit Dire 阅读全文
posted @ 2020-03-21 17:54 月半大熊猫 阅读(1300) 评论(0) 推荐(0) 编辑
摘要: 使用原因 对于我们经常换电脑来工作的人群,在公司工作完,回家里再用U盘或网盘复制/下载我们的代码,简直是一种折磨,一个项目中断后,时间久了再去想继续的时候,你会发现:到底哪个是最新版的?!U盘满了,这个文件夹到底能不能删除?但当你使用了git进行源码管理之后,这些问题完全就不必担心了。 当然我也是一 阅读全文
posted @ 2020-03-21 17:44 月半大熊猫 阅读(8846) 评论(0) 推荐(4) 编辑
摘要: 计算属性:故名思意也是一种属性,可以用插值表达式直接调用 废话不多说,直接上代码: 页面部分 <!-- 用户名下拉菜单 --> <el-dropdown class="user-name" trigger="click" @command="handleCommand"> <span class=" 阅读全文
posted @ 2020-03-15 18:56 月半大熊猫 阅读(474) 评论(0) 推荐(1) 编辑
摘要: 什么是作用域 块级作用域:即在{}花括号内的域,由{ }包括,比如if{}块、for(){}块。注意函数快也叫做块 函数作用域:变量在声明它们的函数体以及这个函数体嵌套的任意函数体都是有定义的。 JS中作用域有:全局作用域、函数作用域,是没有块作用域的。 块级作用域是ES6中的。 什么是undefi 阅读全文
posted @ 2020-03-13 13:17 月半大熊猫 阅读(398) 评论(0) 推荐(0) 编辑
摘要: 1.概念 注解 @ResponseBody,使用在控制层(controller)的方法上。 2.作用 作用:将方法的返回值,以特定的格式写入到response的body区域,进而将数据返回给客户端。 当方法上面没有写ResponseBody,底层会将方法的返回值封装为ModelAndView对象。 阅读全文
posted @ 2020-03-12 09:49 月半大熊猫 阅读(382) 评论(0) 推荐(0) 编辑
摘要: Java将html文本转成纯文本 public static String splitAndFilterString(String input, int length) { if (input == null || input.trim().equals("")) { return ""; } // 阅读全文
posted @ 2020-01-17 16:02 月半大熊猫 阅读(2027) 评论(0) 推荐(1) 编辑
摘要: 首先看简单for循环效果,功能最基本,但可以实现所有循环功能 for (let i = 0; i < list.length; i++) { } 接下来看for in、for of和forEach的常见用法 主要是侧重点不同 一、for in 重点打印key-value对 模板: for (cons 阅读全文
posted @ 2020-01-16 10:59 月半大熊猫 阅读(426) 评论(0) 推荐(0) 编辑
摘要: 一、{} 我们都知道JavaScript的数据结构是松散的,比如说你定义一个变量 var temp; 那么你可以随手这样定义temp.attr1 = "参数1",因为对于JavaScript来说万物皆对象,所以如此来定义是没有任何问题的 那么问题来了,要是定义数组,还能用上面的方法吗? 二、【】 要 阅读全文
posted @ 2020-01-11 19:33 月半大熊猫 阅读(4679) 评论(0) 推荐(2) 编辑
摘要: 一、语法 其中<span></span>可以换成<div></div>, <div></div>的可以换成<templete></templete>都没关系 <el-table-column label="管理员" prop="isAdmin"> <div slot-scope="scope"> < 阅读全文
posted @ 2019-12-31 10:35 月半大熊猫 阅读(5727) 评论(0) 推荐(2) 编辑
摘要: 1.快捷键 ctrl+alt+L代码格式化 2.快捷键 ctrl+h查看hierarchy,只能查看向上向下继承关系,而不能看实现了哪些接口。 3,选中右键--Diagram可以查看实现了哪些接口 4.快捷键 crtl + alt + B查看接口的实现类 5.快捷键Alt+7,展示当前类所有的方法. 阅读全文
posted @ 2019-12-29 14:41 月半大熊猫 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 一、概述 使用sessionStorage存取全局数据: 语法: sessionStorage.setItem("key",value); object = sessionStorage.getItem("key"); 若 value是一般字符串则直接使用 若 value是一个对象比如{ } let 阅读全文
posted @ 2019-12-26 17:11 月半大熊猫 阅读(920) 评论(0) 推荐(0) 编辑
摘要: 一、传统Session认证 1.1、认证过程 1、用户向服务器发送用户名和密码。2、服务器验证后在当前对话(session)保存相关数据。3、服务器向返回sessionId,写入客户端 Cookie。4、客户端每次请求,需要通过 Cookie,将 sessionId 回传服务器。5、服务器收到 se 阅读全文
posted @ 2019-12-26 16:34 月半大熊猫 阅读(1045) 评论(0) 推荐(2) 编辑
摘要: 由于是多个事项,那么这个数据模型是一个数组;为了显示这些代办事项我们首先添加一些样本数据 <script> export default { data() { return { title: 'vue-todos', tableData: [{ date: '2016-05-02', name: ' 阅读全文
posted @ 2019-12-25 15:31 月半大熊猫 阅读(510) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 下一页