06 2018 档案
摘要:YAML Ain’t Markup Language YAML 是一种简洁的非标记语言 YAML以数据为中心,使用空白,缩进,分行组织数据,从而使得表示更加简洁易读 基本规则: 1、大小写敏感 2、使用缩进表示层级关系 3、禁止使用tab缩进,只能使用空格键 4、缩进长度没有限制,只要元素对齐就表示
阅读全文
摘要:1.创建项目 使用IntelliJ IDEA file -> New -> Project-> Spring Initializr -> 选择默认的 url -> Next 可以修改一下项目的信息 -> Next 选上web 输入项目名,选好位置->Finish 默认创建好的目录结构 说明: Dem
阅读全文
摘要:simhash是google用来处理海量文本去重的算法 将一个文档,转换成一个64位的字节,称之为特征字,然后判断重复只需要判断他们的特征字的距离是不是<n(根据经验这个n一般取值为3),就可以判断两个文档是否相似 simhash算法分为5个步骤:分词、hash、加权、合并、降维
阅读全文