摘要: 相信大部分使用Intellij的同学都会遇到这个问题,即使项目使用了spring-boot-devtools,修改了类或者html、js等,idea还是不会自动重启,非要手动去make一下或者重启, 就更没有使用热部署一样。出现这种情况,并不是你的配置问题,相信自己,热部署那几个设置很简单,其根本原 阅读全文
posted @ 2017-11-17 21:18 大肥龙 阅读(450) 评论(0) 推荐(0) 编辑
摘要: 写在前面 Spring为开发者提供了一个名为spring-boot-devtools的模块来使Spring Boot应用支持热部署,提高开发者的开发效率,无需手动重启Spring Boot应用。 devtools的原理 深层原理是使用了两个ClassLoader,一个Classloader加载那些不 阅读全文
posted @ 2017-11-17 18:02 大肥龙 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 在nginx配置文件中,可以在nginx总体的配置文件nginx.conf中,也可以在单独的网站配置环境中进行设置,如:www.tomener.com.conf 在配置环境server段location中添加相应的配置信息: 这里只添加了fastcgi_param RUNTIME_ENVIROMEN 阅读全文
posted @ 2017-09-01 21:07 大肥龙 阅读(1600) 评论(0) 推荐(0) 编辑
摘要: OpenCV 学习笔记(模板匹配) 模板匹配是在一幅图像中寻找一个特定目标的方法之一。这种方法的原理非常简单,遍历图像中的每一个可能的位置,比较各处与模板是否“相似”,当相似度足够高时,就认为找到了我们的目标。 在 OpenCV 中,提供了相应的函数完成这个操作。 matchTemplate 函数: 阅读全文
posted @ 2017-08-12 16:00 大肥龙 阅读(547) 评论(0) 推荐(0) 编辑
摘要: git push 的时候出错,提示: fatal: The remote end hung up unexpectedly 遇见几次了,原因是因为文件太大,把限制放宽就好了。命令: git config http.postBuffer 524288000 阅读全文
posted @ 2017-07-19 11:05 大肥龙 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 上一篇文章《社会化海量数据采集框架搭建》提到如何搭建一个社会化采集系统架构,讲架构一般都比较虚,这一篇讲一下如何实战用低成本服务器做到日流水千万级数据的分布式采集系统。 有这样一个采集系统的需求,达成指标: 需要采集30万关键词的数据 、微博必须在一个小时采集到、覆盖四大微博(新浪微博、腾讯微博、网 阅读全文
posted @ 2017-02-16 13:36 大肥龙 阅读(591) 评论(0) 推荐(0) 编辑
摘要: 在前一篇文章 《海量数据相似度计算之simhash和海明距离》 介绍了simhash的原理,大家应该感觉到了算法的魅力。但是随着业务的增长 simhash的数据也会暴增,如果一天100w,10天就1000w了。我们如果插入一条数据就要去比较1000w次的simhash,计算量还是蛮大,普通PC 比较 阅读全文
posted @ 2017-02-16 11:33 大肥龙 阅读(4024) 评论(0) 推荐(0) 编辑
摘要: 通过 采集系统 我们采集了大量文本数据,但是文本中有很多重复数据影响我们对于结果的分析。分析前我们需要对这些数据去除重复,如何选择和设计文本的去重算法?常见的有余弦夹角算法、欧式距离、Jaccard相似度、最长公共子串、编辑距离等。这些算法对于待比较的文本数据不多时还比较好用,如果我们的爬虫每天采集 阅读全文
posted @ 2017-02-16 11:32 大肥龙 阅读(1117) 评论(0) 推荐(0) 编辑
摘要: 上面那个命令好像有问题。最新使用批量下载图片命令: 阅读全文
posted @ 2016-12-09 15:33 大肥龙 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 今天在看一个遗留系统的数据表的时候发现平时查找的视图是FULL OUT JOIN的,导致平时的数据记录要进行一些限制性处理,其实也可以设置视图各表为右外连接并在视图上设置各列的排序和筛选条件就可以达到效果。 联接条件可在FROM或WHERE子句中指定,建议在FROM子句中指定联接条件。WHERE和H 阅读全文
posted @ 2016-12-07 18:22 大肥龙 阅读(195) 评论(0) 推荐(0) 编辑