摘要: 不需要再注册表里添加什么~ 1. 首先,安装一个 EditPlus 软件,当然,百分之九十的可能你的不是zb的,不然你也不会来这了。 2. 右键 EditPlus -> 一管理员身份运行(一定要管理员) 3. 如果不以管理员身份就会报错,这个设置的执行应该还是编辑注册表 完成 ! 阅读全文
posted @ 2020-02-15 16:44 子ぐ非鱼 阅读(293) 评论(0) 推荐(0) 编辑
摘要: 之前的博客搜索栏用的是 sql 模糊查询进行查找,最近学完lucene,要学以致用啊,就把sql搜索给替换下来吧 中间遇到一些问题,也是学过程中没有提到的,所以说,还是实践出真知啊。 lucene分开来讲的话,我感觉就是两大块:索引维护、搜索索引 索引维护包括:添加索引、删除索引、更新索引 publ 阅读全文
posted @ 2020-02-15 15:17 子ぐ非鱼 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 业务分析 获取 www.51.job.com 上的招聘信息。只爬取“计算机软件”和“互联网电子商务”两个行业的信息。 1. 查询页面,获取查询到列表的中的url 2. 跳转到相应页面,获取需要的数据 存储数据 创建数据库,创建存储对应数据的表 实现流程 开始 —— > 列表页面 —— > 获取url 阅读全文
posted @ 2020-02-15 01:58 子ぐ非鱼 阅读(767) 评论(0) 推荐(0) 编辑
摘要: 在我们抓取到页面之后,还需要对页面进行解析。整个页面都是字符串的形式,可以使用字符串处理工具来解析页面,也可以使用正则表达式,但这些方法都会带来很大的开发成本。所以我们需要一款准们解析 html 页面的工具。 Jsoup jsoup是一款 java 的 HTML 解析器,可直接解析某个URL地址、H 阅读全文
posted @ 2020-02-15 01:50 子ぐ非鱼 阅读(154) 评论(0) 推荐(0) 编辑
摘要: get请求 get请求的基本使用 // 1. 打开浏览器,创建HttpClient对象 CloseableHttpClient httpClient = HttpClients.createDefault(); // 2.输入网址,发起get请求创建HttpGet对象 HttpGet get = n 阅读全文
posted @ 2020-02-15 01:47 子ぐ非鱼 阅读(257) 评论(0) 推荐(0) 编辑