摘要:
网络爬虫的本质就是通过域名加上特定的路由方式与远程资源建立一个短暂的连接,然后通过io流的方式读取。然后说一下jsoup,jsoup可以说是目前的爬虫工具包里面对java底层的工具类封装最简单的一种了,轻便很好用,但是有一些莫名奇妙的限制,用jsoup请求网络资源时,默认读取的最大长度是1024*1 阅读全文
摘要:
1.SUBSTRING_INDEX(x, delim, count) //x表示原字符串,delim关键字,count表示关键字出现的次数 例:SELECT SUBSTRING_INDEX("2018-08-15","-",2); 结果:2018-08 2.SUBSTRING(str,pos) // 阅读全文
摘要:
public class HutoolTest { private static DataSource dataSource = DSFactory.get(); //读取默认路径下的配置文件,数据库连接以及线程池的配置 private static SqlRunner sqlRunner = SqlRunner.create(dataSource); public ... 阅读全文
摘要:
Hutools请求网络资源使用的工具类:HttpRequest和HttpResponse Get方式请求数据 POST方式请求数据 PUT方式请求数据(与POST方式的请求雷同) 阅读全文
摘要:
private static void sendEmaill() { Properties prop = new Properties(); //协议 prop.setProperty("mail.transport.protocol", "smtp"); //服务器 prop.setProperty("mail.s... 阅读全文
摘要:
以Jsoup为例,x-www-form-urlencoded方式 application/json方式 阅读全文
摘要:
HttpClient 是Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议。如果只是需要向Web站点的某个简单页面提交请求并获取服务器响应,HttpURLConnection 阅读全文
摘要:
URLConnection类概述 URLConnection是个抽象类,它有两个直接子类分别是HttpURLConnection和JarURLConnection,它是基于Http协议的。另外一个重要的类是URL,通常URL可以通过传给构造器一个String类型的参数来生成一个指向特定地址的URL实 阅读全文
摘要:
Spring-Data-JPA在做数据存储方面真的很方便,它的目的就是写更少的代码,更多的事情,但是也有其力有未逮或者说处理起来比较闹心的地方。 1.先来感受一下使用JPA做数据查询时,代码的简化程度 单表查询时,只需要根据JPA提供的规范去命名,根本不需要自己去写什么查询语句就可以。 2.当然要自 阅读全文
摘要:
今天在mysql上处理一个数据量达到千万级的数据库表时,要取出满足条件的数据集,然后存入到mongo数据库,使用JPA提供的Pageble去拿分页,再用多线程去取数据时,发现刚开始效率还可以,肯定比单线程强很多,但是这个Pageable有一个问题,在生成sql语句时,会自动加上一个limit *,1 阅读全文