06 2017 档案
摘要:时间2017年6月29日17:51:11 2017年6月10号星期六,我在淮安信息职业技术学院毕业了。那一天我们拿了毕业证书,晚上大伙还是那么几个人(X3-222)一起吃了饭,第二天又各奔东西的去工作了。 我依然在淮安工作,所有那天拿毕业证的我都没有需要请假。也是我五月一号实习到现在的第一份工作,而
阅读全文
摘要:第一节:处理CLOB、BLOB类型数据 第二节:传入多个输入参数 第三节:MyBatis分页 1,逻辑分页 2,物理分页 MyBatis默认情况下,MyBatis启用一级缓存,即同一个SqlSession接口对象调用了相同的select语句,则直接会从缓存中返回结果,而不是在查询一次数据库; 开发者
阅读全文
摘要:第一节:if条件 第二节:choose,when和otherwise条件 第三节:where条件 1.自动加上where; 2.如果where子句以and或者or开头,则自动删除第一个and或者or; 第四节:trim条件 功能和where元素类似,提供了前缀,后缀功能,更加灵活; 第五节:fore
阅读全文
摘要:第一节:一对一关系实现 需要实现一对一的关系,首先我们有两张表,t-addree和t_student。 然后写model层 Address.java Student.java mappers映射类 AddressMapper.java StudentMapper.java 主程序运行类 Studen
阅读全文
摘要:SqlSessionFactoryUtil.java Student.java mybatis-config.xml StudentMapper.java StudentMapper.xml 所有的主测试类都在JUtil的测试方法前后中调用 第一节:insert映射语句 添加映射配置文件 第二节:u
阅读全文
摘要:第一节:environments Mybatis支持多个环境,可以任意配置 第二节:transactionManager Mybatis:支持两种类型的事务管理:JDBC和MANAGED(托管) JDBC:应用程序负责管理数据库连接的生命周期 MANAGED:由应用服务器负责管理数据库连接的生命周期
阅读全文
摘要:jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 博客项目有个需求。展示博客列表的时候,显示一些博客里的图片,增强用户体验; 这里的话,有两种方案,第一种 是
阅读全文
摘要:第一节: Jsoup 获取 DOM 元素属性值 Jsoup获取DOM元素属性值 比如我们要获取博客的href属性值: 我们这时候就要用到Jsoup来获取属性的值 : 我们给下示例代码:
阅读全文
摘要:第一节: Jsoup 使用选择器语法查找 DOM 元素 Jsoup使用选择器语法查找DOM元素 我们前面通过标签名,Id,Class样式等来搜索DOM,这些是不能满足实际开发需求的, 很多时候我们需要寻找有规律的DOM集合,很多个有规律的标签层次; 这时候,选择器就用上了 css jquery都有,
阅读全文
摘要:第一节: Jsoup 简介 Jsoup简介 jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 我们在爬虫采集网页领域 主要作用是 用HttpClient获取到
阅读全文
摘要:第一节: Jsoup 查找 DOM 元素 getElementById(String id) 根据 id 来查询 DOM getElementsByTag(String tagName) 根据 tag 名称来查询 DOM getElementsByClass(String className) 根据
阅读全文
摘要:eclipse中Maven项目jar包下载下来了,不然我们import是时候根本导入不进来,网上的方法都试过了,Maven仓库也清空过后重新下载过了,都解决不了。 后来发现虽然jar包是下载下来了,可是下载的jar是bad singed(损坏的),因此我们根本就import不进来。 原因出在我们在外
阅读全文
摘要:第一节: HttpClient 连接超时及读取超时 HttpClient连接超时及读取超时 httpClient在执行具体http请求时候 有一个连接的时间和读取内容的时间; HttpClient连接时间 所谓连接的时候 是HttpClient发送请求的地方开始到连接上目标url主机地址的时间,理论
阅读全文
摘要:第一节: HttpClient 抓取图片 这里pom.xml需要用到io输入输出: pom.xml 文件: 运行输出: ContentType:image/jpeg D盘下会有一个logo.jpg的图片
阅读全文
摘要:第一节: HttpClient 使用代理 IP 在爬取网页的时候,有的目标站点有反爬虫机制,对于频繁访问站点以及规则性访问站点的行为,会采集屏蔽IP措施。 这时候,代理IP就派上用场了。 关于代理IP的话 也分几种 透明代理、匿名代理、混淆代理、高匿代理 1、透明代理(Transparent Pro
阅读全文
摘要:第一节: 设置请求头消息 User-Agent 模拟浏览器 HttpClient设置请求头消息User-Agent模拟浏览器 比如我们请求 www.tuicool.com 用前面的代码: 返回内容: 网页内容:<!DOCTYPE html><html> <head> <meta http-equiv
阅读全文
摘要:第一节: HttpClient 简介 HttpClient 是 Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议。 官方站点:http://hc.apache.org/ 最
阅读全文
摘要:第一节: htmlunit 模拟浏览器请求 第二节: htmlunit 获取指定元素 第三节: htmlunit 使用代理 IP 第四节: htmlunit 取消 css,javascript 支持 第五节: htmlunit 模拟按钮点击
阅读全文
摘要:第一节: HtmlUnit 简介 htmlunit 是一款开源的java 页面分析工具,读取页面后,可以有效的使用htmlunit分析页面上的内容。项目可以模拟浏览器运行,被誉为java浏览器的开源实现。是一个没有界面的浏览器,运行速度迅速。是junit的扩展之一 采用的是Rhinojs引擎。模拟j
阅读全文
摘要:人生就像自行车方向掌握在自己手中,用力蹬才能前进,没用力还在前进那是在骑下坡路,一路上不管逆风、顺风的时候,全凭自己掌握你的未来取决于你的现在,多少付出多少收获!
阅读全文
摘要:第一节: rootLogger 根配置 Log4j 根配置语法 指代 把指定级别的日志信息输出到指定的一个或者多个位置 其中,level 是日志记录的优先级,分为OFF、FATAL、ERROR、WARN、INFO、DEBUG、ALL或者自定义的级别。 (具体详情见第二节log4j日志等级) 我们依然
阅读全文
摘要:第一节: Log4j 简介 Log4j log for java(java的日志) 是java主流的日志框架,提供各种类型,各种存储,各种格式,多样化的日志服务; 在爬虫领域,主要用于记录爬虫的执行过程,方便排查爬虫执行错误问题; 详细介绍 参考百度百科 http://baike.baidu.com
阅读全文
摘要:log4j是一个用Java编写的可靠,快速和灵活的日志框架(API),它在Apache软件许可下发布。 Log4j是高度可配置的,并可通过在运行时的外部文件配置。它根据记录的优先级别,并提供机制,以指示记录信息到许多的目的地,诸如:数据库,文件,控制台,UNIX系统日志等。 Log4j中有三个主要组
阅读全文