第三周学习进度

本周主要完成了java、python数据抓取功能,老师要求发一篇相关博客,我前几天发过了这次就不在发了,详细思路代码可以看我上一篇博客。

在网络上查找相关资料,java要写一个实体相关类,然后抓取部分代码和html页面,然后连接数据库。具体为这三个步骤

(1)设置URL、URLConnection、BufferedReader *

(2)设置正则表达式,通过获取的数据流进行解析 *

(3)将符合匹配要求的数据存放到list数组中和数据库中

 连接博客https://blog.csdn.net/wjf_1997/article/details/78245702

但是这种方式效率太低了,还要写dao层,于是我采用的python方法,python易操作、比较简单。

我打算周末这两天学习,数据库连接,以及dao层,servlet层这些相关知识,感觉自己这方面还是不太熟悉,另外html的标签以及框架的使用也要学习了。

在这周学习的过程中还是遇到了不小的麻烦,在学习用java数据抓取时,还要另外创建一个实体类,由于创建的实体类和之前数据库表里存的不一样,导致后面的项目,不能成功连接到新建的表,后来还改了表中各列数据的名字才解决的。python抓取过程中也遇到了一些问题,主要是Python语言很多不会,还是在网上找的例子,套过来的。

posted @ 2020-03-13 20:58  烈日灼心h  阅读(60)  评论(0编辑  收藏  举报