HouseStark

导航

7月20日——项目进展情况总结


数据收集与存储

项目预定利用爬虫收集中国科学技术大学等五个高校就业信息平台的宣讲会信息,完成情况如下:

 基本爬虫程序存储至数据库面向对象爬虫类备注
复旦大学 YES YES YES  
中国科学技术大学 YES YES NO  
上海交通大学 YES NO NO  
浙江大学 YES NO NO  
南京大学 NO NO NO 每页只能爬取4条信息

数据库中starkjobs表的结构如图所示:

CREATE TABLE `starkjobs`(
        id      int(11NOT NULL AUTO_INCREMENT,
        title   varchar(255) NOT NULL,
        place   varchar(255) NOT NULL,
        link    varchar(255) NOT NULL,
        time    datetime NOT NULL,
        school  varchar(255) NOT NULL,
        PRIMARY KEY (id),
        UNIQUE  KEY(link)
    )

image1


前端界面

主界面 image2 登陆界面 image3 注册界面 image4

posted on 2016-07-20 22:26  HouseStark  阅读(243)  评论(0编辑  收藏  举报