随笔档案「2019年4月」 - 068郑达

爬虫综合大作业

摘要：本次作业爬取的是最近上映的很火热的电影《反贪风暴》。希望可以爬取一些有意义的东西。最新电影票房排行明细： Scrapy使用的基本流程：一.把爬取的内容保存取MySQL数据库主要代码如下：城市，评论，号码，昵称，评论时间，用户等级 import scrapy class MaoyanItem( 阅读全文

posted @ 2019-04-28 21:27 068郑达阅读(298) 评论(0) 推荐(0)

爬取全部的校园新闻

摘要：1.从新闻url获取新闻详情：字典,anews import requests from bs4 import BeautifulSoup from datetime import datetime import re def click(xbk): id=re.findall('(\d{1,5} 阅读全文

posted @ 2019-04-12 21:30 068郑达阅读(195) 评论(0) 推荐(0)

获取一篇新闻的全部信息

摘要：给定一篇新闻的链接newsUrl，获取该新闻的全部信息标题、作者、发布单位、审核、来源发布时间:转换成datetime类型点击： newsUrl newsId(使用正则表达式re) clickUrl(str.format(newsId)) requests.get(clickUrl) newC 阅读全文

posted @ 2019-04-03 20:40 068郑达阅读(201) 评论(0) 推荐(0)

04 2019 档案

公告