04 2019 档案

摘要:本次作业爬取的是最近上映的很火热的电影《反贪风暴》。希望可以爬取一些有意义的东西。 最新电影票房排行明细: Scrapy使用的基本流程: 一.把爬取的内容保存取MySQL数据库 主要代码如下: 城市,评论,号码,昵称,评论时间,用户等级 import scrapy class MaoyanItem( 阅读全文
posted @ 2019-04-28 21:27 068郑达 阅读(298) 评论(0) 推荐(0)
摘要:1.从新闻url获取新闻详情: 字典,anews import requests from bs4 import BeautifulSoup from datetime import datetime import re def click(xbk): id=re.findall('(\d{1,5} 阅读全文
posted @ 2019-04-12 21:30 068郑达 阅读(195) 评论(0) 推荐(0)
摘要:给定一篇新闻的链接newsUrl,获取该新闻的全部信息 标题、作者、发布单位、审核、来源 发布时间:转换成datetime类型 点击: newsUrl newsId(使用正则表达式re) clickUrl(str.format(newsId)) requests.get(clickUrl) newC 阅读全文
posted @ 2019-04-03 20:40 068郑达 阅读(201) 评论(0) 推荐(0)