摘要:
1. 实验目的 • 理解抓取网页的含义和URL基本构成; • 掌握类和函数及模块的设计与实现; • 掌握网络爬虫原理。 • 理解Unicode编码。 2. 实验内容 本次实验是通过编写Python网络爬虫,爬取百度提供出的新型冠状病毒肺炎疫情实时大数据报告,从中获取国内目前疫情情况,以及其他国家和地 阅读全文
摘要:
一、启动Zookeeper服务 在Windows系统中打开第1个cmd窗口,启动Zookeeper服务: > cd c:\kafka_2.12-2.4.0 > .\bin\windows\zookeeper-server-start.bat .\config\zookeeper.Properties 阅读全文
摘要:
我这里用的是pycharm64.exe软件和数据库MySQL5.5,数据库可视化SQLyogCommunity - 64 bit软件,语言是python3 爬取内容是腾讯实时监控内容,url:https://news.qq.com/zt2020/page/feiyan.htm?from=timeli 阅读全文
摘要:
最终结果(本页面只是一部分的代码,数据的爬取和其他图片的呈现请点击主页查看) 词云 数据准备 https://files.cnblogs.com/files/blogs/673788/data.zip?t=1636387982&download=true 导入的库 from pyecharts im 阅读全文
摘要:
最终结果(本页面只是其中的一部分,具体可查看本人主页) 数据准备 https://files.cnblogs.com/files/blogs/673788/data.zip?t=1636387982&download=true 导入的库 from pyecharts import options a 阅读全文
摘要:
结果截图 (本页面只是其中的一部分,具体可查看本人主页) 数据准备 数据的爬取:https://www.cnblogs.com/qi-6666/p/15525301.html 或:https://files.cnblogs.com/files/blogs/673788/data.zip?t=1636 阅读全文
摘要:
下载好eclipse安装包 上传到虚拟机 在虚拟机上解压安装包 启动eclipse 命令 :./eclipse 错误:修改日志错误 yum install gtk2.i686 gtk2-engines.i686 PackageKit-gtk-module.i686 PackageKit-gtk-mo 阅读全文
摘要:
#需要导入的库from pyecharts import options as opts from pyecharts.charts import Geo from pyecharts.globals import ChartType, SymbolType from pyecharts.chart 阅读全文
摘要:
需要添加和调用的库 具体代码 1 import requests 2 from lxml import etree 3 import json 4 import openpyxl 5 6 7 #通用爬虫 8 url = 'https://voice.baidu.com/act/newpneumoni 阅读全文
摘要:
查看端口 [root@zwq ~]# netstat -tlunp 查看防火墙状态 [root@zwq ~]# sudo systemctl status firewalld 出现dead说明防火墙已关闭 第二种查看方法 [root@zwq ~]# firewall-cmd --state 出现no 阅读全文