码出个世界

导航

2021年4月18日 #

Python爬虫---1

摘要: 网络爬虫按照系统结构和实现技术,大致可以分为以下几种类型:通用网络爬虫、聚焦网络爬虫、增量式网络爬虫、深层页面爬虫。实际的网络爬虫系统通常是几种爬虫技术相结合实现的。 1、通用网络爬虫 通用网络爬虫又称全网爬虫,爬行对象从一些种子URL扩充到整个Web,主要为门户站点、搜索引擎和大型Web服务提供商 阅读全文

posted @ 2021-04-18 11:54 码出个世界 阅读(51) 评论(0) 推荐(0) 编辑

软工大二下第七周学习随笔

摘要: 开始安装配置hbase,我总结了下载方法: 注意:如果在操作HBase的过程中发生错误,可以通过{HBASE_HOME}目录(/usr/local/hbase)下的logs子目录中的日志文件查看错误原因。这里启动关闭Hadoop和HBase的顺序一定是:启动Hadoop—>启动HBase—>关闭HB 阅读全文

posted @ 2021-04-18 11:37 码出个世界 阅读(29) 评论(0) 推荐(0) 编辑