摘要:
一、概述 1.计算机网络的五层协议体系结构 应用层:应用层的任务是通过应用进程的交互来完成特定的网络应用。 运输层:运输层的任务就是负责向两台主机中的进程之间的通信提供数据传输服务。 网络层:网络层负责为分组交换网上的不同主机提供通信服务。 数据链路层:为两台主机之间的数据传输提供链路层的协议,使数 阅读全文
摘要:
一、概述 1.数据抓取 也称为网络爬虫,是指从网上获取数据,并将获取的数据转化为结构化数据,最终将数据存储到本地计算机或数据库的一种技术。 2.数据预处理 分为数据清洗、数据集成、数据转化、数据规约四个环节。 3.数据类型 结构化数据:又称行数据,是由二维表结构来逻辑表达和实现的数据。 非结构化数据 阅读全文