06 2021 档案
摘要:通用网络爬虫的实现原理及过程如下图所示: 通用网络爬虫的实现原理: (1)获取初始的URL。初始的URL地址可以人为地指定,也可以由用户指定的某个或某几个初始爬取网页决定。 (2)根据初始的URL爬取页面并获得新的URL。获得初始的URL地址之后,先爬取当前URL地址中的网页信息,然后解析网页信息内
阅读全文
摘要:爬虫可分为通用网络爬虫、聚焦爬虫、增量式网络爬虫和深层网络爬虫。 通用网络爬虫是捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。通用网络爬虫从互联网中搜集网页,采集信息,这些网页信息用于为搜索引擎建立索引。
阅读全文
摘要:编译是将可阅读的源代码转换为计算机可读的二进制文件,从而使其可以被计算机解析并执行。 编译器以源代码作为输入,将其转换为一系列称为目标码的中间文件。这些目标码文件还不能直接执行,因为其中可能引用了一些源代码中未包含的符号和函数。通过“链接”过程可将各个目标文件链接成为一个可执行的二进制文件,从而解决
阅读全文
摘要:C++处理字符串的方式有两种。第一种来自C语言,常被称为C-风格字符串(C-style string)。另一种基于string类库。 字符数组 存储在连续字节中的一系列字符意味着可以将字符串存储在char数组中,其中每个字符都位于自己的数组元素中。 C-风格字符串具有一种特殊的性质:以空字符(nul
阅读全文
摘要:概述 Win32平台上(包括Windows 9x/NT/2000/XP/Server 2003/Vista/CE/7/10),可执行文件格式是PE。 PE是“Portable Executable File Format”(可移植的执行体)的缩写。PE格式是目前Windows平台上的主流可执行文件格
阅读全文
摘要:GNU Radio GNU Radio的安装(官网教程)https://wiki.gnuradio.org/index.php/InstallingGR GNU Radio的安装 https://zhuanlan.zhihu.com/p/142560387 Ubuntu各版本安装UHD和GNU Ra
阅读全文