摘要:
参考书籍:《自己动手写网络爬虫》 网络爬虫的基本操作是抓取网页。 “打开”网页的过程其实就是浏览器作为一个浏览的“客户端”,向服务器端发送了一次请穷求,把服务器端的文件“抓”到本地,再进行解释,展现。更进一步,可以通过浏览器端查看“抓取”过来的文件源代码, url(Universal Resourc 阅读全文
摘要:
118: 笛卡儿连接:当多张表在一起查询时,没有给定正确的连接条件,结果是第一张表的所有行和第二张表的所有行进行矩阵相乘,得到n*m 行的结果集。 SQL> select ename,dname from emp cross join dept; 等值连接:在连接中给定一个相等的连接条件。 sele 阅读全文
摘要:
网络爬虫是一种自动获取网页内容的程序,是搜索引擎的重要组成部分。搜索引擎优化很大程度上就是针对爬虫而做出的优化。 网络爬虫为搜索引擎从万维网下载网页。一般分为传统爬虫和聚焦爬虫 传统爬虫从一个或若干初始网页的url开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队 阅读全文
摘要:
《Oracle数据库讲义学习笔记》 书写SQL 语句的原则大小写不敏感,但单引和双引内的大小写是敏感的。切记!关键字不能缩写可以分行书写,但关键字不能被跨行书写,单引内也不要跨行书写。一般每个子句独立占一行可以排版来增加可读性字符串用单引列的别名用双引。 101: 一般大写为关键字,小写为自己指定的 阅读全文
摘要:
名为BlackNurse的攻击方式,它不是仅仅建立在网络连接上的单纯ICMP(控制报文协议)泛洪攻击,传统的ICMP泛洪攻击是通过高频向目标发送ICMP请求来实现的,而BlackNurse攻击则是基于ICMP Type Code3的包,而这种通常被路由器和网络设备用来发送金额接受错误信息。 ICMP 阅读全文
摘要:
linux: man命令,显示使用手册 /关键字,搜索手册中想要查询的字 1可执行程序或shell命令2系统调用(Linux内核提供的函数)3库调用(程序库中的函数)4特殊文件(通常在/dev下)5文件格式和惯例(例如/etc/passwd)6游戏7杂项(包括宏包和惯例,比如man(7),groff 阅读全文
摘要:
变量的取用:只是需要在变量名称前面加上 $ , 或者是以 ${variable} 的方式来取用都可以 env列出目前Shell环境下所有环境变量。 set列出当前shell环境下所有的变量。 让使用者由键盘输入一内容,将该内容变成 atest 变量[root@linux ~]# read atest 阅读全文
摘要:
SOA,即面向服务的体系结构(Service-Oriented Architecture,也叫面向服务架构),是指为了解决在Internet环境下业务集成的需要,通过连接能完成特定任务的独立功能实体实现的一种软件系统架构。SOA是一个组件模型,它将应用程序的不同功能单元(称为服务)通过这些服务之间定 阅读全文
摘要:
我们必须要透过『 Shell 』将我们输入的指令与 Kernel 沟通,好让 Kernel 可以控制硬件来正确无误的工作。 由于 kernel 听不懂人类的语言,而人类也没有办法直接记得 kernel 的语言,所以两者的沟通就得藉由 shell 来支持了 kernel 是『核心』的意思,而 Shel 阅读全文
摘要:
《linux私房菜》 cd命令,change directory,切换工作目录 pwd命令,查看当前目录 mkdir命令,新建一个目录 rmdir命令,删除一个空目录 ls命令,显示列表//-l显示详细信息,-a连同隐藏文档显示 cp命令,copy复制档案//cp 源档 目的档 rm命令,删除目录或 阅读全文