09 2017 档案
摘要:一、链接分析: 以"Linux"为搜索的关键字为例: 首页的链接为:https://zhidao.baidu.com/search?lm=0&rn=10&pn=0&fr=search&ie=gbk&word=linux 第二页的链接为:https://zhidao.baidu.com/search?
阅读全文
摘要:一、HTTP报文 1.请求报文 HTTP协议是以ASCII码传输,建立在TCP/IP协议之上的应用层规范。规范把HTTP请求分为三部分:状态行、请求头、消息主体。类似下面这样: HTTP定义了与服务器交互的不同方法,最基本的方法有4中,分别是Get、Post、Put和Delete。 1。Get用于信
阅读全文
摘要:一、存储过程 存储过程是存储在数据库目录中的一段声明性sql语句,感觉其功能类似函数。 我们可以通过create procedure procedure_name 语句创建存储过程,然后通过call procedure_name 语句调用存储过程。 下面我们来详细的说明上述存储过程: 第一个命令de
阅读全文
摘要:一、创建并导入数据库 这里我们使用的是yiibaidb下载这个汽车零售商数据库模型,yiibaidb数据库由以下表组成 customers: 存储客户的数据。 products: 存储汽车的数据 productLines: 存储产品类别数据。 orders: 存储客户订购的销售订单。 orderDe
阅读全文
摘要:一、贝叶斯定理的形式和解释: p(W | D)=p(D|W)p(W)p(D) 它让我们能够通过后验概率p(W | D),在观测到D之后估计W的不确定性。 贝叶斯定理右侧的量p(D | W)有观测数据集D来估计,可以被看成参数向量W的函数,被称为似然函数(like
阅读全文
摘要:这次的主要的目的是从淘宝的搜索页面获取商品的信息。其实分析页面找到信息很容易,页面信息的存放都是以静态的方式直接嵌套的页面上的,很容易找到。主要困难是将信息从HTML源码中剥离出来,数据和网页源码结合的很紧密,剥离数据有一定的难度。 然后将获取的信息写入excel表格保存起来,这次只爬取了前面10页
阅读全文