摘要: [TOC] lxml库 lxml 是 一个HTML/XML的解析器,其是由C语言来实现的,主要的功能是如何解析和提取 HTML/XML 数据。 基本使用 我们可以利用它来解析HTML代码,并且在解析HTML代码的时候,如果HTML代码不规范,它会自动的进行补全。 读取HTML的文档 我们先建立一个叫 阅读全文
posted @ 2019-04-13 14:45 Mingle_Yuan 阅读(225) 评论(0) 推荐(0) 编辑
摘要: [TOC] XMl语言 简介 XML又叫做 可扩展标记语言 。它和HTML语言一样是标记语言,且结构基本一致,然后他们之间也有很多不同的地方: XML主要用于数据的传输和储存;HTML主要用于数据的显示 XMl是没有被预定义标签,需要自行定义标签;HTML是被预定义了的标签 XML都是双标签;HTM 阅读全文
posted @ 2019-04-08 21:15 Mingle_Yuan 阅读(1063) 评论(0) 推荐(1) 编辑
摘要: 文字内容 添加文字 HTML文字的需要添加在 里面。 标题字 标题字就是以几种固定的字号显示文字,在HTML中定义了六级标题。 添加特殊符号 表示空格,一般在代码里面敲出空格之后,在浏览器编译时,是不会显示这些空格的。如果要使用空格,必须使用   。还有一些特殊符号必须使用相应的符号代码实 阅读全文
posted @ 2019-04-07 11:13 Mingle_Yuan 阅读(298) 评论(0) 推荐(0) 编辑
摘要: 文档的基本结构 是该文档的申明,仅仅适用于HTML5的版本,它告诉浏览器如何处理文档,并且让验证器知道按照什么样的标准检查代码的语言,然后用HTML标记标出实际代码的起始位置。其他的任何内容需要包含到 标签里面。且任何注释信息可以放在 或者 标签里面。在编写html的时候,必须使用到标签,标签用 和 阅读全文
posted @ 2019-04-07 10:26 Mingle_Yuan 阅读(219) 评论(0) 推荐(0) 编辑
摘要: [TOC] 爬虫的分类 通用爬虫 通用爬虫是搜索引擎抓取系统(百度、谷歌、搜狗等)的重要组成部分。主要是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。 聚焦爬虫(定向爬虫) :是面向特定需求的一种网络爬虫程序,他与通用爬虫的区别在于:聚焦爬虫在实施网页抓取的时候会对内容进行筛选和处理,尽 阅读全文
posted @ 2019-04-06 09:33 Mingle_Yuan 阅读(268) 评论(0) 推荐(0) 编辑
摘要: 表格标签和表格标题 表格标签 <table></table> 用于定义一个表格的开始和结束; <tr></tr> 定义一组行标记,在一组行标记内可以建立多组由 <td> 标记定义的单元格; <td></td> 定义单元格标签, <td> 标签必须放在 <tr> 标签内。 表格标题 <caption> 阅读全文
posted @ 2019-03-31 18:03 Mingle_Yuan 阅读(269) 评论(0) 推荐(0) 编辑
摘要: 图像标签 图像标签为 <img> ,它是行内元素,其主要功能是在网页里面插入图像,所插入图片由属性 scr 属性决定。主要格式为 <img scr="URL"> ,其中 scr 属性是必要的。 另外其还有以下的属性: 设置图像的宽度和高度 <img scr="URL" width="" height 阅读全文
posted @ 2019-03-31 14:44 Mingle_Yuan 阅读(391) 评论(0) 推荐(0) 编辑
摘要: 函数概论 函数(function)是用于完成特定任务的程序代码的自包含单元。函数具有执行某些动作,或者返回一个值以供程序使用的功能。当然,一个函数可同时具备以上两种功能。我们建议在头文件里面放入一些其他重要的函数和变量,并在主函数里面引入。 一个简单的函数 void starbar(void); 中 阅读全文
posted @ 2019-03-31 09:12 Mingle_Yuan 阅读(519) 评论(0) 推荐(0) 编辑
摘要: 类型 int是符号的整数,其取值范围依赖于计算机系统 八进制和十六进制 其他 数据类型 类型 可能占用比int类型更少的储存空间,用于仅需要小数值的场合以节省空间。 类型 可能占用比int类型更少的储存空间,用于使用大数值的场合。 类型 可能占用比long类型更多的储存空间,用于使用更大数值的场合。 阅读全文
posted @ 2019-03-30 19:08 Mingle_Yuan 阅读(192) 评论(0) 推荐(0) 编辑
摘要: (一) 指示和头文件 实际上,它是一种剪切和粘贴操作,即包括了建立最终的可执行程序时编译器需要用到信息。 (二) 函数 一个C程序总是从main()函数开始执行,可以对其他函数任意命名,但是main()函数必须是开始函数。int 表明函数main()的返回类型是int,void表明没有传入参数。 ( 阅读全文
posted @ 2019-03-30 19:08 Mingle_Yuan 阅读(127) 评论(0) 推荐(0) 编辑