摘要: CPU CPU(Central Processing Unit)是是一块超大规模的集成电路,是一台计算机的运算核心(Core)和控制核心( Control Unit)。它的功能主要是解释计算机指令以及处理计算机软件中的数据。 CPU中包含寄存器、控制器、运算器以及时钟。 寄存器:相当于CPU中的一块 阅读全文
posted @ 2018-10-23 17:55 旧事酒浓1998 阅读(144) 评论(0) 推荐(0) 编辑
摘要: 启动VMware Workstation。 在该界面单击“创建新的虚拟机”图标。 该界面选择安装虚拟机的类型,包括“典型”和“自定义”两种。这种推荐使用“典型”的方式,然后单击“下一步”按钮。 该界面用来选择如何安装客户机操作系统。这里选择“稍后安装操作系统”,然后单击“下一步”按钮。 在该界面选择 阅读全文
posted @ 2018-06-03 19:23 旧事酒浓1998 阅读(2108) 评论(0) 推荐(0) 编辑
摘要: 功能描述: 目标:获取淘宝搜索页面的信息,提取其中的商品和价格。 理解:淘宝的搜索接口 功能描述: 目标:获取淘宝搜索页面的信息,提取其中的商品和价格。 理解:淘宝的搜索接口 目标:获取淘宝搜索页面的信息,提取其中的商品和价格。 理解:淘宝的搜索接口 翻页的处理: 技术路线:requests-re 阅读全文
posted @ 2018-06-03 16:54 旧事酒浓1998 阅读(753) 评论(0) 推荐(0) 编辑
摘要: 完整的解析信息的标记形式,再提取关键信息。 完整的解析信息的标记形式,再提取关键信息。 XML JSON YAML 需要标记解析器:例如:bs4库的标签树遍历 优点:信息解析准确 缺点:提取过程繁琐,速度慢。 无视标记形式,直接搜索关键信息。 优点:信息解析准确 缺点:提取过程繁琐,速度慢。 优点: 阅读全文
posted @ 2018-06-03 16:52 旧事酒浓1998 阅读(851) 评论(0) 推荐(0) 编辑
摘要: 功能描述: 目标:获取上交所和深交所所有股票的名称和交易信息 输出:保存到文件中 技术路线:requests-bs4-re 候选数据网站的选择: 新浪股票:http://finance.sina.com.cn/stock/ 百度股票:https://gupiao.baidu.com/stock/ 候 阅读全文
posted @ 2018-06-03 16:49 旧事酒浓1998 阅读(1046) 评论(0) 推荐(0) 编辑
摘要: Match对象的属性: 属性 说明 .string 待匹配的文本 .re 匹配时使用的pattern对象(正则表达式) .pos 正则表达式搜索文本的开始位置 .endpos 正则表达式搜索文本的结束位置 Match对象的方法: 方法 说明 .group(0) 获得匹配后的字符串 .start() 阅读全文
posted @ 2018-06-03 16:46 旧事酒浓1998 阅读(407) 评论(0) 推荐(0) 编辑
摘要: Re库介绍: Re库是Python的标准库,主要用于字符串匹配。 调用方式:import re 正则表达式的表示类型: raw string类型(原生字符串类型): re库采用raw string类型表示正则表达式,表示为:r'text' 例如:r'[1-9]\d{5}' raw string是指不 阅读全文
posted @ 2018-06-03 16:41 旧事酒浓1998 阅读(8953) 评论(0) 推荐(1) 编辑
摘要: 正则表达式(regular expression):正则表达式是用来简洁的表达一组字符串的表达式。 优势:简洁(一行胜千言) 'PY开头' 后续存在不多于10个字符 后续字符不能是'P'或'Y' 正则表达式:PY[^PY]{0,10} 正则表达式: 通用的字符串表达框架 简洁表达一组字符串的表达式 阅读全文
posted @ 2018-06-03 16:38 旧事酒浓1998 阅读(1119) 评论(1) 推荐(1) 编辑
摘要: 功能描述: 输入:大学排名URL链接:http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html 输出:大学排名信息的屏幕输出(排名,大学名称,总分) 技术路线:requests-bs4 定向爬虫:仅对输入的URL链接进行爬取,不扩展爬取。 程序的程序 阅读全文
posted @ 2018-06-03 16:33 旧事酒浓1998 阅读(458) 评论(0) 推荐(0) 编辑
摘要: bs4库的prettify()方法: 将某一个标签打印: 对于中文的HTML代码,也可以直接打印: 基于bs4库的HTML内容查找方法 <>.find_all(name,attrs,recursive,string,**kwargs):返回一个列表类型,存储查找的结果 name:对标签名称的检索字符 阅读全文
posted @ 2018-06-03 16:23 旧事酒浓1998 阅读(279) 评论(0) 推荐(0) 编辑