2019年11月7日
摘要: 文件操作 1、介绍 计算机系统分为,计算机硬件,操作系统,应用程序 三部分 我们用python或其他语言编写的应用程序若想要把数据永久保存下来,必须要保存于硬盘中,这就涉及到应用程序要操作硬件,众所周知,应用程序是无法直接操作硬件的,这就用到了操作系统。操作系统把复杂的硬件操作封装成简单的接口给用户 阅读全文
posted @ 2019-11-07 22:24 Rannie` 阅读(128) 评论(0) 推荐(0) 编辑
摘要: time、datetime --时间模块 random --随机模块 csv与openpyxl --Excel相关模块 jieba,wordcloud --中文结巴分词 re --正则模块 os --操作系统、sys --解释器 hashlib --加密模块 collections --高级数据类型 阅读全文
posted @ 2019-11-07 19:56 Rannie` 阅读(251) 评论(0) 推荐(0) 编辑
摘要: [TOC] 前言:三大核心硬件 所有软件都是运行硬件之上的,与运行软件相关的三大核心硬件为cpu、内存、硬盘,我们需要明确三点 python解释器执行文件的流程 以python test.py为例,执行流程如下 什么是字符编码? 计算机是以二进制的形式来存储数据的,即它只认识 0 和 1 两个数字。 阅读全文
posted @ 2019-11-07 19:50 Rannie` 阅读(346) 评论(0) 推荐(0) 编辑
2019年11月6日
摘要: 写爬虫,是一个非常考验综合实力的活儿。 有时候,你轻而易举地就抓取到了想要的数据; 有时候,你费尽心思却毫无所获。 好多Python爬虫的入门教程都是一行代码就把你骗上了**“贼船”**,等上了贼船才发现,水好深~ 比如爬取一个网页可以是很简单的一行代码: requests.get('https:/ 阅读全文
posted @ 2019-11-06 19:00 Rannie` 阅读(502) 评论(0) 推荐(0) 编辑
摘要: Requests 基本使用 python发送请求时,可以用requests模块,这个模块不是内置模块 需要安装 pip install requests Requests库的七个主要方法: 方法 描述 requests.request() 构造一个请求,支撑一下各方法的基础方法 requests.g 阅读全文
posted @ 2019-11-06 18:55 Rannie` 阅读(221) 评论(0) 推荐(0) 编辑
摘要: 1、初识爬虫 明晰路径 一般来说,传统的拿数据的做法是:通过浏览器上网,手动下载所需要的数据。其实在这背后,浏览器做了很多我们看不见的工作,而只有了解浏览器的工作原理后,才能真正理解爬虫在帮我们做什么。 浏览器的工作原理 实不相瞒,在这个过程中,浏览器的交流对象不只有你,还有【服务器】。我们可以把服 阅读全文
posted @ 2019-11-06 18:53 Rannie` 阅读(140) 评论(0) 推荐(0) 编辑
2019年11月5日
摘要: 基本数据类型及内置方法 引子:序列 所谓序列,指的是一块可存放多个值的连续内存空间,这些值按一定顺序排列,可通过每个值所在位置的编号(称为索引)访问它们 在python中,序列类型包括字符串、列表、元组、集合和字典,这些序列支持以下几种通用的操作,但比较特殊的是,集合和字典不支持索引、切片、相加和相 阅读全文
posted @ 2019-11-05 18:45 Rannie` 阅读(258) 评论(0) 推荐(0) 编辑
摘要: 1、selenium是什么呢? selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法执行javaScript代码的问题。 它可以做什么呢?它可以用几行代码,控制浏览器,做出自动打开、输入、点击等操作,就像是有一个真正的用户在操作一样。 selenium允许让人去 阅读全文
posted @ 2019-11-05 17:35 Rannie` 阅读(275) 评论(0) 推荐(0) 编辑
2019年11月3日
摘要: Beautiful Soup 是一个可以从 HTML 或 XML 文件中提取数据的 Python 库 Beautiful Soup简介 Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。 它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简 阅读全文
posted @ 2019-11-03 18:53 Rannie` 阅读(320) 评论(0) 推荐(0) 编辑
2019年11月2日
摘要: [TOC] 1.python解释器的种类及特点 ,由C语言开发的,使用最广的解释器(最具广泛兼容性方案) ,基于cpython之上的一个交互式计时器,交互方式增强,功能和CPython一样 ,目标是执行效率,对python代码进行动态编译,提高执行效率 ,运行在java上的解释器,直接把python 阅读全文
posted @ 2019-11-02 20:29 Rannie` 阅读(232) 评论(0) 推荐(0) 编辑
去除动画
找回动画