随笔分类 - Python&数据分析
摘要:title: python = 赋值顺序 && C++ side effect date: 2020-03-17 15:00:00 categories: [python][c++] tags: 语法 先是python = 的运算顺序不清楚,然后搞明白了之后自然就想知道C++是什么样的 1 pyth
阅读全文
摘要:title: python yield && scrapy yield date: 2020-03-17 16:00:00 categories: python tags: 语法 yield 关键字用于生成器。 yield在scrapy中的运用。 1 python yield 1.1 参考 http
阅读全文
摘要:title: 爬虫入门六 总结 资料 与Scrapy实例-bibibili番剧信息 date: 2020-03-16 20:00:00 categories: python tags: crawler 学习资料的补充。 和Scrapy的一个实例 bilibili番剧信息爬取。 1 总结与资料 1.1
阅读全文
摘要:title: 爬虫入门五 gooseeker date: 2020-03-16 16:00:00 categories: python tags: crawler gooseeker是一个简单的爬虫软件。无需编程知识就可以使用。 1 简介 集搜客GooSeeker大数据软件开发始于2007年,200
阅读全文
摘要:title: 爬虫入门四 re date: 2020-03-14 16:49:00 categories: python tags: crawler 正则表达式与re库 1 正则表达式简介 编译原理学过的 正则表达式(Regular Expression,简写为regex或RE),使用单个字符串来描
阅读全文
摘要:title: 爬虫入门三 scrapy date: 2020-03-14 14:49:00 categories: python tags: crawler scrapy框架入门 1 scrapy简介 爬虫框架是实现爬虫功能的一个软件结构和功能组件集合。 官方网站:https://scrapy.or
阅读全文
摘要:title: 爬虫入门二 beautifulsoup date: 2020-03-12 14:43:00 categories: python tags: crawler 使用beautifulsoup解析数据 1 beautifulsoup简介 BeautifulSoup 是一个可以从HTML或X
阅读全文
摘要:title: 爬虫入门一 基础知识 以及request date: 2020-03-05 14:43:00 categories: python tags: crawler 爬虫整体概述,基础知识。 requests库的学习 1.request Requests 是用Python语言编写,基于 ur
阅读全文
摘要:返回的是数组而非int 比如返回x,y 为[1][2] 而非1,2 容易在只有一维一列时没有意识到 其他函数的返回值也要注意
阅读全文
摘要:a.*?b就是a开始b结束的匹配如果要限制是一行的开头和末尾的话就是^a.*?b$例如
阅读全文
摘要:1 Anaconda Anaconda包括Conda、Python以及一大堆安装好的工具包,比如:numpy、pandas、matplotlib等。Conda是一个开源的包、环境管理器(相当于centos里面的yum),可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换。
阅读全文
摘要:数据可视化 基本概念 数据可视化是指借助于图形化的手段,清晰、快捷有效的传达与沟通信息。同时,也可以辅助用户做出相应的判断,更好的去洞悉数据背后的价值。 字不如表,表不如图。 观察号码的频率,每个号码出现了多少次? 文字 08 10 15 20 30 31 33 0601 09 10 17 21 2
阅读全文
摘要:#数据处理 ##数据加载 首先,我们需要将收集的数据加载到内存中,才能进行进一步的操作。pandas提供了非常多的读取数据的函数,分别应用在各种数据源环境中,我们常用的函数为: read_csv, read_table, read_sql, 说明: read_csv与read_table默认使用的分
阅读全文
摘要:#概述 ##numpy numpy(numeric python)是 python 的一个开源数值计算库,主要用于数组和矩阵计算。底层是 C 语言,运行效率远高于纯 python 代码。numpy主要包含2个重要的数据类型: 1)ndarray (N维数组,这个是我们要重点掌握的) 2)matrix
阅读全文
摘要:参考 https://www.runoob.com/python3/python3-class.html #class 类有一个名为 init() 的特殊方法(构造方法),该方法在类实例化时会自动调用,像下面这样: #双下划线 class Complex: def __init__(self, re
阅读全文
摘要:#形如 def func(): print("hello") return 0 #可选 不添加return时用空行表示结束 #参数 def func(v="默认值") : #默认值 print(v) func() func(4) 默认值 4 看起来是空的,但实际是有值的对象 def func(myl
阅读全文
摘要:运算符 参考 https://www.runoob.com/python3/python3-basic-operators.html & https://www.runoob.com/python3/python3-loop.html 运算符优先级: // 取整除 - 向下取接近除数的整数 >>>
阅读全文
摘要:#列表 list 有序,可嵌套,可重复,元素可修改 方括号 占用空间小但时间消耗比较大 mylist=[“kimi”,1,1,1,[“amy”,18]] V=mylist[-1][0] #取到[“amy”,18]中的”amy” mylist[-1][0] =‘jessie’ #替换 Print(le
阅读全文
摘要:#参考 https://www.runoob.com/python3/python3-data-type.html #有一些补充 #标准数据类型 Python3 中有六个标准的数据类型: Number(数字) String(字符串) List(列表) Tuple(元组) Set(集合) Dictio
阅读全文
摘要:#参考 https://www.runoob.com/python3/python3-basic-syntax.html #有一些自己的补充 #编码 默认情况下,Python 3 源码文件以 UTF-8 编码,所有字符串都是 unicode 字符串。 当然你也可以为源码文件指定不同的编码: # -*
阅读全文