随笔分类 - 第三方库
摘要:NumPy库数据存取与函数 数据的CSV文件存取 CSV文件 CSV是一种常见的文件格式,用来存储批量数据 np.savetxt(frame, array, fmt = '%.18e', delimiter=None) frame:文件、字符串或产生器,可以是.gz或.bz2的压缩文件 array:
阅读全文
摘要:NumPy库 安装 pip install NumPy 数据的维度 一维数据:一维数据由对等关系的有序或无序数据构成,采用线性方式组织 对应列表、数组和集合等概念 二维数据:二维数据由多个一维数据构成,是一维数据的组合形式 表格 多维数据:多维数据由一维或二维数据在新维度上扩展形成 高维数据:高维数
阅读全文
摘要:jieba库 概述 jieba是优秀的中文分词第三库 安装 pip install jieba 三种模式 精确模式:把文本精确的切分开,不存在冗余单词 全模式:把文本中所有可能的词语都扫描出来,有冗余 搜索引擎模式:在精确模式基础上,对长词再次切分 jieba常用函数 函数 描述 jieba.lcu
阅读全文
摘要:正则表达式 正则表达式的概念 正则表达式是一种针对字符串表达"简洁"和"特征"思想的工具 正则表达式可以用来判断某一字符串的特征归属 正则表达式的语法 正则表达式语法由字符串和操作符构成 正则表达式的常用操作符 操作符 说明 实例 . 表示任何单个字符 [ ] 字符集,对单个字符给出取值范围 [ab
阅读全文
摘要:wordcloud库 wordcloud库基本介绍 概述:wordcloud是优秀的词云展示第三方库 wordcloud库的安装 pip install wordcloud wordcloud库使用说明 基本使用 wordcloud库把词云当作一个WordCloud对象 wordcloud.Word
阅读全文
摘要:信息组织与提取 信息标记: 标记后的信息可以形成信息组织结构,增加了信息维度 标记后的信息可用于通信、存储或展示的形式 标记的结构与信息一样具有重要价值 标记后的信息更有利于程序理解和运用 信息标记的三种形式 XML(扩展标记语言) 空元素的缩写形式: 注释书写形式: JSON 有类型的键值对key
阅读全文
摘要:BeautifulSoup库 概述 BeautifulSoup库(beautifulsoup4)是解析、遍历、维护、“标签树”的功能库。 官方:https://www.crummy.com/software/BeautifulSoup/ BeautifulSoup库的安装 pip install b
阅读全文
摘要:Requests库 概述 简介:Requests库是Python的第三方库。 Requests库官网:http://www.python-requests.org Requests库的安装 以管理身份运行command控制台。 pip install requests Requests库的2个重要对
阅读全文