随笔分类 - python基础知识
摘要:1.dict简介 字典是另一种可变容器模型,且可存储任意类型对象。 字典的每个键值 key=>value 对用冒号 : 分割,每个键值对之间用逗号 , 分割,整个字典包括在花括号 {} 中 ,格式如下所示: d = {key1 : value1, key2 : value2 } 键必须是唯一的,但值
阅读全文
摘要:1.列表list拼接成字符串 Python join() 方法用于将序列(列表是序列的一种)中的元素以指定的字符连接生成一个新的字符串。 item1 = ["lowman", "isbusy"] item2 = ",".join(item1) # 根据实际需要使用相应的分隔符连接列表元素,如 , :
阅读全文
摘要:1.类和对象的基本概念 面向对象的思想中提出了两个概念,即类和对象。类是对某一类事物的抽象描述,是一种抽象的数据类型,一种模板。而对象用于表示现实中该类事物的个体,也就是具体化了类的描述。它们的关系是,对象是类的具体实例,类是对象的模板。对象根据类创建,一个类可以创建多个对象。比如我定义了一个学生类
阅读全文
摘要:在这个速查手册中,我们使用如下缩写: df:任意的Pandas DataFrame对象 s:任意的Pandas Series对象 raw:行标签 col:列标签 导入依赖包: import pandas as pd import numpy as np 1.导入数据 pd.read_csv(file
阅读全文
摘要:1.df.loc[[index],[colunm]] 通过标签选择数据 loc需要两个单/列表/范围运算符,用","分隔。第一个表示行,第二个表示列 (1)获取指定列的数据 df.loc[:,'reviews'] 注意: 第一个参数为:表示所有行,第2个参数为列名,设置获取review列的数据 im
阅读全文
摘要:1.Python中以绝对路径或者相对路径导入文件的方法 绝对路径就是文件的真正存在的路径,是指从硬盘的根目录(盘符)开始,进行一级级目录指向文件。相对路径就是以当前文件为基准进行一级级目录指向被引用的资源文件。以下是常用的表示当前目录和当前目录的父级目录的标识符 ../ 表示当前文件所在的目录的上一
阅读全文
摘要:1.LDA主题模型简介 主题模型的核心思想是——一篇文章中的每个词语都是经历以下两个步骤之后生成而来: 一篇文章以一定概率选择了某个主题, 然后并从这个主题中以一定概率选择某个词语。 如下图所示: 比如某一篇文档 d,它的主题分布如右方红色柱状图所示。这篇文档最有可能是一篇体育,新闻类型的文档。 :
阅读全文
摘要:1.jieba分词与词性标注 思路: (1)利用pandas读取csv文件中的酒店客户评论,并创建3个新列用来存放分词结果、词性标注结果、分词+词性标注结果 (2)利用jieba分词工具的posseg包,同时实现分词与词性标注 (3)利用停用词表对分词结果进行过滤 (4)将分词结果以20000条为单
阅读全文
摘要:1.Pandas简介 Pandas处理以下三个数据结构 - 系列(Series) 数据帧(DataFrame) 面板(Panel) 这些数据结构构建在Numpy数组之上,这意味着它们很快 考虑这些数据结构的最好方法是,较高维数据结构是其较低维数据结构的容器。 例如,DataFrame是Series的
阅读全文
摘要:1.正则表达式语法 正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。 例如: runoo+b,可以匹配 runoob、runooob、runoooooob 等,
阅读全文
摘要:1.利用python读取文件 (1)Python引入了with语句来自动帮我们调用close()方法 <1>读取指定路径下的文件 with open('/path/to/file', 'r') as f: print(f.read()) <2>写文件 with open('/Users/michae
阅读全文
摘要:from ... import ... 的用法和直接import的区别: 1.直接使用import时,如果需要使用到导入模块内的属性和方法,必须使用模块名.属性和模块名.方法的方式进行调用 2.使用from...improt...时,可以直接使用模块内的属性和方法,相当于该模块被直接导入到局部名字空
阅读全文
摘要:转义字符描述 \(在行尾时) 续行符 \\ 反斜杠符号 \’ 单引号 \” 双引号 \a 响铃 \b 退格(Backspace) \e 转义 \000 空 \n 换行 \v 纵向制表符 \t 横向制表符 \r 回车 \f 换页 \oyy 八进制数yy代表的字符,例如:\o12代表换行 \xyy 十进
阅读全文