上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 27 下一页
摘要: ltp分词加入词典后处理——强制分词 问题:在使用ltp分词模块的时候,某些词典的词被切开后,所分的词没有按照词典进行标注? 此处在借鉴https://blog.csdn.net/KanShiMeKan/article/details/80974977的基础上对进行改进,主要通过正则表达式 impo 阅读全文
posted @ 2022-03-10 17:43 小杨的冥想课 阅读(268) 评论(0) 推荐(0) 编辑
摘要: python爬虫 ## 1.Python爬虫架构 Python 爬虫架构主要由五个部分组成,分别是调度器、URL管理器、网页下载器、网页解析器、应用程序(爬取的有价值数据)。 **调度器:**相当于一台电脑的CPU,主要负责调度URL管理器、下载器、解析器之间的协调工作。 **URL管理器:**包括 阅读全文
posted @ 2022-03-07 10:33 小杨的冥想课 阅读(108) 评论(0) 推荐(0) 编辑
摘要: icecream调试 from icecream import ic def square_of(num): return num*num ic(square_of(2)) ic(square_of(3)) ic(square_of(4))#类似print,不过比print要多输出函数名称+结果 # 阅读全文
posted @ 2022-03-05 20:06 小杨的冥想课 阅读(28) 评论(0) 推荐(0) 编辑
摘要: python零散的小知识点 1.使用heapq模块,获取列表中n个最大或最小的元素 import heapq scores = [51, 33, 64, 87, 91, 75, 15, 49, 33, 82] print(heapq.nlargest(3, scores)) # [91, 87, 8 阅读全文
posted @ 2022-03-04 09:12 小杨的冥想课 阅读(41) 评论(0) 推荐(0) 编辑
摘要: if语句中的多个条件的并与交 1.if语句中同时满足多个条件 math_points = 51 biology_points = 78 physics_points = 56 history_points = 72 my_conditions = [math_points > 50, biology 阅读全文
posted @ 2022-03-03 21:26 小杨的冥想课 阅读(293) 评论(0) 推荐(0) 编辑
摘要: 关于print的一些知识点 1.print**打印多个值,**在每个值之间使用自定义分隔符 print("29", "01", "2022", sep="/") # 29/01/2022 2.print对齐方式:左对齐,右对齐 name = "杨子列" print(name.ljust(20)) # 阅读全文
posted @ 2022-02-28 17:22 小杨的冥想课 阅读(279) 评论(0) 推荐(0) 编辑
摘要: 正则表达式中的split的使用 # 正则表达式中的split的使用 import re pattern = r',|\.|/|;|\'|`|\[|\]|<|>|\?|:|"|\{|\}|\~|!|@|#|\$|%|\^|&|\(|\)|-|=|\_|\+|,|。|、|;|‘|’|【|】|·|!| | 阅读全文
posted @ 2022-02-23 23:10 小杨的冥想课 阅读(353) 评论(0) 推荐(0) 编辑
摘要: 初始化方法__init__ 以前一直迷糊初始化方法到底是个啥呢,用的时候一直捏手捏脚,仿佛一瞬间就明白了,原来初始化方法起到的是一个仓库与媒介的作用,即可以用来暂存公共函数,共其他函数进行调用,当然其他函数经过对象调用时依然不受初始化方法的影响,这极大的提高了编程的灵活性 class Flag: d 阅读全文
posted @ 2022-02-22 14:27 小杨的冥想课 阅读(86) 评论(0) 推荐(0) 编辑
摘要: 正则表达式 正则表达式中如何解决,提取固定区间中出现特征字符最近的内容 #1.提取离23前面最近a的字符串 import re String= "ffasdfas住址dfasklfjsakldfjlsajf23klasjdfasl" repater = "a[^a]*(?=23)"#a后面要一直是非 阅读全文
posted @ 2022-02-21 09:43 小杨的冥想课 阅读(228) 评论(0) 推荐(0) 编辑
摘要: TF-IDF算法与TextRank算法 基于TF-IDF算法的关键词提取 基本语法 jieba.analyse.extract_tags(sentense,topK=20,withWeight=False,allowPOS=()) sentense:待提取的文本 topK:返回权重较大的前多少个关键 阅读全文
posted @ 2022-02-17 21:17 小杨的冥想课 阅读(164) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 27 下一页