摘要: 1.import xx :导入模块,在使用的时候需要 “ 模块.函数 ”来使用 例如: 1 import math 2 math.sqr(5) 2.from xx import xx 和 from xx import * 这两个本质没有区别,都是从其它模块里面导入函数。但是唯一的区别就是* 能够导入 阅读全文
posted @ 2022-11-23 15:48 许个未来— 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 1."is", "in","=="的意思? "is":判断两个对象的标识符(通常所说的内存地址)是否相同。 "in":用于成员检测,判断一个对象是否在另一个对象里面。 "==":判断内容或者地址是否相同,(一般情况is 和 ==的结果可以相同) 阅读全文
posted @ 2022-11-22 16:39 许个未来— 阅读(157) 评论(0) 推荐(0) 编辑
摘要: Python中 find () 函数 的作用是检查一个字符串是否是另一个字符串的子串,并返回子串所在的起始位置索引。 如果没有就会返回-1 阅读全文
posted @ 2022-11-22 16:38 许个未来— 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 将数据写入excel(以前只放在一个列表里通过DataFrame写入csv) 使用pandas直接写入(现在使用多个列表直接写入,写入的excel更加简洁易看) 1 """ 2 coding:utf-8 3 @Software:PyCharm 4 @Time:2022/11/22 14:16 5 @ 阅读全文
posted @ 2022-11-22 14:39 许个未来— 阅读(1026) 评论(0) 推荐(0) 编辑
摘要: 1.二分法:指的是在一个区间内无限迫近一个数。 2.代码解释: 如果说需要排除0 1 两个特殊值,那么需要把左指针的值变为1。 左右指针是指向某一个数,而不是固定的,注意在if判断的时候,不要把判等的地方写到右指针上面,从而导致程序进入死循环。 3.代码: """ coding:utf-8 @Sof 阅读全文
posted @ 2022-11-09 15:14 许个未来— 阅读(72) 评论(0) 推荐(0) 编辑
摘要: TypeError :'NoneType object is not iterable :错误的意思是:没有类型可迭代。 1.当if条件没有考虑到else的情况的时候,函数默认返回None 需要加一个return ‘ ’。 if分支情况在代码量比较多的时候需要注意考虑else的情况,不然容易出现不易 阅读全文
posted @ 2022-10-28 11:26 许个未来— 阅读(1686) 评论(0) 推荐(0) 编辑
摘要: 1.ROC曲线是什么? ROC 曲线是英文“receiver operating characteristic curve”的简称,对应的中文含义是“受试者工作特征曲线”。简单讲就是对不同的阈值形成混淆矩阵,从而连点成线。 2.举例说明 N 为真实的负类样本数量,P 表示真实的正类样本数量。 有10 阅读全文
posted @ 2022-10-21 14:21 许个未来— 阅读(241) 评论(0) 推荐(0) 编辑
摘要: 1.什么是TF-IDF? TF =(某词在文档中出现的次数/文档的总词量) IDF= log e为底(语料库中文档总数/包含该词的文档数+1), +1的原因是避免分母为0 (也被称为逆文档频率,因为是总数除以包含文档数) TF-IDF = TFxIDF TF-IDF值越大表示该特征词对这个文本的重要 阅读全文
posted @ 2022-10-21 10:55 许个未来— 阅读(1404) 评论(0) 推荐(0) 编辑
摘要: 字典类型和CountVectorizer文本类型的特征基本相同,不同的是输出的结果类型,字典直接返回的键值对。 以下代码用jupyter分块运行 运行结果含义参考上一篇:https://www.cnblogs.com/future-panda/p/16809957.html 1 from sklea 阅读全文
posted @ 2022-10-20 15:43 许个未来— 阅读(58) 评论(0) 推荐(0) 编辑
摘要: CountVectorizer是文本特征提取的一种方式:本文为稀疏矩阵具体含义 其中new_data所输出的值用toarray()可以转化为稀疏矩阵 new_data.shape():输出的是稀疏矩阵的维度(列表长度X词典个数) 阅读全文
posted @ 2022-10-20 15:04 许个未来— 阅读(514) 评论(0) 推荐(0) 编辑