摘要: 本周收获 总结一下本周学习内容: 1、学习了《深入浅出Pandas》的的第八章:Pandas多层索引 8.1概述 8.2多层索引操作 8.3数据查询 🚗博客: Pandas:多层索引 2、《Python机器学习基础教程》第六章、第七章 第六章 🚗博客:算法链与管道(上):建立管道 🚗博客:算法 阅读全文
posted @ 2022-06-04 23:19 朝南烟 阅读(30) 评论(0) 推荐(0) 编辑
摘要: 4、停用词 删除没有信息量的单词还有另一种方法,就是舍弃那些出现次数太多以至于没有信息量的单词。有两种主要方法:使用特定语言的停用词(stopword)列表,或者舍弃那些出现过于频繁的单词。 scikit-learn 的 feature_extraction.text 模块中提供了英语停用词的内置列 阅读全文
posted @ 2022-06-04 11:58 朝南烟 阅读(137) 评论(0) 推荐(0) 编辑
摘要: 多层索引是指在行或者列轴上有两个及以上级别的索引,一般表示一个数据的几个分项。 1、创建多层索引 1.1通过分组产生多层索引 1.2由序列创建 1.3由元组创建 1.4可迭代对象的笛卡尔积 1.5将DataFrame转为多层索引对象 2、多层索引操作 多层索引和单层索引一样,但在它也有一些特定的操作 阅读全文
posted @ 2022-06-04 11:38 朝南烟 阅读(643) 评论(0) 推荐(0) 编辑
body { color: #000; background-color: #e6e6e6; font-family: "Helvetica Neue",Helvetica,Verdana,Arial,sans-serif; font-size: 12px; min-height: 101%; background: url(https://images.cnblogs.com/cnblogs_com/caolanying/1841633/o_2009041…ly1geq8oc9owbj21hc0u0th5.jpg) fixed; } #home { margin: 0 auto; opacity: 0.8; width: 65%; min-width: 1080px; background-color: #fff; padding: 30px; margin-top: 50px; margin-bottom: 50px; box-shadow: 0 2px 6px rgba(100, 100, 100, 0.3); }