阿倍森

导航

江荣烽---第六次作业

这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzzcxy/BD-HairlineMaintenanceAssociation
这个作业要求在哪里https://edu.cnblogs.com/campus/fzzcxy/BD-HairlineMaintenanceAssociation/homework/12550
这个作业的目标 <实战结巴分词和聚类频繁项集>
学号 <212106419>
任务步骤:
1.打开指定的DataFrame

2.提取需要进行分析的项目


3.设置停用词,准备对提取处理的语句进行删除标点符号的处理并进行结巴分词

4.通过聚类对句子进行分类处理


5.提取出来需要处理的类型

6.设置一些关键的词语方便提取

7.通过多次提取,讲合格的词语筛选制成自定义jieba词典(这一步需要人工进行筛选)

8.讲筛选完成的txt进行词云图化

posted on 2022-05-21 16:26  阿倍森  阅读(10)  评论(0编辑  收藏  举报