江荣烽---第六次作业
这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzzcxy/BD-HairlineMaintenanceAssociation
这个作业要求在哪里https://edu.cnblogs.com/campus/fzzcxy/BD-HairlineMaintenanceAssociation/homework/12550
这个作业的目标 <实战结巴分词和聚类频繁项集>
学号 <212106419>
任务步骤:
1.打开指定的DataFrame
2.提取需要进行分析的项目
3.设置停用词,准备对提取处理的语句进行删除标点符号的处理并进行结巴分词
4.通过聚类对句子进行分类处理
5.提取出来需要处理的类型
6.设置一些关键的词语方便提取
7.通过多次提取,讲合格的词语筛选制成自定义jieba词典(这一步需要人工进行筛选)
8.讲筛选完成的txt进行词云图化