人云亦云 简述

人云亦云

需求

在数据分析、信息可视化技术不断发展的今天, 我们感受到了太多智能化的推荐, 那是否可以用可视化技术来展现历史长河中褶褶生辉的诗词文化呢?我们团队基于这一点, 为用户呈现出可以自由定制的诗词云。
每次定制均会随机采用一款字体, 与选择的诗词风格相融合, 得到一张专属的”诗云之图”。相信在使用时, 当用户看到诗词作为数据呈现出来, 能够会心一笑, 感受到诗词文化别样的魅力。

分工

  • tong: 创意, 云图部分, 整合
  • guo: 爬虫脚本, 版本维护
  • du: 项目打包, bug测试

创新

  1. 创意, 竞品分析角度

image

  1. 模块化: 通过jieba模块分词、wordcloud模块形成词云, 与爬虫部分耦合度小

遇到的问题:

1️⃣❓使用pyinstaller进行打包, 发现打包后exe文件大小竟将近800MB

原因分析: Anacoda在打包时会将本机上安装的所有Python库也一并算上, 所以此时包含 了大量无关数据.

解决方案:使用conda命令, 在本地创建一个虚拟的python环境, 并且仅安装本项目用到的模块, 可以发现缩小了数十倍

2️⃣❓在其他环境下进行测试时

FileNotFoundError:[Errno2]No such file or directory...C:\Users\.....\dict.txt
[Errno2]No Such file or directory:'draw-what-you-say\dist\stopwords’

原因分析:于jieba中调用了dict.txt文件, wordcloud调用了stopwords,而pyinstaller在打包时不会自动把这两个文件打包

解决方案: 将库中的stopwords, dict一同打包

  • 将Lib\site-packages\jieba_compat.py和Lib\site-packages\wordcloud\wordcloud.py中的__file__改为sys.executable即当前的运行目录,就是运行打包好的exe文件所在的目录, 最后把dict.txt和stopwords以及img文件拷贝到与生成的.exe文件同一目录即可

可以改进的地方

  • 经过后期学习, 可通过nlp相关模型实现更高质量的关键诗词提取(去除一些过渡性的词语)
  • 进行部署, 可供大家使用
posted @ 2022-08-23 21:46  泥烟  阅读(39)  评论(0编辑  收藏  举报