人云亦云 简述
人云亦云
需求
在数据分析、信息可视化技术不断发展的今天, 我们感受到了太多智能化的推荐, 那是否可以用可视化技术来展现历史长河中褶褶生辉的诗词文化呢?我们团队基于这一点, 为用户呈现出可以自由定制的诗词云。
每次定制均会随机采用一款字体, 与选择的诗词风格相融合, 得到一张专属的”诗云之图”。相信在使用时, 当用户看到诗词作为数据呈现出来, 能够会心一笑, 感受到诗词文化别样的魅力。
分工
- tong: 创意, 云图部分, 整合
- guo: 爬虫脚本, 版本维护
- du: 项目打包, bug测试
创新
- 创意, 竞品分析角度
- 模块化: 通过jieba模块分词、wordcloud模块形成词云, 与爬虫部分耦合度小
遇到的问题:
1️⃣❓使用pyinstaller进行打包, 发现打包后exe文件大小竟将近800MB
原因分析: Anacoda在打包时会将本机上安装的所有Python库也一并算上, 所以此时包含 了大量无关数据.
解决方案:使用conda命令, 在本地创建一个虚拟的python环境, 并且仅安装本项目用到的模块, 可以发现缩小了数十倍
2️⃣❓在其他环境下进行测试时
FileNotFoundError:[Errno2]No such file or directory...C:\Users\.....\dict.txt
[Errno2]No Such file or directory:'draw-what-you-say\dist\stopwords’
原因分析:于jieba中调用了dict.txt文件, wordcloud调用了stopwords,而pyinstaller在打包时不会自动把这两个文件打包
解决方案: 将库中的stopwords, dict一同打包
-
详
将Lib\site-packages\jieba_compat.py和Lib\site-packages\wordcloud\wordcloud.py中的__file__改为sys.executable即当前的运行目录,就是运行打包好的exe文件所在的目录, 最后把dict.txt和stopwords以及img文件拷贝到与生成的.exe文件同一目录即可
可以改进的地方
- 经过后期学习, 可通过nlp相关模型实现更高质量的关键诗词提取(去除一些过渡性的词语)
- 进行部署, 可供大家使用
本文来自博客园,作者:泥烟,CSDN同名, 转载请注明原文链接:https://www.cnblogs.com/Knight02/articles/16617968.html