装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

常听说,现在的代码,就和唐朝的诗一样重要。

可对我们来说,写几行代码没什么,但是,要让我们真正地去写一首唐诗,那可就头大了。。既然如此,为何不干脆用代码写一首唐诗?

更多Python视频、源码、资料加群683380553免费获取

准备:

  • python3.6
  • 环境推荐使用anaconda管理python包,可以对于每个项目,创建环境,并在该环境下下载项目需要的包。
  • 推荐使用pycharm作为编译器。

具体步骤:

使用爬虫爬取全唐诗,总共抓取了71000首。

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

 

使用正则表达式对爬取的数据进行处理

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

 

唐诗生成,处理韵脚

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

 

对于韵脚,本来是想找出所有的韵脚并做成字典形式存储起来,但韵脚总共有20多个, 后来发现其实20多个韵脚都是以元音字母开始的,我们可以基于这个规则来判断:

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

 

目前是最初级的五言律诗,且为名动名句式

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

 

藏头诗

其实思路很简单,既然我们有了语料库,那么,我们每次在排列组合词的时候,只需保证生成每句时,第一个名词的第一个字,是按序给定四字成语中的即可

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

 

来看一下结果:

四言诗:

所思浮云
关山车马
高楼流水
闲人肠断

五言律诗:

西风时细雨
山川钓建章
龙门看萧索
几年乡斜阳

藏头诗:

落花流水

落晖首南宫
花枝成公子
流水名朝廷
水声胜白石

当然,现在生成的唐诗还是比较低级的,属于基础的古诗文词语排列组合。 接下来考虑优化模版,提取五言和七言常用句式作为模版。 另外考虑使用机器学习的方法,写RNN来让计算机自动生成充满韵味的诗。

作者:TheodoreXu

出处:https://segmentfault.com/a/1190000013154329

 

posted @ 2022-10-07 20:55  I'm_江河湖海  阅读(7)  评论(0编辑  收藏  举报