2021 年 7月 12 日随笔档案 - 戈小戈

人工智能——爬取金庸小说人物关系导语：人物数据来自于[金庸网](http://www.jinyongwuxia.cc/data/renwu/index.htm "金庸网")，为了便捷，人物姓名部分为手动复制到本地pachong.html文件中，最后的数据存在test2.csv中，人物关系数据来自百度百科。阅读全文

posted @ 2021-07-12 12:30 戈小戈阅读(349) 评论(0) 推荐(0) 编辑

人工智能——爬取金庸小说人物介绍

摘要：

导语：人物数据来自于金庸网，为了便捷，人物姓名部分为手动复制到本地pachong.html文件中，最后的数据存在test.csv中，代码最后的停止3秒，非常有必要。项目完整文件见爬取金庸小说人物介绍效果图：代码： from bs4 import BeautifulSoup import ur 阅读全文

posted @ 2021-07-12 12:18 戈小戈阅读(252) 评论(0) 推荐(0) 编辑

人工智能——自然语言处理可视化，绘制词云和玫瑰图。

摘要：

导语：自然语言处理可视化：利用爬虫抓取互联网上《如懿传》（或其他）电视剧中演员的部分数据，分析演员的姓名、星座、身高、体重和籍贯等信息，绘制词云和玫瑰图。原题其实是《延禧攻略》，不过触类旁通后，我决定改成《如懿传》，此次爬取数据的网站为https://www.tvzn.com，在实际中发现此网站前阅读全文

posted @ 2021-07-12 11:28 戈小戈阅读(239) 评论(0) 推荐(0) 编辑

人工智能——jieba分词示例

摘要：

导语：给定一段文本，利用Jieba分词软件进行分词，分析Jieba分词的原理，展示样本分词效果，样本的topK(10)词：topK(10)是指排序前十，这里我使用了《射雕英雄传》第一回作为给定的文本，即代码中的eg.txt，项目完整文件见人工智能——jieba分词实例效果图：代码： # -*- 阅读全文

posted @ 2021-07-12 11:16 戈小戈阅读(254) 评论(0) 推荐(0) 编辑

戈小戈

时光宓宓，岁月静好。暮风阳明，花开花寂。

公告

戈小戈

时光宓宓，岁月静好。 暮风阳明，花开花寂。

公告

时光宓宓，岁月静好。暮风阳明，花开花寂。