摘要: 从NLP视角看电视剧《狂飙》,会有什么发现? 本文主要内容,获取解析豆瓣《狂飙》的短评相关数据和演职员信息,在数据预处理后,进行简单的数据分析和可视化展示。 阅读全文
posted @ 2023-03-02 19:21 风兮177 阅读(502) 评论(0) 推荐(1) 编辑
摘要: 要进行自然语言处理相关工作,文本数据预处理是个必不可少的过程。本文将对文本数据预处理相关的内容进行归纳整理,主要包括以下4个方面内容:文本数据获取、常规文本数据预处理、任务相关的文本数据预处理、文本预处理工具。 阅读全文
posted @ 2023-01-31 12:00 风兮177 阅读(517) 评论(0) 推荐(0) 编辑
摘要: 趁热打铁,再构建百万节点关系中医药方剂知识图谱 前文自顶向下构建中药知识图谱初探中,已经介绍了知识图谱和中药知识图谱构建的相关基础概念,本文将研究中药方剂数据,趁热打铁,再构建百万节点关系中药方剂知识图谱。该图谱能够让中医药知识图谱更加完善与全面。详细内容请看全文。 阅读全文
posted @ 2022-12-06 16:36 风兮177 阅读(1054) 评论(0) 推荐(1) 编辑
摘要: Py2neo:一种快速导入百万数据到Neo4j的方式 Py2neo是一个可以和Neo4j图数据库进行交互的python包。虽然py2neo操作简单方便,但是当节点和关系达几十上百万时,直接创建和导入节点、关系的方式会越来越耗时。本文提供一个py2neo小技巧,通过简单的代码,能够以每秒1万节点/关系 阅读全文
posted @ 2022-11-30 18:30 风兮177 阅读(635) 评论(0) 推荐(0) 编辑
摘要: 自顶向下构建中药知识图谱初探 当前,知识图谱已在金融、电商和医疗等领域开展了诸多实践性探索,并被广泛的应用在了智能问答、知识搜索、个性化推荐和辅助诊断等知识型驱动的任务中。本文从中药和知识图谱研究视角出发,对所收集中药相关数据进行预处理与实体关系抽取,自顶向下构建中药知识图谱。同时利用neo4j对部分数据进行了可视化分析。 阅读全文
posted @ 2022-11-30 18:30 风兮177 阅读(278) 评论(0) 推荐(0) 编辑
摘要: 数据可视化是一种直观展示数据结果和变化情况的方法,可视化有助于知识发现与应用。Neo4j数据库对于知识图谱的展示形式过于单调。因此,本文基于pyecharts对当前处理的中药知识图谱数据进行分析与可视化。以利用图形传递和表达更清晰的中药知识图谱信息,发掘有潜在价值的内容。 阅读全文
posted @ 2022-11-30 18:30 风兮177 阅读(547) 评论(0) 推荐(0) 编辑
摘要: 正常安装流程 1、安装anaconda 必备条件 2、安装jupyter notebook 一般anaconda自带安装 如没有,则在终端安装 conda install jupyter notebook 3、安装nb-conda 接下来安装nb_conda... 阅读全文
posted @ 2022-11-30 18:30 风兮177 阅读(738) 评论(0) 推荐(0) 编辑
摘要: Keras网络可视化方法 Keras模型可视化 Keras可视化依赖的两个包参考链接 Keras模型可视化 代码: from ke... 阅读全文
posted @ 2022-11-30 18:30 风兮177 阅读(53) 评论(0) 推荐(0) 编辑
摘要: python中文分词方法之基于规则的中文分词 目录 常见中文分词方法 推荐中文分词工具 参考链接 一、四种常见的中文分词方法: ... 阅读全文
posted @ 2022-11-30 18:30 风兮177 阅读(515) 评论(0) 推荐(0) 编辑
摘要: 直接快速下载NLTK数据 直接下载NLTK的数据速度很慢,这里提供NLTK数据集,直接下载即可。或者选择下列百度云下载: 链接:h... 阅读全文
posted @ 2022-11-30 18:30 风兮177 阅读(393) 评论(0) 推荐(0) 编辑