摘要:
本文主要内容,获取解析豆瓣《狂飙》的短评相关数据和演职员信息,在数据预处理后,进行简单的数据分析和可视化展示。 阅读全文
摘要:
要进行自然语言处理相关工作,文本数据预处理是个必不可少的过程。本文将对文本数据预处理相关的内容进行归纳整理,主要包括以下4个方面内容:文本数据获取、常规文本数据预处理、任务相关的文本数据预处理、文本预处理工具。 阅读全文
摘要:
前文自顶向下构建中药知识图谱初探中,已经介绍了知识图谱和中药知识图谱构建的相关基础概念,本文将研究中药方剂数据,趁热打铁,再构建百万节点关系中药方剂知识图谱。该图谱能够让中医药知识图谱更加完善与全面。详细内容请看全文。 阅读全文
摘要:
Py2neo:一种快速导入百万数据到Neo4j的方式 Py2neo是一个可以和Neo4j图数据库进行交互的python包。虽然py2neo操作简单方便,但是当节点和关系达几十上百万时,直接创建和导入节点、关系的方式会越来越耗时。本文提供一个py2neo小技巧,通过简单的代码,能够以每秒1万节点/关系 阅读全文
摘要:
当前,知识图谱已在金融、电商和医疗等领域开展了诸多实践性探索,并被广泛的应用在了智能问答、知识搜索、个性化推荐和辅助诊断等知识型驱动的任务中。本文从中药和知识图谱研究视角出发,对所收集中药相关数据进行预处理与实体关系抽取,自顶向下构建中药知识图谱。同时利用neo4j对部分数据进行了可视化分析。 阅读全文
摘要:
数据可视化是一种直观展示数据结果和变化情况的方法,可视化有助于知识发现与应用。Neo4j数据库对于知识图谱的展示形式过于单调。因此,本文基于pyecharts对当前处理的中药知识图谱数据进行分析与可视化。以利用图形传递和表达更清晰的中药知识图谱信息,发掘有潜在价值的内容。 阅读全文
摘要:
PyQt4编写界面的两种方式 应用PyQt4开发图形化界面有两种方式,一种是直接通过QtDesigner通过提供的窗口部件拖拽进行GUI创建,另外一种是直接进行编程实现。 第一种,QtDesigner方式主要分为以下3个步骤: 1、根据Qt部件... 阅读全文
摘要:
python读入中文文本编码错误 python读入中文txt文本: #coding:utf-8def readFile(): fp = open('emotion_dict//neg//neg_all_dict.txt','r') lis... 阅读全文
摘要:
一、词云“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。二、python实现中文词云显示1、需要准备的python库包括,matp... 阅读全文
摘要:
一、python3 利用当前时间、随机数产生一个唯一的数字作为文件名 代码如下: #-*-coding:utf-8-*-#python3自动生成文件名from datetime import *import timeimport randomfor ... 阅读全文