上一页 1 2 3 4 5 6 7 8 9 ··· 17 下一页
摘要: 昨天使用正则表达式并没有完全解决问题,所以今天尝试使用对字符串的操作解决问题 根据标签内容将其分割,将value完全取出来,替换其中的 " ,然后在将新的内容放进去。 问题解决了。目前数据正在处理中,处理过程比较慢。先看看效果吧。 阅读全文
posted @ 2020-02-09 16:37 星际毁灭 阅读(97) 评论(0) 推荐(0) 编辑
摘要: 由于json的数据格式出问题了,今天对内容进行了分析,打算使用正则表达式解决问题。 写出之后,发现部分的格式问题解决了,但是有的数据中包含特殊字符,还有类似于json的格式,导致部分数据仍然不能处理好。 还在报错中。 阅读全文
posted @ 2020-02-08 22:30 星际毁灭 阅读(91) 评论(0) 推荐(0) 编辑
摘要: 昨天新得到的表为technological表 ,然后其中一列是专家信息,这一列中每条数据也是有多个json数组。 根据其json格式设计新表,然后将其取出来,存入新表。最后加入新一列,就是每个json来自于那条数据。这样也能建立起专家的关系,方便之后问答部分的功能。 在处理过程中,发现了每隔几条数据 阅读全文
posted @ 2020-02-07 23:13 星际毁灭 阅读(65) 评论(0) 推荐(0) 编辑
摘要: 今天把数据,根据json的结构进行了解析,新构造了一张表,然后将其存入数据库。 因为解析json数据过程中,可能是数据量大的原因,当运行到1.3w条的时候就会卡住,然后报错,内存溢出。 经过多次尝试的修改,最终的解决办法是将其打包成jar包,在运行时输入的指令,规定好java虚拟机的内存。 Exce 阅读全文
posted @ 2020-02-06 21:12 星际毁灭 阅读(73) 评论(0) 推荐(0) 编辑
摘要: 昨天下载的数据,我对结构进行了分析,以json的形式存在,但是由于数据量特别大,所以没有办法直接查看。 通过对文件的读取,将所有数据存入了数据库。统计之后,共有数据2w条左右。 不过目前数据还是以json的整体形式存在,需要将各个数据提取出来。 而且数据中,大部分都是英文,计划将其翻译为英文,方便之 阅读全文
posted @ 2020-02-05 21:55 星际毁灭 阅读(75) 评论(0) 推荐(0) 编辑
摘要: 昨天对图谱进行了设计,但是个人感觉这个数据在应用方面起不到特别的作用。 而且考虑到之前,老师建议我自己寻找与题目相关的数据集。 所以今天尝试找一些关于科技相关的数据,经过时间寻找,发现了一个公开的数据集。 目前包含计算机科学领域,由概念、专家和论文组成。其中,科技概念及其关系是从ACM计算分类系统中 阅读全文
posted @ 2020-02-04 20:35 星际毁灭 阅读(105) 评论(0) 推荐(0) 编辑
摘要: 今天主要在图谱的构建上从新进行了考虑。 考虑到初始数据都是以表格的形式存在,数据之间的关系基本都是表格的横纵坐标和表名作为关系 但是这个关系能否利于之后的用户问答还有待考虑。 阅读全文
posted @ 2020-02-03 21:45 星际毁灭 阅读(80) 评论(0) 推荐(0) 编辑
摘要: 今天主要看了一些关于nlp相关的内容,初步计划设计一张表用来储存用户提问以及关键词,达到下一次提问更准确的目的。 还需要完善将用户提问转换为逻辑语句的方案 阅读全文
posted @ 2020-02-02 23:02 星际毁灭 阅读(75) 评论(0) 推荐(0) 编辑
摘要: 今天主要在寻找解决用户提问语义分析的方式 初步计划根据用户提问进行中文分词,然后划分每个单词的词性,并将有用的词汇作为依据在知识库中检索 阅读全文
posted @ 2020-02-01 20:59 星际毁灭 阅读(129) 评论(0) 推荐(0) 编辑
摘要: 计划内容: 1.了解知识图谱相关知识。学习相关内容。 2.搭建系统,完成基本界面。 阅读全文
posted @ 2019-12-23 17:28 星际毁灭 阅读(125) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 17 下一页