Beta-Scum meeting 2

Scrum meeting 2

5.15

会议截图：

drawing

会议记录

GitHub分支链接

成员	已完成	准备进行
zyc	项目选择类型，tag页面删除框，优化提示，删除项目API对接	完善前端工作
lzh	train页面，tag页面优化（本地开发）	训练
ly	后端删除API，后端上传PDF文件修改	实现
dxy	PDF文件替换	新功能实现
wyk	Json转换为excel	可视化数据
llj	调研实体识别API用法	python实现API调用

燃尽图

drawing

遇到的问题

前端的训练模块逻辑还不完整，需要修改生成的数据来适配
对用户上传的文档，如何实现实体识别？目前主要的问题是如何确定字段的组合以及位置，其中位置信息可以通过tables睡醒或者boundingbox属性来间接获得。字段的组合是主要问题，有两种思路：
- 用户标注一个范围框，这样根据范围组合识别，极大程度提高识别率
- 后端自动组合识别，猜测用户需要的字段，进行实体识别
可视化展示如何做？
- 地点数据分布图
- 年龄
- ...

posted @ 2020-05-15 22:28 Name+Not+Found 阅读(140) 评论(0) 收藏举报

刷新页面返回顶部