0. 团队项目-- 英语科技论文润色工具
1. 项目说明
- 设计一个工具,针对某一科技领域,对论文进行润色建议
- 基本语法、词法的检查(可以复用开源软件)
- 建立分层次的专业语料库(大领域,小领域),如下:
+ F02 计算机
+ F0202 计算机软件与理论
+ F020202 软件工程
- F02020201 软件需求
- F02020202 软件设计
- ... 等等
+ 或者,也可以根据关键词来分类,标记预料库中的预料
+ 定义:这里的语料,可以是论文的文本或pdf文档,或初步加工后的信息
- 润色建议:
- 以给定一个单词为对象,查找语料库,找到最佳用法(搭配等)
- 扫描待润色论文,以一句话为一分析单元。
- 语法检查
- 推荐好的表达
- 处理整篇论文
- 如Latex 源码,则过滤其关键词
- 对图形、表格、公式等不做处理
- 其他可能的做法,(同学们可以展开想象)
- 收集用户的反馈
- 是否采纳本工具的建议,建立历史推荐数据的反馈信息跟踪(考虑 后期AI学习 这些数据)
- 这些反馈数据(接受建议、或拒绝建议的数据)可以帮助改进后续的建议;【让你的工具愈来愈聪明】
- 性能指标
- 语法检查不能太慢,精度要求,(少误报,宁缺毋滥)
- 给出建议 要实时
- ...
2. 要求:(需求分析)