返回顶部

OpenAI-Translator

OpenAI-Translator 市场需求分析

 翻译:一个长期存在的沟通需求

 成本分析:人力 vs GPT

 数据安全:在线翻译需上传整个文件

 数据安全:大模型

  • GPT 服务方式:一定程度上解决了完整文件上传问题

  • API调用方式:拆分文档,无需上传整份文件 

  • OpenAI 隐私协议:具有相对可靠的契约精神和法律保障

  • 私有化大模型:端到端解决隐私安全问题

 OpenAI-Translator 产品定义与功能规划

 产品规划(v1.0)

Feat List

  • 支持 PDF 文件格式解析

  • 支持英文翻译成中文。 

  • 支持 OpenAI 和 ChatGLM 模型。 

  • 通过 YAML 文件或命令行参数灵活配置。

  • 模块化和面向对象的设计,易于定制和扩展。

 产品规划v2.0

Feat List

  • 支持图形用户界面 (GUI), 提升易用性。

  • 添加对保留源 PDF 的原始布局的支持。

  • 服务化:以API形式提供翻译服务支持。

  • 添加对其他语言的支持

OpenAI-Translator 技术方案 

架构设计思路

 

实战 PDF 解析库 pdfplumber

pdfplumber 项目(基于pdfminer.six开发),支持解析PDF文件,获取每个文本字符、矩形和线条的详细信息。此外还支持表格提取和可视化调试。

对于机器生成的PDF而言效果最佳,不适用于扫描得到的PDF。

支持:Python 3.8~3.11

OpenAI-Translator 模块设计

 

posted @ 2023-10-09 21:57  Crazymagic  阅读(273)  评论(0编辑  收藏  举报