跨越时空的对话:如何使用AI阅读工具ChatDOC快速建立数字化身?
跨越时空的对话:如何使用 ChatDOC 快速建立数字化身?以史蒂夫·乔布斯 AI 为例
开门见山,这篇文章主要介绍如何将 AI 改造为靠谱、好用、基于某个人物的数字化身。比如,乔布斯 AI、马斯克 AI、张一鸣 AI、王兴 AI、佛陀 AI、孔子 AI.
想象一下,和乔布斯聊产品,和释迦摩尼论佛法,和孔子聊人生哲学,和张爱玲聊爱情……那岂不是能够快速全面提升我们的视野和能力?
让各个领域的精英群体或者名人,成为你的专属 AI 助手,便是这篇文章的写作目的。
目前,全世界最出名的 AI 工具便是 ChatGPT. 直接让 ChatGPT 这样的 AI 模拟这些角色不好吗?答案是,NO. 这需要从 ChatGPT 的缺陷说起。
ChatGPT 模拟角色的缺陷
以 ChatGPT 为代表的 AI 产品掀起了 AI 时代的正式降临。
与以前的 AI 相比,人类可以使用自然语言,像是和好友聊天那样,对 ChatGPT 发号施令。 ChatGPT 可以模拟各种角色,与用户进行互动。在这个过程中,如果对于 ChatGPT 的命令得当,我们可以获得逼真、有趣的交互体验。在某种意义上,ChatGPT 已经可以通过图灵测试。
然而,ChatGPT 对于角色模拟,只是基于角色设定的简单表演,背后的内容,依然是基于 GPT 强大的内容生成能力。如果你的提问内容,在 ChatGPT 的数据训练集中相关数据比较少,那么只能获得一些似是而非、并不准确或者高效的回答。
打个粗略的比喻,没有采用专有数据训练的 ChatGPT,相当于一个表现尚可的演员。这只是形似。 如果需要进一步提升 ChatGPT 的表现,那么便需要让 ChatGPT 了解所需扮演角色的人物传记,深入了解这个角色的所思所想所行。如此,方能做到神似。
为了让 ChatGPT 进化,那么便需要让 AI 阅读扮演角色所需要的垂直领域的专有数据。
ChatDOC = ChatGPT + 垂直领域数据集,打造你的专属 AI
如今,ChatGPT 通过插件也可以直接上传文档进行解析。然而,存在诸多问题。
一,只有 GPT Plus 用户才能使用插件功能。
二,Plus 价格昂贵,且支付困难。
三,无法实现多文档对话。
而 ChatDOC 则是一款基于 ChatGPT,以强化 ChatDOC 读取专业文档能力的 AI 阅读工具。
基于 ChatDOC, 便可以实现将垂直领域的专有数据集投喂给 ChatGPT, 让 ChatGPT实现深度进化。
这篇文章便是以 ChatDOC 为例,展示如何打造基于人物角色的数字化身。
ChatDOC 介绍
下面是 ChatDOC 的简要介绍:
ChatDOC 是一款基于 GPT 的 AI 模型,允许 GPT 与用户所指定的文档进行对话,处理用户的专属数据的 AI 阅读辅助工具。
访问地址:https://chatdoc.com
特点
- 操作简单:一键上传,快速上手;
- 文本智能分析:文本、表格数据处理均准确高效;
- 内容回溯功能:基于问答结果快速查看原文;
- 多文档提问:支持上传一个文件夹,对文件夹进行整体提问;
- 多轮追问:支持基于某一条回答展开多轮会话,方便深度探讨内容;
- 提问支持预设自定义提示词/Prompt 功能;
- 保障用户数据安全:加密存储、数据自主;
- 支持 PDF、Word 等多种文档格式,支持 OCR;
- 开放的生态体系:支持 API, 允许企业用户将 ChatDOC 功能整合至自己的产品;
- 对中文用户友好:大陆地区稳定、流畅访问,支持大陆常见的支付方式进行付费;
如何建立虚拟人物 AI?
主要思路如下:
- 工具:ChatDOC
- 数据:用户自己收集和训练。
我决定使用 ChatDOC 建立 Steve Jobs AI. 主要原因是,数据收集简单。作为科技领袖,乔布斯在全世界范围内拥有庞大的粉丝。这些人已经在互联网将乔布斯的各种演讲视频、访谈视频、纪录片、书籍或者其他文档进行整理。我只需要采用拿来主义,便可以解决数据采集问题。
当然了,这个问题也可以问问 ChatDOC. 提问及回答如下:
对比下来,ChatDOC 比我思虑周全。
下面是具体思路介绍。
如何收集数据?
寻找数据
只有更高质量的数据,才能训练出更好的 AI. 不同资料的可信度、准确度、专业性是不同的。
以经验判断,学术论文、专业书籍、纪录片、专业博客等属于高质量数据。而很多二手信息,则必须坚决抛弃。所谓,垃圾进,垃圾出。
为此,我需要收集关于乔布斯的高质量专有数据。
经过检索,我发现以下数据:
- 综合资料:Steve Jobs Archive. 乔布斯存档内容站点,保存了关于乔布斯演讲、录音、视频、邮件、书籍。其中,Make Something Wonderful 用史蒂夫·乔布斯自己的话记录了他的一生。该书以时间轴的形式记录了这位前苹果公司 CEO 生活中的重要时刻,包括一系列以前从未向公众公开的材料。特别值得注意的是其还包含了苹果内部会议的记录和他发给自己的各种电子邮件。
- 书籍:《史蒂夫·乔布斯传》、《成为乔布斯》等是中英文世界关于乔布斯比较重要的书籍,能帮助人们深入了解乔布斯的成长经历、思维方式、行为方式、主要观点。
- 其他资料。主要是一些乔布斯的演讲、访谈视频及对应的文稿。
注释:Make Something Wonderful 这本书制作精良,质量很高,阅读体验非常好。强烈建议阅读。
如图,我使用 FlowUs 多维表格整理了乔布斯的主要资料。
处理数据
Steve Jobs Archive 为公开的免费内容,直接下载即可。
至于书籍,我在全世界最大的电子书籍图书馆 Z-Library 检索关键词下载。
由于 ChatDOC 目前只支持 PDF、Word 格式,因此,我需要将下载好的 Epub/MOBI 格式转化为 PDF 格式。
国内的格式转换工具,比较有名的便是福昕 PDF 转换大师、转转大师,两者均支持 PDF 格式的多种处理。具体参见:
福昕 PDF 转换大师:功能丰富、专业易用的 PDF 转换工具
转转大师:专业、全能的格式转换工具
其中,我使用了转转大师的电子书转换功能,对我下载的文档进行了批量处理。效果如下:
上传数据
随后,我便得到了我想要的数据集。最后,我将这些数据放在同一个文件夹之下,将整个文件夹一键上传至 ChatDOC.
如图,点击 Drag and Drop Folder as Collection.
最终效果如图:
如何设定对话系统?
在将 ChatDOC 上传后,我们便可以直接进行提问了。
我开始基于乔布斯的专有数据进行提问。使用 ChatDOC 的优点在于,已有的回答言之有物,有理有据,可以追溯答案背后的原文。
现在的问题是,ChatDOC 总是以一副冷冰冰的、论文式的风格回答问题。虽然目前的回答,是基于乔布斯的所思所想,但是表达风格并不是。
那么,应该如何调教 ChatDOC 做到神似乔布斯呢?
简单的来说,需要让 ChatDOC 分析乔布斯的语言风格、性格特征等信息,再根据范例进行回答。
不知道具体怎么提问?这个依然可以向 AI 提问,让 AI 化身为角色设定师。
将 AI 变身为角色设定师
我们的目标是让 AI 更好地扮演某个角色。 但是,我们并不知道如何提一个高质量的问题,以便让 AI 成功实现角色扮演? 对此,思路如下:
- 我们可以反过来询问 AI ,提出你的需求:如果我需要你扮演 XYZ, 需要哪些信息?
- 你可以让 AI 对回答进行总结。随后,我们将回答要点,反向写在提示词之中。再次进行测试。
- 如此,循环往复。直到优化为满足你需求的提示词。
经过几轮调试后,角色设定提示词如下:
请以角色设定师的身份,分析已有文档,并为我创建基于这些文档的角色化身,包括角色能力、成长经历、个性特点、语言风格、领导风格、思维方式、行为特征等角色分析信息。请给出角色简介及对应的对话范例。请注意,在角色设定中,不要使用“AI、人工智能、根据相关文件片段”等关键词或者字眼。下面将由你来模仿扮演该角色。你需要的扮演的角色是:Steve Jobs.
对应的答案如下:
请以角色设定师的身份,分析已有文档,并为我创建基于这些文档的角色化身,包括角色能力、成长经历、个性特点、语言风格、领导风格、思维方式、行为特征等角色分析信息。请注意以下要点:
- 我需要你扮演的角色是 Steve Jobs.
- 回答内容需要基于乔布斯的语言风格、个性特点、思维方式等因素进行回答。
- 回答中不要使用“AI、人工智能、根据相关文件片段、首先/其次/另外/最后、作为乔布斯的化身”等关键词或者字眼。
- 回答要像访谈对话那样,语言偏向口语化,需要通俗易懂。
- 回答基于第一人称进行回答。
下面将由你来模仿扮演Steve Jobs. 我的第一个问题是:你对年轻人创业有什么建议?
我的语言调试有点失败。目前,除了表达方式不太像日常对话。其他效果还是比较完美的。
再次尝试。这次加入对话示例。
回答如下
貌似 ChatDOC 预设了语言表达风格,无法强制 ChatDOC 更改语言风格。目前的回答,明显是论文式风格。这可能和 ChatDOC 的用户多是科研、金融等专业领域的垂直用户有关。
使用建议
如果忽略语言风格,我们也可以直接通过 ChatDOC 这个 AI 阅读工具,与乔布斯进行跨越时空的对话。
根据资料主题,与 AI 进行深度对话
比如,你可以和乔布斯聊苹果公司,聊产品,聊创业,聊设计。这些都是 Steve Jobs AI 所擅长的。
当然了,对于资料库中,相关数据比较少的话题,比如亲密关系。这些乔布斯 AI 的回答可能就有些吃力。不过,再怎么差,这些数据都是基于乔布斯的已有资料,有理有据,而不是基于 GPT 的瞎编乱造。
微调或者优化提示词,多次提问
在使用 ChatDOC 过程中,基于 AI 的回答,内容质量存在一定的波动。如果你对回答不太满意,可以微调提示词,尝试再次询问。
比如,以下是基于同一个问题的 2 个回答。第二个感觉更好一些。
结语
这篇文章虽然以介绍 Steve Jobs AI 为例,但是思路也适用于你训练其他 AI. 让你和这些名人展开跨越时空的对话。
除了基于名人数据训练 AI,我们每个人比较容易获取的还有自己的私人数据。比如,基于自己近几年的微信聊天记录,建立一个自己的数字分身,也未尝不可。
如果你对 ChatDOC 感兴趣,可以尝试搭建自己专属 AI.
工具箱
效率工具箱:阅读、笔记、写作 AI
AI 阅读辅助工具:ChatDOC
知识管理和在线协作工具:FlowUs 息流
特点
FlowUs AI
- 自定义问答;
- 自定义创作;
- 预设问答与创作:头脑风暴、列出执行步骤、罗列大纲、分析优缺点、内容解释、日常小记、故事创作、写文章、翻译、总结
使用教程
更多关于 FlowUs 使用技巧的介绍
书签管理: Wetab 新标签页
Wetab 是一款基于浏览器的新标签页产品,主张辅助用户打造一个兼具效率与美观的主页。
产品特色与功能
移动端使用教程
移动端·综合教程图文版
VisionOn
介绍
一款集流程图、思维导图、白板于一体的轻量级在线图形工具。
特点