大超市和小卖部
去年11月份,OpenAI推出了ChatGPT,见识了大型语言模型的威力后, 很多人过来问我,hey,你们搞自然语言处理的AI工程师们,以后还有活干吗。记得我当时很淡定的回答,你看大型超市出来后,小卖部们还不是完全没有倒闭,而且你看小卖部的新版,小便利店不是依旧不可缺少,到处都是。当时我提这个比喻的时候,没有深度思考,不一定恰当。不过短期内,不在整大型语言模型的我们,不是没有事情做的。昨天一个叫做CalypsoAI的初创公司和我们分享了他们个人信息加密和法律合规的产品, 我觉得就是一个很好的例子。
有了ChatGPT后,大家什么问题都往上放,太方便了,不用自己搜索,筛选和人工总结。用了开心,就完全不管什么隐私不隐私了。没多久,很多公司就明文禁止使用ChatGPT,不然没多久公司的机密都到OpenAI去了。
OpenAI自从以友善的价格公开了API后,网友们更是创意十足,各种prompt暂且不表,但是,还是不能把隐私往别人家送。于是存在在市场上多年的个人信息加密应用Redaction,瞬间又活跃起来了。新使命也很简单,就是往OpenAI送东西的时候,先把所有个人的信息全抹掉。但是一篇文档里,怎么知道哪些是加密信息呢,这时候小卖部作用就不可少了,传统的NER技术就可以使用起来了。训练一些简单的模型,来识别文档中的姓名,电话号码,身份证信息等等。当然这也不是一个简单的问题,因为到底什么是个人隐私呢?即使没有姓名,电话号码和身份证信息,依然还是有可能定位到个人。这些问题也催生了很多初创公司。也许不久后这个问题要依赖于私人LLM来更好的解决。并不是几十B,几个T参数的真正large,那是不是可以说这不算LLM,更像是传统模型转变过来的本地私有模型,就像是小卖部过度成便利店一样。
微信公众号