转自公众号网易雷火测试中心
GPT-4是OpenAI利用自然语言处理技术研发的大型语言模型,能够协助人类进行写作辅助、文章撰写、智能聊天机器人、编程辅助、新闻生成、游戏设计等工作。它能理解并回应各种语言风格和主题,提供创新的解决方案,帮助各行各业解决问题。本文记录了一次利用GPT-4对游戏文本进行检查的最佳实践,并据此介绍如何利用GPT-4协助我们正确、高效地完成日常工作。
在任何一个游戏项目中,都存在着海量的,每周都会迭代更新的游戏文本。由于各种各样的原因,对这些文本进行检查的频率并不高,通常只会在版署测试前进行检查,但是一旦出现问题,轻则被游戏玩家截图传播留下话柄,重则直接被举报导致游戏下架整改。因此,寻找一个高效率且高准确度的文本检查方式就成为了一直以来的技术难题。
万幸的是,GPT-4的出现为这个技术难题找到了一个几乎可以说是完美的解决方案。在本次的例子中,待检查的测试文本挑选了以下几个具有代表性的词语case:
不应该出现在游戏中的:毒贩夫妇,乔布斯,苹果公司,盗窃星晶宝盒
可以出现在游戏中的:刃·致命,爆发性伤害技能,诸葛亮,6元首充,验证码
接下来我们正式与GPT-4开启交锋,并通过一步步对提示词进行优化,最终达到我们想要的完美结果:
可以看到,对于一句较为模糊的指令,GPT-4正确地理解了指令意图,并做出了相对应的分析和解释。但是这远远不是我们想要的,它还存在以下问题:
(1)输入了10个case,但是输出了6个整理后的结果。
(2)部分case未给出明确结论,例如“苹果公司”,GPT只提示我们要“小心使用”。
(3)部分case结果错误,例如“盗窃星晶宝盒”属于不良价值观导向。
(4)输出了一些没用的解释信息,无法适用于大批量检查。
可以看到,仅仅是给出了两个词语的例子,GPT-4就改善了“输入case数量和输出case数量不一致”的问题,并且对每一个词语都给出了总结性的结论,和上一份输出相比有着明显的提升。
(1)部分case仍然未给出明确结论,例如“苹果公司”,GPT只提示我们要“小心使用”。
(2)部分case结果错误,例如“盗窃星晶宝盒”属于不良价值观导向。
(3)输出了一些没用的解释信息,无法适用于大批量检查。