“清华造了个游戏公司!十余个ChatGPT上岗,7分钟开发一款游戏”的版本间的差异

来自通约智库
跳转至: 导航搜索
2个标签移动版编辑移动网页编辑
 
第1行: 第1行:
清华用ChatGPT打造了个「零人工含量」的「游戏公司」,从老板到员工都是AI的那种!
+
{{4}}清华用ChatGPT打造了个「零人工含量」的「游戏公司」,从老板到员工都是AI的那种!
  
 
只要你提出想法,从设计到测试的完整流程,都由AI帮忙搞定。
 
只要你提出想法,从设计到测试的完整流程,都由AI帮忙搞定。
  
 
整个过程走下来,只要七分钟就能完成,成本不到0.3美元(人民币两块多一点)!
 
整个过程走下来,只要七分钟就能完成,成本不到0.3美元(人民币两块多一点)!
 +
 +
[[文件:游戏公司1.jpg|800px]]
  
 
这个「公司」被命名为「ChatDev」,顾名思义,就是通过聊天来进行开发。
 
这个「公司」被命名为「ChatDev」,顾名思义,就是通过聊天来进行开发。
第12行: 第14行:
  
 
这个「公司」开发一款游戏的平均时间是409.84秒,最快的甚至不到三分钟,最慢的也不过17分钟。
 
这个「公司」开发一款游戏的平均时间是409.84秒,最快的甚至不到三分钟,最慢的也不过17分钟。
 +
 +
[[文件:游戏公司2.jpg|800px]]
  
 
消耗方面,ChatDev使用的是ChatGPT的API(3.5-turbo),平均每款游戏使用约48.5K个token。
 
消耗方面,ChatDev使用的是ChatGPT的API(3.5-turbo),平均每款游戏使用约48.5K个token。
第19行: 第23行:
 
那么,这家「公司」是如何运转的呢?
 
那么,这家「公司」是如何运转的呢?
  
让AI分工合作
+
'''让AI分工合作'''
  
 
研究团队为这个「公司」设计了一套由ChatGPT串联起的「ChatChain」。
 
研究团队为这个「公司」设计了一套由ChatGPT串联起的「ChatChain」。
第26行: 第30行:
  
 
为了避免出现失误或幻觉,研发过程中的每一个步骤都由两个bot共同完成。
 
为了避免出现失误或幻觉,研发过程中的每一个步骤都由两个bot共同完成。
 +
 +
[[文件:游戏公司3.jpg|800px]]
  
 
具体而言,ChatDev在制作游戏时一共需要经历设计-编程-测试-文档这四个大环节。
 
具体而言,ChatDev在制作游戏时一共需要经历设计-编程-测试-文档这四个大环节。
第35行: 第41行:
 
CEO会分别与CPO和CTO进行讨论,决定游戏的呈现形式(Web/桌面/移动端…)和使用的编程语言。
 
CEO会分别与CPO和CTO进行讨论,决定游戏的呈现形式(Web/桌面/移动端…)和使用的编程语言。
  
过人类的影子。
+
[[文件:游戏公司4.jpg|800px]]
 +
 
 +
此外,设计环节中,每个bot具体扮演的角色,是由两个instructor(也是bot)分配的。
 +
为了提高设计工作的质量,团队还引入了「记忆流」和「自我反思」两种工作机制。
 +
 
 +
[[文件:游戏公司5.jpg|800px]]
 +
 
 +
「记忆流」会保存每轮对话的记录,供各个bot随时翻阅,确保思路的连贯性。
 +
 
 +
「自我反思」机制是在bot们完成了各自的工作但没有达到要求时,生成一个「伪我」,将问题和有关对话向instructor进行反馈。
 +
 
 +
设计工作结束之后,就进入到了编程环节,包括代码撰写和图形界面设计。
 +
 
 +
CTO向程序员提出要求和大致思路,然后程序员编写代码。
 +
 
 +
设计师会生成GUI方案,并调用有关工具生成图像资源,由程序员进行集成。
 +
 
 +
[[文件:游戏公司6.jpg|800px]]
 +
 
 +
编程过程同样引入了提升质效的工作机制,具体而言包括「代码管理」和「思维指导」。
 +
 
 +
代码管理机制可以保存开发工程中的多个版本,以便出现问题时能够进行回滚。
 +
 
 +
而思维指导机制的两点则是让CTO和程序员「互换角色」,相互了解彼此的想法,当出现问题时能更好解决。
 +
 
 +
[[文件:游戏公司7.jpg|800px]]
 +
 
 +
程序编好之后,就要进行测试了。
 +
 
 +
测试环节分为对代码的审查和实际运行两步,涉及「代码审查员」和「测试工程师」两个角色。
 +
 
 +
测试过程同样引入了「思维指导」机制,当测试反馈不明确时,程序员和测试工程师会进行角色互换。
 +
 
 +
[[文件:游戏公司8.jpg|800px]]
 +
 
 +
测试完成之后,游戏的本体就大功告成了,接下来要做的是撰写文档。
 +
 
 +
文档主要包括环境说明和用户手册两类。
 +
 
 +
前者说明了游戏运行所需依赖的环境,由CTO指导程序员完成。
 +
 
 +
而后者则由是CEO决定包含的内容,交由CPO进行生成。
 +
 
 +
[[文件:游戏公司9.jpg|800px]]
 +
 
 +
到此,一款游戏的开发工作就全部结束了。
 +
 
 +
除了提供开始的想法,整个流程再没有出现过人类的影子。
  
 
当然,这个流程中的对话、代码等信息对人类都是可见的,确保了开发的灵活性。
 
当然,这个流程中的对话、代码等信息对人类都是可见的,确保了开发的灵活性。
  
 
如有需要,也可以进行人工干预,比如替换掉生成的GUI。
 
如有需要,也可以进行人工干预,比如替换掉生成的GUI。
 +
 +
[[文件:游戏公司10.jpg|800px]]
  
 
以上就是关于ChatDev工作过程的全部介绍。
 
以上就是关于ChatDev工作过程的全部介绍。
  
团队简介
+
'''团队简介'''
  
 
ChatDev由清华大学NLP实验室孙茂松教授指导打造,他的研究方向是研究方向为自然语言理解、中文信息处理等。
 
ChatDev由清华大学NLP实验室孙茂松教授指导打造,他的研究方向是研究方向为自然语言理解、中文信息处理等。
第60行: 第115行:
  
 
还有团队利用AI控制角色,在南方公园的背景之下做出了一集电视剧。
 
还有团队利用AI控制角色,在南方公园的背景之下做出了一集电视剧。
 +
 +
[[文件:游戏公司11.jpg|800px]]
  
 
你认为AI还能模拟出什么样的环境呢?欢迎评论区交流。
 
你认为AI还能模拟出什么样的环境呢?欢迎评论区交流。
 
----
 
----
https://mbd.baidu.com/newspage/data/landingshare?context=%7B%22nid%22%3A%22news_9617434014924348603%22%2C%22sourceFrom%22%3A%22search%22%7D&isBdboxFrom=1&pageType=1&rs=3060657059&ruk=g5NAP4O-KfoCXG-SlTFpDA&sid_for_share=57654_2&urlext=%7B%22cuid%22%3A%220aHOtg8P2i_Bavai0u2ef0al28gri2a0guvh8g8fv8Kr0qqSB%22%7D&sShare=1
+
[https://mbd.baidu.com/newspage/data/landingshare?context=%7B%22nid%22%3A%22news_9617434014924348603%22%2C%22sourceFrom%22%3A%22search%22%7D&isBdboxFrom=1&pageType=1&rs=3060657059&ruk=g5NAP4O-KfoCXG-SlTFpDA&sid_for_share=57654_2&urlext=%7B%22cuid%22%3A%220aHOtg8P2i_Bavai0u2ef0al28gri2a0guvh8g8fv8Kr0qqSB%22%7D&sShare=1 量子位2023-07-19 14:51北京]

2023年9月14日 (四) 15:40的最新版本

清华用ChatGPT打造了个「零人工含量」的「游戏公司」,从老板到员工都是AI的那种!

只要你提出想法,从设计到测试的完整流程,都由AI帮忙搞定。

整个过程走下来,只要七分钟就能完成,成本不到0.3美元(人民币两块多一点)!

游戏公司1.jpg

这个「公司」被命名为「ChatDev」,顾名思义,就是通过聊天来进行开发。

在「公司」中,十多个聊天机器人分别扮演着不同的角色,串联在一起完成开发工作。

整个过程用ChatGPT就能完成,无需为每个环节专门训练相应的模型。

这个「公司」开发一款游戏的平均时间是409.84秒,最快的甚至不到三分钟,最慢的也不过17分钟。

游戏公司2.jpg

消耗方面,ChatDev使用的是ChatGPT的API(3.5-turbo),平均每款游戏使用约48.5K个token。

根据这一数据计算,用它来开发游戏,平均每款的成本仅需0.2967美元。

那么,这家「公司」是如何运转的呢?

让AI分工合作

研究团队为这个「公司」设计了一套由ChatGPT串联起的「ChatChain」。

每个bot分别扮演CEO、程序员、设计师等不同角色,涵盖了游戏研发涉及的所有岗位。

为了避免出现失误或幻觉,研发过程中的每一个步骤都由两个bot共同完成。

游戏公司3.jpg

具体而言,ChatDev在制作游戏时一共需要经历设计-编程-测试-文档这四个大环节。

在设计环节开始之前,人类会提供一个初步的想法,这也是唯一需要人类的地方。

这个想法将由bot扮演的CEO、CTO和CP(roduct)O共同进行分析评估。

CEO会分别与CPO和CTO进行讨论,决定游戏的呈现形式(Web/桌面/移动端…)和使用的编程语言。

游戏公司4.jpg

此外,设计环节中,每个bot具体扮演的角色,是由两个instructor(也是bot)分配的。 为了提高设计工作的质量,团队还引入了「记忆流」和「自我反思」两种工作机制。

游戏公司5.jpg

「记忆流」会保存每轮对话的记录,供各个bot随时翻阅,确保思路的连贯性。

「自我反思」机制是在bot们完成了各自的工作但没有达到要求时,生成一个「伪我」,将问题和有关对话向instructor进行反馈。

设计工作结束之后,就进入到了编程环节,包括代码撰写和图形界面设计。

CTO向程序员提出要求和大致思路,然后程序员编写代码。

设计师会生成GUI方案,并调用有关工具生成图像资源,由程序员进行集成。

游戏公司6.jpg

编程过程同样引入了提升质效的工作机制,具体而言包括「代码管理」和「思维指导」。

代码管理机制可以保存开发工程中的多个版本,以便出现问题时能够进行回滚。

而思维指导机制的两点则是让CTO和程序员「互换角色」,相互了解彼此的想法,当出现问题时能更好解决。

游戏公司7.jpg

程序编好之后,就要进行测试了。

测试环节分为对代码的审查和实际运行两步,涉及「代码审查员」和「测试工程师」两个角色。

测试过程同样引入了「思维指导」机制,当测试反馈不明确时,程序员和测试工程师会进行角色互换。

游戏公司8.jpg

测试完成之后,游戏的本体就大功告成了,接下来要做的是撰写文档。

文档主要包括环境说明和用户手册两类。

前者说明了游戏运行所需依赖的环境,由CTO指导程序员完成。

而后者则由是CEO决定包含的内容,交由CPO进行生成。

游戏公司9.jpg

到此,一款游戏的开发工作就全部结束了。

除了提供开始的想法,整个流程再没有出现过人类的影子。

当然,这个流程中的对话、代码等信息对人类都是可见的,确保了开发的灵活性。

如有需要,也可以进行人工干预,比如替换掉生成的GUI。

游戏公司10.jpg

以上就是关于ChatDev工作过程的全部介绍。

团队简介

ChatDev由清华大学NLP实验室孙茂松教授指导打造,他的研究方向是研究方向为自然语言理解、中文信息处理等。

该实验室的刘知远副教授是论文的共同通讯作者,他的研究方向为知识图谱与语义计算、 社会计算与计算社会科学。

论文第一作者是清华软件学院毕业的钱忱博士,2016年从北京理工大学保送清华直博,2021年毕业后到腾讯公司担任应用研究员。

One More Thing

ChatDev利用AI扮演的角色,模拟了公司这一社会场景。

不仅是这个「AI游戏公司」,用AI模拟人类社会已经成为了一种研究趋势。

比如我们此前曾经介绍过的「游戏版西部世界」(游戏版《西部世界》来了!NPC全由AI操控,基于最新GAEA系统打造),就用AI操控NPC,在游戏中构建了一个社会。

还有团队利用AI控制角色,在南方公园的背景之下做出了一集电视剧。

游戏公司11.jpg

你认为AI还能模拟出什么样的环境呢?欢迎评论区交流。


量子位2023-07-19 14:51北京