江南仁:互联网是怎样的从被动的提供咨询服务到主动的提供服务,进而形成“替身”,直至形成永生的虚拟人?

来自通约智库
跳转至: 导航搜索

  互联网在开始的时候,只是一个保存资料信息的场所。可以为人们提供保存博文、邮件、备忘信息等资料。可以为人们提供查询服务。这个阶段,你有什么问题不清楚,你会上百度查询一下。通过互联网,让你更加快速的学习到你所不知道的知识。在这个阶段里,互联网是被动的,里面保存的资料信息需要你启动一个查询程序去执行查询的动作。目前出现的ChatGPT等大语言模型也还是这个范畴的技术,只是ChatGPT回答的更加系统和全面。
  进一步的发展,互联网实现了可以主动为你提供服务的功能,知道你的喜好,知道你最近想购买什么东西,想做什么事情。这个过程是这样的,互联网通过记录了你曾经的查询信息,主动的根据你的目的自动的执行查询功能并向你展现出来,给你做参考。
  随着互联网知道你的事情越多,也就越了解你,不但会提供你需要的资料信息,还可能辅助你决策。尤瓦尔•赫拉利在《未来简史-从智人到智神》一书中描述一个有趣的互联网辅助决策例子:
  许多人会很乐意将大多数决策过程交给这样的系统,或者至少是在面临重要抉择时参考一下意见。谷歌将能够建议我们该看哪部电影、去哪里度假、上大学读什么专业、选哪个工作机会,甚至是该和谁约会及结婚。我可能会说:“嘿,谷歌。约翰和保罗都在追我,我两个都很喜欢,但喜欢的点不太一样,很难做决定。根据你手上所有的资料,你怎么建议?”
  谷歌就会回答:“这个嘛,我从你出生那天起就认识你了。我读过你所有电子邮件,听过你所有电话录音,知道你最爱的电影,也有你的DNA资料和完整的心跳记录,你过去每次约会我都有精确的数据,如果你要的话,我可以把你过去和约翰或保罗约会时的资料调出来,显示你每秒的心跳、血压或血糖值变化。如果有必要,我甚至也能把你们每次做爱的数据调出来,用数字比较谁高谁低。当然,我对他们的认识也不少于对你的认识。所以,基于以上所有信息和我杰出的算法,加上几十年来几百万对伴侣的统计资料,我建议你挑约翰。大约有87%的概率,你们长期满意度会比较高。”
  “当然,因为我非常了解你,所以我知道你不会喜欢这个答案。保罗长得比约翰帅,而你又太看重外表,所以你其实内心希望我的答案是保罗。确实,外表很重要,但实在没有你想的那么重要。你体内的生化算法是从数万年前的非洲大草原开始演化的,在对于潜在配偶的整体评价之中,外表占了35%。至于我的算法,是基于最新的研究和统计数据,认为外表对于长期成功的浪漫关系只有14%的影响。所以,虽然我已经把保罗的外表纳人考虑,但还是建议约翰是你更好的选择。”
  目前的AI大语言模型是通用对话虚拟人,下一步将向专业化个性化方面发展。在个性化方面,会将个人的记忆、知识、爱好、思维方式、语言风格及其专业背景、文化背景、社会关系等特征组合成训练数据对机器人进行训练,形成一个人在网络上的替身。网络上的替身将和这个人互为训练和成长,即将个人的数据训练网络上的替身,而这个人的替身则发挥其计算机特有的海量存储和快速处理能力,结合互联网上综合的信息帮助原型更为快速的学习和提高。原型再将提高了的思想转为思维文件进一步训练网上的替身,而替身又将辅助原型的学习和认知的提升,如此循环的互为训练和成长。是的,可以叫成长,所以现在有人将数据资料对机器人进行训练称之为“喂养”。直至形成逼真的,可以独立进行学习、思考、工作和社交的机器人。到了这样的程度,可以认为是人在虚拟世界的永生了。
  为了创建逼真的虚拟人,原型需要收集大量个人的数据,以便将其用于训练虚拟人模型。以下是需要收集的常用数据类型:
  1.图像数据:收集您的照片和视频,以便虚拟人模型可以学习您的外貌和动作。
  2.音频数据:收集您的语音录音和音频,以便虚拟人模型可以学习您的语音模式和语调。
  3.文本数据:收集您的文本记录,如电子邮件、聊天记录、博客文章等,以便虚拟人模型可以学习您的思维特点和语言习惯。
  4.传感器数据:通过穿戴传感器来收集身体数据(例如,通过加速度计和陀螺仪记录个人的运动),以便虚拟人模型可以学习该人的动作和行为。
  5.社交媒体数据:收集与个人相关的专业和社会相关的背景,以便虚拟人模型可以学习该原型的兴趣爱好、偏好和行为模式。
  注意收集上述有关个人的思想和情感的背景数据时,需要附加个人的体会和感受,比如读书笔记,图片注释,这些附加信息有助于说明与原型的相关性。
  一旦收集了这些数据,就可以使用这些数据来训练虚拟人模型,使其能够模拟该人的特点和行为。
  关于可能需要的大量的计算资源和相关的技术的问题。
  要实现逼真的个性对话虚拟人,需要准备数以百万,到千万级别的训练数据,这对普通人来说,这个数据量是很难准备得到的。好在这些数据包括了与个人相关的专业和社会相关的背景资料。应对的还是马克思的那句“人的本质不是单个人所固有的抽象物,在其现实性上,它是一切社会关系的总和。”即改造我们自己的不仅仅是我们表达思想的文件,还包括影响我们思想形成的文件。这需要每个人在准备训练自己的虚拟人的资料的时候,需要对影响自己的思想形成的专业以及社会关系文件进行标记。