第二章?生成式 AI _043
什么是“大语言模型”? _046
大语言模型是如何工作的? _050
什么是“嵌入”? _051
词嵌入是如何表征含义的? _053
什么是“人工神经网络”? _057
什么是“Transformer”? _062
Transformer 如何使用词嵌入来表达复杂想法? _065
什么是“词元”? _074
大语言模型是如何应用于非语言问题的? _076
什么是“涌现性质”?大语言模型展现出涌现性质了吗? _078
什么是“越狱”?为什么这是个难题? _082
什么是“幻觉”?为什么大语言模型会有“幻觉”? _085
其他用于生成式 AI 的技术有什么? _088
未来的生成式 AI 将如何相互交流? _090
生成式 AI 未来潜在的精通技能有哪些? _090
第三章?可能的影响 _095
有哪些历史先例可以作为衡量生成式 AI 影响的参照? _098
生成式 AI 将如何改变医疗保健? _102
生成式 AI 将如何改变法律体系? _106
生成式 AI 将如何改变教育? _117
生成式 AI 将如何改变软件工程? _123
生成式 AI 将如何改变创意艺术和创意产业? _131
第五章?风险与危险 _161
生成式 AI 将如何被用来推广虚假信息? _164
什么是“算法偏见”? _167
人们会转向机器以寻求情感支持吗? _174
生成式 AI 将如何影响我们的沟通方式? _177
什么是“对齐问题”? _179
“杀手机器人”已经出现了吗? _187
我们应该担心“超级智能”和“奇点”吗? _189
第六章?生成式 AI 的法律地位 _195
计算机程序能签订协议及合同吗? _198
人们应该对其“智能体”的行为承担全部责任吗? _202
生成式 AI 应被赋予如财产所有权等法律权利吗? _205
生成式 AI 能犯罪吗? _207
如何让生成式 AI 对其犯罪行为负责? _209
我们为什么不能通过编写生成式 AI 程序来让其遵守法律和其他规则? _211
第七章?监管、公共政策与全球竞争 _215
生成式 AI 受言论自由法律的保护吗? _218
生成式 AI 的输出内容能受到版权保护吗? _220
正在考虑的监管方案有哪些? _227
适用于生成式 AI 的新法律法规是什么? _237
近些年,机器学习(Machine Learning)的快速进步催生了AI 的一个新兴子领域,即“生成式 AI”。这些程序通过分析大量数字化材料来生成新颖的文本、图像、音乐和软件。
但这个平淡无奇的描述,远远不能对这些非凡的多面手做出公正的评价。
第一波生成式AI浪潮主要专注于自然语言对话。所谓的“大语言模型”(Large Language Model,简称 LLM),已经在广泛的任务上展现出惊人的熟练度,并具有超越人类的表现。同时,它们也倾向于说谎、不合逻辑和表达虚假情感,例如向对话者展示自己的“爱意”。它们用通俗易懂的语言与用户聊天,并轻松解决各种复杂问题。很快,大语言模型将提供专业的医疗护理、开展法律咨询、起草文件、辅导孩子、提供建议、进行治疗、编写计算机程序,以及管理我们的组织机构和基础设施。与此相关的一类生成式 AI,则从简单的描述中生成视觉图像,这些图像与人类艺术作品或者照片几乎毫无区别。还有一些应用程序,可以模仿给定艺术家或音乐家的风格来合成声音或创作乐曲。这些应用程序中最吸引人的,也许是所谓的“多模态”(multimodal),因为多模态整合了多种形式的信息(语言、视觉、声音等),以此来理解世界并进行推理(作为演示,一个多模态系统的原型能够根据冰箱内部的照片来规划一顿饭)。
但这仅仅是生成式 AI 革命的开始。生成式 AI 背后的技术是非常通用的。在这个意义上,这些程序能够从可收集和待处理的任何数据集合中学习。在现代数字世界中,这是一个相对直接的任务。如果配置得当并获得授权,生成式 AI 就能够代表我们来采取行动。
未来的这个技术版本将作为值得信赖的私人助理。它们将为我们做笔记,充当我们在各种论坛上的代表,促进我们的利益,管理我们的通信,并提醒我们注意迫在眉睫的危险。在更为公开的应用程序中,它们将成为政府机构、公司和组织的代言人。通过连接到传感器网络,它们将监控物理世界,警告我们即将发生的环境灾难,比如刚开始形成的龙卷风、森林火灾和有毒物质泄漏。在某些时间紧迫的情况下,我们可能会授权它们立即采取行动,比如在飓风中降落一架受损的飞机,或者营救一个误入车流的儿童。
我们是否终于发现了人工智能的圣杯——所谓的“通用AI”(Artificial General Intelligence,简称 AGI),即可媲美甚至超越人类智能的机器?通用 AI(不要与生成式 AI 混淆)一直是几代科学家难以实现的幻想,更不用说对于众多科幻电影和图书了。值得注意的是,这个问题的答案是肯定的。就所有的实际目的而言,这些系统是多功能的“合成大脑”,但这并不意味着它们具有人类意义上的“思想”。它们没有独立的心之所向(目标和欲望)、胸中成见(偏见和抱负)、感同身受(情感和感觉),这些是人类独有的特质。然而,如果我们用正确的数据来训练它们,并指示其追求恰当的目标,它们就能表现得好像具备这些特质。它们将无比灵活和顺从,并且愿意按照我们的请求承担任何角色,就像一个电子版的“天才雷普利”(Talented Mr. Ripley) 。它们可以扮演奴隶或主人、伴侣或对手、教师或学生。它们会心甘情愿地接受我们最好或最坏的本能,毫无指责或评判之意。
无论怎样夸大这种新技术可能带来的影响都不为过,我们正在见证一个“基蒂霍克(Kittyhawk)时刻”。虽然当今的生成式 AI 是使用固定的训练数据集来构建的,但未来的版本肯定会消除这个限制,就像人类一样不断地学习和整合新信息。目前,虽然它们对世界的体验是以人类生成的内容为媒介的,但这个瓶颈很快就会因生成式 AI 连接实时数据源(比如摄像头和麦克风)而被消除,这在本质上为生成式 AI 赋予了属于它们自己的“眼睛”和“耳朵”。
我们似乎正处于一个新文艺复兴时代的前沿:一场伟大文化与智力活动的爆发。14—17 世纪的文艺复兴,标志着人类活动的重心从宗教(神本位)转到世俗,带来了艺术、科学、技术和人类知识的巨大进步。生成式 AI 可能会引发一种聚焦机器的新的文化转移,我们将加强混合式智能的力量,将其作为加速进步的强大新工具。未来,当寻求最明智、最客观和最可信的建议时,我们将求助于机器,而不是人类。
这场革命的根本在于我们在思索机器方面的范式转变。生成式 AI 颠覆了我们看待计算机的历史传统。自电子时代起,计算机一直被视为人类的神秘对立面:绝对精确、速度惊人、冷酷无情、精于计算,以及缺乏社交礼仪或道德判断。现在,尽管(迄今为止)缺乏任何真实的现实世界经验,生成式 AI 却经常地表现出精湛的人际交往技巧、共鸣力和同理心。
目前,我们尚不清楚这场技术革命是否会为社会带来更加正面的影响,尽管我预计将会如此。生成式 AI 加强了不良行为者用错误的信息和宣传内容充斥世界的能力,污染了社会交流的环境,并降低了信任感。此外,好处最终可能主要归于富人。一些思想家担心生成式 AI 甚至可能对人类构成生存风险,尽管这种担忧被极度夸大了。虽然定论可能还需要很多年才能得出,但是正反两方都有很多话要说。
我们应该如一些人所建议的那样,在为时已晚之前暂停该领域的研究呢,还是采取更审慎的措施呢?对如此强大的系统进行监管是必不可少的,但我们还远不清楚如何才能在减少风险的同时收获益处。
生成式 AI 与早期制造智能机器的尝试有两个关键区别。
首先,生成式 AI 极其通用,既能够起草大学论文,也可以创作十四行诗,还可以解释更换汽车轮胎的步骤,计划感恩节大餐,或者发明一个新词,比如“感官性”(sensocrity),即优先考虑感官的(sensory)愉悦而非智力或情感满足的倾向。以前的AI 系统通常被设计为尽可能准确地执行单一目标任务,比如识别猫的图片或预测交通堵塞的情况。AI 研究曾经在很大程度上被分割成许多使用不同工具和技术的子领域:自然语言处理、计算机视觉、语音识别、机器人等。相比之下,生成式 AI 可以被指示执行(或至少描述如何执行)你能想到的任何任务……尽管它们可能会耐心地向你解释,它们已经被设计者禁止这样做了。 生成式 AI“样样通,样样精”(Jacks of all trades,and masters of most)。
其次,生成式 AI 表现出令人不安的人类倾向,比如犯愚蠢的错误,将谎言误认为事实,以及说善意的谎言来为自己的错误开脱 ,或者说服人们做生成式 AI 想要做的事。 它们展现出了心智理论(预测其他人知道什么或要做什么的能力),并且出奇地善于理解微妙的社交细节,比如“失礼”。