解密生成式AI:你需要了解的

从生成图像到咨询人工智能面试准备,你可能已经接触过生成式人工智能(Generative AI)的应用。

OpenAI的明星产品ChatGPT,以及诸如Google Gemini、Microsoft Copilot和Anthropic的Claude等优秀的ChatGPT替代品,都是生成式AI模型的典型代表。

生成式AI技术已经渗透到许多人的个人和职业生活中,成为不可或缺的一部分。但究竟什么是生成式AI(通常缩写为GenAI)?它与其他类型的人工智能有何区别?其运作原理又是如何?如果你还没来得及向ChatGPT提问,那么本文将为你解答这些问题。

什么是生成式AI?

或许有违我作为一名新闻工作者的职业操守,但在此,我还是决定求助于ChatGPT,让它来定义生成式AI:

"生成式AI是一种人工智能,通过学习现有数据的模式来创建新的内容,例如文本、图像、音乐或代码。它利用生成对抗网络(GANs)和转换器等模型来生成逼真、类人的输出,从而为艺术、设计、写作和其他领域的创意应用提供支持。"

或者,更简洁地说:生成内容的AI就是生成式AI。

虽然"生成式AI"一词是近年才流行起来的,但其概念却由来已久。早在20世纪50年代,计算机科学家亚瑟·塞缪尔(Arthur Samuel)就提出了“机器学习”这一术语,这可以看作是生成式AI的先驱。

尽管几十年来人们不断进行研究和探索,但我们今天所知的生成式AI,其最大的进展出现在十年前,这要归功于工程师伊恩·古德费로우(Ian Goodfellow)开发的生成对抗网络(GANs,如上述定义中所述)。

紧随其后的是2017年谷歌科学家提出的“转换器架构”,这是当今最常用的生成式AI工具的基础。

生成式AI的应用实例

如果你使用过像ChatGPT、Gemini、Copilot或Claude这样流行的聊天机器人工具,那么你已经体验过生成式AI。例如,当你向它寻求餐厅推荐、论文写作帮助,或是一封投诉房东的模板信时。

它的用途广泛,从无伤大雅的娱乐(创作原创诗歌和歌曲,或生成梦幻般的图像),到专业应用(创建演示文稿、设计产品原型、制定战略),甚至有可能拯救生命(药物发现)。

许多社交媒体趋势——例如将自己可视化为玩偶,或将你的宠物狗变成人——都是生成式AI的产物。

然而,生成式AI也被用于不正当用途。"深度伪造"被用来传播虚假信息、损害他人声誉,或制造“裸照”进行性勒索诈骗。这正是生成式AI的迅速普及让许多人担忧的原因之一,尤其是在这项技术变得越来越逼真和易于使用的情况下。

生成式AI的工作原理

请放心,我不会深入探讨概率建模和高维输出的复杂性。实际上,简单来说,你可以认为生成式AI模型执行两个核心功能。

首要任务是从大量数据集中学习模式。这些数据集包括文本、图像、网页、代码以及任何可以输入到模型中的内容;这通常被称为“训练”。

然后,AI模型识别这些数据中的模式,有效地获取知识和理解技术。例如,如果该模型被输入了有史以来最伟大的100部恐怖小说,它将交叉引用这些数据,提取这些书籍共有的结构、语言、主题和叙事手法。

接下来,它将应用这些训练来生成全新的内容。因此,当你要求ChatGPT计划你的下一个假期时,它会提取它所收集到的所有信息,并使用一种叫做“学习概率分布”的方法来撰写回答。

对于书面回复,它通过逐字逐句的方式进行,利用其所掌握的数据来选择句子中最合适的下一个单词。或者对于图像,使用基于转换器的模型的生成式AI工具会接收它所见过的无数真实图像的颜色和构图。例如,要求Midjourney创建一个漫画,它可能会考虑它之前接受过的所有训练样本,以生成准确符合要求的内容。

经常有人混淆“人工智能”和“生成式人工智能”这两个术语。人工智能是一个涵盖所有形式人工智能的统称。生成式人工智能是人工智能的一个分支,特指那些能够生成内容的人工智能工具。

IBM的国际象棋电脑“深蓝”就是一个著名的例子,它在1997年击败了加里·卡斯帕罗夫(Garry Kasparov)——历史上最伟大的国际象棋棋手之一。“深蓝”使用所谓的符号人工智能来学习棋步、评估棋局并做出战略决策,但它不能被归类为生成式人工智能,因为它没有创造任何新的东西。

另一个常见的非生成式人工智能的例子是判别式人工智能。它被应用于面部识别软件,用于将你的智能手机相册中的照片进行分组,或者识别垃圾邮件并将其从你的收件箱中隐藏。

因此,虽然像ChatGPT、Copilot和Gemini这样的聊天机器人肯定属于广义的人工智能范畴,但更准确地说,它们被归类为生成式AI模型。

生成式AI面临的挑战

除了上面提到的生成式AI的恶意使用之外,生成式AI的其他缺点更多的是该技术工作方式的固有产物。这些模型的好坏取决于它们所接受训练的信息。信不信由你,互联网上存在大量过时、误导或完全错误的信息——所有这些信息都可能被聊天机器人吸纳,然后作为事实重新吐出来。这些错误也被称为“幻觉”。

出于同样的原因,生成式AI模型也可能陷入强化偏见或刻板印象的陷阱。正如ChatGPT本身给出的一个例子:"文本到图像模型通常会将“护士”等职业与女性联系起来,而将“首席执行官”与男性联系起来。"

学术机构一直在绞尽脑汁地处理学生使用ChatGPT等工具来撰写论文和毕业论文的问题。而它对创意产业构成的挑战——生成式AI真的会让作家、演员、音乐家和艺术家完全变得多余吗?——是一个永恒的争论焦点。

生成式AI 带来了重塑创意产业的潜力,也引发了对其对劳动力市场影响的担忧。机器生成内容的能力引发了关于人类技能和创造力在未来经济中的价值的重要问题。

超越炒作:生成式AI的未来轨迹

虽然围绕生成式 AI 的讨论通常集中在其功能和潜在陷阱上,但重要的是要考虑其更广泛的影响以及塑造其轨迹的关键考虑因素。以下是需要考虑的一些重要方面:

道德考量和负责任的开发

随着生成式 AI 变得越来越强大,道德考量在指导其开发和部署中变得至关重要。偏见、虚假信息和知识产权等问题需要认真解决,以确保负责任且符合道德地使用这些技术。优先考虑透明度、问责制和公平性对于建立对生成式 AI 系统及其输出的信任至关重要。

构建一个负责任的生成式AI生态系统需要持续的对话和协作,涉及研究人员、开发者、政策制定者和公众。需要建立清晰的道德准则和最佳实践,以指导生成式AI的开发和使用,并确保这些技术能够促进公平、透明和有益的成果。此外,需要开发强大的机制来检测和纠正偏见,减少虚假信息的传播,并保护知识产权。

人机协作

生成式 AI 的未来不在于完全取代人类,而在于增强人类能力和促进人机协作。通过利用 AI 的优势来自动执行重复性任务、生成创意和提供见解,人类可以专注于需要批判性思维、情商和领域专业知识的更高级别的活动。这种协作方法可以释放新的生产力和创新潜力。

我们可以预见,未来的工作场所将越来越多地依赖于人机协作。生成式AI将成为人类的强大工具,帮助他们更好地完成工作,提高效率和创造力。医生可以利用AI来诊断疾病,工程师可以利用AI来设计更高效的产品,艺术家可以利用AI来探索新的艺术形式。在这种协作模式下,人类和AI将相互补充,共同创造更大的价值。

行业转型和新机遇

生成式 AI 有潜力颠覆各个行业,从医疗保健和金融到娱乐和教育。通过自动化流程、个性化体验和释放新的创意可能性,组织可以利用生成式 AI 来提高效率、降低成本并获得竞争优势。随着企业适应这些技术,预计工作角色将发生转变,创造新的需要专业知识来开发、部署和维护生成式 AI 系统的机会。

在医疗保健领域,生成式AI可以帮助医生诊断疾病、制定个性化治疗方案以及加速药物研发。在金融领域,生成式AI可以帮助银行识别欺诈行为、评估风险并提供个性化的金融建议。在娱乐领域,生成式AI可以创造新的游戏体验、生成逼真的电影特效以及创作原创音乐。在教育领域,生成式AI可以提供个性化的学习体验、自动评估学生的作业以及创造更具吸引力的课程。

技能提升和劳动力发展

随着生成式 AI 越来越普遍,个人需要获得新的技能和能力才能在不断变化的就业市场中蓬勃发展。重点应放在培养诸如批判性思维、解决问题、创造力和沟通等技能上,以及对 AI 道德含义和负责任使用的理解。技能提升和培训计划可以帮助员工适应新的工作角色,并利用生成式 AI 带来的机会。

未来的劳动力市场将对那些具备批判性思维、解决问题、创造力和沟通能力的人才需求旺盛。此外,对AI的道德含义和负责任使用的理解将变得越来越重要。政府、企业和教育机构需要共同努力,提供技能提升和培训计划,帮助员工适应新的工作角色,并利用生成式AI带来的机会。

应对挑战和减轻风险

生成式 AI 并非没有挑战和风险。应对偏见、虚假信息和滥用等问题需要多方面的努力,包括技术保障措施、监管框架和公众意识活动。持续监控和评估生成式 AI 系统的影响对于识别和减轻潜在的负面后果至关重要。

应对生成式AI的挑战需要采取多方面的措施。技术保障措施可以帮助检测和纠正偏见,减少虚假信息的传播,并防止滥用。监管框架可以为生成式AI的开发和使用提供指导,并确保其符合伦理和社会价值观。公众意识活动可以提高公众对生成式AI的理解,并帮助他们识别和应对潜在的风险。

结论:拥抱负责任的创新

生成式 AI 代表着技术进步的重大飞跃,为各个行业和个人带来了巨大的潜力。通过解决道德问题、促进人机协作、拥抱产业转型、加大技能提升力度以及应对挑战,我们可以释放生成式 AI 的全部优势,同时减轻其风险。随着我们继续探索生成式 AI 的可能性,至关重要的是以负责任、以人为本和具有前瞻性的心态来对待创新。