ChatGPT 无处不在,但它能做什么,又是如何工作的?我们将分解基础知识,并解释如何开始使用人工智能。
自 2022 年 ChatGPT 首次亮相以来已经过去了几年,你很可能仍然处于人工智能之旅的起步阶段。我们每天都在学习更多关于人工智能的知识,了解这项技术的运作方式可以帮助你充分利用你的对话。
虽然 ChatGPT 在表面上很容易使用,但在幕后却发生了许多为每个用户定制的复杂计算。大型语言模型 (LLM) 依赖于巨大的人工智能神经网络,可以处理和生成类似人类的文本、分析图像,甚至可以自己说话。以下是它的工作原理。
ChatGPT 背后的技术是什么?
从最基本的意义上讲,ChatGPT 是一个对话式的网站或移动应用程序,可以接收来自人类的请求。人们已经为它找到了许多创造性的用途,包括撰写文章和电子邮件、设计网站、编写软件代码以及通过人工智能代理完成任务。
虽然 ChatGPT 是当今最流行的人工智能聊天机器人,但您可能听说过的其他聊天机器人包括 Google Gemini、Perplexity 和 Anthropic 的 Claude。它们都经过大量数据的训练,这“教会”它们如何以一种令人信服的方式与人类互动,就好像它们是人类一样。但它们更像是外星人(或蹒跚学步的孩子),不断试图学习如何成为一个成年人。它们也希望受欢迎;OpenAI 最近不得不回滚一项 ChatGPT 更新,因为它变得过于谄媚。
这个学习过程是通过向聊天机器人输送数据来实现的,这些数据主要来自互联网(维基百科是一个大的来源),包括受版权保护的书籍、YouTube 视频和其他原创材料,在某些情况下会引发诉讼。聊天机器人外星人渴望尽可能多的信息,以便它们能够不断表现得更好。
该模型通过从数据中获取一段文本(例如,维基百科文章的开头句子)并尝试预测序列中的下一个标记来学习。然后,它将输出与其在训练语料库中的实际文本进行比较,并调整其参数以纠正任何错误。通过在一个非常大的文本(或图像或语音)主体上反复执行此操作,它可以开发出一种语言模型,当给定提示时,该模型可以创建连贯的文本序列。
此过程依赖于一种名为深度神经网络 (DNN) 的软件架构,特别是 Transformer 网络。Transformer 网络擅长将文本分解成“标记”,这些标记基本上是单词的一部分(“单词”是一个标记,“基本上”是两个标记)。然后,它会根据用户的交互预测最有可能与用户产生共鸣的序列。每次计算都因人而异,这需要大量的电力和能源。
ChatGPT 还会“记住”你之前的对话,以生成定制的回复。你与它交谈得越多,它就越能完善与你的互动。如果你说“那不对”之类的话,该模型会注意到并在下次尝试不同的方法。这被称为“从人类反馈中进行强化学习”(RLHF),这也是 ChatGPT 比其前身更有用的原因。
如何试用 ChatGPT?
你可以在 OpenAI 的网站或应用程序(iOS或 Android)上注册 ChatGPT,即使不创建账户也可以使用基本版本。免费版本足以满足偶尔的对话需求,但它限制了你每天可以与旗舰 GPT-4o 模型进行的交流次数以及你可以上传的照片数量。
对于严肃的、持续的使用,你可能需要尝试付费版本 ChatGPT Plus,它每月收费 20 美元。它具有更少的限制和额外的功能,如 Sora 视频创建模型和自定义 GPT。后者是你可以在特定任务(如语言翻译)中使用的微型模型,而主要的 ChatGPT 模型更像是一个全能型的运动员。
OpenAI 还提供其他订阅层级,如每月 200 美元的 Pro 模型,该模型没有限制,可以执行编译高级研究报告之类的操作。还有面向大型组织的团队和企业账户。最后,开发人员也可以通过 OpenAI 的 API 访问 ChatGPT,你根据使用的令牌数量付费。
我可以用 ChatGPT 做什么?
有了正确的说明和上下文,ChatGPT 会非常有用。以下是你用 ChatGPT 可以做的一些事情。
写作
ChatGPT 可以成为一个有用的写作助手。如果你提示它一次性写一篇完整的文章,它会给出好坏参半的结果。但如果你与它逐步合作,ChatGPT 可以做令人印象深刻的事情。例如,你可以从一个大纲开始,并在 OpenAI 的聊天机器人的帮助下充实每个部分.
编辑
ChatGPT 是一位出色的编辑助手;可以用它进行副本编辑、校对、改写、风格调整等。
翻译
ChatGPT 可以很好地翻译成几种语言。如果你正在从事一个专门的领域,你可以通过提供上下文来改进它的翻译,例如源语言和目标语言文档的示例。
总结
ChatGPT 可以总结文章、演讲和论文。当你提供指导方针时,例如要突出显示哪些主题,它会变得更准确。
集思广益
ChatGPT 可以在这里提供各种帮助,从为演示文稿建议讨论点到计划旅行。
编写代码
ChatGPT 是一个很好的编码助手,可以将功能描述转换为几种编程和脚本语言的工作代码。
创建和解释图像
你可以上传照片并询问有关它们的问题;例如,添加一张树的照片并询问“这是什么植物?” 如果你有问题,ChatGPT 还可以解释屏幕截图,你可以在手机上看到一些东西。它还可以用其新的内部生成器创建图像,该生成器受到了好评。
进行口头对话
使用语音模式,你无需精心制作完美的文本提示。只需对着麦克风说话并开始聊天。
创建电影片段
Sora 视频生成器会生成自定义片段,只有几秒钟长,没有声音,可以用作增强更大的视频项目或用作独立片段。它适用于 ChatGPT Plus 和 Pro 订阅者,并且可以通过 Microsoft Bing 应用程序免费提供有限的功能。
我们不建议将 ChatGPT 作为研究工具,因为它倾向于产生幻觉或编造信息。像 ChatGPT 这样的法学硕士可以将文本组合在一起,使其在词汇上是正确的,但在事实上是错误的。这也适用于使用 ChatGPT 进行编码:它可能会生成非功能性或不安全的代码。一个好的经验法则是将 ChatGPT 作为起点,然后通过点击 ChatGPT 提供的源链接或单独的 Google 搜索来检查其输出的真实性。(Perplexity 是另一个以引文为中心的聊天机器人。)
ChatGPT 有哪些替代方案?
其他几家公司和组织已经开发了与 ChatGPT 相比的指令跟踪 LLM。
- **Google Gemini:**谷歌的人工智能模型几乎可以完成你用 ChatGPT 可以做的所有事情,而且可以连接到谷歌的生态系统,因此你可以将其输出导出到 Gmail、谷歌表格、文档等。
- **Bing:**微软已向 OpenAI 投资了数十亿美元,它已将 ChatGPT 集成到其 Bing 搜索引擎中。它是一个对话式界面,用于搜索知识并执行你使用 ChatGPT 可以执行的其他任务。它会引用其生成的信息来源,这使你能够验证信息来源。
- **Claude:**Anthropic 是一家总部位于旧金山的人工智能实验室,它推出了 Claude,这是一款 ChatGPT 竞争对手,在写作和编码方面享有很高的声誉。
- **Perplexity:**作为谷歌的替代方案,许多人使用 Perplexity 来搜索网络。它正在迅速崛起,并将成为摩托罗拉新款 Razr 手机上的首选搜索平台。据报道,三星正在洽谈做同样的事情。
- **开源模型:**开源社区发布了你可以在自己的服务器上运行的 LLM。这些 LLM 可以帮助你控制你的数据并避免供应商锁定。开源 LLM 比 ChatGPT 小得多,而且更难设置,但如果你有技术能力,它们可以产生令人印象深刻的结果。Meta 的 Llama 模型是一些最知名的模型。其他选项包括 Open Assistant、Alpaca、Vicuna 和 Dolly 2。