ChatGPT 解密：你需要知道的一切 | zh-CN

ChatGPT 无处不在，但它能做什么，又是如何工作的？我们将分解基础知识，并解释如何开始使用人工智能。

自 2022 年 ChatGPT 首次亮相以来已经过去了几年，你很可能仍然处于人工智能之旅的起步阶段。我们每天都在学习更多关于人工智能的知识，了解这项技术的运作方式可以帮助你充分利用你的对话。

虽然 ChatGPT 在表面上很容易使用，但在幕后却发生了许多为每个用户定制的复杂计算。大型语言模型 (LLM) 依赖于巨大的人工智能神经网络，可以处理和生成类似人类的文本、分析图像，甚至可以自己说话。以下是它的工作原理。

ChatGPT 背后的技术是什么？

从最基本的意义上讲，ChatGPT 是一个对话式的网站或移动应用程序，可以接收来自人类的请求。人们已经为它找到了许多创造性的用途，包括撰写文章和电子邮件、设计网站、编写软件代码以及通过人工智能代理完成任务。

虽然 ChatGPT 是当今最流行的人工智能聊天机器人，但您可能听说过的其他聊天机器人包括 Google Gemini、Perplexity 和 Anthropic 的 Claude。它们都经过大量数据的训练，这“教会”它们如何以一种令人信服的方式与人类互动，就好像它们是人类一样。但它们更像是外星人（或蹒跚学步的孩子），不断试图学习如何成为一个成年人。它们也希望受欢迎；OpenAI 最近不得不回滚一项 ChatGPT 更新，因为它变得过于谄媚。

这个学习过程是通过向聊天机器人输送数据来实现的，这些数据主要来自互联网（维基百科是一个大的来源），包括受版权保护的书籍、YouTube 视频和其他原创材料，在某些情况下会引发诉讼。聊天机器人外星人渴望尽可能多的信息，以便它们能够不断表现得更好。

该模型通过从数据中获取一段文本（例如，维基百科文章的开头句子）并尝试预测序列中的下一个标记来学习。然后，它将输出与其在训练语料库中的实际文本进行比较，并调整其参数以纠正任何错误。通过在一个非常大的文本（或图像或语音）主体上反复执行此操作，它可以开发出一种语言模型，当给定提示时，该模型可以创建连贯的文本序列。

此过程依赖于一种名为深度神经网络 (DNN) 的软件架构，特别是 Transformer 网络。Transformer 网络擅长将文本分解成“标记”，这些标记基本上是单词的一部分（“单词”是一个标记，“基本上”是两个标记）。然后，它会根据用户的交互预测最有可能与用户产生共鸣的序列。每次计算都因人而异，这需要大量的电力和能源。

ChatGPT 还会“记住”你之前的对话，以生成定制的回复。你与它交谈得越多，它就越能完善与你的互动。如果你说“那不对”之类的话，该模型会注意到并在下次尝试不同的方法。这被称为“从人类反馈中进行强化学习”(RLHF)，这也是 ChatGPT 比其前身更有用的原因。

如何试用 ChatGPT？

你可以在 OpenAI 的网站或应用程序（iOS或 Android）上注册 ChatGPT，即使不创建账户也可以使用基本版本。免费版本足以满足偶尔的对话需求，但它限制了你每天可以与旗舰 GPT-4o 模型进行的交流次数以及你可以上传的照片数量。

对于严肃的、持续的使用，你可能需要尝试付费版本 ChatGPT Plus，它每月收费 20 美元。它具有更少的限制和额外的功能，如 Sora 视频创建模型和自定义 GPT。后者是你可以在特定任务（如语言翻译）中使用的微型模型，而主要的 ChatGPT 模型更像是一个全能型的运动员。

OpenAI 还提供其他订阅层级，如每月 200 美元的 Pro 模型，该模型没有限制，可以执行编译高级研究报告之类的操作。还有面向大型组织的团队和企业账户。最后，开发人员也可以通过 OpenAI 的 API 访问 ChatGPT，你根据使用的令牌数量付费。

我可以用 ChatGPT 做什么？

有了正确的说明和上下文，ChatGPT 会非常有用。以下是你用 ChatGPT 可以做的一些事情。

写作

ChatGPT 可以成为一个有用的写作助手。如果你提示它一次性写一篇完整的文章，它会给出好坏参半的结果。但如果你与它逐步合作，ChatGPT 可以做令人印象深刻的事情。例如，你可以从一个大纲开始，并在 OpenAI 的聊天机器人的帮助下充实每个部分.

编辑

ChatGPT 是一位出色的编辑助手；可以用它进行副本编辑、校对、改写、风格调整等。

翻译

ChatGPT 可以很好地翻译成几种语言。如果你正在从事一个专门的领域，你可以通过提供上下文来改进它的翻译，例如源语言和目标语言文档的示例。

总结

ChatGPT 可以总结文章、演讲和论文。当你提供指导方针时，例如要突出显示哪些主题，它会变得更准确。

集思广益

ChatGPT 可以在这里提供各种帮助，从为演示文稿建议讨论点到计划旅行。

编写代码

ChatGPT 是一个很好的编码助手，可以将功能描述转换为几种编程和脚本语言的工作代码。

创建和解释图像

你可以上传照片并询问有关它们的问题；例如，添加一张树的照片并询问“这是什么植物？” 如果你有问题，ChatGPT 还可以解释屏幕截图，你可以在手机上看到一些东西。它还可以用其新的内部生成器创建图像，该生成器受到了好评。

进行口头对话

使用语音模式，你无需精心制作完美的文本提示。只需对着麦克风说话并开始聊天。

创建电影片段

Sora 视频生成器会生成自定义片段，只有几秒钟长，没有声音，可以用作增强更大的视频项目或用作独立片段。它适用于 ChatGPT Plus 和 Pro 订阅者，并且可以通过 Microsoft Bing 应用程序免费提供有限的功能。

我们不建议将 ChatGPT 作为研究工具，因为它倾向于产生幻觉或编造信息。像 ChatGPT 这样的法学硕士可以将文本组合在一起，使其在词汇上是正确的，但在事实上是错误的。这也适用于使用 ChatGPT 进行编码：它可能会生成非功能性或不安全的代码。一个好的经验法则是将 ChatGPT 作为起点，然后通过点击 ChatGPT 提供的源链接或单独的 Google 搜索来检查其输出的真实性。（Perplexity 是另一个以引文为中心的聊天机器人。）

ChatGPT 有哪些替代方案？

其他几家公司和组织已经开发了与 ChatGPT 相比的指令跟踪 LLM。

**Google Gemini：**谷歌的人工智能模型几乎可以完成你用 ChatGPT 可以做的所有事情，而且可以连接到谷歌的生态系统，因此你可以将其输出导出到 Gmail、谷歌表格、文档等。
**Bing：**微软已向 OpenAI 投资了数十亿美元，它已将 ChatGPT 集成到其 Bing 搜索引擎中。它是一个对话式界面，用于搜索知识并执行你使用 ChatGPT 可以执行的其他任务。它会引用其生成的信息来源，这使你能够验证信息来源。
**Claude：**Anthropic 是一家总部位于旧金山的人工智能实验室，它推出了 Claude，这是一款 ChatGPT 竞争对手，在写作和编码方面享有很高的声誉。
**Perplexity：**作为谷歌的替代方案，许多人使用 Perplexity 来搜索网络。它正在迅速崛起，并将成为摩托罗拉新款 Razr 手机上的首选搜索平台。据报道，三星正在洽谈做同样的事情。
**开源模型：**开源社区发布了你可以在自己的服务器上运行的 LLM。这些 LLM 可以帮助你控制你的数据并避免供应商锁定。开源 LLM 比 ChatGPT 小得多，而且更难设置，但如果你有技术能力，它们可以产生令人印象深刻的结果。Meta 的 Llama 模型是一些最知名的模型。其他选项包括 Open Assistant、Alpaca、Vicuna 和 Dolly 2。

更新于 2025-06-09

# OpenAI # GPT # Chatbot