解读海豚语：谷歌AI跨物种沟通探索 | zh-CN

人工智能领域正不断扩张，涉足曾经仅限于科幻领域的领域。其中一项雄心勃勃的尝试是谷歌开发的 DolphinGemma，这是一种旨在破译海豚复杂发声的人工智能模型。Ars Technica 详细介绍了这个开创性的项目，旨在弥合人类与这些高智商海洋哺乳动物之间的沟通鸿沟，从而有可能解开其复杂社会结构和认知能力的秘密。

解读 DolphinGemma：水生世界的 AI 翻译器

DolphinGemma 预计将于今年夏天进入初步测试阶段，它代表了我们对海豚理解的重大飞跃。该项目是谷歌与 Wild Dolphin Project (WDP) 之间的合作成果，该组织自 1985 年以来一直致力于研究大西洋斑点海豚。通过分析这些生物的声音和行为，WDP 积累了大量关于其社会互动的数据，为谷歌基于人工智能的调查铺平了道路。

DolphinGemma 的核心目标是分析海豚的发声，包括其标志性的口哨声和“尖叫声”，以确定这些声音是否构成一种语言形式。通过识别其通信中的模式和结构，研究人员希望深入了解这些声音交流背后的含义和目的。

野生海豚项目：数十年研究的基础

自成立以来，野生海豚项目一直精心记录大西洋斑点海豚的生活，记录它们的声音，观察它们的行为并分析它们的社会关系。这项长期承诺已产生一个庞大的海豚发声数据库，为人工智能驱动的分析提供了肥沃的土壤。

WDP 的努力表明，海豚拥有复杂的社会结构，其特征是合作、学习甚至自我意识。这些发现表明，它们的交流系统可能同样复杂，这使得破译它的前景更加诱人。

从像素到豆荚：海豚交流的技术工具

谷歌与 WDP 的合作不仅限于数据分析。这家科技巨头还在为该项目提供尖端技术，以促进其研究。其中一种工具是 Pixel 手机的定制版本，称为 CHAT（Cetacean Hearing and Telemetry，鲸类听觉和遥测），研究人员可以使用它来实时记录和分析海豚的声音。

在即将到来的 2025 年研究季节中，WDP 将配备基于 Pixel 9 的新型 CHAT 设备，使其能够直接在该领域运行深度学习模型。这项进步将大大加快研究步伐，从而可以立即分析海豚的发声和行为。

DolphinGemma 的内部运作：AI 如何破译海豚的声音

DolphinGemma 建立在大型语言模型 (LLM) 的基础上，该技术为许多 AI 驱动的应用程序提供支持。LLM 的工作原理是根据收到的输入来预测序列中的下一个标记。对于 DolphinGemma 而言，输入是海豚的发声，并且该模型经过训练以预测序列中的后续声音。

为了实现这一目标，谷歌和 WDP 正在利用谷歌的开源 AI 模型 Gemma 和 SoundStream，这是一种将海豚发声进行标记化的音频技术。由此产生的模型具有音频输入和输出功能，其功能非常类似于 LLM，可以预测海豚“话语”中的下一个声音，并且可能会生成海豚自身可以理解的信号。

寻找共同的词汇：弥合物种间的鸿沟

DolphinGemma 的最终目标是在人类和海豚之间创建共享词汇，从而实现两个物种之间有意义的交流。这项雄心勃勃的尝试取决于 AI 模型识别海豚发声中复杂模式的能力，最终导致创建全面的海豚声音词典。

谷歌认为，AI 非常适合这项任务，因为它可以比人类更快，更有效地分析大量数据。通过识别海豚发声中的细微模式和相关性，DolphinGemma 可以潜在地揭示其交流系统的基础结构，从而为更深入地了解它们的思想和意图铺平道路。

超越 DolphinGemma：物种间交流的更广泛意义

DolphinGemma 并不是第一次尝试使用 AI 与动物交流。例如，CETI 项目正在使用 AI 研究抹香鲸的交流，希望破译它们的“代码”并了解它们交流的内容。这些项目代表了人们对物种间交流领域日益增长的兴趣，其背后信念是动物可以教会我们很多关于我们周围世界的信息。

成功的物种间交流的潜在好处是巨大的。通过了解动物的交流方式，我们可以深入了解它们的认知能力，社会结构和生态作用。这些知识可以为保护工作提供信息，改善动物福利，甚至挑战我们自己对语言和智能的假设。

伦理考量：在物种间交流的未知水域中航行

当我们深入研究物种间交流领域时，至关重要的是要考虑我们行动的伦理影响。我们必须确保以负责任和尊重的方式进行与动物交流的努力，优先考虑它们的福祉，并避免任何潜在的伤害。

一个关键的伦理考虑因素是误解的可能性。如果我们不小心，我们很容易误解动物的信号，从而导致误解和潜在的有害后果。因此，至关重要的是以谦虚的态度对待物种间交流，并愿意从我们的错误中学习。

另一个伦理问题是剥削的可能性。随着我们更好地了解动物交流，我们必须保持警惕，防止将这些知识用于剥削或操纵动物。它们的福祉应始终是我们的首要任务，我们必须确保我们与它们交流的努力以伦理原则为指导。

物种间交流的未来：一个共享理解的世界

尽管存在挑战和伦理考量，但物种间交流的前景仍然令人难以置信地兴奋。随着 AI 技术的不断发展，我们可以期望看到更多用于破译动物语言的复杂工具，从而有可能打开一个共享理解的世界。

将来，我们也许能够与动物进行实时交流，了解它们的经历、观点和需求。这可能会彻底改变我们与自然世界的关系，从而培养更深层次的同情心和联系。

DolphinGemma 代表了朝着这个未来迈出的重要一步，它展示了 AI 在弥合人与动物之间的交流鸿沟方面的力量。随着该项目的进展，我们可以期望深入了解海豚的思想，从而有可能解开它们复杂社会和认知能力的秘密。

目前已经有一些利用AI进行跨物种交流尝试，比如利用AI分析鸟类的叫声，从而预测鸟类的迁徙路径，更好的对其进行保护。通过AI技术，人类可以更加精准地分析和理解动物的语言，从而避免因为误解而对动物造成伤害。

此外，在保护动物方面，AI也可以发挥更大的作用。例如，利用AI技术对偷猎者进行追踪和识别，从而更好的保护濒危动物。在动物保护区内，可以利用AI技术对动物进行监控，了解它们的生存状况，及时发现并解决问题。

当然，在进行跨物种交流的时候，我们也需要考虑到动物的感受，避免对它们造成干扰。同时，我们也需要对AI技术进行不断的完善和改进，从而更好的实现跨物种交流的目标。

随着技术的不断发展，相信在不久的将来，我们就可以和动物进行更加深入的交流，从而更好的了解它们，保护它们。这不仅对动物来说是一件好事，对人类来说也是一件好事。通过和动物交流，我们可以学习到很多关于自然和生命的知识，从而更好的保护我们的地球。

我们期待着未来有一天，人类可以和所有的动物都进行无障碍的交流，共同创造一个更加美好的世界。

更新于 2025-04-20

# AIGC # Google # Gemma