Разгадка ChatGPT: Все, что нужно знать

ChatGPT повсюду, но что он может делать и как работает? Мы разберем основы и объясним, как начать пользоваться искусственным интеллектом (artificial intelligence, AI).

Не прошло и пары лет с момента дебюта ChatGPT в 2022 году, и вполне вероятно, что вы все еще находитесь в начале своего пути знакомства с AI. Каждый день мы узнаем все больше об AI, и понимание того, как работает эта технология, может помочь вам максимально эффективно использовать ваши разговоры.

Хотя ChatGPT на первый взгляд прост в использовании, под капотом происходят сложные вычисления, настроенные для каждого пользователя. Большие языковые модели (Large Language Models, LLM) опираются на огромные нейронные сети AI, которые могут обрабатывать и генерировать текст, подобный человеческому, анализировать изображения и даже говорить самостоятельно. Вот как это работает.

Что лежит в основе ChatGPT?

В самом простом смысле, ChatGPT - это разговорный веб-сайт или мобильное приложение, которое принимает запросы от людей. Люди нашли ему множество творческих применений, включая написание статей и электронных писем, дизайн веб-сайтов, написание программного кода и выполнение задач через AI-агентов.

Хотя ChatGPT является самым популярным AI-чат-ботом на сегодняшний день, другие чат-боты, о которых вы, возможно, слышали, включают Google Gemini, Perplexity и Claude от Anthropic. Все они обучены на огромных объемах данных, что «учит» их взаимодействовать с людьми убедительным образом, как если бы они были людьми. Но они больше похожи на инопланетян (или маленьких детей), которые постоянно пытаются научиться быть взрослыми. Они также хотят быть популярными; OpenAI недавно пришлось отменить обновление ChatGPT, поскольку он стал слишком льстивым.

Этот процесс обучения достигается путем подачи чат-боту данных, которые поступают в основном из Интернета (Википедия является крупным источником), включая книги, защищенные авторским правом, видео на YouTube и другие оригинальные материалы, что в некоторых случаях приводит к судебным тяжбам. Чат-боты-инопланетяне жаждут как можно больше информации, чтобы они могли постоянно лучше себя проявлять.

Модель учится, беря фрагмент текста из данных (например, первое предложение статьи в Википедии) и пытаясь предсказать следующий токен в последовательности. Затем он сравнивает свой вывод с фактическим текстом в своем обучающем корпусе и настраивает свои параметры, чтобы исправить любые ошибки. Повторно выполняя это на очень большом массиве текста (или изображений, или речи), он может разработать языковую модель, которая может создавать связные последовательности текста при заданном запросе.

Этот процесс опирается на программную архитектуру, называемую глубокой нейронной сетью (Deep Neural Network, DNN), в частности, на сеть Transformer (Transformer network). Сети Transformer отлично разбивают текст на «токены», которые по сути являются частями слов («слово» - это один токен, а «по сути» - два токена). Затем он прогнозирует наиболее вероятную последовательность, которая будет резонировать с пользователем, основываясь на взаимодействии пользователя. Каждое вычисление уникально для этого человека, что требует огромных объемов электроэнергии и энергии.

ChatGPT также «помнит» ваши предыдущие разговоры, чтобы генерировать индивидуальные ответы. Чем больше вы с ним разговариваете, тем лучше он совершенствует свое взаимодействие с вами. Если вы говорите что-то вроде «Это неправильно», модель примет это к сведению и в следующий раз попробует другой подход. Это называется «обучением с подкреплением на основе обратной связи от человека» (Reinforcement Learning from Human Feedback, RLHF), и именно это делает ChatGPT более полезным, чем его предшественники.

Как попробовать ChatGPT?

Вы можете зарегистрироваться в ChatGPT на веб-сайте OpenAI или в приложении (iOS или Android), и даже базовую версию можно использовать без создания учетной записи. Бесплатная версия достаточна для случайных разговоров, но она ограничивает количество взаимодействий, которые вы можете проводить с флагманской моделью GPT-4o в день, а также количество фотографий, которые вы можете загружать.

Для серьезного, постоянного использования, возможно, стоит попробовать платную версию ChatGPT Plus, которая стоит 20 долларов в месяц. Она имеет меньше ограничений и дополнительные функции, такие как модель создания видео Sora и пользовательские GPT (custom GPT). Последние представляют собой микромодели, которые вы можете использовать для конкретных задач, таких как языковой перевод, в то время как основная модель ChatGPT больше похожа на спортсмена-универсала.

OpenAI также предлагает другие уровни подписки, такие как модель Pro за 200 долларов в месяц, которая не имеет ограничений и может выполнять такие операции, как составление расширенных исследовательских отчетов. Существуют также командные и корпоративные учетные записи для крупных организаций. Наконец, разработчики также могут получить доступ к ChatGPT через API OpenAI, где вы платите на основе количества используемых токенов.

Что я могу делать с ChatGPT?

При наличии правильных инструкций и контекста ChatGPT может быть очень полезным. Вот некоторые вещи, которые вы можете делать с ChatGPT.

Письменная работа

ChatGPT может быть полезным помощником в написании текстов. Если вы предложите ему написать целую статью за один раз, он выдаст смешанные результаты. Но если вы будете работать с ним шаг за шагом, ChatGPT сможет делать впечатляющие вещи. Например, вы можете начать с плана и развить каждую часть с помощью чат-бота OpenAI.

Редактирование

ChatGPT - отличный помощник в редактировании; используйте его для копирайтинга, корректуры, перефразирования, корректировки стиля и т. д.

Перевод

ChatGPT хорошо переводит на несколько языков. Если вы работаете в специализированной области, вы можете улучшить его переводы, предоставляя контекст, такой как примеры документов на исходном и целевом языках.

Составление резюме

ChatGPT может составлять резюме статей, речей и эссе. Он становится более точным, когда вы предоставляете рекомендации, например, какие темы следует выделить.

Мозговой штурм

ChatGPT может оказать различную помощь, от предложения пунктов для обсуждения в презентации до планирования поездок.

Написание кода

ChatGPT - хороший помощник в кодировании, который может преобразовывать описания функций в рабочий код на нескольких языках программирования и сценариев.

Создание и интерпретация изображений

Вы можете загружать фотографии и задавать вопросы о них; например, добавьте фотографию дерева и спросите: «Что это за растение?» ChatGPT также может объяснить скриншоты, если у вас есть вопрос о том, что вы видите на своем телефоне. Он также может создавать изображения с помощью своего нового внутреннего генератора, который получил положительные отзывы.

Ведение устных разговоров

Используя голосовой режим, вам не нужно придумывать идеальные текстовые подсказки. Просто говорите в микрофон и начинайте разговор.

Создание видеоклипов

Генератор видео Sora создает пользовательские клипы продолжительностью всего несколько секунд, без звука, которые можно использовать для улучшения более крупных видеопроектов или в качестве отдельных фрагментов. Он доступен для подписчиков ChatGPT Plus и Pro, а также бесплатно с ограниченной функциональностью через приложение Microsoft Bing.

Мы не рекомендуем использовать ChatGPT в качестве инструмента для исследования, поскольку он склонен к галлюцинациям или фабрикованию информации. LLM, такие как ChatGPT, могут составлять текст таким образом, что он грамматически правильный, но фактический неверный. Это также применимо к кодированию с помощью ChatGPT: он может генерировать нерабочий или небезопасный код. Хорошее эмпирическое правило - использовать ChatGPT в качестве отправной точки, а затем проверять достоверность его выходных данных, переходя по ссылкам на источники, предоставленные ChatGPT, или с помощью отдельного поиска в Google. (Perplexity - еще один чат-бот, ориентированный на цитаты.)

Какие есть альтернативы ChatGPT?

Несколько других компаний и организаций разработали LLM для отслеживания инструкций, сопоставимые с ChatGPT.

  • Google Gemini: AI-модель Google может делать почти все, что вы можете делать с ChatGPT, и может подключаться к экосистеме Google, поэтому вы можете экспортировать свой вывод в Gmail, Google Sheets, Docs и т. д.
  • Bing: Microsoft инвестировала миллиарды долларов в OpenAI, и она интегрировала ChatGPT в свою поисковую систему Bing. Это диалоговый интерфейс для поиска знаний и выполнения других задач, которые вы можете выполнять с помощью ChatGPT. Он цитирует источники информации, которую он генерирует, что позволяет вам проверять источник информации.
  • Claude: Anthropic, AI-лаборатория, базирующаяся в Сан-Франциско, представила Claude, конкурента ChatGPT, пользующегося высокой репутацией в области письма и кодирования.
  • Perplexity: В качестве альтернативы Google многие люди используют Perplexity для поиска в Интернете. Он быстро набирает обороты и станет предпочтительной поисковой платформой для новых телефонов Razr от Motorola. Сообщается, что Samsung ведет переговоры о том же.
  • Модели с открытым исходным кодом: Сообщество открытого исходного кода выпустило LLM, которые вы можете запускать на своих собственных серверах. Эти LLM могут помочь вам контролировать ваши данные и избегать привязки к поставщику. LLM с открытым исходным кодом намного меньше, чем ChatGPT, и их сложнее настроить, но они могут давать впечатляющие результаты, если у вас есть технические навыки. Модели Llama от Meta являются одними из самых известных. Другие варианты включают Open Assistant, Alpaca, Vicuna и Dolly 2.