Descifrando ChatGPT: Lo que debes saber

ChatGPT está en todas partes, pero ¿qué puede hacer y cómo funciona? Desglosaremos los fundamentos y explicaremos cómo empezar a usar la inteligencia artificial.

Han pasado un par de años desde que ChatGPT debutó en 2022, y es muy probable que aún te encuentres en las primeras etapas de tu viaje hacia la inteligencia artificial. Cada día aprendemos más sobre la IA, y comprender cómo funciona esta tecnología puede ayudarte a sacarle el máximo provecho a tus conversaciones.

Aunque ChatGPT es fácil de usar en la superficie, tras bambalinas ocurren muchos cálculos complejos personalizados para cada usuario. Los modelos lingüísticos grandes (LLM) dependen de enormes redes neuronales de IA que pueden procesar y generar texto similar al humano, analizar imágenes e incluso hablar por sí mismas. Aquí te explicamos cómo funciona.

¿Cuál es la tecnología detrás de ChatGPT?

En su sentido más básico, ChatGPT es un sitio web o aplicación móvil conversacional que puede recibir solicitudes de humanos. La gente le ha encontrado muchos usos creativos, entre ellos escribir artículos y correos electrónicos, diseñar sitios web, escribir código de software y completar tareas a través de un agente de inteligencia artificial.

Si bien ChatGPT es el chatbot de IA más popular en la actualidad, otros de los que quizás hayas oído hablar incluyen Google Gemini, Perplexity y Claude de Anthropic. Todos ellos están entrenados con enormes cantidades de datos que les “enseñan” a interactuar con los humanos de manera convincente, como si fueran humanos. Pero se parecen más a extraterrestres (o niños pequeños) que constantemente intentan aprender a ser adultos. También quieren ser populares; OpenAI recientemente tuvo que revertir una actualización de ChatGPT porque se estaba volviendo demasiado adulador.

Este proceso de aprendizaje se lleva a cabo alimentando al chatbot con datos, principalmente de Internet (Wikipedia es una gran fuente), incluidos libros protegidos por derechos de autor, videos de YouTube y otro material original, lo que en algunos casos ha provocado demandas. Los chatbots alienígenas anhelan la mayor cantidad de información posible para poder desempeñarse cada vez mejor.

El modelo aprende tomando un fragmento de texto de los datos (por ejemplo, la oración inicial de un artículo de Wikipedia) e intentando predecir la siguiente ficha en la secuencia. Luego, compara su salida con el texto real que estaba en el corpus de entrenamiento y ajusta sus parámetros para corregir cualquier error. Al hacer esto repetidamente en un cuerpo muy grande de texto (o imagen o voz), puede desarrollar un modelo de lenguaje que, cuando se le da un mensaje, puede crear secuencias coherentes de texto.

Este proceso se basa en una arquitectura de software llamada red neuronal profunda (DNN), en particular una red Transformer. Las redes Transformer sobresalen en dividir el texto en “tokens”, que son esencialmente partes de palabras (“palabras” es un token, “esencialmente” son dos tokens). Luego, predice la secuencia que tiene más probabilidades de resonar con el usuario en función de su interacción. Cada cálculo es diferente para cada persona, lo que requiere mucha energía y potencia.

ChatGPT también “recuerda” tus conversaciones anteriores para generar respuestas personalizadas. Cuanto más hablas con él, más perfecciona su interacción contigo. Si dices algo como “eso no es correcto”, el modelo tomará nota e intentará un enfoque diferente la próxima vez. Esto se conoce como “aprendizaje por refuerzo a partir de la retroalimentación humana” (RLHF), que es una razón por la que ChatGPT es más útil que sus predecesores.

¿Cómo puedo probar ChatGPT?

Puedes registrarte en ChatGPT en el sitio web o la aplicación de OpenAI (iOS o Android), e incluso puedes usar la versión básica sin crear una cuenta. La versión gratuita es suficiente para conversaciones ocasionales, pero limita la cantidad de interacciones que puedes tener con el modelo insignia GPT-4o por día y la cantidad de fotos que puedes cargar.

Para un uso serio y continuo, es posible que desees probar la versión paga ChatGPT Plus, que cuesta $20 por mes. Tiene menos limitaciones y características adicionales, como el modelo de creación de video Sora y GPT personalizados. Este último es un micromodelo que puedes usar para tareas específicas (como la traducción de idiomas), mientras que el modelo ChatGPT principal es más como un atleta completo.

OpenAI también ofrece otros niveles de suscripción, como el modelo Pro de $200 por mes, que no tiene límites y puede realizar tareas como compilar informes de investigación avanzados. También hay cuentas de equipo y empresariales para organizaciones más grandes. Finalmente, los desarrolladores también pueden acceder a ChatGPT a través de la API de OpenAI, y se les cobra en función de la cantidad de tokens que usan.

¿Qué puedo hacer con ChatGPT?

Con las instrucciones y el contexto correctos, ChatGPT puede ser bastante útil. Aquí hay algunas cosas que puedes hacer con ChatGPT.

Escritura

ChatGPT puede ser un asistente de escritura útil. Si le indicas que escriba un artículo completo de una sola vez, obtendrás resultados mixtos. Pero si trabajas con él paso a paso, ChatGPT puede hacer cosas impresionantes. Por ejemplo, puedes comenzar con un esquema y luego completar cada sección con la ayuda del chatbot de OpenAI.

Edición

ChatGPT es un excelente asistente de edición; puedes usarlo para la edición de textos, la revisión, la reescritura, los ajustes de estilo, etc.

Traducción

ChatGPT puede traducir bastante bien a varios idiomas. Si estás trabajando en un campo especializado, puedes mejorar su traducción al proporcionar contexto, como muestras de documentos en los idiomas de origen y destino.

Resumen

ChatGPT puede resumir artículos, discursos y trabajos de investigación. Se vuelve más preciso cuando proporcionas pautas, como qué temas resaltar.

Lluvia de ideas

ChatGPT puede ayudar aquí con todo, desde sugerir puntos de discusión para una presentación hasta planificar un viaje.

Codificación

ChatGPT es un buen asistente de codificación que puede convertir descripciones funcionales en código de trabajo en varios lenguajes de programación y scripting.

Crear e interpretar imágenes

Puedes cargar fotos y hacer preguntas sobre ellas; por ejemplo, agrega una foto de un árbol y pregunta “¿Qué planta es esta?” ChatGPT también puede explicarCapturas de pantalla si tienes preguntas y puedes ver algo en tu teléfono. También puede crear imágenes con su nuevo generador interno, que ha recibido críticas favorables.

Mantener conversaciones verbales

Con el modo de voz, no necesitas elaborar el mensaje de texto perfecto. Simplemente habla por el micrófono y comienza a chatear.

Crear clips de películas

El generador de video Sora crea clips personalizados de solo unos segundos de duración y sin sonido que se pueden usar para mejorar proyectos de video más grandes o como piezas independientes. Está disponible para los suscriptores de ChatGPT Plus y Pro, y una funcionalidad limitada está disponible de forma gratuita a través de la aplicación Microsoft Bing.

No recomendamos usar ChatGPT como herramienta de investigación porque tiende a alucinar o inventar información. Un LLM como ChatGPT puede juntar textos de una manera que sea correcta en términos de vocabulario, pero incorrecta en términos de hechos. Esto también se aplica al uso de ChatGPT para la codificación: puede generar código no funcional o inseguro. Una buena regla general es usar ChatGPT como punto de partida y luego verificar la exactitud de su salida haciendo clic en los enlaces de origen proporcionados por ChatGPT o con una búsqueda separada en Google. (Perplexity es otro chatbot que se centra en las citas).

¿Qué alternativas hay a ChatGPT?

Varias otras empresas y organizaciones han desarrollado LLM de seguimiento de instrucciones que compiten con ChatGPT.

  • Google Gemini: El modelo de IA de Google puede hacer casi todo lo que puedes hacer con ChatGPT y se conecta al ecosistema de Google, por lo que puedes exportar su salida a Gmail, Hojas de cálculo de Google, Documentos, etc.
  • Bing: Microsoft ha invertido miles de millones de dólares en OpenAI y ha integrado ChatGPT en su motor de búsqueda Bing. Es una interfaz conversacional para buscar conocimiento y realizar otras tareas que puedes realizar con ChatGPT. Cita las fuentes de información que genera, lo que te permite verificar los orígenes.
  • Claude: Anthropic, un laboratorio de IA con sede en San Francisco, lanzó Claude, un competidor de ChatGPT que tiene una sólida reputación por escribir y codificar.
  • Perplexity: Como alternativa a Google, muchas personas usan Perplexity para buscar en la web. Está en rápido ascenso y será la plataforma de búsqueda predeterminada en los nuevos teléfonos Razr de Motorola. Se informa que Samsung está en conversaciones para hacer lo mismo.
  • Modelos de código abierto: La comunidad de código abierto ha lanzado LLM que puedes ejecutar en tus propios servidores. Estos LLM pueden ayudarte a controlar tus datos y evitar el bloqueo del proveedor. Los LLM de código abierto son mucho más pequeños que ChatGPT y más difíciles de configurar, pero pueden producir resultados impresionantes si tienes la habilidad técnica. Los modelos Llama de Meta son algunos de los más conocidos. Otras opciones incluyen Open Assistant, Alpaca, Vicuna y Dolly 2.