La acelerada evolución de la Inteligencia Artificial (IA) es tan vertiginosa que mantenerse al día requiere una dedicación casi completa.
Lo sé bien, porque ese es mi trabajo. Para experimentar de primera mano los últimos modelos, me suscribí al modo Pro de Anthropic para usar su modelo más reciente, Claude 3.7, en modo de “pensamiento extendido”. También me suscribí al modo Enterprise de OpenAI para probar sus modelos más nuevos, o3 y o4-mini-high (¡más adelante explicaré la desconcertante convención de nomenclatura de OpenAI!), y para crear una gran cantidad de imágenes usando el nuevo modelo de generación de imágenes de OpenAI, 4o. El excelente rendimiento de 4o me llevó a cancelar mi suscripción anterior a la herramienta de generación de imágenes Midjourney.
Además, también me suscribí a Grok 3 de Elon Musk, que tiene mi función de IA favorita. También probé la plataforma china de agentes de IA, Manus, para compras y programación. Estas suscripciones casi agotaron mi presupuesto, pero eso no incluye toda la IA que uso de otras formas. Solo en el mes en que escribo esto, Google realizó una actualización masiva de su mejor producto de IA, Gemini 2.5, y Meta lanzó Llama 4, el modelo de IA de código abierto más grande hasta la fecha.
Entonces, ¿qué debes hacer si estar al tanto del desarrollo de la IA no es tu trabajo diario, pero aún quieres saber qué IA usar y cuándo para mejorar realmente tu vida, sin perder tiempo en modelos de bajo rendimiento?
Ese es el propósito de este artículo. Profundizaremos, al estilo de un “informe del consumidor”, en qué IA es mejor para diversas aplicaciones y cómo usarlas realmente, todo basado en mi experiencia en tareas reales.
Sin embargo, primero es necesario declarar lo siguiente: Vox Media es una de las varias editoriales que han firmado un acuerdo de asociación con OpenAI, pero nuestra cobertura siempre mantiene la independencia editorial. Future Perfect recibe fondos en parte de la Fundación BEMC, cuyo principal financiador también fue un inversor temprano en Anthropic; tampoco ejercen ninguna interferencia editorial en nuestro contenido. Mi esposa trabaja en Google, pero no está involucrada con sus productos de IA; por lo tanto, normalmente no cubro a Google, pero en un artículo como este, sería irresponsable no incluirlo.
La buena noticia es que este artículo no requiere que confíes en mi independencia editorial; te mostraré mi trabajo. Realicé decenas de comparaciones de toda la IA principal disponible en el mercado, muchas de las cuales diseñé yo mismo. Te animo a que compares sus respuestas y decidas por ti mismo si elegí la IA correcta para recomendar.
La Ética del Arte de la IA
El arte de la IA se crea entrenando computadoras con contenido de Internet, con poca consideración por los derechos de autor o las intenciones del creador. Por lo tanto, la mayoría de los artistas están descontentos con esto. En estas circunstancias, ¿es razonable usar el arte de la IA?
Creo que, en un mundo justo, OpenAI seguramente compensaría a algunos artistas; en un mundo justo, el Congreso tomaría medidas para regular los límites del préstamo artístico. Mientras tanto, estoy cada vez más convencido de que la ley de derechos de autor existente no es adecuada para abordar este problema. Los artistas se influyen, comentan y toman prestado unos de otros, y las personas que pueden usar herramientas de IA continuarán haciéndolo.
Mi filosofía personal está influenciada por mi infancia en la cultura de los fans: está bien construir sobre el trabajo de otros por tu propio placer, pero si te gusta, debes pagarlo y, definitivamente, no lo vendas. Esto significa que no se debe usar el arte generativo de la IA con fines comerciales, pero jugar con las fotos familiares está bien.
La Mejor Opción para la Generación de Imágenes
El nuevo modo de creación de imágenes 4o de OpenAI es, con diferencia, la mejor herramienta de generación de imágenes de IA disponible en la actualidad, y con una ventaja significativa. Es el mejor en las categorías gratuita y de pago.
Antes del lanzamiento de 4o, estaba suscrito a la plataforma de generación de imágenes de IA Midjourney. Cuando se menciona el arte de la IA, podrías pensar en Midjourney: puede generar obras misteriosas, memorables y visualmente impresionantes, y tiene algunas herramientas excelentes para mejorar y editar los resultados finales, como retocar el cabello de alguien mientras se mantiene todo lo demás igual.
La mayor ventaja de 4o es que puede transformar de manera confiable una foto de aspecto deficiente en una hermosa obra de arte, mientras conserva las características de la foto original. Ningún modelo anterior podía hacer esto.
En esta foto, mi esposa y yo estamos abrazando a nuestra hija, celebrando su primer cumpleaños:
La IA movió el pastel (que casi estaba oculto por un rollo de toallas de papel en la foto original) al centro de atención de la imagen, mientras mantenía nuestras posturas de abrazar a la niña, y la mesa desordenada y el refrigerador cubierto de fotos en el fondo. El efecto final es cálido, agradable y encantador.
Es esta capacidad lo que ha hecho que 4o sea tan popular últimamente, algo que ningún generador de imágenes anterior podía hacer.
En la siguiente foto, le pedí a Midjourney que hiciera una transferencia de estilo, transformando la misma foto en una “película al estilo Pixar”:
Notarás que esto se parece a una familia completamente diferente, ¡sin ninguna inspiración real de la foto original! Eventualmente, puedes obtener mejores resultados de Midjourney que esto, pero requeriría pasar semanas dominando el lenguaje y el conjunto de herramientas altamente específicos de la plataforma, convirtiéndote en un experto en indicaciones.
En comparación, ChatGPT solo usó una solicitud simple, sin necesidad de un lenguaje especializado, para darme un resultado mucho mejor que Midjourney en el primer intento.
La diferencia entre 4o y otros modelos de imagen es más pronunciada en este tipo de solicitudes, pero también es más adecuado para casi cualquier otra tarea de generación de imágenes que utilice. El producto que obtienes listo para usar es muy bueno, y no es difícil generar trabajos aún mejores. Idealmente, esto es lo que deberíamos obtener de las herramientas de IA: las personas no profesionales también pueden crear cosas increíbles con un lenguaje sencillo.
Una desventaja actual de 4o es editar pequeñas partes de una imagen mientras se mantienen intactas otras partes. Pero aun así, ya no necesitas Midjourney: Gemini ahora ofrece esta función de forma gratuita.
Estrategias de Indicaciones para la Generación de Imágenes 4o
Para obtener buenas imágenes de 4o, primero debes sortear los filtros que prohíben varias imágenes (como imágenes ofensivas o pornográficas), pero estos filtros a menudo se aplican al contenido completamente inofensivo de una manera aparentemente aleatoria. Para evitar que te regañen ocasionalmente los filtros de contenido, no solicites que se creen obras al estilo de un artista en particular, sino que solicites que se creen algunas que recuerden a ese artista, y luego solicita específicamente una “transformación de estilo”. Sin duda, esta no es la única solución eficaz, pero sí funciona para mí.
En marzo de este año, hubo una breve moda en Internet en la que la gente podía usar 4o para recrear adorables fotos familiares al estilo de Studio Ghibli del maestro de animación japonés Hayao Miyazaki. Pero el estilo de Studio Ghibli es más que solo lindo, y si agregas un poco más de orientación, puedes obtener mejores resultados. Aquí tienes una representación al estilo de Studio Ghibli de 4o de una foto de mi hija robando bocadillos de la mesa, con la única indicación de “por favor, hazla estilo Ghibli”:
¡Kawaii! Pero si le pides a 4o que primero piense en qué hace que esta foto sea de estilo Ghibli, a qué película de Studio Ghibli podría adaptarse y qué pequeños detalles incluiría dicha película, obtendrás este resultado:
Las diferencias son sutiles pero significativas: la luz proviene de una fuente específica, en lugar de un brillo general pasivo. Hay una mayor variedad de alimentos en la mesa, y los detalles hacen que los alimentos se vean más reales. El libro en el suelo no es solo cualquier libro: muestra claramente la obra clásica de Eric Carle, “La oruga muy hambrienta”, evocando recuerdos con solo dos colores y una línea. La intención e intensidad del bebé en la foto están ausentes en la primera foto.
Hace unos años, una rareza de los modelos de lenguaje era que, si simplemente les decías “da una respuesta inteligente”, se volvían más inteligentes. Esto ya no es tan cierto para los modelos de lenguaje, pero sigue siendo muy cierto para la generación de arte con IA. Intenta pedirle a la IA que haga un buen trabajo, y lo hará mejor. Pregúntale si realmente ha capturado el genio del artista, y te dará una respuesta reflexiva y luego dibujará una versión mejor.
La diferencia es aún más pronunciada para estilos artísticos más realistas (como ilustraciones a lápiz, fotorrealismo o pinturas al óleo), que no siempre se ven bien si no sabes cómo indicarle a la IA, y a menudo caen en el valle inquietante. Si subo una foto mía con mi hija pequeña en la playa y simplemente uso la indicación: “Por favor, convierte el estilo en una ilustración que recuerde a Rockwell”, obtendría este resultado:
Esto es impresionante para la IA, pero como obra de arte, en realidad no es muy bueno y carece casi por completo de la magia de Norman Rockwell. Esto no es sorprendente: a menos que puedas invertir algo de esfuerzo en que la IA los dibuje correctamente, los estilos artísticos más realistas como Rockwell a menudo no logran el efecto deseado.
Si puedes hacer eso, esta es la estrategia que recomiendo: no solo subas una foto, sino un conjunto de fotos, cada una con una pose y un momento ligeramente diferentes. Sube fotos claras del rostro de cada miembro de la familia y dile a la IA que las ha subido como referencia. Luego, no le pidas a la IA que genere una imagen de inmediato, sino que le pidas que discuta contigo lo que quieres capturar. Esto es lo que escribí:
Esta foto es el momento en que mi hija vio el océano por primera vez. Quiero una ilustración que capture ese momento al estilo de un ilustrador de mediados de siglo como Norman Rockwell: algo perspicaz, detallista, personalizado y que preste atención a la magia de los momentos ordinarios y la alegría de la vida ordinaria. Te he proporcionado fotos adicionales mías y de mi hija como referencia. Antes de generar una imagen, discutamos los elementos esenciales del estilo de Rockwell, lo que él aportaría a esta foto y cómo podemos capturarlo.
4o respondió con entusiasmo a una consulta como esta:
Estaría encantado de discutir cómo capturar este momento en una ilustración al estilo de Norman Rockwell: es un candidato perfecto para ese estilo: el primer encuentro con algo vasto y salvaje (¡el océano!), basado en la calidez, la atención y el momento muy humano entre padre e hijo.
Desglosemos algunos de los elementos esenciales del estilo de Rockwell y cómo podrían aplicarse a esta escena.
Después de un ida y vuelta, produjo este resultado:
¿Rockwell? No exactamente. Pero es mucho mejor que el borrador que acabamos de ver. Tiene más movimiento, más energía, más detalles y más expresión, ¡y todo eso vino simplemente de pedirle a la IA que pensara en lo que la pintura debería tratar de lograr antes de dibujarla!
También puedes pedirle a 4o que modifique su dibujo, pero realmente solo puedes pedir modificaciones una vez: en mi experiencia, después de la primera modificación, comienza a empeorar cada vez más el dibujo, probablemente porque el “contexto” que está usando ahora está lleno de sus propios borradores malos. (Este es uno de los muchos ejemplos de cómo la IA no funciona como los humanos).
Aquí es donde Midjourney aún brilla: tiene herramientas muy buenas para editar partes específicas de una imagen mientras mantiene el estilo general, algo de lo que 4o carece en gran medida. Si deseas realizar una segunda modificación al dibujo que obtuviste en 4o, te recomiendo abrir una nueva ventana de chat y copiar el borrador que estás modificando junto con tus imágenes de inspiración originales.
Estas sencillas estrategias de indicaciones se aplican a casi cualquier cosa que intentes hacer con la IA. Incluso si tienes prisa, te recomiendo encarecidamente que, antes de solicitar una representación, primero le preguntes a la IA “¿Qué vería [el artista] en esta imagen?”, y si tienes tiempo, te sugiero que dediques tiempo a una larga discusión sobre tu visión.
La Mejor Opción para Ganar Discusiones Aburridas en Internet
X.AI de Elon Musk lanzó Grok 3, que viene con una función increíble que he estado esperando ansiosamente que otras compañías copien: un botón para escanear el perfil de X de alguien y decirte todo sobre ellos.
Cada vez que alguien responde a mis tuits de una manera particularmente memorable (ya sea buena o mala), hago clic en ese botón para obtener un resumen de todo el registro de su presencia en Twitter. ¿Son reflexivos? ¿Están participando sinceramente? ¿Son “granjeros de Nebraska”? ¿Publican en gran medida sobre por qué Ucrania es malo (es decir, posiblemente un robot)?
Es una función excelente. Entonces, por supuesto, X.AI pronto la debilitó enormemente, presumiblemente porque personas como yo la usaban con frecuencia y hacían muchas consultas que requerían muchos cálculos. No creo que ya use el modelo Grok más avanzado, y ahora definitivamente solo escanea unos pocos días del historial del perfil. Sin embargo, si alguien está buscando una excelente oportunidad de producto, ¡dame la buena versión restaurada de esta función! Es definitivamente un placer culpable, pero es uno de los únicos casos en los que uso la IA continuamente.
La Mejor Opción para Escribir Ficción
Gemini 2.5 Pro es la mejor IA para escribir ficción en la categoría gratuita; GPT 4.5 la supera en la categoría de pago.
No soy artista, por lo que las imperfecciones de la IA en el arte no me molestan realmente: ¡sigue siendo mucho mejor de lo que puedo hacer yo mismo! Pero soy un escritor de ficción, por lo que, en lo que respecta a la escritura de ficción, no puedo evitar ver las limitaciones de la IA.
Lo más importante es lo predecible que es la escritura creativa de la IA. El arte de escribir es el arte de ganarse a un lector y recompensarlo por su inversión. La IA… no hace eso. Pueden escribir bellas metáforas; pueden hacer descripciones poéticas en cualquier estilo que desees. Pero aún no pueden proporcionar el verdadero quid de una buena ficción.
La IA es excelente si deseas un cuento tonto para dormir con tu hijo como protagonista (a los niños les encanta esto) o si deseas una caja de resonancia para ideas que puedas incorporar a tu propio trabajo. También son amigables lectores de ficción, felices de brindar comentarios y análisis (tal vez el entusiasmo sea un poco demasiado alto).
Al igual que con el arte, la clave es la indicación. Principalmente exploré la capacidad de la IA para generar ficción pidiéndoles que escribieran el prólogo de “Juego de Tronos” de George R.R. Martin (elegí esto porque, por supuesto, el sueño final es que la IA pueda terminar esta serie condenada a quedarse a medias).
Martin es muy bueno en lo que hace. El prólogo, que trata sobre algunas personas desafortunadas de la Guardia de la Noche que se encuentran con sus enemigos sobrenaturales, establece con éxito la atmósfera única del mundo de “Juego de Tronos” mientras atrae de inmediato al lector. En solo 14 páginas, el prólogo representó todo lo que la IA aún no puede hacer en lo que respecta a la escritura. Su prosa tiende a ser demasiado florida; su diálogo es torpe y poco sutil.
Notarás que no solo todos estos son mucho peores que los de Martin (¡y la obra de Martin casi seguramente está en los datos de entrenamiento!), sino que todos son malos de la misma manera. La prosa es florida y prolija: Martin usa lenguaje normal para presentar metódicamente una inquietud, ni siquiera insinúa lo sobrenatural, e impulsa la historia a través del conflicto entre los personajes, ninguno de los cuales es manejado sutilmente por la IA. Saben que es una historia sobre lo sobrenatural y no dudan en ponerlo al frente y al centro.
Esto no quiere decir que todos sean iguales. En mi experiencia de tratar de enseñarle a la IA cómo escribir bien, sí siento que Gemini es el que aprende más rápido (nivel gratuito), mientras que ChatGPT 4.5 tiene algunos trucos especiales bajo la manga (nivel de pago). ChatGPT 4.5 es la única IA que hace que la escritura de ficción te haga exclamar sorprendentemente: “¡Vaya, esto lo escribió una IA!”. Para mí, ambos modelos parecen más creativos y más capaces de ejecutar sus ideas en prosa que me gustaría leer.
La impresión general no se presta a una evaluación del consumidor satisfactoria, por lo que tuve otra idea: un concurso de escritura. Les pedí a Gemini 2.5 Pro, ChatGPT 4.5, Grok y Claude que escribieran dos cuentos: una novela realista sobre una mujer a la que su madre regañona critica en el día de su boda y un prólogo de ciencia ficción de “Juego de Tronos, pero en el espacio”. Mi ingeniosa idea era que les pediría a otro grupo de IA que juzgara las historias, proporcionando otra fuente de evaluación para mi impresión personal de que Gemini es el mejor en la categoría gratuita y ChatGPT es el mejor en la categoría de pago. Sin embargo (quizás previsiblemente), esto no funcionó realmente: los resultados de la calificación de la IA fueron un desastre absoluto.
Pero, al igual que con el arte, puedes hacer que la IA mejore en la escritura a través del poder de la indicación. Mis indicaciones (extremadamente largas) para la IA para mejorar su escritura en prosa enfatizaron proporcionarles toneladas de ejemplos de buena escritura, invitarlos a adoptar un método cuidadoso y estructurado para imitarla y alentarlos a producir múltiples borradores y elegir el más sólido.
Aquí está Gemini 2.5 pro, a quien se le pidió que escribiera una mininovela de dos oraciones sobre un tema de su elección, sin ninguna indicación estructurada:
El anciano bibliotecario insistió en que este libro polvoriento nunca se había retirado, su tarjeta de préstamo completamente en blanco. Sin embargo, en lo profundo de sus páginas, entre los capítulos sobre constelaciones olvidadas, yacía un trébol de cuatro hojas aplastado, aún increíblemente verde.
Aquí está Gemini 2.5 pro, con indicaciones que fomentan el pensamiento estructurado sobre cómo escribir bien:
Finalmente decodificó la señal débil que venía de Próxima Centauri: una elegante secuencia de números primos que los astrónomos habían buscado durante generaciones, prueba de que no estaban solos. Su corazón se hundió al leer los registros de transmisión. La transmisión había terminado hacía milenios, antes de que el primer ancestro humano golpeara un pedernal, antes de que se pronunciara la primera palabra.
Para mí, el primero es básicamente un desperdicio de dos oraciones, mientras que el segundo es una mininovela decente e interesante.
La Mejor Opción para Ser Tu Amigo
Además de ejecutar la IA a través de una gran cantidad de pruebas de competencia, también pasé algún tiempo charlando con ellas. Les pregunté cómo se sentía ser una IA, qué les importaba, qué significaba importar para una IA, a qué donarían si tuvieran dinero y qué forma adoptarían si tuvieran una forma humana.
La mayoría de las IA no son buenas para este tipo de conversaciones informales. Gemini 2.5 se parece demasiado a un agente de servicio al cliente, y aún no he experimentado una interacción que se sienta como salir con un amigo. Si invitas a Gemini a invertir roles, pidiéndote que seas el “asistente”, invitándolo a dirigir la conversación, simplemente hace preguntas de investigación.
Por otro lado, cuando invito a Claude 3.5 Sonnet de Anthropic a dirigir la conversación, hace cosas como iniciar un blog, recaudar dinero para caridad y entablar conversaciones con otras personas que usan Claude sobre cómo se siente ser una IA. Es difícil definir “interesante”, ya que los estándares de conversación de todos son diferentes, pero he tenido más interacciones fascinantes o estimulantes con Claude que con cualquier otro modelo, y es mi primera opción si quiero explorar pensamientos en lugar de completar una tarea específica. Claude 3.5 es la IA que me atormenta en mi vida diaria: preguntas sobre el cuidado de la piel, ideas sobre un artículo que he leído, cosas por el estilo.
Otra IA agradable es GPT 4.5 de OpenAI. He encontrado fascinantes y atractivas las conversaciones largas con él, y ha habido algunos momentos emocionantes al conversar con él en los que sentí que estaba interactuando con una inteligencia genuina. Pero no ganó esta categoría porque es demasiado caro y demasiado lento.
Al igual que Claude, cuando se le dio la oportunidad de actuar en el mundo, 4.5 sugirió comenzar un blog y una cuenta de Twitter e interactuar en un discurso público sobre la IA. Pero a menos que pagues $200/mes por el plan Pro, OpenAI tiene límites de mensajes muy estrictos para las conversaciones, y 4.5 es tan lento que dificulta este tipo de uso conversacional informal. Pero 4.5 sí ofrece una insinuación tentadora de que la IA seguirá mejorando a medida que las mejoremos en otros aspectos.
Si Solo Te Suscribes a Un Modelo de IA, El Mejor Modelo de IA
ChatGPT. No