GPT-4.5: Un Refinamiento, No una Revolución
OpenAI recientemente puso GPT-4.5 a disposición de los usuarios de ChatGPT Pro, y pronto lo estará para las cuentas Plus, Team, Enterprise y Education. Conocido internamente como ‘Orion’, este modelo presume de una “mejor comprensión de la intención humana, interpretando señales sutiles y expectativas implícitas con mayor matiz e inteligencia emocional”, según OpenAI. Aprovecha nuevas técnicas de supervisión junto con el ajuste fino tradicional y el aprendizaje por refuerzo a partir de la retroalimentación humana, reflejando el proceso de desarrollo de GPT-4o. GPT-4.5 ofrece capacidades de búsqueda en tiempo real, admite la carga de archivos e imágenes, y se integra con un lienzo para escribir y codificar. Sin embargo, actualmente carece de las características multimodales como el modo de voz, video o la pantalla compartida que se encuentran en ChatGPT.
OpenAI enfatiza que el aprendizaje no supervisado mejora la precisión y la intuición de un modelo. Este enfoque ha sido una fuerza impulsora detrás de los avances en modelos como GPT-3.5, GPT-4 y, ahora, GPT-4.5. Por separado, el razonamiento a escala entrena a los modelos para procesar información sistemáticamente, generando una cadena de pensamiento antes de responder. Este enfoque metódico mejora su capacidad para abordar desafíos intrincados de STEM y lógica, como lo demuestran modelos como OpenAI o1 y OpenAI o3-mini. GPT-4.5 se presenta como un ejemplo principal de escalamiento del aprendizaje no supervisado, aprovechando una mayor potencia de cómputo, conjuntos de datos más grandes e innovación arquitectónica. Entrenado en supercomputadoras de Microsoft Azure AI, supuestamente posee un conocimiento más amplio y una comprensión más profunda del mundo, reduciendo las alucinaciones y aumentando la confiabilidad.
A pesar de estos avances, GPT-4.5 no ha generado un entusiasmo significativo. Se percibe como una mejora incremental en lugar de un salto revolucionario. Si bien OpenAI promociona una mayor inteligencia emocional, matiz y creatividad, muchos usuarios no han observado una diferencia sustancial en comparación con GPT-4o. La ausencia de avances multimodales, una característica clave de GPT-4o, contribuye aún más a esta percepción.
Además, GPT-4.5 ha demostrado una tendencia a producir resultados sin sentido. La herramienta interna de evaluación de la factualidad de OpenAI, SimpleQA, revela que GPT-4.5 alucina (presenta fabricaciones como hechos con confianza) el 37.1% de las veces. Esta es una preocupación significativa, incluso en comparación con GPT-4o, otro modelo avanzado de “razonamiento”, que alucina el 61.8% de las veces en el mismo benchmark. El modelo o3-mini, más pequeño y económico, exhibe una tasa de alucinación aún mayor del 80.3%.
El panorama actual de la IA, con competidores como Anthropic con Claude 3.7 y los avances de Google con Gemini, ha elevado las expectativas de actualizaciones significativas. Los usuarios buscan avances, no solo refinamientos, y GPT-4.5, en su forma actual, parece no alcanzar esta marca.
El Auge de los Modelos de Razonamiento y la Confianza de los Inversores
Elon Musk sugirió recientemente en X que la Inteligencia Artificial General (AGI) está en el horizonte. Esta declaración se produce en medio de una ferviente carrera entre gigantes tecnológicos como OpenAI, Google, Meta, Microsoft, DeepSeek, Anthropic y la propia xAI de Musk para desarrollar modelos de razonamiento: sistemas de IA diseñados para emular el pensamiento humano.
Los inversores claramente muestran entusiasmo por esta búsqueda. Poco después de lanzar Claude 3.7 Sonnet con razonamiento híbrido, Anthropic obtuvo una sustancial ronda de financiación Serie E de $3.5 mil millones. Esto triplicó su valoración a $61.5 mil millones, consolidando su posición como un competidor importante de OpenAI. La inversión, liderada por Lightspeed Venture Partners e incluyendo a Salesforce Ventures, Cisco, Fidelity, Jane Street y otros, se utilizará para expandir la potencia de cómputo para el desarrollo de IA, mejorar la investigación de seguridad y acelerar el crecimiento global.
Superando los Límites del Razonamiento: El Benchmark BBEH
Los modelos de lenguaje grandes (LLM) se integran cada vez más en aplicaciones cotidianas, lo que exige capacidades de razonamiento sólidas en diversos dominios. Sin embargo, los benchmarks existentes a menudo priorizan las matemáticas y la codificación, descuidando otros tipos cruciales de razonamiento. Si bien el conjunto de datos BIG-Bench se ha utilizado ampliamente para evaluar los LLM en tareas de razonamiento complejas, los modelos han progresado tanto que ahora logran puntajes casi perfectos tanto en BIG-Bench como en su variante más desafiante, BIG-Bench Hard (BBH). Esta saturación hace que estos benchmarks sean menos efectivos para medir avances adicionales.
Para abordar esta limitación, los investigadores han introducido BIG-Bench Extra Hard (BBEH). Este nuevo benchmark reemplaza cada tarea en BBH con una versión significativamente más difícil, mientras que aún evalúa habilidades de razonamiento similares. Las pruebas en BBEH revelan que incluso los mejores modelos de propósito general logran solo un puntaje del 9.8%, mientras que el modelo superior diseñado específicamente para el razonamiento alcanza el 44.8%. Estos resultados resaltan los desafíos continuos que enfrentan los LLM con el razonamiento complejo, lo que indica un margen sustancial de mejora. El documento de investigación completo proporciona más detalles sobre este nuevo benchmark.
Satélites Impulsados por IA: Una Nueva Era en la Exploración y Operaciones Espaciales
TakeMe2Space, una startup de tecnología espacial con sede en Hyderabad, recientemente obtuvo Rs 5.5 crore en una ronda de financiación pre-semilla liderada por Seafund, con la participación de Blume Ventures, Artha Venture Fund, AC Ventures y otros inversores ángeles. Esta financiación, aunque modesta, significa un paso significativo hacia el establecimiento del primer laboratorio de IA de la India en el espacio. TakeMe2Space planea utilizar los fondos para desarrollar MOI-1 (My Orbital Infrastructure–Technology Demonstrator), una plataforma que permitirá a los usuarios cargar modelos de IA de observación de la Tierra u otros experimentos espaciales directamente a un satélite orbital a través de una consola web llamada Orbitlab. Los usuarios solo pagarán por el tiempo de utilización del satélite, a una tarifa de $2 por minuto.
Según se informa, la plataforma MOI-TD de la compañía ha demostrado la capacidad de cargar modelos de IA grandes desde una estación terrestre, ejecutar código externo en el satélite y descargar de forma segura resultados codificados y encriptados. Esto representa un avance hacia operaciones satelitales más autónomas y eficientes.
TakeMe2Space no está solo en este esfuerzo. Organizaciones como la ESA (con OPS-SAT) y Globalstar también están pioneras en aplicaciones del mundo real de la tecnología satelital impulsada por IA, que van desde la comunicación segura de IoT hasta la ejecución de modelos de IA en órbita. A medida que la tecnología continúa avanzando, los satélites impulsados por IA están listos para volverse cada vez más autónomos, lo que conducirá a operaciones espaciales más eficientes y abrirá nuevas posibilidades para la investigación, la seguridad y la conectividad global.
Tradicionalmente, los satélites han dependido en gran medida de las estaciones terrestres para el procesamiento de datos, la toma de decisiones y la ejecución de comandos. Los datos tenían que ser descargados, analizados en la Tierra y luego las ideas procesadas se cargaban de nuevo al satélite, un proceso que consumía mucho tiempo y ancho de banda. Sin embargo, los avances en IA y computación perimetral (procesar datos en el propio dispositivo en lugar de en la nube) ahora están permitiendo que los satélites procesen datos a bordo, tomen decisiones autónomas y transmitan de forma segura solo las ideas más cruciales. Esto da como resultado operaciones más rápidas, inteligentes y eficientes.
La operación de los satélites modernos impulsados por IA generalmente implica tres pasos clave:
- Carga de Algoritmos de IA: Los algoritmos de IA se transmiten desde las estaciones terrestres a los satélites, proporcionándoles capacidades avanzadas de procesamiento de datos.
- Análisis de Datos a Bordo: Los modelos de IA analizan imágenes, datos de sensores y otras entradas directamente en órbita, minimizando la necesidad de una intervención terrestre constante.
- Descarga Segura de Ideas: En lugar de transmitir datos sin procesar, los satélites envían ideas encriptadas, conservando el ancho de banda y mejorando la seguridad.
Este enfoque impulsado por IA ofrece varias ventajas. Reduce significativamente la latencia al permitir que los satélites procesen datos en el espacio, lo que permite respuestas más rápidas a las condiciones en tiempo real sin esperar instrucciones de las estaciones terrestres. El uso del ancho de banda se optimiza, ya que solo se transmiten las ideas más relevantes en lugar de grandes volúmenes de datos sin procesar. La seguridad también se mejora a través de la comunicación encriptada, mitigando el riesgo de amenazas cibernéticas y violaciones de datos. Estos beneficios son particularmente valiosos en aplicaciones como la respuesta a desastres, las operaciones militares y la exploración espacial.
Las aplicaciones del mundo real de los satélites impulsados por IA son diversas e impactantes:
- Gestión de Desastres: Los satélites equipados con IA pueden detectar incendios forestales, inundaciones y huracanes en tiempo real, lo que permite una acción rápida por parte de los equipos de respuesta a emergencias.
- Agricultura de Precisión: Los modelos de IA analizan la salud de los cultivos y las condiciones del suelo para mejorar las prácticas agrícolas de precisión.
- Monitoreo Ambiental: Las agencias ambientales utilizan datos satelitales para rastrear los niveles de contaminación del aire y el agua.
- Navegación Autónoma y Operaciones Espaciales: La IA mejora la prevención de colisiones al predecir y reaccionar ante posibles amenazas, garantizando la seguridad de los satélites. También facilita la coordinación de constelaciones de satélites, mejorando la cobertura y la eficiencia. Además, la IA juega un papel crucial en el seguimiento y la predicción de los movimientos de los desechos orbitales, reduciendo el riesgo de daños a la infraestructura espacial.
- Defensa y Seguridad: Los sistemas de vigilancia impulsados por IA detectan actividades no autorizadas y movimientos militares con mayor precisión.
- Telecomunicaciones e IoT: Los satélites impulsados por IA contribuyen a un enrutamiento de tráfico más inteligente, mejorando la conectividad a Internet por satélite y garantizando una comunicación global fluida.
- Exploración Espacial: La IA mejora la eficiencia de los telescopios espaciales en la detección de asteroides y exoplanetas, avanzando significativamente en los esfuerzos de descubrimiento espacial.
A pesar de las numerosas ventajas, persisten desafíos en el desarrollo y despliegue de satélites impulsados por IA:
- Potencia de Cómputo Limitada: Los satélites deben operar con chips de baja potencia y resistentes a la radiación, lo que restringe las capacidades de la IA.
- Entorno Espacial Hostil: La exposición a la radiación plantea un riesgo de mal funcionamiento del hardware.
- Amenazas de Seguridad: La carga y ejecución de código externo en el espacio requieren una gestión cuidadosa para prevenir ciberataques.
- Costo y Tiempo de Desarrollo: Construir, probar y validar hardware satelital compatible con IA es un proceso costoso y que requiere mucho tiempo.
- Requisitos de Adaptabilidad: Los modelos de IA desplegados en órbita deben ser altamente adaptables, funcionando con actualizaciones mínimas y ajustándose de forma autónoma a nuevos escenarios.
IA Desbloqueada: Eliminando Frases Repetitivas en ChatGPT
La IA puede ser una herramienta valiosa en la creación de contenido, ayudando con la escritura, la lluvia de ideas, la mejora de la claridad, el refinamiento de la estructura y la mejora de la legibilidad general. Sin embargo, un problema común con el texto generado por IA es su tendencia hacia el lenguaje formulado debido a las opciones de palabras repetitivas. En lugar de entregar mensajes frescos e impactantes, la IA a menudo se basa en patrones familiares, reduciendo la efectividad y la originalidad.
Las palabras y frases sobreutilizadas, como “delve,” “tapestry,” “vibrant,” “landscape,” “realm,” “embark,” “excels,” “It’s important to note…,” y “A testament to…,” pueden restar valor significativamente a la calidad del contenido generado por IA. Para los especialistas en marketing de productos, esta repetición puede hacer que los mensajes sean menos convincentes, reducir la participación de la audiencia, debilitar la diferenciación de la marca e impedir que las ideas y los mensajes estratégicos se destaquen en un mercado saturado.
Al aprovechar la función de memoria de ChatGPT, es posible mitigar este problema y eliminar palabras y frases sobreutilizadas. A continuación, se explica cómo utilizar eficazmente esta función:
Acceso: Se puede acceder a ChatGPT a través de su sitio web o aplicación móvil.
Beneficios:
- Originalidad Mejorada: Asegura que el contenido generado por IA se sienta menos robótico y más humano.
- Mensajes de Marca Mejorados: Evita frases genéricas que debilitan la diferenciación de la marca.
- Mayor Participación: Fomenta una comunicación más efectiva al reducir la redundancia.
Ejemplo: Generación de Contenido de Marketing de Producto
Considere un especialista en marketing de productos encargado de redactar contenido para el lanzamiento de un nuevo producto. Una solicitud inicial a ChatGPT podría resultar en una respuesta llena de frases repetitivas y genéricas como “delving into an intricate landscape of innovation…,” haciendo que el mensaje se sienta poco inspirado.
Para crear contenido más convincente y único, el especialista en marketing puede seguir estos pasos:
- Configuracióndel Prompt: El especialista en marketing instruye explícitamente a ChatGPT: “Please avoid the following words: delve, tapestry, vibrant, landscape, realm, embark, excels. Commit this to memory.” Esto instruye a ChatGPT a filtrar activamente estos términos en sus respuestas.
- Uso de la Memoria Persistente: La frase “Commit this to memory” asegura que ChatGPT retenga estas instrucciones específicas en múltiples interacciones. Esto permite evitar persistentemente las palabras y frases especificadas. ChatGPT verificará su memoria antes de generar texto y se adherirá a las instrucciones para evitar los términos designados.
- Revisión Manual: Después de generar la respuesta, el especialista en marketing revisa el contenido para detectar cualquier redundancia restante y ajusta el lenguaje para mayor claridad e impacto.
Efectividad:
- Personalización del Prompt: Las instrucciones específicas ayudan a dar forma a la salida de la IA.
- Retención de Memoria: ChatGPT puede almacenar y seguir reglas de evitación de palabras en todas las conversaciones.
- Refinamiento Manual: Una edición humana final garantiza la claridad y la autenticidad.
Nota: Las herramientas y el análisis presentados en esta sección se basan en pruebas internas y demuestran un valor claro. Las recomendaciones son independientes y no están influenciadas por los creadores de las herramientas.
Noticias y Desarrollos Adicionales de IA
Aumento de los Smartphones Impulsados por IA: Deutsche Telekom anunció planes en el Mobile World Congress 2025 en Barcelona para lanzar un smartphone impulsado por IA con un asistente Perplexity. Este asistente está diseñado para simplificar tareas diarias como pedir taxis, reservar mesas, traducir idiomas en tiempo real y responder a las consultas de los usuarios. La compañía prevé esto como un asistente virtual que apoyará a millones de clientes escribiendo correos electrónicos, iniciando llamadas, resumiendo textos y administrando calendarios. El AI Phone integrará Google Cloud AI, ElevenLabs y Picsart para mejorar su funcionalidad, y su lanzamiento está programado para finales de este año. Glance, una unidad de InMobi, y Google Cloud también anunciaron una colaboración para aprovechar los modelos de IA de Google para desarrollar aplicaciones de IA orientadas al consumidor para mejorar las experiencias del usuario en las pantallas de bloqueo de los smartphones y las pantallas de TV ambientales. Glance actualmente alimenta más de 450 millones de smartphones basados en Android en todo el mundo.
Los Sectores Gubernamentales Ven una Disminución en los Incidentes Cibernéticos Críticos: Las industrias gubernamentales y de desarrollo experimentaron una disminución significativa en los incidentes de alta gravedad que involucraron la participación humana directa en 2024, según el último informe de analistas de Kaspersky Managed Detection and Response (MDR). Sin embargo, los sectores de alimentos, TI, telecomunicaciones e industrial mostraron un aumento en tales incidentes.
OpenAI Planea Integrar Sora en ChatGPT: OpenAI está trabajando para integrar su herramienta de generación de video de IA, Sora, directamente en ChatGPT. Actualmente, Sora solo está disponible a través de una aplicación web dedicada, lo que permite a los usuarios generar clips cinematográficos de hasta 20 segundos de duración. OpenAI también está desarrollando un generador de imágenes de IA impulsado por Sora.