GPT-4o

OpenAI: la Inteligencia Artificial ahora puede escuchar, hablar y ver

La nueva versión de ChatGPT, GPT-4o, brinda interacción multimodal y asombrosa naturalidad de voz. ¿Cómo cambiará esto la experiencia del usuario?

OpenAI ha presentado su último avance tecnológico, el GPT-4o, una versión mejorada de su popular modelo de inteligencia artificial. Esta actualización transforma por completo la experiencia de ChatGPT, ofreciendo una interacción más natural y sofisticada para los usuarios. El GPT-4o es capaz de procesar texto, audio y video, permitiendo una comunicación más rica y fluida.

El CEO de OpenAI, Sam Altman, expresó su asombro ante el nuevo avance: "El nuevo modo de voz (y video) es la mejor interfaz computacional que he utilizado. Parece la IA de las películas; y todavía me sorprende un poco que sea real."

Embed

Multimodal: la Inteligencia Artificial cada vez más parecida a la ficción

Una de las características más destacadas de esta versión es su capacidad multimodal, que permite al sistema aceptar cualquier combinación de texto, audio e imagen como entrada, y generar respuestas en los mismos formatos. Además, el GPT-4o puede responder a entradas de audio en tan solo 232 milisegundos, con un promedio de 320 milisegundos, equiparándose al tiempo de respuesta humano en una conversación.

En palabras de Mira Murati, directora de Tecnología de OpenAI: "Es la primera vez que damos un gran paso adelante en lo que respecta a la facilidad de uso. Esta interacción se vuelve mucho más natural y mucho, mucho más fácil."

La presentación de OpenAI también destacó la capacidad del GPT-4o para mantener conversaciones habladas en tiempo real, así como su habilidad para interactuar mediante texto y "visión", lo que le permite comprender y discutir imágenes y gráficos proporcionados por los usuarios. Incluso, demostraron que el modelo detectaba las emociones de los usuarios; en un caso, escuchó la respiración de un ejecutivo y le animó a calmarse.

Embed

La tecnología y las funciones actualizadas llegarán a ChatGPT en los próximos meses. Los usuarios sin suscripción pagada de ChatGPT dispondrán de un número limitado de interacciones con el nuevo modelo GPT-4o antes de que la herramienta vuelva automáticamente a depender del antiguo modelo GPT-3.5; los usuarios de pago tendrán acceso a un mayor número de mensajes con el último modelo.

Estos avances representan un cambio significativo en la experiencia del usuario de ChatGPT y marcan un hito en el desarrollo de la inteligencia artificial. Con la capacidad de generar contenido en varios formatos y una interacción de apariencia natural./CNN

Te Puede Interesar