OpenAI estaría probando GPT-Bidi-1, un nuevo modelo de voz para ChatGPT que permite hablar y escuchar al mismo tiempo, eliminando la espera de turnos. Esta tecnología busca imitar la fluidez de una conversación real, donde los interlocutores pueden interrumpirse o reaccionar en simultáneo. Para los usuarios, esto significa una interacción más natural y rápida con la inteligencia artificial, acercándose a una charla cotidiana.
Cómo funciona la conversación bidireccional en ChatGPT 🗣️
GPT-Bidi-1 procesa audio en tiempo real mediante un sistema de duplex completo, similar al de una llamada telefónica. El modelo no solo reconoce el habla, sino que también analiza pausas, tonos y superposiciones para decidir cuándo responder o callar. A diferencia de los asistentes actuales, que esperan a que termines de hablar, este sistema permite interrumpir al asistente sin que se bloquee. La clave está en un buffer de audio que prioriza el contexto inmediato, evitando cortes o respuestas fuera de lugar.
Adiós a los silencios incómodos con la IA 😅
Por fin podrás interrumpir a ChatGPT sin sentir que estás siendo grosero con una máquina. Ahora, cuando el asistente se lance en un monólogo sobre las bondades del reciclaje, podrás decirle basta sin esperar a que termine su frase. Lo malo es que, si eres de los que hablan solos, la IA podría contestarte sin que le hayas preguntado nada. Prepárate para discutir con tu teléfono como si fuera tu compañero de piso.