Publicado el 04/04/2026, 23:17:21 | Autor: 3dpoder

Microsoft presenta sus propios modelos fundacionales de IA para texto, voz e imágenes

Microsoft ha anunciado el desarrollo de tres modelos fundacionales propios de inteligencia artificial. Este movimiento busca reducir su dependencia de OpenAI y construir capacidades multimodales internas. Los modelos, enfocados en transcripción, generación de voz y creación de imágenes, se integrarán en servicios como Azure y Teams.

Un cerebro digital brillante se ramifica en tres iconos: un micrófono, un altavoz y una paleta de pintura, sobre el logo de Azure.

Desglose técnico de los modelos MAI-Transcribe-1 y MAI-Voice-1 🤖

La arquitectura se centra en modelos especializados. MAI-Transcribe-1 está optimizado para una transcripción de voz rápida y eficiente en recursos. MAI-Voice-1 gestiona la síntesis de audio a partir de texto. Un tercer modelo, aún sin nombre oficial, se encargará de la generación de imágenes. Su integración en productos busca ofrecer funciones con menor latencia y costo.

Suleyman y su plan para 2027: ¿adiós a los pagos por token? 💡

Con Mustafa Suleyman al mando, Microsoft parece haber memorizado la lección: no es cómodo que tu socio estratégico te cobre la factura de la luz de un país cada vez que un usuario pide quitar fondos a una imagen en Teams. Para 2027 aspiran a tener sus propias creaciones, lo que podría traducirse en que, por fin, un error de transcripción en una reunión solo nos cueste un brazo, en lugar de un brazo y una pierna.