Xiaomi bringt OmniVoice auf den Markt, seine Sprach-KI, die sogar Mandarin spricht

08. May 2026 Veröffentlicht | Aus dem Spanischen übersetzt

Xiaomi hat OmniVoice vorgestellt, ein Open-Source-KI-Modell für die Text-zu-Sprache-Umwandlung. Das Tool unterstützt hunderte Sprachen, inklusive Sprachklonen und anpassbarer Sprachgenerierung. Laut dem Unternehmen zeichnet es sich besonders im Chinesischen und Englischen aus und übertrifft kommerzielle Systeme bei verschiedenen Aufgaben. Seine Stärke: Es kann Sprache in Sprachen mit wenigen Trainingsdaten generieren und so den Zugang zu Minderheitensprachen erleichtern.

Eine futuristische Benutzeroberfläche zeigt Sprachwellen in Blau und Rot auf einer Weltkarte, mit dem Xiaomi-Logo und Text in Mandarin-Chinesisch und Englisch, was die OmniVoice-KI symbolisiert.

Wie OmniVoice Sprachen mit geringen Ressourcen verwaltet 🗣️

OmniVoice verwendet eine Transformer-basierte Architektur und Multi-Task-Training, um Sprachsynthese unter Bedingungen begrenzter Daten zu erreichen. Das Modell nutzt gemeinsame Repräsentationen zwischen Sprachen, was den Wissenstransfer von ressourcenreichen zu ressourcenarmen Sprachen ermöglicht. Xiaomi gibt an, dass OmniVoice in Blindtests die Natürlichkeit proprietärer Systeme wie denen von Google oder Microsoft erreicht oder übertrifft, insbesondere bei Tönen und Intonationen des Chinesischen. Der Quellcode und die Gewichte sind auf GitHub unter der Apache-2.0-Lizenz verfügbar, sodass Entwickler sie an ihre Bedürfnisse anpassen können.

Jetzt kann sich sogar dein Toaster auf 500 Sprachen beschweren 🤖

Mit OmniVoice kann jedes Startup mit drei Euro und einem Laptop die Stimme seines Nachbarn klonen, um ihn sagen zu lassen, er solle den Bohrer zurückgeben. Das Beste ist: Wenn du keine Daten hast, um das Modell in deiner lokalen Sprache zu trainieren, verspricht dir Xiaomi, dass vier WhatsApp-Audios und ein TikTok-Video ausreichen. Bald werden wir Sprachassistenten in Feuerlöschern oder im Kühlschrank sehen, die auf Swahili Gedichte aufsagen. Es fehlt nur noch, dass es lernt, Ich habe den Einkauf vergessen mit dem richtigen Ton der Schuld zu sagen.