OpenAI und die Technologiebranche wenden sich zunehmend KI Geräten zu, die auf Audiofunktionen basieren, und legen dabei Wert auf natürliche Sprachinteraktion anstelle traditioneller bildschirmbasierter Benutzeroberflächen.
Photo Credit: REUTERS
OpenAI arbeitet an der Integration von sprachbasierter künstlicher Intelligenz in sein Modell, was die Leistung und die angebotenen Dienste deutlich verbessern könnte. Laut einem Bericht von The Information hat das Unternehmen in den letzten zwei Monaten mehrere Teams aus den Bereichen Entwicklung, Produktmanagement und Forschung zusammengelegt, um seine Audiomodelle grundlegend zu überarbeiten. Dies geschieht im Hinblick auf ein sprachgesteuertes persönliches Gerät, das voraussichtlich in etwa einem Jahr auf den Markt kommen soll. Diese interne Umstrukturierung soll Berichten zufolge die Entwicklung eines primär audiobasierten persönlichen Geräts unterstützen, das OpenAI voraussichtlich innerhalb des nächsten Jahres vorstellen wird.
Diese Initiative steht im Einklang mit einem breiteren Trend im Technologiesektor hin zu Schnittstellen, bei denen Audio eine zentrale Rolle spielt und Bildschirme zunehmend in den Hintergrund treten. Mehrere Unternehmen haben diesen Trend bereits verstärkt. Meta hat beispielsweise eine Funktion für seine Ray Ban Smartglasses eingeführt, die mithilfe eines Fünf Mikrofon Arrays Gespräche in lauten Umgebungen isoliert und verbessert. Google testet derzeit „Audio Overviews“, die Suchergebnisse in gesprochene Zusammenfassungen umwandeln, während Tesla den Grok Chatbot von xAI in seine Fahrzeuge integriert, um natürliche, sprachgesteuerte Interaktionen für Aufgaben wie Navigation und Klimasteuerung zu ermöglichen.
Die Fokussierung auf Audio beschränkt sich nicht nur auf etablierte Branchenführer. Eine Reihe von Startups verfolgt ähnliche Ambitionen, die Ergebnisse waren jedoch gemischt. Der AI Pin von Humane, ein bildschirmfreies Wearable, verschlang erhebliche Investitionen, konnte sich aber letztendlich nicht durchsetzen. Der Friend AI Anhänger, der als tragbarer Begleiter für die Aufzeichnung des täglichen Lebens vermarktet wird, erntete Kritik aufgrund von Datenschutzbedenken.
Das kommende Audiomodell von OpenAI, das voraussichtlich Anfang 2026 erscheinen wird, soll Berichten zufolge natürlichere Sprache erzeugen, Unterbrechungen fließend verarbeiten und überlappende Dialoge ermöglichen – ähnlich wie in menschlichen Gesprächen. Das Unternehmen soll außerdem ein breiteres Ökosystem von Geräten erforschen, darunter möglicherweise Smartglasses und bildschirmlose Lautsprecher, die weniger als herkömmliche Werkzeuge, sondern vielmehr als intelligente Begleiter fungieren.
Wie The Information berichtet, steht diese Ausrichtung im Einklang mit der Designphilosophie des ehemaligen Apple Chefdesigners Jony Ive, der nach der Übernahme seines Unternehmens io durch OpenAI für 6,5 Milliarden US Dollar den Hardware Initiativen von OpenAI beigetreten ist.
Werbung
Werbung
Oppo F33, Oppo F31 Pro Launch Timeline, Price Range Revealed in New Leak
Capcom Adds Original Versions of Resident Evil 1, 2 and Resident Evil 3 Nemesis to Steam