Wird der Wettbewerb zwischen KI-Entwicklern das Ende der menschlichen Rasse bedeuten? Könnten wir alle für Roboter das werden, was Hunde für Menschen sind? Dieser Artikel hinterfragt Googles sprachgesteuerten KI-Assistenten Projekt Astra, der als ernstzunehmender Konkurrent zu Open AIs ChatGPT 4o erscheint.

In einem möglichen Fall von “Keeping up with the Joneses” hat Google Inc. einen neuen multimodalen KI-gesteuerten Agenten namens Projekt Astra eingeführt, einen Tag nach der Ankündigung von ChatGPTs GPT4o. Das neue System, das später in diesem Jahr eingeführt wird, wird in der Lage sein, menschliche Anfragen in Echtzeit mit Text-, Audio- oder Videoeingaben zu beantworten. Um die angeborenen Fähigkeiten von Projekt Astra zu demonstrieren, teilte Google ein Demo-Video, das den KI-Assistenten zeigt, der in Echtzeit mit Menschen interagiert und Fragen über Spracheingabe beantwortet.

Reagiert mit einer menschenähnlichen Stimme

Googles Ankündigung folgt auf die Einführung von GPT4o am Vortag. Das KI-gesteuerte Modell von OpenAI kann schnell auf Sprachbefehle reagieren, um zu sagen, was es auf einem Computerbildschirm oder der Kamera eines Smartphones “sieht”. Projekt Astra antwortet mit einer menschenähnlichen Stimme, die einen emotional ausdrucksstarken Ton verwendet, der Emotionen wie Flirten und Überraschung simuliert.

Projekt Astra, den Google als “Universal-KI” beschreibt, könnte für den täglichen Gebrauch wirklich hilfreich werden. Er soll ein lehrbarer, proaktiver Agent sein, der natürliche Sprache entschlüsseln kann. Laut Google kann sein Vorzeige-KI-für-alles-Agent Informationen schneller verarbeiten, indem er Videoframes kodiert, Videos durchsucht und Spracheingaben in eine Ereignischronik einfügt und die Daten zwischenspeichert.

KI-Modelle mit mehr Verständnis von der physischen Welt

Der KI-Assistent ist darauf ausgelegt, natürlich zu klingen, und Benutzer können zwischen verschiedenen Stimmen wählen. Kommentierend zur Wahl des Tech-Giganten für einen autonomen Agenten sagte Googles Deep Mind CEO Demis Hassabis, dass der Agent eine komplexe und dynamische Welt genauso verstehen und darauf reagieren müsse wie Menschen.

Das Konzept wird voraussichtlich das Versprechen einlösen, das Hassabis im letzten Jahr bezüglich des Potenzials eines Projekts Gemini machte, als Google es erstmals im Dezember vorstellte. Google sagt, dass es Projekt Astra über eine neue Benutzeroberfläche namens Gemini Live zur Verfügung stellen wird, deren mehrere Prototyp-Smart Glasses der Tech-Gigant noch testet, während er versucht, seine Führungsposition in der KI wiederherzustellen. Hassabis ist der Meinung, dass das Auffüllen von KI-Modellen mit mehr Verständnis von der physischen Welt sie effektiver macht und Systeme wie Projekt Astra effektiver macht. Hassabis sagte zum KI-Agenten:

Es muss eine komplexe und dynamische Welt genauso verstehen und darauf reagieren wie Menschen – und aufnehmen und sich merken, was es sieht und hört, um den Kontext zu verstehen und Maßnahmen zu ergreifen. […] Es muss auch proaktiv, lehrbar und persönlich sein, damit Benutzer natürlich und ohne Verzögerung mit ihm sprechen können.

Voraussichtlich später in diesem Jahr

Dank multimodaler KI, einer Kombination aus neuronalen Netzwerkmodellen mit der Fähigkeit, Eingaben aus mehreren Quellen von Kameras und Mikrofonen zu verarbeiten und sie anschließend mit KI zu mischen, kann Projekt Astra Informationen zwischenspeichern, die es später schnell abrufen kann. Ohne zu spezifizieren, wann Projekt Astra in seine Produkte integriert wird, wiederholte Hassabis, dass die Gemini-App wahrscheinlich einige dieser Funktionen später in diesem Jahr enthalten werde, und fügte hinzu:

Ich wäre sehr überrascht, wenn das nicht bedeutet, dass das Google Pixel 9, das wir später in diesem Jahr erwarten, damit ausgestattet wird.

Haftungsausschluss: Alle Materialien auf dieser Seite dienen nur zu Informationszwecken. Keines der Materialien sollte als Anlageberatung interpretiert werden. Bitte beachten Sie, dass trotz der Art vieler Materialien, die auf dieser Website erstellt und gehostet werden, HODLFM.DE keine Finanzreferenzressource ist und die Meinungen von Autoren und anderen Mitwirkenden ihre eigenen sind und nicht als finanzielle Beratung aufgefasst werden sollten. Wenn Sie eine solche Beratung benötigen, empfiehlt HODLFM.DE dringend, sich an einen qualifizierten Fachmann der Branche zu wenden.