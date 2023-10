OpenAI baut den Funktionsumfang von ChatGPT kontinuierlich aus. Nachdem das Tool bislang auf Texteingaben beschränkt war, kann man bald auch mit ChatGPT sprechen. Dann lassen sich „Prompts“ aufsagen und man bekommt die Antworten direkt vorgelesen, anstatt sie vom Bildschirm ablesen zu müssen.

Die Sprachsteuerung in ChatGPT wurde Ende September 2023 angekündigt und wird seitdem für Nutzer ausgerollt (Quelle: OpenAI). Dabei soll die Funktion zunächst an Unternehmen verteilt werden. Wie bei den meisten neuen Funktionen ist auch die Sprachfunktion von ChatGPT nur für Nutzer der kostenpflichtigen Bezahlvariante „ChatGPT Plus“ vorgesehen. Nutzer in den USA bekommen dabei zuerst den Zugriff auf die Funktion.

Prompts einsprechen & Antworten vorlesen lassen

Die Sprachausgabe funktioniert ähnlich wie bei Alexa und Siri. Man sagt also einen Befehl, den die Künstliche Intelligenz dann verarbeitet. Im Gegensatz zu den Lösungen von Apple, Amazon und Co. sind die Antworten von ChatGPT qualitativ aber hochwertiger und ausführlicher. Die Sprachausgabe ist in den ChatGPT-Apps für Android und iOS verfügbar und muss zunächst in den „Einstellungen“ aktiviert werden. Ist das Feature einmal eingeschaltet, kann man so mit ChatGPT sprechen:

Hat man Zugriff auf die Funktion, findet man oben in der Übersicht der Chat-Verläufe ein Kopfhörer-Symbol. Einmal angetippt, sieht man eine kurze Lade-Animation. Sobald ein Kreis zu sehen ist, kann man die Spracheingabe aktivieren, indem man draufdrückt. Kleinere Kreise zeigen an, dass ChatGPT zuhört. Dann kann man seinen Prompt einsprechen. Eine animierte Sprechblase zeigt an, dass der Befehl verarbeitet wird. Anschließend wird die Antwort von ChatGPT vorgelesen. Tippt man auf die entsprechende Funktion, kann man sich die Antwort zusätzlich auch wie gewohnt in Textform anzeigen lassen.

ChatGPT kann sprechen

Standardmäßig antwortet ChatGPT auf Englisch. Man kann die Einstellung aber auch ändern und dann zum Beispiel Aussagen auf Deutsch sowie weiteren Sprachen, etwa Polnisch, Französisch, Spanisch oder Japanisch hören. Laufende Antworten lassen sich nicht durch einen Sprachbefehl stoppen. Man muss also bis zum Ende anhören, was ChatGPT zu sagen hat. Für die Spracherkennung setzt OpenAI auf das hauseigene Modell „Whisper“. Für die Umsetzung soll das Unternehmen mit fünf Synchronsprechern zusammengearbeitet haben. Antworten lassen sich in fünf verschiedenen Stimmen vortragen.

Tipp: Wer auch in der kostenlosen Version Befehle in ChatGPT einsprechen statt eintippen will, kann ein Browser-Add-on nutzen. Bei Chrome eignet sich zum Beispiel die Erweiterung „Sprachsteuerung für ChatGPT“. Mit dem Stiftsymbol lässt sich die Spracheingabe starten, über den Lautsprecher kann man den ausgegebenen Text anhören. Den kostenlosen Download findet ihr hier:

Sprachsteuerung für ChatGPT voicewave.xyz

Neben der Sprachsteuerung hat OpenAI auch eine Funktion vorgestellt, mit der man in ChatGPT Bilder hochladen und Informationen darauf untersuchen lassen kann.

