Siri: Entwickler machen Spracherkennung auf Macs, PCs und Android-Geräten möglich

Florian Matthey
10

iOS-Entwickler haben Siri auf einem iPhone 4, iPad und sogar einem iPhone 3GS zum Laufen gebracht. Das alles scheint aber nicht genug gewesen zu sein: Einige Entwickler wollen nun einen Weg gefunden haben, Siri innerhalb anderer Apps und sogar auf anderen als iOS-Geräten zu installieren.

Die Entwickler von Applidium wollten verstehen, wie Siri genau arbeitet. Dafür haben sie sich genau angesehen, welche Daten ein iPhone 4S mit Apples Servern austauscht. Das ließ sich zwar nicht immer ohne Weiteres feststellen – so sind die Daten komprimiert und der Datenaustausch erfolgt über eine HTTPS-Verbindung. Mit Hilfe einiger Tricks wollen die Entwickler aber auch diese Hindernisse überwunden haben.

Anhand der so gesammelten Erkenntnisse soll es nun möglich sein, Siri in eine eigene App zu integrieren. Diese Software muss dann nicht einmal auf einem iOS-Gerät arbeiten – theoretisch lässt sich Siri also auch auf einem Mac, PC oder Android-Gerät verwenden. Applidium hat als Beweis eine ZIP-Datei hochgeladen, in der sich eine französische Sprachaufnahme und die “Antwort” von Apples Server als Textdatei befindet. Das Ganze soll komplett ohne den Einsatz eines iPhones funktioniert haben.

Allerdings bleibt ein Stolperstein: Damit die Server auf eine Siri-Anfrage reagieren, wollen sie die Identifikationsnummer (UDID) eines iPhone 4S sehen. Wer Siri also auf einem anderen Gerät einsetzen will, muss sich eine solche besorgen, und dann besteht das Risiko, dass Apple entsprechende Nummern auf eine “Blacklist” setzt. Bisher soll das Ganze aber ohne weitere Probleme funktionieren, und Applidium bietet eine Reihe an Tools an, die anderen Entwicklern die Arbeit an ähnlichen Tools erleichtern sollen.

Darüber hinaus benennt der Entwickler auch einige interessanten Fakten zu Siris Arbeitsweise: Zum einen haben sie herausgefunden, dass Siri tatsächlich komplette Audio-Aufnahmen, komprimiert mit dem Audio-Codec Speex, verschickt. Die eigentliche Spracherkennung findet daher vollständig auf Apples Servern und nicht auf dem iPhone statt. Auch haben die Entwickler entdeckt, dass sowohl das iPhone als auch der Server sehr gesprächig miteinander sind: So verschickt der Server für jedes einzelne Wort eines erfassten Textes Metadaten wie eine “Confidence Score” sowie Timestamps, die die “Position” des Wortes innerhalb der Aufnahme benennen.

Weitere Themen: Android

Neue Artikel von GIGA APPLE

GIGA Marktplatz