Nuance im Gespräch: Siri, Know-How und Testballons

„Siri, wie ist Deine Verbindung zu Nuance?“ – „Darüber möchte ich lieber nicht sprechen“. Der Sprachassistent im iPhone 4S hält sich bedeckt, wenn es um seine Ursprünge geht. Viele Beobachter sind der Meinung, Siri arbeitet mit Nuance-Know-How. Was hinter diesem Namen steckt, verrät uns der Marketing-Manager des Unternehmens.

Nuance: Ein Entwickler im Hintergrund

Schon vor der Vorstellung von iOS 5 auf der letzten WWDC gab es einige Spekulationen über eine Kooperation zwischen Nuance und Apple. Insbesondere nachdem bekannt wurde, dass Apple Siri übernommen hat. Was heute im iPhone 4S als Systemfunktion integriert ist, war seinerzeit eine separate App mit dem gleichen Namen.

Im Gespräch mit giga.de verrät Reimund Schmald, Marketing-Manager für dem Bereich Mobility von Nuance in Europa, den mittleren Osten und Afrika etwas mehr über das Unternehmen. Vor der Berichterstattung über die Übernahme von Siri durch Apple dürfte Nuance vor allem durch Apps wie Dragon Dictation* oder Dragon Remote Microphone* ein Begriff gewesen sein.

Dabei hat jeder, der schon einmal mit seinem Mobiltelefon eine SMS unter Zuhilfenahme von „Text on 9 keys“ (oder „T9“) geschrieben hat, Nuance-Technologie verwendet. Auch in jedem Navigationssystem, das dem Benutzer Anweisungen vorliest oder ihm erlaubt, eine Adresse per Sprache einzugeben, steckt ein Stückchen Nuance. Ebenso wie in vielen sprachgesteuerten Hotline-Menüs¹.

„Mehr Lizenzen als Microsoft“

Das Unternehmen ist einer der weltweit führenden Anbieter von Spracherkennung, Texterkennung und „Natural Language Understanding“ (NLU), also dem Verstehen natürlicher Sprache. Es verfügt über 4.000 Patente in diesem Bereich und vergibt „mehr Lizenzen als Microsoft“.

Dabei liegt das Hauptgeschäft für Nuance nicht im Verkauf von Apps. „Im Geschäftsbereich für Mobilanwendungen verdienen wie unser Geld mit Großkunden wie OEMs oder Mobilfunkanbietern“, erläutert Schmald. Diese lassen sich angepasste Lösungen entwickeln, die sie später als Standard-Funktion in ihre Produkte integrieren.

Kein Netz, kein Nuance: Nicht ohne meinen Server

Basiert diese Lösung nicht auf dem Verstehen festgelegter Befehle, die einer bestimmten Syntax folgen (wie etwa in der Mercedes S-Klasse von Daimler), sondern auf der Erkennung natürlicher Sprache, kommen immer auch Nuance-Server ins Spiel. Dort werden die normalsprachlichen Eingaben in Aktionen umgesetzt und als Kommandos an das Gerät zurückgesendet, das sie aufgenommen hat.

Dieser Vorgang lässt sich in zwei Komponenten aufteilen, erklärt Schmald. Einerseits muss die Spracheingabe erkannt und möglicherweise in Text umgewandelt werden. Andererseits muss diese Information verstanden, also inhaltlich erfasst und mit einer für das System relevanten Bedeutung gefüllt werden. Letzteres erfordert hochkomplexe Rechenarbeit.

„Ein lebendiger Prozess“: Warum Siri nie autark sein wird

Aus diesem Grund glaubt Schmald auch nicht daran, dass Smartphones oder Tablets mittelfristig eigenständig in der Lage sein werden, Eingaben in natürlicher Sprache zu verstehen. „Das ist ein lebendiger Prozess und die Software muss ständig angepasst werden“, weswegen immer noch eine Verbindung zu einem Wi-Fi- oder 3G-Netz benötigt werde.

Die reine Erkennung der Sprache und ihre Umwandlung in Text könnte dagegen schon früher auf den Geräten selbst erledigt werden. Aktuell ist auch hierfür stets eine Verbindung zu den Nuance-Servern vonnöten. Sollte sich jedoch die Rechenleistung weiter so rasant entwickeln, könnte dieser Teil der Serverlast bald wegfallen.

Davon könnte möglicherweise auch Apples Rechenzentrum in North Carolina profitieren. Jedenfalls sofern dort Nuance-Software für die Verarbeitung von Siris Anfragen zum Einsatz kommt – und hierauf gab es im Vorfeld der iOS-5-Präsentation einige Hinweise. Möglich wäre aber auch, dass jede dieser Anfragen an eigene Rechner des Entwicklers weitergeleitet wird und Apples Serverfarm allein der Bewältigung von iCloud-Aufgaben dient. Allerdings wäre diese Auslagerung eines Dienstes, von dem derart wichtige Funktionen abhängen, untypisch. Ein Kontrollverlust, den Apple üblicherweise zu vermeiden sucht.

„Unsere Apps sind Testballons und Werbung“

Das Kerngeschäft von Nuance ist also der Verkauf von Lizenzen und Technologie an Großkunden. Warum aber zusätzlich noch Anwendungen wie Dragon Dictation oder Dragon Search* entwickeln? „Apps sind für uns Testballon und Werbung zugleich“ erklärt Schmald. Man verwendet die Programme für iOS und andere Umgebungen also quasi als Schaufenster für das, was Nuance den Großabnehmern zu bieten hat. Mit dieser Methode erreicht der Hersteller nach eigenen Angaben immerhin 10 Millionen Menschen, die seine Apps bereits heruntergeladen haben.

Neue Funktionen können auf diese Weise an einem großen Publikum getestet werden, bevor sie in das tatsächliche Produktportfolio aufgenommen werden. „Wir nehmen die Anregungen der User auf und verbessern so unsere Produkte für die Großkunden“ – im Grunde einfache Art der Marktforschung.

Entwickler willkommen: Spracherkennungs-SDK für alle

Einen Teil dieser Technologie stellt der Hersteller über sein Entwicklerportal auch anderen Interessenten zur Verfügung. Allerdings werden aktuell nur SDKs zur Spracherkennung angeboten, nicht zur Interpretation der erkannten Sprache via NLU. „Wir stellen „Natural Speech Understanding“ derzeit nur Großkunden zur Verfügung“, so Schmald, da mit einem SDK immer auch ein Support-Netzwerk einhergehen müsse. „Soweit sind wir noch nicht, arbeiten aber parallel auch daran“.

Doch die alles entscheidende Frage lautet: Steckt in Siri nun wirklich Nuance-Know-How? „Ich will es einmal so sagen“, orakelt Schmald, „in der ehemaligen App von der Firma Siri war ein Nuance-Logo zu sehen. Jetzt ist Siri von Apple und der Sprachassistent auf dem iPhone 4S ist danach benannt“. Verständlicherweise wollen sich die Beteiligten nicht explizit zu eventuellen Lizenzvereinbarungen untereinander äußern. Uns ist trotzdem klar, dass Siri ohne Nuance geradezu undenkbar wäre.

Wir danken Reimund Schmald, Mobile Marketing Manager für die EMEA-Region bei Nuance recht herzlich für das Interview.

¹ Hierfür möchte ich persönlich dem gesamten Nuance-Team von Herzen tiefste Dankbarkeit aussprechen!

iPhone-Display kaputt? Akku zu schnell leer? Kein Problem: Display oder Akku selbst tauschen mit den Komplettsets zur iPhone-Display-Reparatur oder dem iPhone-Akku-Wechsel von GIGA & Fixxoo!

Neue Artikel von GIGA APPLE

GIGA Marktplatz