Industrie, Automation -

Sprachassistenten als Benutzerschnittstelle der Zukunft Hören und ­gehorchen

Frank Gerwarth, Produktmanager bei Reichelt Elektronik, stellt sich der Frage, ob wir in Zukunft noch physikalische Eingabegeräte benötigen, um einen Computer oder andere elektronische Geräte zu bedienen und welche Herausforderungen die Sprachassistenztechnologie dafür überwinden muss.

Sprechen statt tippen – das ist für Elektroniknutzer weitaus intuitiver und meist schneller. Es bleibt jedoch ein Spagat zu vollbringen: Einerseits kann der digitale Assistent eine echte Hilfestellung und Erleichterung im Alltag bedeuten; dafür muss er jedoch den Anwender gut verstehen. Deshalb ist es andererseits nötig, dass dieser Informationen über sich preisgibt, die der Sprachassistent mithilfe von künstlicher Intelligenz verarbeitet, um daraus lernen zu können.

eli: Bereits moderne Touchscreens reagieren auf Gesten wie Tippen oder Wischen und kommen damit der natürlichen menschlichen Interaktion schon sehr nahe. Ist es eine logische Folge, dass Sprache als nächste Stufe der intuitiven Steuerung folgt?

Gerwarth: Absolut – denn die Sprachsteuerung kommt unserer zwischenmenschlichen, alltäglichen, oft unbewussten Kommunikation sehr nahe. Während es vor ein paar Jahren noch eine Besonderheit war, sich mit einer Maschine zu unterhalten, merken wir das heute oft nicht einmal. Man denke an ein Video des Google-Assistenten, in dem er völlig selbstverständlich einen Termin für den Nutzer ausmacht, ohne dass der Gesprächspartner am Telefon merkt, dass er nicht mit einem Menschen spricht. In Zukunft wird sich der Einsatz von Spracheingabetechnologien noch weiterverbreiten, sodass der Rückschritt zur Eingabe durch Tippen oder sogar manuelles Aufschreiben für viele Nutzer undenkbar sein wird. Die Sprachsteuerung trägt auch maßgeblich dazu bei, den technologischen Fortschritt intuitiver und inklusiver zu gestalten. So profitieren gerade Menschen, die sich altersbedingt oder aufgrund von anderen Einschränkungen mit der Bedienung via Touchscreen schwertun, vom Komfort gesprochener Anweisungen. Daher wird auch der fortschreitende demografische Wandel die Nachfrage nach Spracheingabe verstärken.

eli: Neben den offensichtlichen Vorteilen ist die Sprachbedienung auch eine Herausforderung für Geräteentwickler – und sie birgt Risiken.

Gerwarth: Das stimmt, Herausforderungen liegen beispielsweise noch in der Erkennungsrate der Worte; sie liegt leider noch immer nicht bei 100 %. Auch haben Verbraucher von Problemen berichtet, wenn sie mit Dialekt sprechen. Die übliche Geräuschkulisse im Büro oder in den eigenen vier Wänden kann die Erkennungsquote beeinträchtigen. Die Hersteller arbeiten jedoch intensiv daran, die Technologie weiterzuentwickeln, sodass die Erkennungsrate weiter steigt. Die Spracherkennung ist auch kein wirklich neues Thema. Bereits seit vielen Jahren gibt es Diktierlösungen, die das gesprochene Wort in Text umwandeln und somit eine Eingabe per Tastatur überflüssig machen. Dies erleichtert Ärzten oder Anwälten das Erstellen von Dokumenten, die sie früher aufwendig tippen mussten. Jetzt gilt es, gesprochene Anweisungen in Aktionen von Geräten umzusetzen.

eli: Aber welche konkreten Befürchtungen könnten Anwender davon abhalten, sprachgesteuerte Geräte zu benutzen?

Gerwarth: Eine Befragung von 1000 Probanden in Deutschland zur Nutzung von Sprachassistenten hat gezeigt, dass viele Verbraucher noch Sicherheitsbedenken bezüglich ihrer Daten haben. Dem Sprachassistenten werden persönliche Informationen preisgegeben, die mithilfe von künstlicher Intelligenz verarbeitet werden. Die Sorge vieler Nutzer ist es, dass die Daten gespeichert werden, und unklar ist, was mit ihnen passiert. Die Technologie ist noch nicht weit genug ausgereift, um diese Bedenken gänzlich aus dem Weg zu räumen. Daher ist in letzter Zeit die heikle Frage, wie der Datenschutz gewährleistet werden kann, vermehrt Gegenstand der öffentlichen Diskussion geworden.

eli: Sind Sicherheitsbedenken auch ein Thema, wenn man ein sprachgesteuertes Gerät in der Öffentlichkeit benutzt?

Gerwarth: Natürlich auch das – bei der Nutzung von Sprachassistenten an öffentlichen Orten wie in Zügen oder Restaurants ist der Datenschutz schwierig zu gewährleisten. Hier können andere Anwesende oder Passanten die Spracheingabe mithören – ob sie es wollen oder nicht. Vertrauliche Informationen wie Kontodaten, Telefonnummern, Adressen oder medizinische Befunde dürften wohl die wenigsten Nutzer freiwillig an Umstehende weitergeben. Zudem würde, wenn sich Sprachassistenten als völlig alltäglich in der Öffentlichkeit etablieren würden, der Lärmpegel an öffentlichen Orten wie Restaurants, Museen oder auch Zügen erheblich ansteigen. Diese Herausforderungen müssen also gelöst werden, bevor sich Sprachassistenzsysteme zur Nutzung in der Öffentlichkeit verbreiten können.

eli: Wo sehen Sie denn dann die prä­destinierten Einsatzgebiete für Sprach­steuerung?

Gerwarth: Ein großer Vorteil von Sprachassistenzsystemen liegt ganz klar darin, dass man zwei freie Hände hat und nicht erst eine Tätigkeit unterbrechen muss, um Informationen manuell oder elektronisch zu erfassen. Außerdem erfolgt die Eingabe wesentlich bequemer und schneller, als wenn alles getippt werden muss. Daher ist Spracherkennung vor allem beim Autofahren nützlich oder bei der Bedienung von Smart-Home-Geräten – beispielsweise kann der Nutzer die Musiklautstärke erhöhen oder das Licht dimmen, während er kocht oder Hausarbeiten erledigt.

eli: Und solche Anwendungsfelder, die heute noch nicht so offensichtlich sind, beispielsweise in der Industrie?

Gerwarth: Die gibt es, etwa in Laboren oder anderen medizinischen Einrichtungen, die eine hohe Sterilität erfordern – Informationen können einfach per Spracheingabe dokumentiert werden, ohne dass man sich um die Kontamination von Smartphone, Stift oder Papier Gedanken machen muss. Ebenso können beispielsweise Berufstätige in der maschinellen Fertigung, die dringend beide Hände zur Arbeit brauchen, einfacher Informationen austauschen. Die Nutzung von Spracherkennungssystemen ist so individuell und vielfältig wie das Leben. Jeder Anwender hat seine persönlichen Anwendungsgebiete, und auch Unternehmen entwickeln Szenarien für ein ergonomischeres Arbeiten. Aktuell gibt es aber noch viele Grenzen für die sprachgesteuerte Arbeit, hier müssen Entwickler die Notwendigkeit erkennen und Lösungsvorschläge ausarbeiten.

eli: Die meisten Sprachassistenten sind mit weiblichen Stimmen ausgestattet. Warum ist das so?

Gerwarth: Studien haben ergeben, dass weibliche Stimmen als entspannter, geduldiger und angenehmer wahrgenommen werden als männliche – daher besitzen die meisten Sprachassistenten wohl weibliche Stimmen. Dies ist uns von Navigationssystemen bereits seit langer Zeit bekannt, und die Diskussionen gab es hierzu schon mehrfach. Da Alexa und Co. aber auf Beschimpfungen oder sexuelle Anspielungen meist sehr ruhig und manchmal sogar flirtend reagieren, sind sie in die Kritik der Öffentlichkeit geraten. Zudem wird befürchtet, dass sie als devote, stets folgsame Helferinnen veraltete Rollenbilder bestärken.

eli: Ist mit den Sprachassistenten somit auch eine Verantwortung vebunden, was das Vermitteln von Werten betrifft?

Gerwarth: Wie ein Sprachassistent kommuniziert und welche Werte er dabei transportiert, hängt davon ab, mit welchen Daten er trainiert wurde. Schwingen dabei veraltete Rollenbilder mit, sind diese auch präsent, wenn der Assistent in Interaktion mit dem Nutzer tritt. Daher ist eine genaue Kenntnis des Datensatzes und ein Verständnis des Lernprozesses einer KI seitens des Entwicklers notwendig, um keine ungewünschten Ergebnisse zu erzielen. Bei der Entwicklung dieser Systeme sollte immer auch auf gemeingültige Werte geachtet werden, die aber von Land zu Land unterschiedlich sein können.

eli: Welche Rolle spielt das Thema Sprach­assistenzsysteme bei Reichelt Elektronik?

Gerwarth: Die Steuerung per Sprache ist für smarte Geräte sehr wichtig und auch ein Kaufkriterium. Wir nutzen diese Systeme auch privat und sind offen für die weitere Entwicklung und Möglichkeiten, die sie uns bieten. Den Komfort der Sprachsteuerung, möchten wir nicht mehr missen. Einen Lichtschalter musste ich zuhause schon lange nicht mehr betätigen. Der Einstieg in die smarte Gerätewelt beginnt meistens mit vernetzten Beleuchtungs- oder Audiolösungen. Hat man sich erst einmal an die neue Bequemlichkeit gewöhnt, ist die Erweiterung des Systems mit intelligenten Überwachungskameras, Rauchmeldern, Türklingeln oder Steckdosen nur noch eine Frage der Zeit. All diese Geräte lassen sich dann in der Regel auch per Sprachsteuerung kontrollieren.

eli: Abschließend ein kurzer Blick in die Zukunft: Wie würde denn Ihrer Meinung nach die ultimative Benutzerschnittstelle beschaffen sein?

Gerwarth: Wie die Zukunft aussehen kann, haben uns viele Science-Fiction-Filme zu zeigen versucht. Die Filme der 80er-Jahre wurden von der technologischen Entwicklung teilweise schon weit überholt. Ob wir in der Zukunft überhaupt noch die Sprache als Kommunikationsmittel nutzen werden, steht in den Sternen. Implantate könnten der nächste Schritt für den Austausch von Informationen sein, lautlos und gedan­kenschnell. Schalter und Knöpfe könnten jedenfalls bald der Vergangenheit ange­hören.

Danke für das Gespräch.

reichelt elektronik GmbH & Co. KG,
Elektronikring 1,
26452 Sande,
Tel. 04422 955-333,
Fax 04422 955-111,
E-Mail info@reichelt.de,
www.reichelt.de
Weitere Downloads zu diesem Artikel
Firmeninformationen
Weitere Beiträge zum Thema Industrie, Automation
Alle Artikel des Ressorts
Weitere Beiträge zum Thema Konsumer Alle Artikel des Ressorts
© elektronikinformationen.de 2019 - Alle Rechte vorbehalten