Mittwoch, 6. November 2013

Meine Meinung zum Mircosoft Kinect

Derzeit gibt es im Netz einen Hype um den Microsoft Kinect und seinen möglichen Einsatz als Gebärdensprachdolmetscher für Gehörlose, welchen ich aber nicht nachvollziehen kann als gehörloses Mitglied der Gebärdensprachgemeinschaft.

Hier der Beitrag, der derzeit im Netz kursiert: Kinect für Echtzeit-Übersetzung in Gebärdensprache

Dieser Blogpost soll dazu dienen zu veranschaulichen, warum der Einsatz von Microsoft Kinect als Gebärdensprachdolmetscher sehr begrenzt ist und nie so verfeinert werden kann, so dass er tatsächlich Gebärdensprachdolmetscher ersetzen können wird.

Es gab schon in der Vergangenheit diverse ähnliche Projekte, die alle das Ziel hatten, einen Computeravatar als Gebärdensprachdolmetscher zu erstellen, die sind aber alle gescheitert und das Geld, welches in diese Projekte gesteckt wurde, einfach versickert. Die hätte man meiner Meinung nach an anderen Stellen besser investieren können. Das bekannteste Projekt aus dieser Zeit war das gemeinsame Projekt "eSIGN" von Deutschland, Holland und Großbritannien - hier der Link dazu:

Introduction to eSIGN

Die Gebärdensprache jedoch stellt jeden, der versucht sie zu lernen vor 3 Herausforderungen: Das Zusammenspiel von Mimik, Körpersprache und Gebärden muss funktionieren und dann ist noch der Umstand, dass z.B. die deutsche Gebärdensprache eine ganz andere Syntax hat als die deutsche Lautsprache. Das muss man alles berücksichtigen und ich denke nicht, dass ein Gebärdensprachdolmetscher-Avatar das alles so perfekt bewältigen kann wie ein menschlicher Gebärdensprachdolmetscher, der das alles in Sekundenschnelle erfassen kann.

Ein anderer wichtiger Punkt ist auch: Gehörlose sind auf den Augenkontakt angewiesen, denn darüber bekommen sie das Feedback, ob man ihnen zugehört hat und ihr Anliegen verstanden hat. Ein Computeravatar kann dieses natürliche Bedürfnis nicht befriedigen, was natürlich ein Störfaktor in dieser Art von Kommunikation ist.

Ein weiteres Manko fiel mir im Video auch auf: Die Gebärdenden sind dazu gezwungen sehr sauber und akzentuiert zu gebärden, damit der Computer die Gebärden richtig entziffern kann. Schaut man sich aber die normale Geschwindigkeit der Gebärdensprache an, so wird einem klar, dass der Computer das nicht erfassen kann, weil es sehr viele Feinheiten gibt in der Kommunikation.

Ein Beispiel: Für die Piratenpartei habe ich das Wahlprogramm in Gebärdensprache gemacht und man kriegt da schon einen guten Einblick, wie komplex die Gebärdensprache ist:

Wahlprogramm der Piratenpartei mit Gebärdensprache und Untertitel 

Hans Carlos Hofmann aka @hanscarlos, ein Mitglied der Piratenpartei hat sich die Mühe gemacht und von der ersten Minute des Wahlprogramms eine 5-Fach-Slow-Motion zu erstellt:

Wahlprogramm der Piratenpartei mit Gebärdensprache und Untertitel in 5-FACH-Slowmotion

Ich denke, bei diesem Vergleich wird es klar, was ein menschlicher Gebärdensprachler so alles erfassen kann in Sekundenschnelle und auch sofort merkt, ob das Gesagte nun ironisch, zweideutig, ernst oder wütend war.

Außerdem hat jeder Gehörlose eine andere Art zu gebärden, man kann nicht den Computer ungefähr 5 verschiedene Leute vom Computer erfassen lassen und dann denken: "OH prima, jetzt haben wir alle möglichen Unterschiede in der Art zu gebärden erfasst.." So funktioniert es nun mal nicht. Jeder hat ein eigenes Tempo in der Gebärdensprache und die Gebärdensprache lässt sich nicht in ein steifes Korsett pressen.

Den Einsatz von Kinect beim Arzt würde ich nicht empfehlen, denn mir ist die Wahrscheinlichkeit der Fehlerquote einfach zu hoch, dies wurde mir auch vom User @jmairboeck bestätigt:





Die Lösung für das Problem, dass Gebärdensprachdolmetscher oft nur schwer zu bekommen sind, liegt im Internet, aber anders als gedacht.

Die Firma VerbaVoice hat das Problem anders gelöst und zwar mit Hilfe des Internet UND menschlichen Gebärdensprachdolmetschern, die über das Internet zugeschaltet werden können. Diese Art zu dolmetschen in Gebärdensprache nennt man ferndolmetschen.

Dieses Video hier zeigt eine sehr gute Demonstration der Einsatzbereiche:

Einsätze von VerbaVoice - Kommunikation ist immer und überall möglich

Wirklich interessant wird das Video aber erst ab der 02:24 Minute, weil da genau die Bereiche angesprochen werden, die angeblich durch den Einsatz von Kinect gewährleistet werden sollen. Und der nächste Beitrag ab 03:14 Minute ist ebenfalls interessant.

Ich hoffe, dass mein Blogbeitrag nun aufschlussreich Licht ins Dunkle bringen konnte, weswegen ich dem Einsatz von Kinect skeptisch gegenüber stehe. Die einzig möglichen Einsatzbereiche sind wie gesagt, sehr begrenzt.

Was ich mir vorstellen könnte, ist: Kinect wird am Flughafen und am Bahnhof eingesetzt, wo man fragen kann: "Entschuldigung, ich habe mein Gepäck verloren, wie komme ich zur Gepäckermittlungstelle?" Also so Sachen, wo die Gespräche sehr fixiert sind und einem bestimmtem Schema F folgen und nie daraus ausbrechen, das kommt dann der Logik der Computer entgegen.

Menschliche Kommunikation folgt aber nicht immer der Logik und das trifft auch auf die noch komplexere Gebärdensprache zu. :-)

Kommentare:

  1. WEnn das Ding so "gut" funktioniert wie andere Übersetzer, dann OMG!

    AntwortenLöschen
  2. Es wäre gut, wenn Du schon auf die Alternative VerbaVoice hinweist, auch erwähnst, dass Du für sie beruflich tätig bist. Transparenz fängt im Kleinen an ;-)

    AntwortenLöschen
  3. Habe ich doch. Wenn du nach rechts guckst, dann siehst du den Disclaimer, wo deutlich und klar steht, dass ich die Firma VerbaVoice unterstütze.

    AntwortenLöschen

Falls es nicht klappt zu kommentieren, kann man mir eine E-mail unter der Mailadresse im Blog hinterlassen - derzeit scheint Blogger damit Probleme zu haben. :-( P.S. Beleidigende und unsachliche Kommentare werden nicht freigeschaltet.