AIVA - AI Voice Assistant

UX Design

Projektart

UX Design

Jahr

2024

WErkzeuge

Microsoft Excel, R Studio, PowerPoint, Miro

View project

Das AIVA-Projekt diente in erster Linie dazu, Test- und Evaluierungsmethoden in der UX-Forschung zu erlernen. Anhand der Entwicklung eines intuitiven Sprachassistenten für Senior:innen im Kontext autonomer Busse setzten wir einen iterativen Designprozess um.

Formative Tests

Unser Projekt begann mit einer Wettbewerbsanalyse bestehender Lösungen im Bereich autonomer Busse, speziell für Senior:innen mit begrenzten technischen Vorkenntnissen. Schnell wurde klar, dass unser Konzept innovativ war – es gab kaum KI-gestützte Systeme mit diesem Fokus.

Nach der Research-Phase entwickelten wir einen Low-Fidelity-Papierprototyp für AIVA, den wir in einer formativen Nutzerstudie mit sieben Teilnehmenden testeten. Mithilfe eines szenariobasierten Cognitive Walkthroughs und der Think-Aloud-Methode konnten wir die Nutzerinteraktionen in Echtzeit beobachten und qualitative Daten zu Erwartungen und mentalen Modellen sammeln.

Die Tests deckten Schwächen in der Informationsarchitektur und im Icon-Design des Dashboards auf, die wir in der nächsten Iteration verbesserten. Zudem zeigte sich ein geringes Vertrauen in sprachgesteuerte KI – ein kritischer Faktor für unsere Zielgruppe.

‍

High-Fidelity Prototyping

Basierend auf dem ersten Testing und Nutzerfeedback entwickelten wir einen High-Fidelity-Prototyp und führten eine zweite Usability-Studie mit 14 Teilnehmenden durch. Die Tests umfassten vier Kernaufgaben, um Sprachinteraktion und manuelle Eingabe via Bildschirmtastatur direkt zu vergleichen.

Zur summativen Evaluation setzten wir standardisierte Methoden ein:

‍

System Usability Scale (SUS)
NASA Task Load Index (NASA-TLX-raw)
User Experience Questionnaire (UEQ)

‍

Datenanalyse

Die gesammelten Daten wurden in zwei Altersgruppen (>60 und <60) segmentiert und anhand der offiziellen Metriken in Microsoft Excel ausgewertet. Für die Visualisierung habe ich R Studio verwendet und konnte meine Kenntnisse in diesem Tool erweitern und die Möglichkeiten schätzen lernen. Zuvor habe ich hauptsächlich JMP genutzt. Durch meinen Informatikhintergrund fiel es mir leicht, mich in R einzuarbeiten und eigene Scripte zu erstellen.

‍

Zentrale Erkenntnisse:

- SUS-Werte zeigten eine nahezu exzellente Usability.

- NASA-TLX: Die Aufgabe „Sie sind unsicher, wie Sie das System nutzen – was tun Sie?“ verursachte eine hohe kognitive Belastung (40,1), besonders bei älteren Nutzer:innen. Grund war die Verwechslung von „Hilfe“- und „Sprachassistent“-Icons.

- Manuelle Zieleingabe (9,0) hatte eine geringere Arbeitslast als Sprachsteuerung (22,0).

- UEQ-Werte: Positive Gesamtbewertung (0,9), wobei pragmatische Qualität (1,12) höher abschnitt als hedonische (0,66).

- Ältere Teilnehmende hatten Schwierigkeiten, das Konzept eines Prototyps zu verstehen – ein Hinweis für klarere Briefing-Protokolle.

‍

Reflexion

Unser datengetriebener Ansatz lieferte wertvolle Erkenntnisse über Nutzererwartungen und Herausforderungen im Umgang mit sprachgesteuerten KI-Systemen, insbesondere in autonomen Fahrzeugen. Die enge Zusammenarbeit im Team, kombiniert mit Research, visuellem Design und Testing, ermöglichte die Entwicklung eines Prototyps, der gezielt auf die Bedürfnisse unserer Zielgruppe eingeht.