Spreken is zilver, bewegen is goud. Of is het omgekeerd?
Als men het tegenwoordig over de futuristische alternatieven heeft om een computer te bedienen, komt bijna steeds als eerste de Minority Report film naar boven. In de lege ruimte maak je enkele sleep, roteer en wegwerp gebaren en holografische schermen gehoorzamen gedwee. Gek eigenlijk dat we dan die andere, toch veel oudere scifi klassieker van de computer waarmee je gewoon kan praten een beetje zijn vergeten. Misschien is dat omdat we in België nogal nare herinneringen overgehouden hebben aan spraaktechnologie? Meer waarschijnlijk is natuurlijk dat die Minority Report interface ons sterk doet denken aan een mashup tussen de Kinect en de iPhone & iPad bediening.
Als het van Microsoft afhangt is dit voor de nabije toekomst inderdaad de weg waarop we verder gaan en staan we binnenkort bij het geven van presentaties met onze armen te zwaaien om naar de volgende slide te gaan. Als het echter van Apple afhangt, komt die spraakherkenning terug in de kijker, en Siri is daar waarschijnlijk het voorsmaakje van.
Met de bewegingssensor zijn er nog wel wat problemen, en iedereen die ooit met de Wii, of met de Kinect iets gespeeld heeft zal dat wel weten. Maar net zo goed zijn er nog heel wat hindernissen met die natuurlijke spraak interface. Denk maar aan ondersteuning van talen; gaan we allemaal Engels moeten spreken, of komt er ondersteuning voor alle talen? Of wat met dialecten? Komt daarbij dat Siri, zoals zoveel andere van dit soort toepassingen, eigenlijk gewoon scant op bepaalde sleutelwoorden, of gekende zinnen, echt begrijpen is er zeker niet bij.
Dus, welke weg gaat het uiteindelijk uitgaan? Praten we straks tegen al onze toestellen, of staan we er naar te zwaaien? Het voor de hand liggende antwoord is natuurlijk dat het een combinatie van beide zal zijn. Spraakinterfaces zijn niet echt subtiel en dus niet geschikt voor in publieke plaatsen. Hoewel, als ik sommige mensen hoor telefoneren in het openbaar, denk ik niet dat subtiliteit bij hen hoog aangeschreven staat. Los daarvan is spraak ook niet echt handig voor visuele handelingen. Aan de andere kant is de interface op basis van handgebaren minder laagdrempelig dan gewoon vragen of zeggen wat je wil, behalve dan wanneer het fysieke handelingen betreft. Ik zou bijvoorbeeld liever hebben dat de chirurg de operatie uitbeeldt, dan dat hij alles moet beschrijven. Ook zaken waarbij meerdere gebruikers moeten of kunnen samenwerken, zullen waarschijnlijk eenvoudiger gaan via gebaren, dan via een kakofonie van gesproken commando’s.
Enfin, we zijn nog niet af van het gekende toetsenbord en bijhorende muis, maar we zijn mogelijk toch weeral een stap verder in de richting van de toekomst.
Thomas Verschueren
Werkt als Marketing & Communications Manager bij RealDolmen, maar schrijft hier volledig in eigen naam.
Twitter | Blog | LinkedIn
Reacties