Uitdagingen bij voicebots

Posted on

2020-06-04

Zou het niet mooi zijn, een voicebot die automatisch antwoordt op vragen die gebruikers telefonisch stellen aan het contactcenter? Niet alleen wordt de vraag van de beller altijd correct herkend en wordt er een relevant antwoord gegeven via spraak in de taal van de beller, de bot is dan nog eens onvermoeibaar 24/7 beschikbaar en kan talloze bellers tegelijkertijd van antwoord dienen, zonder wachttijd. Callcenter agents kunnen zich toespitsen op het beantwoorden van de complexere vragen.

Niets dan voordelen lijkt het. Maar het voorzien van voicebots is niet zo eenvoudig. Er zijn enkele uitdagingen.

Spraak

Het fundamentele verschil tussen een chatbot en een voicebot is de spraak. In theorie komt het er eenvoudigweg op neer om de gesproken vraag om te zetten naar tekst, deze tekstuele vraag te voeden aan een chatbot en het tekstuele antwoord tenslotte terug om te zetten naar spraak. Het omzetten van spraak naar tekst (Speech-To-Text, STT) is echter niet zo eenvoudig. Systemen voor STT werken beter naarmate ze meer getraind worden. Voor het Engels is er veel trainingsmateriaal voorhanden en zijn de resultaten goed. Aangezien er voor het Nederlands minder trainingsmateriaal voorhanden is, is de kwaliteit van de omzetting iets minder goed.

De beperktere audiokwaliteit bij telefoongesprekken kan ook roet in het eten gooien bij het correct omzetten van spraak naar tekst. Voeg daarbij nog de mogelijke dialecten toe van de bellers en het wordt duidelijk dat de spraak niet altijd even goed begrepen wordt.

Intentie

Na de omzetting van spraak naar tekst is het de taak van de voicebot om de intentie van de beller te herkennen. Dit is in principe hetzelfde als bij een “klassieke” tekstuele chatbot, maar fouten in de omzetting van spraak naar tekst kunnen de intentieherkenning verstoren.

Als de intentie van de beller niet met voldoende zekerheid kan bepaald worden, dan is het noodzakelijk dat de beller kan doorgestuurd worden naar een menselijke agent. In elk geval verwacht de beller dat hij/zij geholpen wordt bij contactname met het contactcenter.

Om de kwaliteit van de voicebot te kunnen verbeteren is het cruciaal om feedback te vragen aan de beller. Een eenvoudige ja/nee vraag (“bent u geholpen?”) kan al belangrijke input leveren om de voicebot te verbeteren.

Scope

Een specifieke uitdaging bij voicebots is het aangeven van de scope: hoe maken we een beller duidelijk welke vragen hij kan stellen? Deze uitdaging stelt zich al bij tekstuele chatbots, maar is bij voicebots nog groter aangezien er helemaal geen scherm is om de opties te presenteren. Een mogelijkheid is om de scope in het begin aan te geven, eventueel met een voorbeeldvraag. Maar als er teveel mogelijkheden zijn, kan er voor gekozen worden om de beller volledig vrij zijn vraag te laten stellen. Als de vraag binnen de scope valt van de voicebot kan de bot de vraag onmiddellijk beantwoorden, zoniet kan er een transfer gebeuren naar een menselijke agent.

Personalisatie

Naast algemene vragen zou een voicebot ook kunnen antwoorden op specifieke dossiervragen, bijvoorbeeld “wanneer kan ik op pensioen?” Antwoorden op vragen over het eigen dossier vereisen dat de identiteit van de beller met voldoende zekerheid gekend is. Waar we de gebruiker bij een klassieke webtoepassing kunnen laten aanmelden met één van de digitale sleutels, is dat bij een telefoonoproep niet evident. Een minimale vorm kan erin bestaan om zich te baseren op het telefoonnummer van de beller. Voorwaarde is dat het telefoonnummer op voorhand gekoppeld werd aan het profiel van de beller. Een andere mogelijkheid is om een aantal vragen te stellen waar enkel de beller het antwoord op kent.

In het ideale geval kan de beller zich authenticeren op basis van zijn/haar stem; de beller hoeft dan geen expliciete actie te ondernemen. Dergelijke voice authentication vereist echter een zekere setup: er moeten voldoende geluidssamples verzameld worden om een voldoende betrouwbare voiceprint te kunnen opstellen. Dit is te vergelijken met het instellen van een fingerprint op een smartphone waarbij je meerdere keren een vinger op de lezer legt vanuit verschillende hoeken. Die voiceprint moet dan nog eens op een betrouwbare manier gekoppeld worden aan de juiste identiteit. Het is met andere woorden verre van evident om een beller op deze manier betrouwbaar te authenticeren.

Privacy

Het is mogelijk dat de conversaties van bellers met de voicebot een tijd bijgehouden worden voor analytische doeleinden. Er moet dan ook stilgestaan worden bij de geldende regels rond privacy, in het bijzonder omdat het gaat over stemopnames. Indien de omzetting van spraak naar tekst gebeurt op basis van een cloud service, is dit een bijkomend aandachtspunt.

Conclusie

Voicebots hebben het potentieel om de werklast van een contactcenter te verlichten en een betere service te bieden aan de beller. Dit is echter op voorwaarde dat de scope van de vragen waar de voicebot op kan antwoorden beperkt is, dat het gaat over algemene vragen (geen specifieke dossiervragen) en dat de spraakinput van voldoende kwaliteit is.

Dit is een ingezonden bijdrage van Bert Vanhalst, IT consultant bij Smals Research. Dit artikel werd geschreven in eigen naam en neemt geen standpunt in namens Smals.

Digital Twins in administratieve context

2026-05
Smals Research Webinar – Modernisering van legacy-projecten met AI

2026-05
“Talk to your data” avec ChatGPT

2026-04
Een “on-premise” Trusted Execution Environment gebruiken

2026-04

Uitdagingen bij voicebots

Spraak

Intentie

Scope

Personalisatie

Privacy

Conclusie

More posts

Digital Twins in administratieve context

Smals Research Webinar – Modernisering van legacy-projecten met AI

“Talk to your data” avec ChatGPT

Een “on-premise” Trusted Execution Environment gebruiken