OpenAI kondigt real-time Voice API aan tijdens hun Devday

Als onze marketing mensen hun werk goed gedaan hebben, heb je al een aantal keer use cases en voorbeelden van ons voorbij zien komen waarin we een AI model, een text-to-speech model en een transcriber (van spraak naar text) aan elkaar gekoppeld hebben zodat we een AI kunnen laten bellen.

We gebruiken dit nu in een aantal projecten, o.a. om afspraken in te plannen voor financieel adviseurs, accountmanagers in de auto hun CRM te laten bijwerken en bij een deurwaarder om de wachttijd voor het maken van een betaalregeling te verkorten.

De resultaten en met name de opgeleverde tijdsbesparing en efficiency waren al indrukwekkend. En het potentieel nog veel groter: terwijl een AI afspraken voor je inplant kan jij je richten op het goed voorbereiden en aandacht geven aan de afspraken zelf. Geheel in lijn met onze missie om mensen te bevrijden van saai, geestdodend, herhalend ‘computerwerk’ om ze weer vrij te maken voor écht mensenwerk!

Maar er waren ook duidelijke verbeterpunten, zo waren de gesprekken wat traag, was het nog niet heel makkelijk om elkaar snel te onderbreken en klonk de stem van de AI goed, maar zat er nog niet veel emotie in.

Als we OpenAI mogen geloven gaat dit rap veranderen!

OpenAI Real-time API

Misschien ben je een fanatieke gebruiker van de ChatGPT app en heb je Advanced Voice Mode al geprobeerd. Dan denk je nu waarschijnlijk: dit is in ChatGPT toch allemaal al opgelost? En dat klopt: met de nieuwe Voice Mode is praten met ChatGPT een stuk vlotter, natuurlijker en menselijker geworden! Die technologie komt nu ook beschikbaar om zelf te gebruiken in toepassingen. 🤓

OpenAI heeft dus een belangrijke toevoeging aan hun platform aangekondigd: de Real-time API, in eerste instantie met een Voice-model. Deze nieuwe API stelt ons in staat om snelle spraak-naar-spraak ervaringen in onze applicaties te integreren. Hierdoor hoeft spraak niet meer naar tekst omgezet te worden voordat een AI model erop kan reageren, om het vervolgens weer naar spraak om te zetten.

Een grote stap richting meer natuurlijke, soepel lopende gesprekken tussen mens en computer met veel potentieel voor allerlei nieuwe toepassingen.

Overigens wil OpenAI in een later stadium ook zaken als Vision en Video toevoegen aan de Real-time API.

Veel nieuwe use-cases

Met de aankondiging van deze nieuwe technologie, die overigens op het moment van schrijven nog niet publiek beschikbaar is, worden weer veel nieuwe toepassingen mogelijk. Denk aan klantenservice-bots die natuurlijker klinken en beter reageren op nuances in gesprekken. Of aan educatieve tools die real-time taallessen kunnen geven, waarbij de AI direct reageert op uitspraak en intonatie.

In dit voorbeeld wordt advanced voice mode gebruikt voor role-playing tijdens een training.

Kansen

Voor bedrijven betekent dit een kans om hun dienstverlening naar een hoger niveau te tillen. Stel je voor: een AI-assistent die moeiteloos afspraken plant, maar ook direct kan inspelen op veranderingen in je agenda. Of een virtuele receptionist die bezoekers verwelkomt en complexe vragen kan beantwoorden zonder merkbare vertraging.

In de retail zou deze technologie kunnen zorgen voor een persoonlijke shopping assistant die klanten telefonisch door het assortiment gidst, real-time productaanbevelingen doet en zelfs bestellingen kan plaatsen. Voor reis- en evenementenbureaus kan het leiden tot een virtuele reisplanner die niet alleen tickets boekt, maar ook direct reisadviezen geeft op basis van je voorkeuren en budget.

En wat dacht je van een AI-telefonist voor het MKB? Eentje die inkomende gesprekken afhandelt, afspraken inplant en basisvragen beantwoordt, zodat jij en je team zich kunnen focussen op het échte werk. Deze toepassingen zijn laagdrempelig, maar kunnen een enorm verschil maken in efficiency en klanttevredenheid.

Het mooie is: dit zijn nog maar de eerste ideeën. De echte innovatie zal komen wanneer bedrijven deze technologie gaan toepassen op hun specifieke uitdagingen. Waar liggen in jouw organisatie kansen om menselijk contact te verrijken met AI, zonder de persoonlijke touch te verliezen?

Kritische blik

Die persoonlijke touch is iets om scherp in het vizier te houden. Hoewel de voordelen van AI-stemtechnologie duidelijk zijn, is het cruciaal om een balans te vinden tussen efficiëntie en het behoud van waardevolle menselijke interacties. Automatisering kan veel tijd en kosten besparen, maar we moeten kritisch blijven kijken naar waar menselijk contact onvervangbaar is. Vooral in situaties waar empathie, nuance en persoonlijke aandacht essentieel zijn, zoals in de zorg of bij complexe klantvragen, blijft de menselijke touch onmisbaar.

Laten we dus samen op zoek gaan naar die use cases waar AI juist mensen vrij kan maken zodat zij die menselijke aandacht kunnen geven op de momenten waarop dat van cruciaal belang is.

Wij staan te popelen om samen met onze klanten te ontdekken hoe we deze nieuwe mogelijkheden kunnen inzetten om nog meer repetitief werk weg te nemen en ruimte te creëren voor écht waardevol mensenwerk. Want daar gaat het uiteindelijk om: technologie inzetten om mensen te versterken, niet te vervangen.

Benieuwd hoe jouw bedrijf kan profiteren van deze ontwikkelingen? Laten we er eens over sparren!

Vorige
Vorige

Hoe vaak staan de letters "AI" in jouw jaarplan voor 2025?

Volgende
Volgende

Kritische succesfactoren voor het toepassen van AI voor jouw bedrijf