'Wij ontzorgen softwareleveranciers in de zorg bij een gebruiksvriendelijke introductie van spraak-naar-tekst'

Welke stappen heb je genomen om het opnemen van spraak-naar-tekst van Attendi mogelijk te maken voor bestaande oplossingen?

Bij Attendi gebruiken we een API om audio te ontvangen en tekst te versturen. Wij hebben voor dit doel een gepaste API ontwikkeld die voldoet aan alle veiligheidsvereisten en eenvoudig geïmplementeerd kan worden in bijvoorbeeld het Elektronisch Cliënten Dossier (ECD).

Op dit moment hebben we een RTF (Return-Time-Factor) van ongeveer 5%. Dat wil zeggen als wij een rapportage ontvangen van 30 seconden dat de zorgprofessional het resultaat in 1.5 seconde ziet op het scherm. Om dit resultaat mogelijk te maken gebruiken we servers die geoptimaliseerd zijn voor het uitvoeren van zogenaamde vector berekeningen, daardoor gaat het verwerken van audio-data en het terugsturen van deze data door ons spraak-naar-tekst model sneller.

Aangezien domeinen in de zorg in taal aanzienlijk verschillen stelt Attendi per domein een apart model beschikbaar met een hoge nauwkeurigheid. We hebben er echter voor gekozen om maar één API te gebruiken. Zo is het makkelijker om te integreren en documenteren terwijl de leveranciers van softwareoplossingen voor de zorg wél eenvoudig kunnen schakelen tussen verschillende modellen op basis van het domein van de aangesloten zorginstellingen.

Hoe garandeer je zorginstellingen en softwareleveranciers dat er door Attendi vertrouwelijk wordt omgegaan met de data?

Attendi heeft voor de GGZ en voor de Woonzorg een nauwkeurigheid van 90%. Dit resultaat behaal je niet zomaar. Om de onderliggende modellen te kunnen optimaliseren hebben wij toegang nodig tot privacygevoelige data, wat in ons geval ingesproken rapportages zijn. Dit is dé uitdaging voor ons die we moeten oplossen om spraak-naar-tekst te leveren van hoge kwaliteit. Uiteraard voldoen we bij Attendi aan de hoogste compliance standaarden binnen de zorg, zoals de vereisten uit NEN7510 en ISO 27001. Toch zijn er specifiek extra risico’s als het gaat om het verwerken van uitgesproken rapportages en daar hebben we dan ook extra maatregelen voor genomen.

Onze API is zodanig ontworpen dat wij géén enkele toegang hebben tot data wanneer een softwareleverancier met onze API de oplossing integreert. Om onze modellen toch te kunnen trainen, starten we met een trainingsperiode. Tijdens deze periode maken wij met zowel de zorginstelling als de softwareleverancier afspraken over het gebruik van data voor het trainen van de modellen.

Als Attendi maken we géén gebruik van een bestaande spraak-naar-tekst oplossing zoals die van Google. De volledige technologie, van de spraak-naar-tekst tot en met de annotatie software voor het trainen, is in eigen huis ontwikkeld. Daardoor zijn we in volledige controle over de dataverwerking en kunnen we daarover transparante afspraken maken met onze partners. Het menselijk aspect hier is een groot risico. Ga je het annoteren van de data uitbesteden of doe je het zelf? Bij Attendi kiezen we ervoor om met vaste mensen te werken die bij ons in dienst zijn. We kunnen daardoor specifiek aangewezen personen tijdelijk toegang geven en hun activiteiten nauwgezet loggen. Daarnaast stelt het ons ook in staat om zelf de educatie te doen als het gaat om vertrouwelijk omgaan met privacygevoelige data.

Tot slot, wat voor advies zou je aan software leveranciers willen meegeven bij een implementatie van spraak-naar-tekst?

Voor een optimale integratie bieden we de API’s aan via twee soorten keys. Een secret key die als koppeling dient tussen onze servers en die van de softwareleverancier, en een public key waarmee de audio direct vanaf de gebruikersapplicatie gestuurd kan worden naar ons. Wij adviseren onze partners dan ook om gebruik te maken van de public key, zo ontvangt ons spraak-naar-tekst model sneller audiobestanden. Door het op deze manier te integreren ziet een zorgprofessional direct een resultaat met minimale vertraging.

Naast het leveren van een robuuste API beslaat een optimale gebruikerservaring van spraak-naar-tekst rapporteren veel meer. Zo moet het voor gebruikers bijvoorbeeld inzichtelijk zijn wanneer de opname start, gepauzeerd kan worden en wanneer er te veel omgevingsgeluid is. Wij hebben verschillende implementaties gedaan, waardoor we goed zicht hebben onder welke omstandigheden spraak-naar-tekst goed werkt voor zorgprofessionals. Deze kennis en herbruikbare componenten gebruiken we om partners te ontzorgen bij een zorgvuldige implementatie. Het is niet nodig dat iedere partner zelf opnieuw het wiel gaat uitvinden.

Wil je meer weten over hoe spraak-naar-tekst zorgvuldig kan worden opgenomen in jouw softwareoplossing? Neem dan contact met Arjan op.

Arjan Groenewegen - arjan@attendi.nl