Over NPO
Omroep:
NPO Innovatie
Thema:
Artificiële Intelligentie
Status:
Verkenning
NPO Innovatie | Artificiële Intelligentie

Spraakwaterval

Verbetering Nederlands spraakmodel
Sinds de introductie van deep learning modellen hebben toepassingen van taal- en spraaktechonologie een vogelvlucht genomen. Steeds meer organisaties zien kansen in het verder automatiseren van klantenservices of het automatisch transcriberen van gesprekken, vergaderingen, programma's en presentaties. Dit alles wordt mede mogelijk gemaakt door het trainen van AI op grote en diverse datasets. Deze data is wel beschikbaar, maar ligt verspreid over verschillende organisaties en kan om een veelvoud van redenen niet samengevoegd en gedeeld worden: Spraak is de akoestische tegenhanger van een vingerafdruk, bevat allerlei indicatoren van gevoelige informatie over de spreker zoals diens geslacht, leeftijd, en medische aandoeningen, en bovendien kan de spraakdata zelf geclassificeerde informatie bevatten. Daarnaast mogen verschillende (spraak)datasets ook niet gedeeld worden over organisaties heen, omdat deze data middels een copyright of andere eigendomsrechten alleen in-house gebruikt mogen worden.

De vele ontwikkelingen op het gebied van privacy-enhancing techniques (PET) maken het mogelijk om op een efficiënte en veilige manier gezamenlijk data te kunnen gebruiken zonder elkaars data daadwerkelijk kunnen inzien. Dit project onderzoekt de mogelijkheden om met behulp van deze PET-technieken spraakdata van verschillende organisaties te gebruiken om uiteindelijk een Nederlandstalig spraakmodel te ontwikkelen dat niet alleen goed kan omgaan met Standaardnederlands, maar ook goed overweg kan met jargon, vaktaal, accenten, en dialecten. NPO werkt hierbij samen met TNO, de Nederlandstalige Spraakcoalitie, en CZ.

Projectoverzicht

Filter op:

Thema's