Elektroniktillverkaren Xiaomi har presenterat projektet ”Own My Voice”, en egenutvecklad teknologi som gör det möjligt att anpassa text-to-speech-uppspelning med en personligt designad röst, snarare än en monoton, tydligt artificiell standardröst.
Projektet syftar dels till att förbättra upplevelsen i Xiaomis röstassistenter men man ser också andra viktiga användningsområden – framför allt ger det en möjlighet för människor som har problem med tal, exempelvis afasi eller svår stamning, att uttrycka sig via text på ett personligt sätt, och därmed förbättra deras kommunikation och förenkla inkludering för dessa grupper i arbetslivet och socialt.
Tekniken är utvecklad av Xiaomi AI Labs och rösten kan med hjälp av AI-teknik också förmedla naturliga språkmönster för intonation, pauser och hastighet.
Rösten genereras från en bank där fler än 200 volontärer donerat röster. För att säkerställa anonymiteten och dataintegriteten har rösterna i banken manipulerats för att skapa nya, unika röster men med ett mänskligt tonfall. Utifrån banken sker en matchning med användarens verkliga röst, vilket ger en grund som sedan kan personaliseras ytterligare.
”Om vi kan se och möta behoven för dessa grupper i ett tidigt stadium , kan vi minska tiden det tar för tekniken att spridas. Det gör att nyttan av nya teknologier blir tillgängliga för människor med särskilda behov snabbt”, säger Zhu Xi, talesperson för Xiaomis initiativ Tech for Good, i ett blogginlägg.
Projektet fortsätter med ytterligare forskning med förhoppningen att implementera tekniken i företagets produkter.