Próbka głosu pozwoli zdiagnozować chorobę i wykryć niebezpieczeństwo. Nad rozwojem technologii pracuje polska firma

W ciągu ostatnich lat światowy rynek analizy mowy notuje szybki wzrost. Rozwój algorytmów Big Data i głębokiego uczenia się w połączeniu ze wzrostem mocy obliczeniowej sprawił, że możliwości analizy mowy są znacznie większe. Dla działów sprzedaży, marketingu i usług technologia analizy mowy oznacza wzrost przychodów i wydajności. To także korzyści dla samych użytkowników – technologia po samym głosie może zdiagnozować chorobę, a nawet stwierdzić, czy znajdujemy się w niebezpieczeństwie.

– Technologia analizy mowy oznacza np. wykrywanie różnego rodzaju przestępstw lub nadużyć w dużej liczbie rozmów telefonicznych, takich jak wyciek danych osobowych czy niewłaściwy sposób prowadzenia sprzedaży przez telefon. Drugi typowy przykład to ustalanie, dlaczego dany sprzedawca jest najlepszy, co powoduje jego sukces. To zaś wsparcie dla pozostałych sprzedawców, żeby mogli to robić lepiej – mówi agencji Newseria Innowacje dr hab. Bartosz Ziółko, prezes Techmo.

Technologia rozpoznawania może przełożyć się na dużą korzyść biznesową, przede wszystkim w obsłudze klienta, rezerwacjach telefonicznych czy ankietowaniu respondentów. Analiza mowy umożliwia takim firmom efektywne gromadzenie, porządkowanie i analizowanie dużych ilości danych o klientach i potencjalnych klientach.

– Analityka mowy dotyczy zarówno tonu wypowiedzi, emocji, słów kluczowych, może też pójść w trochę szerszy kontekst, np. jaki jest odbiorca, jaki jest jego profil – wskazuje dr hab. Bartosz Ziółko.

Technologia automatyzuje szereg procesów operacyjnych, w tym nagrywanie rozmów, rozpoznawanie mowy i transkrypcję, wyszukiwanie według słów kluczowych czy zarządzanie jakością rozmów. Za pomocą rozwiązań do analizy mowy wszystkie te procesy są wykonywane z większą szybkością i na wyższym poziomie niż w przypadku jakiegokolwiek systemu analizy danych, który obsługuje człowiek.

– Sprawny operator jest w stanie oglądać prawie 10 monitorów, obraz wideo może być przyspieszony dwukrotnie. Jednak w wypadku analizy mowy to nie jest możliwe. Jedna godzina analizy audio wymaga jednej godziny pracy człowieka, a więc jest to raczej nierealne w praktyce. Biorąc pod uwagę duże call center w Polsce, gdzie około tysiąc osób pracuje jednocześnie, musiałoby być drugie tysiąc osób, które to kontroluje, dlatego tutaj systemy informatyczne są kluczowe – przekonuje prezes Techmo.

Alexa Amazona czy Cortana Microsoftu to tylko przykłady narzędzi aktywowanych głosem. Systemy do analizy mowy, ale też takie, które można sterować poleceniami, są rozbudowane przede wszystkim w języku angielskim. W Polsce jeszcze stosunkowo mało jest nowoczesnych technologii, które bazowałyby na języku polskim – rozpoznawały mowę potoczną czy związki frazeologiczne. Może to zmienić polska firma Techmo.

–  Dla firm amerykańskich, globalnych, polski rynek nie jest aż tak duży, dlatego często nie chcą aż tyle czasu i energii poświęcać na dopracowanie tych narzędzi. Techmo w dużej mierze inwestuje w zrobienie tego typu rozwiązań skutecznych dla języka polskiego – wskazuje dr hab. Bartosz Ziółko.

Techmo umożliwia komunikację między inteligentnymi urządzeniami czy między budynkami a użytkownikami. Maszyny można też nauczyć rozpoznawać choroby i identyfikować ryzyko ich wystąpienia wyłącznie na podstawie głosu. To narzędzie nie do przecenienia w telemedycynie. Naukowcy ustalają takie parametry mowy i oddechu podczas mowy, które są charakterystyczne dla danej choroby, a sztuczna inteligencja jest w stanie je rozpoznać tylko na podstawie próbki głosu.

Co istotne, narzędzia do analizy głosu potrafią ocenić, czy dana osoba znajduje się w niebezpieczeństwie – badają nie tylko tembr głosu, ale też użyte słowa. Na tej podstawie niemal bezbłędnie są w stanie określić, czy nie grozi nam niebezpieczeństwo. Takie technologie stosują już organy policji w kilku krajach, na razie w ramach pilotażu, ale być może narzędzie wejdzie do szerszego użycia.

Techmo oferuje technologię analizy mowy przystosowaną do języka polskiego. Może to zrewolucjonizować rozwój innowacyjnych narzędzi. Skorzystają na tym zwykli użytkownicy, ale także i polskie firmy będą mogły zwiększyć konkurencyjność na globalnym rynku.

– Coraz więcej rzeczy załatwiamy przez telefon głosowo i będzie coraz więcej różnego rodzaju komplikacji, od prostych rzeczy jak np. reklamacje, po różnego rodzaju kontrole pracowników pracujących przez telefon, gdzie pracodawca chce mieć obraz, co np. 200 pracowników de facto zrobiło, jaka jest ich skuteczność, czy zachowywali procedury, które były ustalone. Informacja w ogóle jest coraz cenniejszym dobrem i będzie coraz bardziej oczekiwana w systemach audio – ocenia prezes Techmo.

Top