Az Interspeech-konferencia a beszédtechnológiával foglalkozók legnagyobb és legrangosabb éves tanácskozása, amelyet az idén Szászország fővárosában, Drezdában rendeztek. A szervezők minden évben versenyt is kiírnak a résztvevőknek. A Computational Paralinguistic Challenge-en a feladat a beszédben rejlő információ kinyerése automatikus módszerekkel. A múlt években beszéd alapján kellett az alany véralkohol-szintjét megbecsülni, vagy azt, hogy mióta fut valaki a futópadon, milyen ételt rág a beszéde közben. Az idén a többi között a Parkinson-kór felismerése volt a cél a beszélő hangja alapján.
A szegedi csapat tagjai: Gosztolya Gábor és Tóth László, az MTA-SZTE Mesterséges Intelligencia Kutatócsoport tudományos munkatársa és -főmunkatársa, Grósz Tamás, az SZTE TTIK Informatikai Tanszékcsoport doktorandusz hallgatója és Busa-Fekete Róbert, a németországi Paderborni Egyetem oktatója. A szegedi kutatók nem először vettek részt a konferencián és a versenyen, amelyről a múlt években is példás eredményekkel tértek haza.
„A konferencia előtt egy-két hónappal egy honlapon adatbázist helyeznek el, ezen az adatbázison kell a résztvevőknek kísérletezni – mondta el Tóth László, az MTA-SZTE Mesterséges Intelligencia Kutatócsoport tudományos főmunkatársa. A verseny lényege a gépi tanulási algoritmusok használata. Tanítópéldákat adunk az algoritmusnak, az pedig automatikusan megtalálja az összefüggéseket. A nehézség általában a megfelelő algoritmus kiválasztása és finomhangolása. A hang felismerése ezután számítógépen keresztül egy szoftver segítségével történik” – tette hozzá a kutató.

