TÁVKÖZLÉSI ÉS MÉDIAINFORMATIKAI TANSZÉK
Budapesti Műszaki és Gazdaságtudományi Egyetem - Villamosmérnöki és Informatikai Kar

Témák listája

Önfelügyelt akusztikus modellezés
Az önfelügyelt (vagy self-supervised) előtanulás, egy rendkívül hatékony módszer a mély neuronhálók beszédfelismerési és természetes nyelvfeldolgozási alkalmazásaiban, ahol felügyelt (címkézett) adatok nélkül javíthatjuk drasztikusan a különféle nyelvi/akusztikai felismerési/osztályozási feladatok pontosságát. A konkrét feladat a wav2vec2.0 transformer keretrendszer megismerése, és a legújabb eszközkészletek (HuggingFace, SpeechBrain vagy Fairseq) alkalmazása beszédfelismerési feladatokra. Javasolt előképzettség: Python programozás, deep learning alapok. Háttérinformáció: https://ai.facebook.com/blog/self-supervision-and-building-more-robust-speech-recognition-systems/
Témavezető: Dr. Mihajlik Péter