TÁVKÖZLÉSI ÉS MÉDIAINFORMATIKAI TANSZÉK
Budapesti Műszaki és Gazdaságtudományi Egyetem - Villamosmérnöki és Informatikai Kar

Felügyelet nélküli akusztikus modellezés GAN használatával

A gépi beszédfelismeréshez (automatikus szövegleiratozáshoz) hagyományosan nagy mennyiségű hangra és hozzá tartozó szöveges leiratra van szükség. Ennek előállítása drága és időigényes. Az újabb, önfelügyelt tanításon alapuló megközelítések lehetővé tették a leiratmentes akusztikus előtanítást, így csupán egy pár órányi felügyelt tanítás is elegendő a beszédfelismerő betanításához. Ennél is továbbmegy a teljesen felügyelet nélküli tanítás: csupán írott szöveg alapján GAN (Generative Adversarial Network) segítségével sikerült a META (FB) kutatóinak "rávenni" az előtanított akusztikus modelleket a hang szöveges leiratozására. Magyar nyelvre szeretnénk a világon elsőként ilyen rendszer készíteni, amibe lehetőség van bekapcsolódni. Python programozási és deep learning ismeretek előnyt jelentenek. https://ai.facebook.com/blog/wav2vec-unsupervised-speech-recognition-without-supervision/
Kapcsolódó oktatók: Dr. Mihajlik Péter
Kapcsolódó tárgyak:
  • Info, BSc, Önálló laboratórium
  • Önálló laboratórium, VIR BSc szakirány
  • Önálló laboratórium, Infokommunikációs hálózatok szakirány
  • Önálló laboratórium, Médiainformatika és -biztonság szakirány, Médiainformatika ágazat
  • Önálló laboratórium 1, Médiainformatika
  • Önálló laboratórium 2, Médiainformatika
  • Önálló laboratórium 1, Info, Msc,
  • Önálló laboratórium 2, Info, MSc,
  • Önálló laboratórium 2, Hálózatok és szolgáltatások
  • Önálló laboratórium 1, Hálózatok és szolgáltatások
  • TesztÖnlab kettő
  • Teszt önlab 3
  • Önálló laboratórium 1, MSc, Infokommunikációs rendszerek
  • Önálló laboratórium 2, MSc, Infokommunikációs rendszerek
  • Önálló laboratórium 1 Villamosmérnök, MSc,
  • Önálló laboratórium 2, Okos város, Vez.nélk. rendsz.
  • Teszt Önlab tárgy
  • Önálló laboratórium
  • Önálló laboratórium, Infokommunikációs rendszerek szakirány