TÁVKÖZLÉSI ÉS MÉDIAINFORMATIKAI TANSZÉK
Budapesti Műszaki és Gazdaságtudományi Egyetem - Villamosmérnöki és Informatikai Kar

Automatic speech recognition for low-resource languages

Speech recognition technology has been used for a long time, but recognizing a speech accurately is a very difficult task. In this topic, we mainly use the conformer-ctc model provided by open-source toolkits (Nemo), and fine-tune the model to achieve better training results. If you are interested in automatic speech recognition, and have a good foundation in python, it is highly recommended that you choose this topic.
Témavezető: Meng Yan
Kapcsolódó oktatók: Dr. Mihajlik Péter
Kapcsolódó tárgyak:
  • Önálló laboratórium 1, Médiainformatika
  • Önálló laboratórium 2, Médiainformatika
  • Önálló laboratórium 1, Info, Msc,
  • Önálló laboratórium 2, Info, MSc,
  • Önálló laboratórium 2, Hálózatok és szolgáltatások
  • Önálló laboratórium 1, Hálózatok és szolgáltatások
  • TesztÖnlab kettő
  • Teszt önlab 3
  • Önálló laboratórium 1, MSc, Infokommunikációs rendszerek
  • Önálló laboratórium 2, MSc, Infokommunikációs rendszerek
  • Önálló laboratórium 1 Villamosmérnök, MSc,
  • Önálló laboratórium 2, Okos város, Vez.nélk. rendsz.
  • Teszt Önlab tárgy