TÁVKÖZLÉSI ÉS MÉDIAINFORMATIKAI TANSZÉK
Budapesti Műszaki és Gazdaságtudományi Egyetem - Villamosmérnöki és Informatikai Kar

COMPUTER VISION AND NATURAL LANGUAGE PROCESSING IN MACHINE LEARNING

Computer vision (CV) and Natural Language Processing (NLP) are two main subfields of machine learning, and a lot of research is going on there. These two subfields overlap together in tasks such as text generation out of image (image2text) or vice-versa (text2image). A new subfield has emerged, i.e. Story Visualization, with the help of the advancement of GANs and Diffusion models. The task of the student(s) is to explore Story Visualization topic by investigating and utilizing the state-of-the-art models in the field. No. of students: 1 - 3 contact email: alshouha@edu.bme.hu
Kapcsolódó oktatók: Modafar Mohammad Mahmood Al-Shouha
Kapcsolódó tárgyak:
  • Info, BSc, Önálló laboratórium
  • Önálló laboratórium, VIR BSc szakirány
  • Önálló laboratórium 1, Médiainformatika
  • Önálló laboratórium 2, Médiainformatika
  • Önálló laboratórium 1, Info, Msc,
  • Önálló laboratórium 2, Info, MSc,
  • Önálló laboratórium 2, Hálózatok és szolgáltatások
  • Önálló laboratórium 1, Hálózatok és szolgáltatások