Als Multimodal AI PhD Intern arbeiten Sie an der Entwicklung innovativer Ansätze zur Detektion von KI-generierten Inhalten, die mehrere Datenmodalitäten wie Audio und visuelle Signale kombinieren. Ihr Fokus liegt auf der Erforschung und Implementierung neuer Verfahren, die tiefere Mustererkennung über Modalitäten hinweg ermöglichen, um manipulierte Inhalte präziser zu identifizieren.
Was Sie tun werden
- Entwickeln und testen Sie neuartige Methoden zur Erkennung generativer multimodaler Inhalte.
- Forschen Sie an Aufgaben der multimodalen Deepfake-Detektion und logischen Schlussfolgerung über Medien hinweg.
- Arbeiten Sie eng mit einem Team aus Forschenden zusammen, um Ideen zu diskutieren und weiterzuentwickeln.
- Verfassen Sie wissenschaftliche Berichte und bereiten Publikationen für renommierte Konferenzen und Zeitschriften vor.
- Implementieren und evaluieren Sie eigene Ansätze mit modernen Deep-Learning-Technologien wie Python, PyTorch und GPU-basierten Cloud-Ressourcen (z. B. AWS oder GCP).
Anforderungen
- Sie sind immatrikulierter Doktorand in einem technischen Fachgebiet und befinden sich idealerweise im dritten Jahr oder später Ihres Promotionsprogramms.
- Sie bringen Erfahrung in multimodalem maschinellen Lernen mit, insbesondere in Bereichen wie audio-visuelle Klassifikation oder audio-sprachliche Schlussfolgerung.
- Sie verfügen über fundierte Kenntnisse in Python und der Entwicklung von Deep-Learning-Modellen mit PyTorch.
- Sie haben bereits peer-reviewed Publikationen in anerkannten KI- oder Sprachverarbeitungskonferenzen wie CVPR, NeurIPS, ACL oder Interspeech veröffentlicht.
- Sie sind motiviert, an der Weiterentwicklung einer umfassenden Plattform zur Erkennung


