Du bekommst spannende Aufgaben!
Optimierung der RAG-Pipeline
Bewertung, Überwachung und kontinuierliche Verbesserung der Performance unserer Retrieval-Augmented-Generation (RAG) Pipeline, um qualitativ hochwertige Antworten auf juristische Anfragen sicherzustellen.
Prototypisierung, Evaluierung und Weiterentwicklung unserer RAG-Pipeline zur Steigerung von Antwortgenauigkeit, Geschwindigkeit und Kosteneffizienz.
Feinabstimmung großer Sprachmodelle (LLMs), um Präzision und Relevanz bei der Beantwortung juristischer Fragestellungen sicherzustellen.
Datenpipelines & Datenverarbeitung
Entwurf, Implementierung und Wartung robuster ETL-Pipelines für eine nahtlose Datentransformation.
Optimierung von Workflows zur Speicherung und Verwaltung geparster Inhalte in einer Vektordatenbank, um eine effiziente Informationsabfrage zu ermöglichen.
AI/ML-Integration
Entwicklung und Verbesserung von Embedding- und Chat-Modellen zur Optimierung der Nutzererfahrung.
Enge Zusammenarbeit mit dem Software-Engineering-Team zur nahtlosen Integration von AI / ML-Komponenten in die übergeordnete Produktarchitektur.
Produktivbetrieb & Betrieb
Deployment von LLMs und zugehörigen Modellen in der Produktionsumgebung unter Nutzung der Azure-Cloud-Infrastruktur, um optimale Performance und Zuverlässigkeit zu gewährleisten.
Zusammenarbeit mit dem Operations-Team zur Automatisierung des Modell Deployments mittels Terraform und weiteren CI/CD-Tools, um Skalierbarkeit und Effizienz sicherzustellen.