Masterarbeit »Einsatz von Large Language Models (LLMs) zum Data Profiling in Datenkatalogen«
Dortmund, DE, 44147
Fraunhofer-Gesellschaft
Die Fraunhofer-Gesellschaft mit Sitz in Deutschland ist die weltweit führende Organisation für anwendungsorientierte Forschung. Mit ihrer Fokussierung auf zukunftsrelevante Schlüsseltechnologien sowie auf die Verwertung der Ergebnisse in...Deine Chance auf einen unterstützenden Praxispartner mit einem hochrelevanten Thema für Deine Masterarbeit!
Am Fraunhofer-Institut für Software- und Systemtechnik ISST in Dortmund leisten wir angewandte Spitzenforschung für den Digitalisierungsstandort Europa. Unsere Leidenschaft gilt der Welt der Daten: Wir streben danach, den Wert der Ressource »Daten« voll auszuschöpfen und Datengebenden in Datenräumen (Data Spaces) einen souveränen Umgang mit ihren Daten zu ermöglichen. Dabei setzen wir Standards für eine faire Datenökonomie in Bereichen wie Mobilität, Industrie und Gesundheitswesen. In wegweisenden Projekten schaffen wir innovative Digitalisierungslösungen mit nachhaltigem Mehrwert für die Gesellschaft und Wirtschaft in Deutschland und Europa.
Unsere Mobilität und unsere Städte befinden sich im Wandel. Trends wie die Verkehrswende, der Klima- und demographische Wandel sowie der Wunsch nach mehr Nachhaltigkeit und Lebensqualität, erfordern neue, intelligente Ansätze. In der Abteilung »Mobility & Smart Cities« nutzen wir unsere Kompetenzen und Technologien in den Bereichen Data Sharing und Datenmanagement, um zur Lösung dieser Herausforderungen beizutragen.
Hochrelevante Themen dabei sind Datenkataloge und Large Language Models (LLMs). Um die passenden Daten für die eigenen Unternehmungen zu finden, setzen immer mehr Unternehmen auf Datenkataloge. Datenkataloge speichern Metadaten über Daten und machen diese für Nutzer durchsuchbar. Die Qualität des Suchergebnisses hängt stark von der Verfügbarkeit und Qualität der Metadaten ab. Aufgrund stetig steigender Datenmengen, die in einem Datenkatalog inventarisiert werden müssen, ist ein manuelles Pflegen der Metadaten nicht sinnvoll. Es bedarf an Automatismen, um die Metadaten zu sammeln und zu bestimmen. Häufig ist es jedoch so, dass klassische Algorithmik hierbei an ihre Grenzen stößt. Large Language Models (LLMs) wie etwa ChatGPT können hier einen neuen Ansatzpunkt bieten, die Pflege der Metadaten zu unterstützen.
Du bist kurz vor Abschluss Deines Masterstudiums und suchst nach einem Praxispartner mit einem hochrelevanten Thema für Deine Abschlussarbeit? Du interessierst Dich für die Welt der Daten und einen sinnvollen und effizienten Umgang mit (Meta-)Daten? Dann schreibe Deine Masterarbeit an unserem Institut und profitiere von unserem Wissen und unserer Unterstützung.
Was Du bei uns tust
Ziel der Masterarbeit ist es, zu identifizieren, inwiefern Large Language Models (LLMs) eingesetzt werden können, um Metadaten für den Datenkatalog zu erzeugen und zu pflegen. Dabei liegt der Fokus auf denjenigen Metadaten, die auch von DCAT, einem Standardvokabular rund um Datenkataloge, erfasst werden.
Mögliche Aufgaben, die Du im Rahmen deiner Masterarbeit bearbeiten kannst:
- Analyse existierender Literatur zum Thema Prompt Engineering
- Identifikation von Anwendungsfällen, in denen LLMs die Metadatengenerierung unterstützen können
- Entwicklung eigener Prompts, die für die Generierung von Metadaten sinnvoll wiederverwendet werden können
- Evaluierung der LLM-Metadaten gegenüber dem, was klassische Algorithmen oder die manuelle Eingabe leisten
Was Du mitbringst
- Ein laufendes Masterstudium in Wirtschaftsinformatik, Wirtschaftsingenieurwesen, Wirtschaftswissenschaften, Informatik oder einer vergleichbaren Fachrichtung
- Erste Erfahrung mit Prompt Engineering (Zero-shot, Few-shot, CoT, ToT Prompting)
- Idealerweise erste Erfahrungen im Bereich Datenmanagement
- Einen teamorientierten, sorgfältigen und eigenverantwortlichen Arbeitsstil
- Gutes Deutsch und Englisch in Wort und Schrift
Was Du erwarten kannst
- Zukunftsgestaltende Tätigkeiten an der Schnittstelle von Wissenschaft und Wirtschaft
- Die Möglichkeit, Deine Masterarbeit zu einem hochrelevanten und zukunftsweisenden Thema zu verfassen
- Arbeit in einem aufgeschlossenen und engagierten Team mit offener Atmosphäre und flachen Organisationsstrukturen
- Viel Freiraum zur Gestaltung und Umsetzung eigener innovativer Ideen
- Persönliche Betreuung und Unterstützung, wobei Du von unserem großen Erfahrungsschatz profitierst
Wir wertschätzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrüßen daher alle Bewerbungen – unabhängig von Alter, Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und Identität. Schwerbehinderte Menschen werden bei gleicher Eignung bevorzugt eingestellt.
Die Stelle ist zunächst auf 6 Monate befristet.
Mit ihrer Fokussierung auf zukunftsrelevante Schlüsseltechnologien sowie auf die Verwertung der Ergebnisse in Wirtschaft und Industrie spielt die Fraunhofer-Gesellschaft eine zentrale Rolle im Innovationsprozess. Als Wegweiser und Impulsgeber für innovative Entwicklungen und wissenschaftliche Exzellenz wirkt sie mit an der Gestaltung unserer Gesellschaft und unserer Zukunft.
Haben wir Dein Interesse geweckt? Dann bewirb Dich jetzt online mit Deinen aussagekräftigen Bewerbungsunterlagen. Wir freuen uns darauf, Dich kennenzulernen!
Fragen zu dieser Position beantwortet Dir gerne:
Daniel Tebernum
daniel.tebernum@isst.fraunhofer.de (Achtung: Diese E-Mail-Adresse kann nur für Rückfragen genutzt werden)
Es können nur Bewerbungen über unser Online-Bewerbungsportal angenommen werden (Button »Jetzt bewerben« am Seitenende). Bewerbungen per E-Mail oder Post können wir leider nicht berücksichtigen.
Fraunhofer-Institut für Software- und Systemtechnik ISST
Kennziffer: 72853 Bewerbungsfrist:
* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰
Tags: ChatGPT Computer Science Engineering GPT LLMs Prompt engineering
More jobs like this
Explore more AI, ML, Data Science career opportunities
Find even more open roles in Artificial Intelligence (AI), Machine Learning (ML), Natural Language Processing (NLP), Computer Vision (CV), Data Engineering, Data Analytics, Big Data, and Data Science in general - ordered by popularity of job title or skills, toolset and products used - below.
- Open MLOps Engineer jobs
- Open Data Science Manager jobs
- Open Data Manager jobs
- Open Lead Data Analyst jobs
- Open Senior Business Intelligence Analyst jobs
- Open Principal Data Engineer jobs
- Open Data Engineer II jobs
- Open Power BI Developer jobs
- Open Sr Data Engineer jobs
- Open Data Scientist II jobs
- Open Data Analytics Engineer jobs
- Open Business Intelligence Developer jobs
- Open Product Data Analyst jobs
- Open Junior Data Scientist jobs
- Open Business Data Analyst jobs
- Open Sr. Data Scientist jobs
- Open Data Analyst Intern jobs
- Open Senior Data Architect jobs
- Open Big Data Engineer jobs
- Open Principal Data Scientist jobs
- Open Junior Data Engineer jobs
- Open Manager, Data Engineering jobs
- Open Data Product Manager jobs
- Open Data Quality Analyst jobs
- Open Azure Data Engineer jobs
- Open Data quality-related jobs
- Open GCP-related jobs
- Open Business Intelligence-related jobs
- Open Java-related jobs
- Open ML models-related jobs
- Open Data management-related jobs
- Open Privacy-related jobs
- Open Data visualization-related jobs
- Open Deep Learning-related jobs
- Open Finance-related jobs
- Open PhD-related jobs
- Open PyTorch-related jobs
- Open TensorFlow-related jobs
- Open APIs-related jobs
- Open NLP-related jobs
- Open Consulting-related jobs
- Open Snowflake-related jobs
- Open CI/CD-related jobs
- Open LLMs-related jobs
- Open Generative AI-related jobs
- Open Kubernetes-related jobs
- Open Hadoop-related jobs
- Open Data governance-related jobs
- Open Airflow-related jobs
- Open DevOps-related jobs