Senior Data Architect / Data Engineer (w/m/d) – Fokus NLP

Permanent employee, Full-time · Frankfurt am Main

Read job description in:
Über uns
statworx ist ein führendes Beratungs- und Entwicklungsunternehmen für Daten und KI mit Sitz in Frankfurt am Main. Wir bieten strategische Beratung für mittelständische Unternehmen und globale Konzerne. Wir entwickeln innovative Daten- & KI-Lösungen für alle Unternehmensbereiche und Tätigkeitsfelder. Wir befähigen Menschen auf allen Kompetenzniveaus mit unseren Daten- & KI-Bildungsformaten. Kurz gesagt: Wir unterstützen Unternehmen bei allen Aspekten der digitalen Transformation – seit mehr als 10 Jahren, in über 500 Daten- & KI-Projekten und für über 100 Kunden aus fast allen Industrien.
 
Unsere AI Development-Abteilung dient als Katalysator für Data & AI Transformation. Dabei setzen wir auf eine ganzheitliche Herangehensweise, die von der initialen Evaluierung der KI-Reife über die Konzeption und Ausarbeitung der Daten- und KI-Lösung bis hin zur praktischen Umsetzung und Skalierung von KI-Lösungen reicht. Durch unsere tiefgehende Expertise in Data Engineering, Data Science, Machine Learning sorgen wir dafür, dass unsere Kunden den maximalen Nutzen aus ihren Daten ziehen.

Deine Aufgaben
  • Du verbindest klassisches Data Engineering mit modernen NLP-Ansätzen – insbesondere im Umfeld von Large Language Models (LLMs), Embeddings, Knowledge Graphs, Retrieval-Augmented Generation (RAG) und Text-to-SQL-Anwendungen
  • Du konzipierst, entwickelst und betreibst moderne Datenarchitekturen, die die Basis für fortschrittliche NLP-Anwendungen bilden – von Knowledge-Management-Systemen über semantische Suchlösungen bis hin zu RAG-Use-Cases
  • Du arbeitest eng mit unseren Kund:innen zusammen, verstehst ihre fachlichen Anforderungen und Datenprozesse und entwickelst daraus maßgeschneiderte, skalierbare Daten- und KI-Lösungen
  • Du implementierst skalierbare Datenpipelines und -infrastrukturen, um große Mengen strukturierter und unstrukturierter Daten effizient bereitzustellen, zu transformieren und zu versionieren
  • Du stellst Datenqualität, -sicherheit und -governance über die gesamte Wertschöpfungskette sicher und etablierst Best Practices im Umgang mit sensiblen Daten in KI-Projekten
  • Du verantwortest den Aufbau und Betrieb skalierbarer Dateninfrastrukturen in Cloud-Umgebungen und automatisierst Deployments sowie Monitoring-Systeme, um Zuverlässigkeit und Verfügbarkeit sicherzustellen
  • Du berätst unsere Kund:innen und internen Teams strategisch zu Datenarchitekturen, Technologien, Tools und Best Practices und agierst als verlässliche:r Sparringspartner:in
  • Du unterstützt jüngere Kolleg:innen, teilst dein Wissen aktiv im Team und trägst durch Workshops, Blogbeiträge oder interne Talks zur Weiterentwicklung der Data-Engineering-Community bei statworx bei

Dein Profil
  • Du hast ein erfolgreich abgeschlossenes Masterstudium – z. B. in (Wirtschafts-)Informatik oder einem vergleichbaren Studiengang
  • Du bringst mindestens fünf Jahre einschlägige Berufserfahrung im Bereich Data Engineering oder Data Architecture mit
  • Du verfügst über ein tiefes Verständnis moderner Datenarchitekturen (Data Lakes, Lakehouses, Data Warehouses) und bist mit ETL-/ELT-Prozessen sowie Datenmodellierung bestens vertraut
  • Idealerweise hast du Erfahrung im Aufbau von Dateninfrastrukturen für NLP-Anwendungen – insbesondere im Umfeld von LLMs, Retrieval-Augmented Generation (RAG), Semantic Layern und Knowledge Graphs
  • Praktische Erfahrung mit Text-to-SQL-Systemen oder der Entwicklung von Schnittstellen zwischen natürlicher Sprache und Datenbanken ist ein Plus
  • Du hast Erfahrung mit Cloud-Plattformen (Azure, AWS oder GCP) und modernen Datenplattformen wie Databricks oder Snowflake
  • Du kennst dich mit Infrastructure-as-Code (z. B. Terraform, Pulumi) und CI/CD-Workflows (z. B. GitHub Actions, GitLab CI, Azure DevOps) aus
  • Du besitzt sehr gute Kenntnisse in Python, SQL und Bash/Shell und legst Wert auf sauberen, effizienten und wartbaren Code
  • Du verstehst die Bedeutung von Data Governance, Sicherheit und Datenschutz (z. B. DSGVO) und berücksichtigst diese Aspekte konsequent bei der Architekturplanung
  • Du kombinierst analytisches Denkvermögen mit der Fähigkeit, fachliche Anforderungen in technische Lösungen zu übersetzen, und kommunizierst sicher mit Stakeholdern auf allen Ebenen
  • Du sprichst fließend Englisch (in Wort und Schrift) und verfügst über fortgeschrittene Deutschkenntnisse – oder bist bereit, diese aktiv auszubauen
Das bieten wir Dir
  • Data Science- und KI-Beratung als Kerngeschäft: Dich erwarten spannende Projekte mit namhaften Kund:innen – von innovativen NLP-Use Cases bis hin zu anspruchsvollen Data-Science- und Machine-Learning-Anwendungen
  • Fachliche Tiefe und Vielfalt: Du arbeitest an komplexen, vielseitigen Fragestellungen und erweiterst dabei kontinuierlich deine Expertise in Data Science, Machine Learning und Künstlicher Intelligenz
  • Weiterentwicklung auf allen Ebenen: Wir fördern deine methodische, fachliche und persönliche Entwicklung – durch regelmäßiges Feedback, individuelle Förderung und unser Mentoring-Programm
  • Kultur und Zusammenarbeit: Dich erwartet ein offenes, diverses und wertschätzendes Arbeitsumfeld mit flachen Hierarchien, kurzen Entscheidungswegen und einem starken Teamgeist
  • Agile Arbeitsweise: Wir leben eine moderne, iterative Arbeitskultur mit klarer Kommunikation, Eigenverantwortung und Raum für neue Ideen
  • Transparente Vergütung: Wir bieten faire, nachvollziehbare Gehaltsstufen, die regelmäßig an Markt- und Leistungsentwicklungen angepasst werden
  • Flexibles Arbeiten: Unser modernes Office in Frankfurt ist dein zentraler Arbeitsort – gleichzeitig hast du die Möglichkeit, regelmäßig remote zu arbeiten und bis zu vier Wochen pro Jahr aus dem EU-Ausland zu arbeiten.
  • Mobilität & Gesundheit: Profitiere von einem ermäßigten Deutschlandticket und vergünstigtem Zugang zu Sport- und Wellnessangeboten über Wellpass
  • Ausstattung & Extras: Hochwertiges IT-Equipment (z. B. MacBook Pro), regelmäßige Team-Events und zusätzliche Leistungen wie Kinderbetreuungszuschüsse und attraktive Mitarbeiterrabatte runden dein Gesamtpaket ab
Deine Bewerbung
Bewirb Dich einfach über das Bewerbungsformular und hänge Deinen aktuellen Lebenslauf inklusive einer Darstellung Deiner Software- und Methodenkenntnisse an. Wir werden uns anschließend umgehend bei Dir melden. Bei Fragen rund um Deine Bewerbung oder die verschiedenen Einstiegsmöglichkeiten erreichst Du uns telefonisch unter +49-(0)69-6783-0676-5 oder unter jobs@statworx.com.

Was für uns besonders wichtig ist: Wir schätzen die Einzigartigkeit jedes Menschen und begegnen einander stets auf Augenhöhe. Unterschiedliche Hintergründe, Einstellungen und Ideen bereichern uns und bilden die Grundlage unseres Erfolgs. Daher freuen wir uns über jede Bewerbung – unabhängig von Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung, Alter sowie sexueller Orientierung und Identität.
About us
With deep expertise in Data Engineering, Data Science, and Machine Learning, we help our clients unlock the full potential of their data.statworx is a leading consulting and development company for data and AI, based in Frankfurt am Main. We offer strategic consulting for medium-sized businesses and global corporations. We develop innovative data and AI solutions across all business areas and corporate functions. We empower people at all levels of expertise with our data and AI education formats. In short: We support companies in all aspects of digital transformation – for over 10 years, in more than 1000 data and AI projects, and for over 100 clients from almost all industries.

Our AI Development department acts as a catalyst for data and AI transformation. We take a holistic approach that spans the entire journey — from assessing AI maturity to designing, developing, and scaling end-to-end data and AI solutions.
Your tasks
  • Combine classical data engineering with modern NLP approaches – particularly in the context of Large Language Models (LLMs), embeddings, knowledge graphs, Retrieval-Augmented Generation (RAG), and text-to-SQL applications
  • Design, develop, and operate modern data architectures that form the foundation for advanced NLP applications – from knowledge management systems and semantic search solutions to RAG use cases
  • Work closely with our clients to understand their business requirements and data processes, and translate them into tailored, scalable data and AI solutions
  • Implement scalable data pipelines and infrastructures to efficiently provide, transform, and version large volumes of structured and unstructured data
  • Ensure data quality, security, and governance along the entire value chain, and establish best practices for handling sensitive data in AI projects
  • Build and operate scalable data infrastructures in cloud environments, and automate deployments and monitoring systems to ensure reliability and availability
  • Provide strategic advice to clients and internal teams on data architecture, technologies, tools, and best practices, acting as a trusted advisor
  • Support and mentor junior colleagues, share your knowledge within the team, and contribute to the development of statworx’s data engineering community through workshops, blog posts, or internal talks

Your profile
  • You hold a Master’s degree in (Business) Informatics, Computer Science, or a related field
  • You have at least five years of relevant professional experience in data engineering or data architecture
  • You have a strong understanding of modern data architectures (Data Lakes, Lakehouses, Data Warehouses) and are experienced in ETL/ELT processes and data modeling
  • Ideally, you have experience building data infrastructures for NLP applications – especially in the context of LLMs, Retrieval-Augmented Generation (RAG), semantic layers, and knowledge graphs
  • Hands-on experience with text-to-SQL systems or developing interfaces between natural language and databases is a plus
  • You are experienced with cloud platforms (Azure, AWS, or GCP) and data platforms such as Databricks or Snowflake
  • You are familiar with Infrastructure-as-Code (e.g., Terraform, Pulumi) and CI/CD workflows (e.g., GitHub Actions, GitLab CI, Azure DevOps)
  • You have excellent programming skills in Python, SQL, and Bash/Shell, and you write clean, efficient, and maintainable code
  • You understand the importance of data governance, security, and privacy (e.g., GDPR) and incorporate these principles into your architectural design
  • You combine strong analytical thinking with the ability to translate business requirements into technical solutions and communicate effectively with stakeholders at all levels
  • You are fluent in English (written and spoken) and have advanced German skills — or are willing to actively improve them
Our offer
  • Data & AI consulting as our core business: Work on exciting projects with leading clients – from cutting-edge NLP use cases to complex data science and machine learning solutions
  • Depth and diversity: Engage with challenging, multifaceted problems and continuously expand your expertise in data science, machine learning, and AI
  • Continuous development: We support your professional and personal growth through regular feedback, tailored learning opportunities, and our mentoring program
  • Culture and collaboration: Experience an open, inclusive, and respectful working environment with flat hierarchies, short decision-making paths, and a strong sense of team spirit
  • Agile mindset: We embrace a modern, iterative way of working characterized by transparency, autonomy, and space for new ideas
  • Transparent compensation: Enjoy fair, structured salary bands that are regularly reviewed and adjusted to market developments
  • Flexible work setup: Our modern Frankfurt office is your main place of work – at the same time, you have the flexibility to work remotely on a regular basis and up to four weeks per year from within the EU
  • Mobility & well-being: Benefit from a subsidized Germany Ticket and discounted access to sports and wellness programs via Wellpass
  • Equipment & extras: High-quality IT equipment (e.g., MacBook Pro), regular team events, childcare support, and attractive employee discounts complete your package

Your application
Apply via the application form and upload your current CV including a description of your software and methodological skills. Afterwards, we will then contact you as soon as possible. If you have any questions concerning your application or our vacancies, you can reach us by telephone at +49-(0)69 6783-0676-5 or via jobs@statworx.com.  
 
What is particularly important to us is that we value the uniqueness of each individual and always treat each other as equals. Diverse backgrounds, attitudes, and ideas enrich us and form the basis of our success. That’s why we welcome every application – regardless of gender, nationality, ethnic and social origin, religion, ideology, disability, age, as well as sexual orientation and identity.  
Your application
Please apply using the application form below and attach your current CV including a description of your software skills and additional application documents if you like. We will get back to you as soon as possible. If you have any questions about your application or the various entry opportunities, you can reach us by phone on +49-(0)69-6783-0676-5 or via email to jobs@statworx.com.

What is particularly important to us is that we value the uniqueness of each person and always treat each other as equals. Different backgrounds, attitudes and ideas enrich us and form the basis of our success. We therefore welcome every application - regardless of gender, nationality, ethnic and social background, religion, ideology, disability, age, sexual orientation and identity.
Uploading document. Please wait.
Please add all mandatory information with a * to send your application.