Python Data Science Engineer
Mechelen, Belgium
Talan
Nous croyons que seule une pratique humaniste de la technologie fera du nouvel âge numérique une ère de progrès pour tous. Engageons-nous ensembleCompany Description
Passionate about digital, data, IoT or AI and willing to join a dynamic and ambitious team on a human scale?
For more than 15 years, we have been advising companies and administrations and supporting them in the implementation of their transformation projects in Brussels and abroad.
To do so, we rely both on technological leverage and on the strength of our DNA based on collective intelligence, agility and entrepreneurial spirit.
With a presence on five continents and more than 4,000 employees, our goal is to reach more than a €1 billion revenue by 2024. Innovation is at the heart of our development and we are involved in areas linked to the technological changes of major groups, such as Big Data, IoT, Blockchain and Artificial Intelligence.
Our values & playfields:
- Intelligence collective
- Agility
- Entrepreneurship /Intrapreneurship
- Promote diversity/mixity (Support to the Fondation femmes@Numerique...)
- Commitment (employees, partners, schools, associations...)
- Respect for human beings and quality of life at work
- Open-mindedness and inclusiveness
Together, let’s build Talan’s future.
Job Description
Je werkt mee aan de uitbouw van onze data pipelines binnen ons big data platform. Je komt in een agile team met de mentaliteit van een startup. Je bent een goede data engineer en hebt de kennis en attitude om in enterprise grade data solutions development (ci/cd, unittesting, pr reviews) mee te bouwen. Je kunt naast de technische ontwikkeling van pipelines ook begrijpen hoe je value uit deze data kan halen. Je kunt exploratief eerst inzichten verwerven en kunt productiewaardige data solutions bouwen. Je kunt overweg met statistische en AI modellen. Open constructief inhoudelijk en technisch bijsturen is in je natuur. Je hebt ervaring met technische integraties en kunt hier in mee denken/bouwen (api, event based, pipeline sheduling en transaction handling…). Je denkt functioneel sterk mee en durft te sturen. Je bent minstens 2/5 beschikbaar om on-site in Mechelen het team te versterken.
Qualifications
Contexte technique
Aantoonbare praktische kennis van data science and machine learning algorithms. Gebruikt in praktische context met data vervuiling, time constraints en onzekerheid. Kunnen omzetten van spikes naar b2c waardige services eg druktebarometer, recommendations, …
Je kunt functionele problemen omzetten in een target solution en kunt hier gidsen met je expertise in design van data producten.
Je bent pragmatisch om good enough solutions te bouwen en niet voor alles fancy AI te kiezen (eg soms is een heuristiek genoeg)
Je ontwikkelt volledig mee en bent niet vies van het designen, bouwen en deployen van een set aan batch data applicaties in spark / azure batch
Ervaring in workflow mgmt en job scheduling van data loads (airflow, azure data factory)
Ervaring in real time data streaming en verwerking is een plus (azure functions / event hubs / streaming analytics)
Ervaring in cloud Azure is een plus. Algemene cloud ervaring is een must
Kennis van ETL voor grote data sets op gedistribueerde systemen
Doorgedreven kennis in programmeertalen (python, sql, hcl, ...) en in het exposen van data (API, sql server, event streams,..)
Ervaring met data exploratie: Jupyter notebooks, dashboarding ... en het waarde halen uit data. We verwachten dat je door eigen analyses en inzichten business opportuniteiten of service verbeteringen kunt identificeren. Je hebt voldoende durf om nieuwe assumpties naar voor te brengen. Je hebt aantoonbare ervaring om business rules en complexiteiten te kunnen afwegen
Ervaring met ETLs met complexe aggregaties, deduplicatie en joins
Kennis en goesting om te werken in een context van build automatisatie en devops CI/CD tooling: git, Terraform/ARM templates, Circle CI. We gaan meerdere keren per dag naar productie met verschillende producten.
Contexte d'affaires
We wensen bij De Lijn de klantenkennis op te bouwen om verder onze service te verbeteren. Zowel outbound in intelligente interacties met onze klanten, als bedrijfsmatig in een meer gerichte inzet van investeringsmiddelen om ons aanbod beter op de vraag af te stemmen.
Additional Information
DUTCH speaking
Tags: Agile Airflow APIs Azure Big Data Blockchain CI/CD Data pipelines DevOps ETL Git Jupyter Machine Learning Pipelines Python Spark SQL Streaming Terraform
Perks/benefits: Startup environment
More jobs like this
Explore more AI, ML, Data Science career opportunities
Find even more open roles in Artificial Intelligence (AI), Machine Learning (ML), Natural Language Processing (NLP), Computer Vision (CV), Data Engineering, Data Analytics, Big Data, and Data Science in general - ordered by popularity of job title or skills, toolset and products used - below.
- Open Lead Data Analyst jobs
- Open MLOps Engineer jobs
- Open Data Science Manager jobs
- Open Senior Business Intelligence Analyst jobs
- Open Data Manager jobs
- Open Data Engineer II jobs
- Open Power BI Developer jobs
- Open Principal Data Engineer jobs
- Open Sr Data Engineer jobs
- Open Data Analytics Engineer jobs
- Open Business Intelligence Developer jobs
- Open Junior Data Scientist jobs
- Open Data Scientist II jobs
- Open Product Data Analyst jobs
- Open Senior Data Architect jobs
- Open Sr. Data Scientist jobs
- Open Business Data Analyst jobs
- Open Big Data Engineer jobs
- Open Data Analyst Intern jobs
- Open Manager, Data Engineering jobs
- Open Azure Data Engineer jobs
- Open Data Product Manager jobs
- Open Data Quality Analyst jobs
- Open Junior Data Engineer jobs
- Open Principal Data Scientist jobs
- Open Data quality-related jobs
- Open Business Intelligence-related jobs
- Open GCP-related jobs
- Open ML models-related jobs
- Open Data management-related jobs
- Open Java-related jobs
- Open Privacy-related jobs
- Open Finance-related jobs
- Open Data visualization-related jobs
- Open APIs-related jobs
- Open Deep Learning-related jobs
- Open PyTorch-related jobs
- Open TensorFlow-related jobs
- Open PhD-related jobs
- Open Consulting-related jobs
- Open Snowflake-related jobs
- Open NLP-related jobs
- Open CI/CD-related jobs
- Open Kubernetes-related jobs
- Open Data governance-related jobs
- Open Airflow-related jobs
- Open Hadoop-related jobs
- Open LLMs-related jobs
- Open Generative AI-related jobs
- Open Databricks-related jobs