Stage : Data Scientist - F/H
Le Plessis-Robinson, France
CS GROUP
CS GROUP assure la conception, la réalisation, le déploiement, la maintenance et l’exploitation de systèmes intelligents, sûrs, sécurisés & interconnectés.Description de l'entreprise
Le groupe Novidy's est spécialisé dans les solutions et les services Cyber sécurité et Transformation de l'IT. Sa taille intermédiaire et son expérience permettent à Novidy's d'accompagner ses clients sur des projets à la fois dimensionnants et innovants techniquement, et qui requièrent une très grande flexibilité.
Depuis Juin 2018, Novidy’s a choisi de rejoindre le groupe CS Communication et Système
En combinant l'expertise et le dynamisme de Novidy’s avec les atouts dont dispose CS, notamment en matière de certifications PASSI, et de relations avec, les Opérateurs d’Importance Vitale, l’ANSSI, et autres instances gouvernementales, Novidy's a renforcé son offre de services et sa notoriété sur le marché de la Cyber sécurité.
Avec désormais plus de 200 experts, ce rapprochement a permis de gagner au minimum deux ans sur le plan de développement de l'entreprise, au plus grand bénéfice des clients et des collaborateurs.
Le groupe accompagne ses clients dans les phases de conseil, d'intégration de solutions, de prestation de services, d'accompagnement au travers de son SOC/NOC et de son Assistance Opérationnelle 24/24, ou de ses Centres de Services.
Description du poste
Dans le cadre de ses activités, le groupe CS Novidy’s recherche des stagiaires désirant rejoindre nos activités de Cybersécurité. Vous interviendrez au cœur de l’innovation dans l’analyse et la recherche de menaces physiques et Cyber (CyPhy) dans le Big data. Vous contribuerez à la réalisation de nos projets de Cybersécurité et de R&D dans des contextes nationaux et internationaux.
Au cours de votre stage vous rejoignez l’Unité Opérationnelle de R&D de CS Novidys. Vous collaborerez de manière active avec nos équipes SOC/NOC, Conseil & Audit et Pen-tester.
Actuellement, les équipes en charge de la cybersécurité sont submergées de données d’événements et de logs émanant de leurs différents produits de défense et/ou de leur système SIEM. À cela s’ajoutent les millions de flux de données sur les menaces destinés à contextualiser et à hiérarchiser ces alertes, qu’ils soient disponibles en Open Source ou issus de sources commerciales, d’acteurs du secteur ou des fournisseurs de sécurité existants.
Beaucoup de logiciels de fouille de données proposent des bibliothèques permettant d'implémenter un ou plusieurs algorithmes d'apprentissage par arbre de décision pour extraire de l’information pertinente pour les équipes de cybersécurité.
Vous serez amené à étudier les solutions existantes, comme par exemple : le logiciel Open Source R contenant plusieurs implémentations de CART, telles que rpart, party et randomForest, les logiciels libres Weka et Orange (et son module orngTree) ou encore la bibliothèque libre Python scikit-learn ; mais également Salford Systems CART, IBM SPSS Modeler, RapidMiner, SAS Enterprise Miner, KNIME, Microsoft SQL Server.
Mais aussi, vous serez acteurs dans la réalisation de solutions innovantes visant le prédictible.
Sujets du stage : Développement expérimental d'un système de détection d’attaques physiques et cyber (CyPhy) dans le Big data.
· Après avoir procédé à une analyse de la valeur des technologies actuelles. Vous serez en capacité de définir un état l’art de la Cyber Threat Intelligence (CTI) et vous permettra de construire une cartographie des plateformes de CTI. Cet état de l’art doit permettre d’identifier dans les solutions existantes les limites d’exploitation et les limites de détection des attaques comme par exemple l’usage de « biais ». Les conclusions de cet état de l’art permettront d’ouvrir des axes de recherche et de développement pour la construction d’une preuve de concept en utilisant des techniques de « machine learning » et/ou de « data mining », pour ne citer que les deux principales.
· Sur la base de l’état de l’art élaboré ci-dessus, vous élaborerez la preuve de concept d’un arbre de décision innovant permettant l’identification des attaques physiques et Cyber (CyPhy). Après avoir amélioré les performances de recherche de ces attaques, vous procéderez à l’analyse des avantages et inconvénients ainsi qu’à une recherche d’alternatives ouvrant sur de nouveaux axes d’amélioration. Votre approche méthodique pour construire ce modèle vous permettra de :
o Définir la problématique à résoudre ;
o Acquérir, analyser et explorer les données disponibles ;
o Extraire des caractéristiques pour l'entraînement du modèle retenu ;
o Choisir ou construire un modèle d’apprentissage adapté à la problématique et aux données ;
o Entraîner, évaluer et optimiser l'algorithme d'apprentissage ;
o Tester l’efficacité du modèle ;
o Déployer le modèle pour faire des prédictions ;
Qualifications
Vous suivez actuellement un cursus en école d’Ingénieur ou Université de niveau M1 ou M2 et idéalement, vous connaissez les langages de programmation Python, C/C++, Shell et Bash.
Comme futur scientifique des données vous êtes capable de coder, de créer des prototypes, et de les intégrer.
Parmi les principaux langages associés à cette science des données, on comptera sur votre capacité à développer vos connaissances parmi les langages SQL, R, SAS, Java, Scala, et Julia, en fonction des orientations techniques prises durant le déroulement de votre stage.
Informations supplémentaires
Pourquoi choisir CS GROUP ?
Pour notre filière Expert qui valorise vos compétences techniques, notre engagement dans l’innovation avec un budget R&D de 30 millions d’euros/an, nos engagements sociétaux et environnementaux : index d’égalité professionnelle à 86/100, partenaire de l’association Elles bougent, membre de la planète Tech Care etc.
Et bien sûr : la possibilité de télétravailler, un programme de cooptation, la complémentaire santé, les RTT, le CE.
La suite des événements :
Si votre profil correspond, vous aurez un entretien technique avec un de nos Responsables opérationnels. Puis, vous rencontrerez prénom du ou des recruteurs lors d’un entretien RH. Et nous nous engageons à vous faire un retour par téléphone :)
#CSNovidys #hiring #LI-Hybrid #LI-LM1
* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰
Tags: Big Data Data Mining Java Julia KNIME Machine Learning Open Source Python R RapidMiner R&D SAS Scala Scikit-learn SPSS SQL Weka
More jobs like this
Explore more AI, ML, Data Science career opportunities
Find even more open roles in Artificial Intelligence (AI), Machine Learning (ML), Natural Language Processing (NLP), Computer Vision (CV), Data Engineering, Data Analytics, Big Data, and Data Science in general - ordered by popularity of job title or skills, toolset and products used - below.
- Open Data Science Manager jobs
- Open Lead Data Analyst jobs
- Open MLOps Engineer jobs
- Open Senior Business Intelligence Analyst jobs
- Open Data Engineer II jobs
- Open Data Manager jobs
- Open Sr Data Engineer jobs
- Open Power BI Developer jobs
- Open Principal Data Engineer jobs
- Open Data Analytics Engineer jobs
- Open Business Intelligence Developer jobs
- Open Junior Data Scientist jobs
- Open Data Scientist II jobs
- Open Product Data Analyst jobs
- Open Senior Data Architect jobs
- Open Sr. Data Scientist jobs
- Open Business Data Analyst jobs
- Open Big Data Engineer jobs
- Open Data Analyst Intern jobs
- Open Manager, Data Engineering jobs
- Open Azure Data Engineer jobs
- Open Data Quality Analyst jobs
- Open Data Product Manager jobs
- Open Junior Data Engineer jobs
- Open Principal Data Scientist jobs
- Open Data quality-related jobs
- Open Business Intelligence-related jobs
- Open GCP-related jobs
- Open ML models-related jobs
- Open Data management-related jobs
- Open Java-related jobs
- Open Privacy-related jobs
- Open Data visualization-related jobs
- Open Finance-related jobs
- Open APIs-related jobs
- Open Deep Learning-related jobs
- Open PyTorch-related jobs
- Open Snowflake-related jobs
- Open Consulting-related jobs
- Open TensorFlow-related jobs
- Open PhD-related jobs
- Open CI/CD-related jobs
- Open NLP-related jobs
- Open Kubernetes-related jobs
- Open Data governance-related jobs
- Open Airflow-related jobs
- Open Hadoop-related jobs
- Open LLMs-related jobs
- Open Databricks-related jobs
- Open Data warehouse-related jobs