Stage : Data Scientist - F/H

Le Plessis-Robinson, France

Applications have closed

CS GROUP

CS GROUP assure la conception, la réalisation, le déploiement, la maintenance et l’exploitation de systèmes intelligents, sûrs, sécurisés & interconnectés.

View company page

Description de l'entreprise

Le groupe Novidy's est spécialisé dans les solutions et les services Cyber sécurité et Transformation de l'IT. Sa taille intermédiaire et son expérience permettent à Novidy's d'accompagner ses clients sur des projets à la fois dimensionnants et innovants techniquement, et qui requièrent une très grande flexibilité.

Depuis Juin 2018, Novidy’s a choisi de rejoindre le groupe CS Communication et Système

En combinant l'expertise et le dynamisme de Novidy’s avec les atouts dont dispose CS, notamment en matière de certifications PASSI, et de relations avec, les Opérateurs d’Importance Vitale, l’ANSSI, et autres instances gouvernementales, Novidy's a renforcé son offre de services et sa notoriété sur le marché de la Cyber sécurité.

Avec désormais plus de 200 experts, ce rapprochement a permis de gagner au minimum deux ans sur le plan de développement de l'entreprise, au plus grand bénéfice des clients et des collaborateurs.

Le groupe accompagne ses clients dans les phases de conseil, d'intégration de solutions, de prestation de services, d'accompagnement au travers de son SOC/NOC et de son Assistance Opérationnelle 24/24, ou de ses Centres de Services. 

Description du poste

Dans le cadre de ses activités, le groupe CS Novidy’s recherche des stagiaires désirant rejoindre nos activités de Cybersécurité. Vous interviendrez au cœur de l’innovation dans l’analyse et la recherche de menaces physiques et Cyber (CyPhy) dans le Big data. Vous contribuerez à la réalisation de nos projets de Cybersécurité et de R&D dans des contextes nationaux et internationaux.

Au cours de votre stage vous rejoignez l’Unité Opérationnelle de R&D de CS Novidys. Vous collaborerez de manière active avec nos équipes SOC/NOC, Conseil & Audit et Pen-tester.

Actuellement, les équipes en charge de la cybersécurité sont submergées de données d’événements et de logs émanant de leurs différents produits de défense et/ou de leur système SIEM. À cela s’ajoutent les millions de flux de données sur les menaces destinés à contextualiser et à hiérarchiser ces alertes, qu’ils soient disponibles en Open Source ou issus de sources commerciales, d’acteurs du secteur ou des fournisseurs de sécurité existants.

Beaucoup de logiciels de fouille de données proposent des bibliothèques permettant d'implémenter un ou plusieurs algorithmes d'apprentissage par arbre de décision pour extraire de l’information pertinente pour les équipes de cybersécurité.

Vous serez amené à étudier les solutions existantes, comme par exemple : le logiciel Open Source R contenant plusieurs implémentations de CART, telles que rpart, party et randomForest, les logiciels libres Weka et Orange (et son module orngTree) ou encore la bibliothèque libre Python scikit-learn ; mais également Salford Systems CART, IBM SPSS Modeler, RapidMiner, SAS Enterprise Miner, KNIME, Microsoft SQL Server.

Mais aussi, vous serez acteurs dans la réalisation de solutions innovantes visant le prédictible.

Sujets du stage : Développement expérimental d'un système de détection d’attaques physiques et cyber (CyPhy) dans le Big data.

·        Après avoir procédé à une analyse de la valeur des technologies actuelles. Vous serez en capacité de définir un état l’art de la Cyber Threat Intelligence (CTI) et vous permettra de construire une cartographie des plateformes de CTI. Cet état de l’art doit permettre d’identifier dans les solutions existantes les limites d’exploitation et les limites de détection des attaques comme par exemple l’usage de « biais ». Les conclusions de cet état de l’art permettront d’ouvrir des axes de recherche et de développement pour la construction d’une preuve de concept en utilisant des techniques de « machine learning » et/ou de « data mining », pour ne citer que les deux principales.

·        Sur la base de l’état de l’art élaboré ci-dessus, vous élaborerez la preuve de concept d’un arbre de décision innovant permettant l’identification des attaques physiques et Cyber (CyPhy). Après avoir amélioré les performances de recherche de ces attaques, vous procéderez à l’analyse des avantages et inconvénients ainsi qu’à une recherche d’alternatives ouvrant sur de nouveaux axes d’amélioration. Votre approche méthodique pour construire ce modèle vous permettra de :

o   Définir la problématique à résoudre ;

o   Acquérir, analyser et explorer les données disponibles ;

o   Extraire des caractéristiques pour l'entraînement du modèle retenu ;

o   Choisir ou construire un modèle d’apprentissage adapté à la problématique et aux données ;

o   Entraîner, évaluer et optimiser l'algorithme d'apprentissage ;

o   Tester l’efficacité du modèle ;

o   Déployer le modèle pour faire des prédictions ;

Qualifications

Vous suivez actuellement un cursus en école d’Ingénieur ou Université de niveau M1 ou M2 et idéalement, vous connaissez les langages de programmation Python, C/C++, Shell et Bash.

Comme futur scientifique des données vous êtes capable de coder, de créer des prototypes, et de les intégrer.

Parmi les principaux langages associés à cette science des données, on comptera sur votre capacité à développer vos connaissances parmi les langages SQL, R, SAS, Java, Scala, et Julia, en fonction des orientations techniques prises durant le déroulement de votre stage.

Informations supplémentaires

Pourquoi choisir CS GROUP ?

Pour notre filière Expert qui valorise vos compétences techniques, notre engagement dans l’innovation avec un budget R&D de 30 millions d’euros/an, nos engagements sociétaux et environnementaux : index d’égalité professionnelle à 86/100, partenaire de l’association Elles bougent, membre de la planète Tech Care etc.

Et bien sûr : la possibilité de télétravailler, un programme de cooptation, la complémentaire santé, les RTT, le CE.

La suite des événements :

Si votre profil correspond, vous aurez un entretien technique avec un de nos Responsables opérationnels. Puis, vous rencontrerez prénom du ou des recruteurs lors d’un entretien RH. Et nous nous engageons à vous faire un retour par téléphone :)
 

#CSNovidys #hiring #LI-Hybrid #LI-LM1

* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰

Tags: Big Data Data Mining Java Julia KNIME Machine Learning Open Source Python R RapidMiner R&D SAS Scala Scikit-learn SPSS SQL Weka

Region: Europe
Country: France
Job stats:  14  2  0
Category: Data Science Jobs

More jobs like this

Explore more AI, ML, Data Science career opportunities

Find even more open roles in Artificial Intelligence (AI), Machine Learning (ML), Natural Language Processing (NLP), Computer Vision (CV), Data Engineering, Data Analytics, Big Data, and Data Science in general - ordered by popularity of job title or skills, toolset and products used - below.