Thèse CIFRE : Withings et INRIA - Data science pour les objets connectés (H/F)

Issy-les-Moulineaux, Île-de-France, France

Applications have closed

Withings

The full ecosystem of Withings smart devices is designed to give you the powerful tools and insights you need to understand and improve your health for the long term.

View company page

Chez Withings, nous souhaitons redonner aux individus le contrôle de leur santé.

Nous avons l’obsession de créer des produits beaux et intuitifs, afin que chacun puisse les utiliser facilement au quotidien; nos balances connectées, montres hybrides, tensiomètres, moniteurs de sommeil et tous les dispositifs de notre gamme sont aujourd’hui utilisés par des millions d’utilisateurs.

Notre objectif : permettre la prévention, le dépistage et l’accompagnement d’un certain nombre de maladies chroniques via des produits et des services innovants, afin de révolutionner la manière dont on prend soin de notre santé.

Pour cela Withings collecte via ses produits un grand nombre de data-points différents : mesures de poids (BMI, masse maigre, grasse etc.), d’activité physique (nombre de pas, reconnaissance d’activité etc.), de fréquence cardiaque, SpO2, ECG, tension artérielle, ou encore de sommeil (phases, score d’apnée du sommeil). Pour chaque utilisateur, ces mesures sont à échantillonnage variable.

Détail du poste

A travers ses dispositifs, Withings collecte un grand nombre de data-points différents: allant de mesures de poids (BMI, masse maigre, grasse etc), d’activité physique (nombre de pas, reconnaissance d’activité etc.), de fréquence cardiaque, SpO2, ECG, tension artérielle, ou encore de sommeil (phases, score d’apnée du sommeil). Ces mesures proviennent d’appareils différents (montres, balances, tensiomètres ou capteur de pression) et d’utilisateurs spécifiques. elles sont donc parcimonieuses et à échantillonnage variable.

Dans ce contexte :

  • Withings souhaite développer des méthodes de clustering de séries temporelles non supervisées pour faciliter la découverte de nouveaux biomarqueurs et mieux comprendre ses utilisateurs.

Détails de la collaboration

Ces questions étant techniquement complexes une collaboration (thèse cifre) avec l’INRIA a été mise en place pour avancer sur le sujet. La partie recherche du poste sera supervisée par Christophe Biernacki (INRIA - Lilles) et Cristian Preda (INRIA - Lilles) spécialisés dans :

  • La construction des modèles de clustering en grande dimension : Il s’agit de modéliser les données sous la forme d’un mélange de distributions dont les paramètres doivent être estimés à partir des données. En grande dimension, le nombre de paramètres est aussi plus important d’où la nécessité de représenter les données dans des espaces de dimension réduite. Quelques pistes sont les mélanges de lois gaussiennes/multinomiales1,2 et les techniques basés sur les modèles à variables latentes (PCA, PLS)3.
  • La modélisation et le clustering des données temporelles (signaux). La représentation des données sous forme de fonctions de temps est connue en statistique sous le nom d’analyse de données fonctionnelles 4. Nous proposons dans ce stage de s'intéresser à l’analyse des données fonctionnelles univariées et multivariées avec un objectif de clustering. Les méthodes présentées en 5 et 6 seront développées. Une méthodologie pour l’analyse conjointe de données mixtes (données temporelles et non indexées par le temps) sera réalisée sur la base des travaux
  • La formalisation des modèles de régression avec variables réponse fonctionnelle : Il s’agit de prédire une trajectoire (possible multivariée) à partir des co-variables de type hétérogène (scalaire, catégorielles, fonctionnelles)7.

Détails du sujet

Les méthodes d’analyses ont été choisies sur la base de travaux internes antérieurs et la spécialisation des chercheurs de l’INRIA. Mais Withings et l’INRIA restent bien entendus ouvert sur l’utilisation de méthodes non cités et pousseront le candidat à faire ses propres choix méthodologiques selon son parcours et affinités mathématiques.

Nous suivons activement le développement des méthodes de deep learning et toute proposition cohérente liée à ces approches sera étudiée avec plaisir si le candidat a une certaine expérience sur ce sujet.

Détails de l’équipe

Le poste se situe dans l’équipe Data Analytics chez Withings qui se compose de 6 personnes.

L’équipe a pour but de mettre en valeurs les données récoltées pour tous les appareils et d’apporter une aide opérationnelle à l’ensemble de Withings. Les membres de l’équipe sont déployés dans différentes unités à l’intérieur de Withings et travaillent en très forte autonomie avec les équipes auxquelles ils sont affiliés.

Dans le contexte de la thèse le candidat travaillera en relation directe avec la personne (data scientist & clinical biomarkers analyst) de l’équipe chargée de la mise en valeurs médicale des données stockées en base.

L’équipe data analytics travaille en étroite collaboration avec l’équipe Machine Learning chargée de développer les algorithmes embarqués. Il y aura donc des échanges et des questions croisés sur certains points techniques avec cette équipe.

Organisation du travail

La répartition du travail a été planifié de la façon suivante :

  • ¾ du temps chez Withings (3 semaines par mois) : Chez Withings le candidat sera chargé d’apporter son expertise de recherche pour résoudre les questions d’analyse de série temporelles et les amener à des réalisations pratiques concrètes pour les utilisateurs. Une partie du temps sera aussi consacrée à des interactions avec d’autres équipes pour comprendre leurs problématiques et faciliter le transfert de savoir de recherche à une réalité utilisable sur le terrain.
  • ¼ du temps (1 semaine par mois) à l’INRIA (équipe MODAL, Lille) : Dans l’équipe de l’INRIA le candidat sera challengé sur les questions théoriques. Ce temps a pour but de faciliter une effervescence scientifique au travers des contacts avec d’autres étudiants et d’autres chercheurs spécialisés dans les questions décrites précédemment.

Conditions de travail

  • L’ensemble des déplacements et le logement à Lille seront pris en charge par Withings.
  • Bourse de thèse cifre réglementée + rémunération entreprise selon profil

Bibliographie

1. Biernacki, C. & Maugis, C. High-dimensional clustering. in Choix de modèles et agrégation, Sous la direction de J-J. DROESBEKE, G. SAPORTA, C. THOMAS-AGNAN Edition: Technip. (2015).

2. Cardot, H., Cénac, P. & Monnez, J.-M. A fast and recursive algorithm for clustering large datasets with k-medians. Comput. Stat. Data Anal. 56, 1434–1449 (2012).

3. Escofier, B. & Pagès, J. Analyses factorielles simples et multiples: objectifs, méthodes et interprétation. (Dunod, 2008).

4. Ramsay, J. O. & Silverman, B. W. Functional Data Analysis. (Springer, 2005). doi:10.1007/b98888.

5. Jacques, J. & Preda, C. Functional data clustering: a survey. Adv. Data Anal. Classif. 8, 231–255 (2014).

6. Jacques, J. & Preda, C. Model-based clustering for multivariate functional data. Comput. Stat. Data Anal. 71, 92–106 (2014).

7. Preda, C. & Saporta, G. PLS regression on a stochastic process. Comput. Stat. Data Anal. 48, 149–158 (2005).

Requirements

  • Le candidat devra être de niveau bac +5 sortant d’une formation d’ingénieur avec un solide parcours en mathématiques ou de formation universitaire en mathématiques théoriques ou appliquées.
  • Maîtrise de python nécessaire
  • Maîtrise de SQL et R recommandée
  • Une forte appétence pour le travail de recherche appliquée et la compréhension des problématiques d’entreprise sont requises.
  • Niveau d’anglais demandé C1.

Benefits

    • Intégrer un des pionniers et leaders mondiaux de la santé connectée, plusieurs fois primé au Consumer Electronic Show
    • Contribuer à des projets innovants et ambitieux pour la santé de demain dans un environnement agile et en constante évolution
    • Intégrer une entreprise internationale, membre de la FrenchTech 120, dont les équipes sont basées à Issy-les-Moulineaux, Boston, Hong-Kong et Shenzhen
    • Participer à l’amélioration continue de nos produits et services en les bêta-testant avant leur sortie, notamment lors de nos nombreuses sessions sportives entre collègues
    • Bénéficier de nombreux avantages : Stock Options, smartphone et ordinateur de votre choix, réductions pour des activités culturelles et sportives, restaurant d’entreprise, et bien plus encore
    • Participer à la Withings Med Academy en assistant à des conférences de professionnels de santé afin de renforcer ses connaissances dans le domaine médical
    • Collaborer avec des collègues passionnés et célébrer ensemble chacune de nos réussites !

    Toutes les candidatures reçues sont étudiées indépendamment de l’origine ethnique, des croyances, de la religion, du genre, de l’orientation sexuelle ou de la santé des candidats. Withings aspire à offrir et garantir l’égalité des chances aux candidats et seules les personnes habilitées (RH et Management) auront accès aux informations concernant votre candidature.

Tags: Agile Clustering Data analysis Data Analytics Deep Learning Machine Learning Python R SQL

Perks/benefits: Career development Equity

Region: Europe
Country: France
Job stats:  15  3  0

More jobs like this

Explore more AI, ML, Data Science career opportunities

Find even more open roles in Artificial Intelligence (AI), Machine Learning (ML), Natural Language Processing (NLP), Computer Vision (CV), Data Engineering, Data Analytics, Big Data, and Data Science in general - ordered by popularity of job title or skills, toolset and products used - below.