Conception d’une librairie R ou Python pour l’analyse de réseaux dynamiques

Institutions

  • Sorbonne Université / CNRS
  • Laboratoire d’informatique de Paris 6 (UMR 7606)
  • Équipe “Complex Networks” (www.complexnetworks.fr)

Adresse

  • LIP6, 4 place Jussieu, 75005 Paris

Supervision

  • Robin Lamarche-Perrin, chargé de recherche CNRS
  • Matthieu Latapy, directeur de recherche CNRS

Contrat

  • CDD d’un an à temps plein (septembre 2018 – août 2019)
  • De 2443€ à 3019€ brut, selon expérience

Ce poste est en partie financé par le programme H2020 FETPROACT 2016-2017 de la Commission européenne à travers le projet ODYCCEUS “Opinion Dynamics and Cultural Conflicts in European Spaces” qui a débuté en janvier 2017 (voir www.odycceus.eu).

Pour postuler, merci d’envoyer un CV complet, ainsi qu’une lettre de motivation, à <Robin.Lamarche-Perrin@lip6.fr>

Contexte de recherche

De nombreuses structures en réseau nous constituent ou nous entourent : réseaux biologiques organisant les interactions entre protéines, matrices de co-occurrence de mots pour l’analyse du langage, réseaux sociaux et échanges d’information sur le Web, réseaux de transport, transactions financières, etc. La théorie des graphes propose des solutions formelles pour analyser de tels réseaux et répondre à des questions concernant leurs propriétés structurelles. Existe-t-il un chemin reliant deux nœuds pris au hasard ? Quels nœuds sont les plus importants ? Le réseau peut-il être décomposé en groupes cohérents ?

Dans le cas où ces réseaux sont dynamiques, c’est-à-dire dans le cas où leurs nœuds et leurs liens évoluent au cours du temps, l’approche classique consiste à agréger l’information temporelle pour obtenir une séquence de graphes statiques. Les propriétés structurelles de chaque graphe “snapshot” sont ensuite mesurées avec les méthodes classiques, et on peut alors analyser l’évolution de ces propriétés au cours du temps. Pourtant, dans de nombreux cas concrets, les chercheur·euse·s souhaiteraient aborder les réseaux dynamiques comme de véritables objets tridimensionnels : en considérant simultanément (et non pas séquentiellement) leur dimension structurelle et leur dimension temporelle.

À ce titre, l’équipe “Complex Networks” du LIP6 travaille sur le formalisme des flots de liens pour représenter les réseaux dynamiques comme des ensembles d’interactions temporelles : la donnée de départ est donc un ensemble de triplets (A,B,T) indiquant que le nœud A a interagi avec le nœud B à l’instant T (par exemple, la personne A a envoyé un message à la personne B à l’instant T). L’algorithmique pour les flots de liens a ceci de fondamental qu’il n’est paxs question de calculer l’évolution d’une propriété structurelle au cours du temps, mais de prendre en compte dès le départ la nature “en flot” des données. Il s’agit de définir et de calculer des propriétés à la fois structurelles et temporelles en généralisant les concepts classiques développés par la théorie des graphes, comme la connexité, la densité, les motifs relationnels, etc.

Mission

De nombreuses mesures (structurelles et temporelles), ainsi que des algorithmes et quelques programmes, ont été développés au cours des dernières années par les membres de l’équipe “Complex Networks”. Il nous paraît aujourd’hui important d’unifier et d’intégrer ces différents travaux théoriques au sein d’un outil cohérent et accessible aux chercheur·euse·s de différents domaines, et notamment des chercheur·e·s en sciences humaines et sociales. L’objectif de ce poste d’ingénieur·e de recherche est donc de développer une librairie (R ou Python) pour l’exploration, la visualisation et l’analyse de réseaux dynamiques en s’appuyant sur le formalisme des flots de liens et sur les différents travaux de l’équipe.

Ceci nécessitera en particulier :

  • d’interagir avec les différents membres de l’équipe pour récupérer les formalismes et les programmes développés lors de leur recherche et pour se les approprier ;

  • de développer une librairie R ou Python intégrant de manière cohérente ces différentes fonctionnalités pour la manipulation, la mesure et la visualisation de flots de lien ;

  • de rédiger une documentation complète à destination d’autres développeur·euse·s qui souhaiteraient contribuer à l’enrichissement de cette librairie ;

  • de rédiger une documentation à destination des utilisateur·trice·s de la librairie, notamment des chercheur·euse·s en sciences humaines et sociales, par exemple sous la forme de tutoriels fournissant des exemples concrets d’utilisation.

Diplôme et compétences

  • Doctorat en informatique ou diplôme d’ingénieur·e

  • Excellentes connaissances de R et/ou de Python pour le développement

  • Bon niveau de rédaction en anglais pour la documentation et les tutoriels

  • Usage de Git pour la gestion du projet

Bibliographie

Voir la liste des articles publiés sur le site de l’équipe : http://www.complexnetworks.fr/papers/