8ème Conseil des Partenaires
Le lundi 25 Novembre 2019 -14h00
ISC-PIF
salle shakerspace (RDC)
Entrée par le 11 place Nationale, 75013 Paris
Rapport d’activité – période Juillet à Novembre 2019
Ordre du Jour
0. Approbation de l’ordre du jour
1. Approbation du compte rendu du 7ème Conseil des Partenaires
2. Instances de pilotage de l’ISC-PIF
2.1 Reconduction des conventions de Partenariat
Tous les partenaires de l’ISC-PIF ont reconduit leur partenariat pluriannuel à l’exception de l’INSERM. La direction de l’ISC-PIF doit reprendre les discussions avec les différents ITMO afin de renouveler cette collaboration.
2.2 Point sur les fusions de partenaires
-
- INRA et IRSTEA ont fusionné pour créer l’INRAE au 01/01/2020,
- UPMC fait maintenant partie de Sorbonne Université,
- L’Université Paris-Diderot fait maintenant partie de l’Université de Paris.
La question du barème des cotisations des partenaires se pose étant donné que les nouvelles entités universitaires permettent à un bien plus grand nombre de leur personnel de bénéficier des services de l’ISC-PIF.
3. Utilisation des nouveaux espaces dédiés aux systèmes complexes au sein du TOTEM
Il y a eu 18 jours auditorium de réservés entre mai et octobre 2019. Il reste encore des créneaux non utilisés pour 2019 et partenaires sont invités à communiquer sur cette opportunité auprès de leur personnel.
4. Point d’actualité 2019 (deux semestres)
4.1 Plate-formes et Axes scientifiques développés à l’Institut
Voici les principales avancées sur ces plate-formes pour la période (cliquez sur le titre pour déplier).
4.1.1 Infrastructure de Cloud pour les Systèmes Complexes
Responsable d’infrastructure : Maziyar Panahi
L’ISC-PIF dispose de serveurs sur site et hors site (dans la salle de calcul du LAL) où il opère un Cloud sous OpenStack.
L’infrastructure Cloud hébergée au LAL est utilisée actuellement par plusieurs projets de l’ISC-PIF. Elle permet de déployer rapidement des machines pour des besoins spécifiques et de proposer à des projet l’hébergement de moyens de calcul avec toutes les facilités du Cloud.
Les investissements mutualisés sont ainsi grandement facilités.
Sont actuellement hébergés sur le cloud de l’ISC-PIF les plateformes Gargantext, Multivac, OpenMOLE, Community Explorer les services cœur de l’ISC-PIF ainsi que certains projets de résidents.
ISC-PIF IT Infrastructure Roadmap (2014-2019)
Voici un résumé synthétique de l’évolution des infrastructures sous ma responsabilité:
- Calcul: passage de 90 coeurs de calcul à 2328 coeurs (+2000% en 5 ans)
- Stockage: passage de 20To à 860To (+3900% en 5 ans)
- Machines Virtuelles: passage de 2 à 138 (+5900% en 5 ans)
- Serveurs: passage de 5 à 68 (+840% en 5 ans)
Évolution des infrastructure depuis juillet 2019 :
- Installation et configuration d’un système de visioconférence pour la diffusion en direct et l’archivage de vidéos dans les salles de séminaires et les auditoriums,
- Commande et installation et configuration 2 nouveaux processeurs (48 coeurs) et 96 Go de mémoire,
- Plus d’instances Cloud dédiées pour les partenaires (Geo Cités, IGN, résidents et projets de l’ISC-PIF, etc.)

Multivac

OpenMOLE

ISC-PIF

Gargantext
4.1.2 Community Explorer
Le Community Explorer est en train d’être intégré à Gargantext dans le cadre d’une collaboration avec l’IMT.
Cela permettra de déployer une version 4 de gargantext qui remplacera le community explorer et proposera à l’ensemble de la communautés systèmes complexes un véritable GPS des systèmes complexes : quels sont les acteurs ? où se situent-ils ? Quelles sont les avancées dans un domaine donné ?
Le communityexplorer est actuellement disponible sur http://communityexplorer.org
4.1.3 Gargantext et Analyse des réseaux socio-sémantiques
Chef de projet : Alexandre Delanoë (ISC-PIF)
Rappel : Gargantext est une plateforme collaborative d’analyse et d’exploration des grands corpus textuels développée et hébergée par l’ISC-PIF. Elle est coordonnée par Alexandre Delanoë et David Chavalarias. Cette plate-forme implémente des résultats de recherches menés à l’ISC-PIF et chez les partenaires dans le domaine de la scientométrie, bibliométrie et science studies. C’est un macroscope social qui se veut accessible à tous.
Développement depuis juillet 2019
- Septembre 2019
- début de la Rolling Release
- Version V4 “fonctionnelle”
- Les prochaines étapes:
- juridiques
- ergonomiques/usage/doc
- Octobre 2019
- RGPD Compliant et solution innovante pour la gestion des droits des utilisateurs (simple et efficace),
- Multi-instance management: les mainteneurs des instances Gargantext deviennent responsables de la gestion des données utilisateurs. Possibilité de se connecter à plusieurs instances Gargantext depuis le même front end.
- Novembre 2019
- Nouvelle ergonomie Front-End avec un nouveau Framework de développement Purescript,
- Ergonomie pour satisfaire les nouveaux utilisateurs et les utilisateurs avancés: un arbre typé polymorphique et purement fonctionnel.
Développement du réseau
De nouveaux partenariats ont été mis en place autour de la plateforme :
– Université d’Amsterdam: workshop juillet 2019 (prévision de participation aux workshop semestriels ~ 100 participants à chaque fois)
– L’équipe Cillex, autourdumot.fr (Bruno Gaume): workshop commun en octobre 2019
– L’équipe Prospero (F. Chateauraynaud et J. Debaz): workshop fin nov 2019
Instance de démonstration
Une démonstration des nouvelles fonctionnalités de la nouvelle version sera faite en Conseil des Partenaires (10 min).
4.1.4 Multivac Platform: Unified Big Data Analytics Platform
Chef de projet : Maziyar PANAHI (ISC-PIF/CNRS)
Multivac est une plate-forme de l’ISC-PIF lancé en 2016 pour faciliter la conservation, l’accès et l’analyse de grand ensembles de données. Elle s’appuie sur des technologies de pointe utilisées par les grands acteurs du web et des Big Data dans l’espoir de faire bénéficier le monde de la recherche de ces nouvelles technologies et faciliter ainsi la recherche et l’expérimentation sur le Big Data. Multivac plateforme composée de plus de 120 serveurs interconnectés pour traiter l’ensemble des aspects du Big Data, avec plus de 145 milliards d’enregistrements (+50-80M/j) et plus 300To de stockage.
Multivac Data Science Lab (DSL)
Environnement de programmation sur le Cloud permettant d’offrir l’analyse de grandes données à des projets de recherche et à des scientifiques individuels. Il contient plus de 40 serveurs dans le Cloud (LAL) avec plus de 130 milliards de documents. Collaboration avec les ingénieurs et chercheurs du projet ANR (Epique).
- Hadoop/Spark Cluster (Scala, Python, R, Java, and C/C++)
- Interactive Big Data Analytics (shareable notebooks, visualizations, etc.)
- +40 Serveurs +1000 cœurs et 2To de mémoire 80To de stockage distribué
- Public datasets
- +120 milliards de pages vues sur Wikimedia
- +220 millions de postes 4chan pol (politiquement incorrect)
- +23 millions d’articles dans PubMed
- +5.6 million titres et réponses – Le Grand Débat National et Le Vrai Débat
- Utilisation du cluster
- Lancement de Total Containers à travers la grappe Multivac chaque mois: plus 12520
- Mémoire totale utilisée par les applications sur Apache Spark tous les mois: 803.7 TiB
- VCores et mémoire alloués chaque mois:
Nouveaux projets et collaborations en 2019
1. MATIS /IGN (Hadoop/Spark, distributed C++ )
L’équipe MATIS mène des recherches en mathématiques et en informatique appliquées à la photogrammétrie, la vision par ordinateur et la télédétection pour l’imagerie multi-capteurs (optique, LiDAR, radar, etc.) et multi-sources. L’équipe a pour principales missions l’amélioration de la production, de l’analyse et de la valorisation des référentiels IGN grâce à imagerie terrestre, aéroportée et/ou satellitaire.
Distributed delaunay triangulation of 500M of points in 6min on Multivac DSL cluster!
2. CNRS 80|Prime
Victor Chomel a été recruté en thèse sur un bourse 80 PRIME atour du projet Politoscope sous la direction de David Chavalarias en collaboration avec l’équipe Etis de l’Université Cergy Pontoise (co-directeur de thèse : Boris Borzic).
L’Equipes Traitement de l’Information et Systèmes, est une unité de recherche commune au CNRS (UMR 8051), à l’ENSEA Cergy et à l’Université de Cergy-Pontoise. ETIS est rattaché principalement à l’Institut des sciences informatiques et leurs interactions (INS2I).
Domaine : IA / Deep Learning & sciences sociales computationnelles
3. CNRS-Momentum
« Etudier l’effet de l’extension de l’obligation vaccinale en France sur les attitudes vis-à-vis des vaccins », par Jeremy Ward, chercheur à l’unité Vecteurs – Infections Tropicales et Méditerranéennes qui rejoindra le Groupe d’Etude des Méthodes de l’Analyse Sociologique de la Sorbonne en 2019, porte sur l’obligation vaccinale et ses effets sur une partie importante de la population. Cette étude articulera des méthodes classiques des sciences sociales et les apports récents de la web-analyse pour évaluer les effets de cette mesure sur les attitudes vis-à-vis des vaccins.
Cas d’utilisation dans Multivac DSL
Certaines plate-formes de l’ISC-PIF interagissent avec Multivac:
- Gargantext (https://gargantext.org) : plateforme d’analyse de données textuelles qui intègre des API Multivac (REPEC),
- Cartographie des Risques (http://risk.iscpif.fr/ – collaboration avec AXA) : plateforme qui intègre une API Multivac
D’autres plate-formes, développées par Maziyar Panahi sont contruites à partir de Multivac:
- Climatoscope/Tweetoscope (http://tweetoscope.iscpif.fr/) : plateforme en production qui vient d’être sélectionnée par l’exposition internationale Places and Spaces jusqu’en 2025 (Places and Spaces / macroscope).
- Politoscope : plateforme nationale d’analyse de la scène politique française en ligne. Ce projet a très forte visibilité (plus de 80 articles dans la presse, y compris internationale) irrigue plusieurs projets (ANR, Europe) et est à l’origine de plusieurs partenariats. Elle comprend : un tableau de bord public Présidentielle 2017, un démonstrateur version kiosque Expo, un service d’APIs (https://politoscope.org/) et une application mobile disponible en version beta sur iOS.
A l’automne 2019, la nouvelle application SciCope développée en partenariat avec la direction de la communication du CNRS a été déployée sur iOS/Apple Store. Après des tests, elle sera également déployées sous Android. Scicope est nouveau média sur application mobile développé pour la Direction de la Communication du CNRS. ScienceScope est hébergé sur l’infrastructure ISC-PIF alimentée par la plate-forme Multivac. A ce titre, la Direction de la Communication du CNRS contribue au renouvellement de cette infrastructure à hauteur de 25k€.
4.1.5 OpenMOLE et grille de Calcul
Responsables de projet : Romain Reuillon (CR Géographie-cité Paris 1/ ISC-PIF ) et Mathieu Leclaire (ISC-PIF / Géographie-cité Paris 1)
OpenMOLE est une plateforme libre d’exploration des modèles de simulation Système Complexe.
Activité récente :
- Organisation de l’école d’été en juin 2019 sur l’exploration des modèles Systèmes Complexes eX Modelo pendant 1 semaine. Cours théoriques, mises en oeuvres pratiques et challenge de modélisation en groupe. Quelques chiffres:
- 25 participants,
- 14 doctorants, 8 chercheurs, 3 entreprises,
- 14 français, 5 européens, 6 extra UE,
- 6 EPST français, 3 entreprises, 6 universités européennes,
- 17 hommes, 8 femmes,
- 8 encadrants issus de la communauté OpenMOLE.
- Extension eX Modelo “Technical Workshop” de 3 jours du 9 au 11 septembre 2019, pour travailler sur les problématiques d’exploration des participant à eX Modelo:
- 15 participants
- 6 encadrants
- Conférence JCAD (Journées du Calcul et de la Donnée) du 9 au 11 Octobre 2019,
- Journées Ifremer – Réseau Mexico – GDR Ecostat – GDR MascotNum
- Publication d’un stage pour le déploiement automatique de cluster de calcul,
- Investissement de 140k€ pour maintenir l’infrastructure de grille hebergée au LAL et au LNPHE pour le calcul dans Openmole et renforcer l’infrastructure de cloud pour héberger le service multi-utilisateurs d’Openmole
Orientations techniques:
- Conception et développement d’un service OpenMOLE multi-utilisateurs basé sur Kubernetes: s’appuie sur un stage de master de 6 mois de Mengxue GUO, les premières version devraient être disponible début 2020,
- Support des technologie de container dans OpenMOLE pour faciliter l’intégration des modèles: docker, singularity, charlie cloud…
- Amélioration du langage OpenMOLE: vers plus de simplicité et d’expressivité.
4.1.6 LinkrBrain
Chef de projet : Salma Mesmoudi (Univ. Paris 1, Equipex MATRICE, Programme 13Novembre)
LinkRbrain (www.linkrbrain.org) est une plateforme de méta-analyse de la littérature en neuro-imagerie fonctionnelle portée par l’Equipex MATRICE et l’Université Paris 1 et hébergée à l’ISC-PIF.
Au cours de la période de novembre 2018 à juin 2019, le CNRS a proposé de valoriser le projet Linkrbrain dans le cadre du programme de prématuration. Le financement demandé est de 100 000 euros.
Dans le cadre de ce programme, le projet a été évalué lors de trois Commissions d’évaluation. Le mardi 18 juin 2019 a eu lieu la troisième Commission, qui a donné son avis favorable au financement, sous réserve que :
• le Président du CNRS et le Directeur Général de l’Innovation confirme la décision positive
• une étude de marché soit faite et donne avis favorable au financement.
L’étude de marché sera prise en charge par le CNRS.
Si l’étude de marché est concluante, la plateforme sera financée et une augmentation du taux de financement est possible.
Entre avril et juin 2019, l’équipe a accueilli une stagiaire, Mathilde Louça, en stage facultatif de Master 1 en Neurosciences. Elle a travaillé principalement sur la mémoire traumatique et sur l’amélioration des résultats de Linkrbrain du côté génétique.
4.2 Projets ISC-PIF et projets en résidence
Plusieurs projets de l’ISC-PIF et d’établissements partenaires sont actuellement en résidence :
- Persist (IRSTEA) : incubation d’équipe sur l’étude de la viabilité des systèmes environnementaux. Établissement porteurs : IRSTEA. Accueil d’une équipe de 4 personnes. Ce projet sera renouvelé pour 3 personnes pendant 2 ans à compter du 1er janvier 2020 et sous l’égide de l’INRAE (fusion IRSTEA/INRA).
- SoDUCo (IGN) : programme interdisciplinaire de recherche financé par l’ANR (Project-ANR-18-CE38-0013) qui vise à mettre en place une plateforme ouverte pour la construction de données géo-historiques ouvertes, leur validation, leur manipulation, leur analyse et leur diffusion. Établissements porteurs : IGN, EHESS, EPITA, Archives Nationales. Accueil d’une équipe de 2 personnes en moyenne par semaine.
- MACA (EHESS) : programme de recherche sur la cognition autiste. Établissement porteur : EHESS. Une personne (exploratoire). Ce projet vient d’obtenir un accompagnement pour une prématuration de projet d’entreprise de la part du CNRS. Accueil de deux à trois personnes.
- Algodiv (EHESS) : programme de recherche sur la diversité de l’information en ligne. Une personne hébergée à partir du 1er janvier 2020.
- FORCCAST (EHESS) Cartographie des controverses. Projet Investissement d’Avenir. Etablissement porteur : Sciences-PO,
- Epique (ISC-PIF) : programme de recherche sur la reconstruction à grande échelle de la dynamique des sciences. Établissement porteurs : UPMC, CNRS partenaire. Accueil d’une personne.
- APPEAL (CNRS, IRD) : Analyse sociologique de réseaux autour du projet de construction du parc éolien flottant de Groix (Projet APPEAL – ANR/ITE/FEM). Début de résidence en mai 2019, pour la durée d’un an. Accueil d’une personne.
- POLARIVAX (CNRS) : programme de recherche sur la reconstruction à grande échelle de la dynamique des sciences. Établissement porteurs : CNRS, INSERM
- MOSSCOW (CNRS, Université de Cergy-Pontoise) Doctorant effectuant ses travaux dans le cadre du projet Politoscope, financé par l’appel à projet 80 Prime du CNRS.
- Morphogenèse urbaine (CEA) : Accueil d’un doctorant travaillant sur l’application des méthodes de physique statistique à des systèmes complexes particuliers : les systèmes urbains.
A compter de 2020 :
- MALICES (INRAE): Travail à l’interface des disciplines biologiques, mathématiques appliquées, intelligence artificielle, cognition, visualisation, viabilité. L’enjeu du projet est de développer des approches d’exploration de données ou front de pareto ainsi que des approches d’apprentissage interactif s’appuyant sur une forte interaction entre l’Homme et l’ordinateur en passant par des visualisations adaptées. Accueil de 4 personnes pendant 1 an à partir de janvier 2020.
Résidence de chercheurs invités étrangers
- Matthew Egbert (School of Computer Science, University of Auckland) : La recherche est centrée sur l’utilisation de modèles informatiques dans l’étude interdisciplinaire de la vie et l’esprit. un intérêt particulier est porté sur la nature autoreconstructive (autopoïétique) des organismes vivants et à la façon dont ils se reconstruisent. A été accueilli deux mois à l’automne 2019.
- Kaiyuan Lin (Doctorant, Sony CSL) : Megadiversity Management System (MMS). Un système de soutien agricole durable pour un rendement élevé et un bien-être mutuel. Accueil de 6 mois de septembre 2019 à fin février 2020.
- Paulo Serodio, University of Oxford et University of Barcelona. Résidences dans le cadre du projet financé par l’IRSF “Mapping Economics”. Établissement porteurs : Univ. Barcelona, Sciences Po, ISRF.
En ce qui concerne les possibilités de financement de futurs projets, l’ISC-PIF a participé à plusieurs journées d’informations du programme cadre Horizon 2020 dans le domaine des Sciences Humaines et Sociales.
Ces réunions portaient sur les appels à projet 2020, ainsi que la présentation du prochain programme cadre « Horizon Europe ». Des compte-rendus ont été réalisés à l’issue de chaque réunion et ils sont à votre disposition sur demande à giulia.martabosio@iscpif.fr (Giulia BOSIO, chargée des projets DIM).
4.3 Programmes de formations : “outils et méthodes systèmes complexes”
Responsable : Mathieu Leclaire (CNRS/ISC-PIF).
L’ISC-PIF a mis en place des formations gratuites aux outils et méthodes des systèmes complexes, principalement autour des plateformes de l’ISC-PIF. Les formations à Gargantext reprendront en 2020 après la release de la version 4 afin d’éviter de former sur une version qui n’est plus maintenue et sera prochainement remplacée.
Pour les formations à OpenMOLE, en raison d’un nombre important de désistements de dernière minute, il a été décidé pour le moment de mettre l’accent sur les écoles d’été et leur suivi tout au long de l’année. L’école 2019 a ainsi rassemblé 25 élèves qui sont revenus pour des sessions de travail à l’ISC-PIF depuis pour un suivi de leurs travaux.
4.4. Dissémination et Culture scientifique
Responsable : Margaux Calon (chargée de communication et médiation scientifique)
Octobre 2019 : Événement ARTEX, Journée Arts et Sciences des Systèmes Complexes
A l’occasion des 80 ans du CNRS et de la Fête de la Science 2019, l’Institut des Systèmes Complexes de Paris Île-de-France (CNRS) a organisé une Journée Arts & Sciences des Systèmes Complexes le 11 octobre 2019, au TOTEM.
De 14h à 22h, une vingtaine d’artistes et de chercheurs ont proposé au public – près de 300 participants – de découvrir les systèmes complexes à travers des dispositifs de médiation innovants, des installations artistiques et des conférences grand public.