Pour une meilleure visibilité de la recherche française 1/3 : Accès aux données sur la recherche

Cet article rend compte d’une enquête en trois volets que nous avons menée pour comprendre d’où venait le manque de visibilité et de lisibilité de la recherche française. À défaut d’avoir pu tout couvrir, l’enquête nous a menés sur la voie de l’open data, mais pas au sens où on l’entend traditionnellement en science : ce qui nous intéresse ici ce sont les données sur la recherche récoltées par les administrateurs, et non pas les données scientifiques produites par les chercheur/ses. Cette distinction, qui devrait sauter aux yeux dès notre premier article, est reconnue notamment du Ministère de l’enseignement supérieur et de la recherche. Nous vous souhaitons une bonne lecture, en espérant ouvrir un chantier qui nous emmènera loin !

La recherche française, combien de divisions ?

La formule de Staline se demandant quelle était la force de frappe du Vatican pourrait très bien s’appliquer aujourd’hui à la recherche française. Qui comprend encore quelles thématiques scientifiques sont prioritaires ? Qui fait quoi dans le millefeuille des Labex, Equipex, Idex, unités de recherche, CUE ex-PRES, Instituts du CNRS, Alliances thématiques… ? Qui possède une vision année après année des financements accordés par l’Agence nationale de la recherche (ANR) ? Comment savoir quelle infrastructure de recherche a permis quelle publication ? À toutes ces questions légitimes, portées par les décideurs, les chercheurs ou les citoyens, il n’y a pas de réponses évidentes et surtout pas d’endroit où les chercher.

Comme l’affirmait le recteur de l’université de Liège, Bernard Rentier, aux Journées Couperin de janvier dernier, un dirigeant de la recherche doit savoir ce que ses labos produisent au même titre qu’un chef d’entreprise doit savoir quelles pièces ses employés produisent. De ce point de vue, les tableaux de bord de la recherche française sont bien lacunaires. La France pilote sa recherche dans le brouillard et les scientifiques en sont rendus à suivre le sens changeant du vent et à user d’entregent politique pour conduire au mieux leurs travaux.

Or ce n’est pas une fatalité. Pour l’université de Liège, il a suffi de rendre obligatoire le dépôt des publications des chercheurs dans son archive ouverte pour percevoir l’étendue des recherches menées, et la quantité des travaux publiés (qu’ils n’imaginaient pas). Et pour un pays comme la France ? Nous arguons que des données sur l’activité et la production de la recherche existent déjà mais qu’elles sont enfouies dans les organismes. Une première étape consisterait donc à les rassembler et les publier : c’est l’injonction de l’open data faite à l’administration française et qu’est chargé de coordonner un service du Premier ministre, Etalab.

L’open data selon l’ANR

Forts du mandat donné à Etalab pour favoriser l’ouverture des données des établissements publics administratifs (dont fait partie l’ANR), nous avons demandé en mars 2012 que soit publié sous forme exploitable l’ensemble des données concernant les projets financés par l’agence (montants, laboratoires, chercheurs, thématiques, durée…). Cette demande portée par Deuxième labo était co-signée par sept chercheurs, développeurs et journalistes. En voici un extrait :

Bonjour,

nous (…) demandons solennellement à Etalab l’ouverture des données de l’Agence nationale de la recherche, en particulier celles qui concernent les dotations qu’elle octroie.

Depuis la Loi d’orientation et de programmation de la recherche de 2006, l’Agence nationale de la recherche (ANR) regroupe plusieurs aides de l’État auparavant dispersées, pour offrir aux chercheurs un guichet unique permettant de financer leurs projets de recherche. Les moyens d’action de l’ANR, même s’ils sont réduits en comparaison de l’enveloppe générale de la recherche, sont des moyens non récurrents qui jouent un rôle important dans les orientations de recherche des laboratoires. On estime que l’enveloppe de l’ANR représente environ la moitié des financements incitatifs reçus par la recherche publique, ce qui correspond à ce jour à 4,8 milliards d’euros accordés à près de 9 000 projets.

Un mois et demi plus tard nous avons été invités à réitérer notre demande sur l’“espace collaboratif d’échanges” d’Etalab, ce que nous fîmes. En l’absence de réaction, nous avons rencontré en janvier 2013 le webmaster de l’ANR et une chargée de mission. Qui nous ont confirmé que ce n’était pas une priorité de l’ANR, au motif que l’ANR ne représenterait que 8 à 10 % du budget total de la recherche publique (mais la moitié des financements incitatifs “sur projets”, comme nous l’indiquions dans notre demande dans l’attente d’une estimation contraire) et que le paysage de la recherche française étant complexe (on l’avait remarqué, merci), l’ANR ne saurait agir en dehors d’une action groupée.

En attendant, il faut se contenter des informations que l’ANR publie sur son site web, à la fois incomplètes et dispersées ! Nous avons fait l’inventaire pour vous :

  • pour chaque appel à projets, pas toujours évident à trouver, vous pouvez accéder à un fichier PDF qui contient la liste des projets sélectionnés, avec pour chacun : l’acronyme du projet, son titre et le nom du chercheur qui le porte. C’est tout. Ni résumé, ni mots clés, ni affiliation ou tutelle, etc.
  • vous pouvez également faire des recherches dans la base de données des projets dite “Suivi bilan”, avec un succès variable : nous n’y avons pas retrouvé le projet FADO (sélectionné en 2007) ni le projet VSN-RAP (sélectionné en 2009) ; en revanche quand ça marche, vous pouvez tomber sur des fiches projet assez complètes
  • si vous n’avez pas peur de vous faire passer pour un partenaire privé (puisque c’est aux partenariats public-privé qu’il est destiné), le Moteur de la recherche donne les titres des projets financés par l’ANR et le nom des labos mais sans résumé. La navigation est sommaire et l’absence de permaliens ne permet pas de partager la page d’un projet. Plus grave sans doute, la couverture est toujours imparfaite : les tests effectués par le réseau du CNRS “Valorisation en sciences humaines et sociales” montrent que sur 12 projets, aucun n’a pu être retrouvé à partir des mots contenus dans les titres. “De plus dans certains cas seul le nom du laboratoire apparaît sans même un titre de projet.”
  • enfin, les jolis cahiers thématiques que l’ANR publie au compte-goutte vous donneront une information supplémentaire, à savoir la liste des productions scientifiques de chaque projet. Cependant, il faudra vous contenter parfois de paragraphes très vagues sans référence à aucune publication. Là où les références précises des publications sont indispensables pour qui veut pouvoir les consulter, éventuellement complétées par des observations plus générales.

Mais la bonne nouvelle c’est que ce n’est pas une fatalité, comme le montre la transparence à l’œuvre au Royaume-Uni !

Pendant ce temps, au Royaume-Uni… et ailleurs

La première chose qu’on attend d’une base de données sur la recherche, c’est d’être à jour et utilisable. La deuxième, c’est d’offrir les informations les plus complètes possibles, avec possibilité d’entrer par projet, par laboratoire, par thématique, par porteur… et d’agréger les données à ces différents niveaux au lieu de faire se côtoyer des informations parcellaires qui ne se parlent pas. Enfin, la troisième c’est d’être réutilisable selon les principes de l’Open Definition, pour laisser le champ libre à de nouvelles analyses, des mashups, des visualisations de données etc.

Tout ceci, on le trouve au Royaume-Uni.

Prenons par exemple l’organisme qui finance les projets de recherche en sciences de la vie, le BBSRC : il propose un moteur de recherche couvrant les données de 3 170 dotations octroyées pour un total de 1,2 milliard de livres, avec une date de dernière mise à jour clairement indiquée. La base de données comprend aussi bien des fiches projet que des fiches chercheur (voir capture ci-dessous).

Ficher chercheur BBSRC

Exemple de fiche d’un chercheur financé par le BBSRC.

Voici une base de données à jour et facile d’utilisation, avec des informations riches et agrégées à différents niveaux. Mais ce n’est pas tout : le BBSRC, avec les 6 autres agences de financements de la recherche britannique, a mis en place le portail national “Gateway to Research” qui recense l’ensemble des subventions (toutes disciplines confondues) et leurs bénéficiaires depuis 2006 ! Un véritable état des lieux de la recherche au Royaume-Uni, actuellement en version bêta, en attendant la version stable prévue d’ici la fin de l’année.

Ce portail possède la même structure de données que le site du BBSRC  : fiches projet (voir capture ci-dessous), fiches chercheur, et prochainement des fiches secteur géographique et des fiches thématiques.

Fiche projet GtR

Exemple de fiche projet du portail “Gateway to research”.

Le portail “Gateway to research” va plus loin en autorisant la réutilisation de ses données (placées sous l’Open Government Licence) via une API, et l’organisation d’un hackathon pour inviter des développeurs à s’en emparer !

Dernier point : le code même du portail est libre et sera publié sous une licence open source quand ses auteurs en seront suffisamment satisfaits ! Nous sommes peu habitués à autant d’ouverture et de transparence en France 😉

Les plus attentifs auront remarqué dans la capture ci-dessus d’une notice “Gateway to Research” l’onglet “Publications”, parfois remplacé par “Impact”. Il recense les livrables scientifiques (research outputs) du projet de recherche, une information cruciale pour évaluer la réussite du projet et capitaliser sur ses productions. C’est également un levier puissant à l’heure où l’impact socio-économique de la recherche doit sans cesse être démontré. Encore plus en sciences humaines et sociales : ainsi, l’agence de financement britannique de la recherche en sciences sociales et économiques (ESRC) met en avant sur son site une rubrique “Impacts and findings”, dont un “Research catalogue” qui comprend plus de 100 000 publications issues de projets financés (voir capture ci-dessous pour un exemple). À comparer avec l’ANR, où seuls les cahiers thématiques vous donnent les outputs des projets de recherche, souvent réduits à la portion congrue.

Output projet ESRC

Exemple de publication issue d’un projet financé par l’ESRC.

Nous reviendrons dans le prochain volet sur la mécanique des flux d’information qui permet au portail fédérateur “Gateway to research” de fonctionner si parfaitement. En attendant, signalons quelques initiatives similaires dans d’autres pays :

  • en Slovénie, Science Atlas publie les données de 5 716 projets de recherche, 682 905 publications, 35 272 chercheurs, et 17 190 conférences vidéo
  • [MàJ 09/02/2014] en Slovaquie, SK CRIS recense 18 165 chercheurs, 10 544 projets, 1 267 organisations et 7 425 publications et autres valorisations de la recherche (voir ces explications en français)
  • aux Pays-Bas, NARCIS recense 59 427 chercheurs, 852 320 publications, 2 894 organisations et 29 077 jeux de données (un projet qui fêtera ses 10 ans en 2014 !)
  • en Flandre (région néerlandophone de la Belgique), le FRIS (Flanders Research Information Space) Research Portal publie les données de 25 779 projets de recherche, 3 596 publications, 2 083 organisations et 26 647 chercheurs. Sur chaque notice, une visualisation permet d’explorer le réseau hybride composé de ces différentes entités :
Réseau chercheur FRIS

Réseau du chercheur Stefaan De Henauw tracé par le FRIS Research Portal.

L’open data selon le Ministère de l’enseignement supérieur et de la recherche

Gonflés à bloc par ces bonnes pratiques de l’étranger, nous avons voulu élargir nos investigations aux données du Ministère disponible sur le portail open data de l’État français. Résultat : rien !

https://twitter.com/deuxieme_labo/status/341512919902740480

Passée cette surprise, on nous encourage sur Twitter à creuser un peu, jusqu’à trouver certaines données sur les effectifs de la recherche publique, provenant du Ministère de l’éducation nationale (voir capture ci-dessous) : problème de production des données ? Problème d’attribution (plus probable) ? En tous cas ça ne fait pas sérieux !

Sur data.gouv.fr, des données sur les effectifs de la recherche publique provenant du Ministère de l’éducation nationale ?

Sur data.gouv.fr, les données sur les effectifs de la recherche publique proviennent du Ministère de l’éducation nationale.

Interrogé, le Ministère nous a répondu sur Twitter qu’il allait publier plus de statistiques ; effectivement, un mois plus tard était publiée sur data.gouv.fr la nouvelle édition de l’Atlas régional des effectifs étudiants. Et le Ministère de renvoyer également à l’état des lieux chiffré publié sur son site, ce à quoi nous avons répondu que des indicateurs synthétiques ne suffisent pas, et qu’on attend également des données brutes, des référentiels etc.

En particulier, nous sommes très intéressés par le répertoire national des structures de recherche, qui est aujourd’hui en phase de pilote opérationnel après plusieurs années de discussion et de travail. Il a pour vocation de recenser l’ensemble des structures de la recherche publique déclarées par les universités, les grandes écoles ou les organismes de recherche. Il ne constitue pas un système d’information sur la recherche ; il est un référentiel qui permet de mettre en correspondance les informations sur une même structure résidant dans les différents systèmes d’information du ministère ou des établissements. Parmi les utilisateurs naturels du répertoire, le Ministère citait en 2008 l’ANR, pour “tirer les bilans par établissement (universités, organismes) des candidatures et des lauréats”, en rattachant chaque structure de recherche à sa ou ses tutelle(s). Ce répertoire doit aussi servir à identifier les structures pour entretenir in fine “une banque de données sur les compétences et les ressources des laboratoires”.

Cependant, la nécessité de conférer une certaine autorité à cette liste alourdit ses mises à jour et leur validation. Certains acteurs que nous avons interrogé préfèrent la “légèreté” d’autres répertoires “de fait”, sur lesquels nous reviendrons dans l’épisode 2. Il n’empêche que le Ministère aurait vocation à rendre ce référentiel disponible au titre de l’open data, pour ouvrir la porte à d’autre exploitations possibles.

Vous avez dit interopérabilité ?

Disposer de jeux de données pays par pays serait un premier grand pas. Mais autant imaginer tout de suite comment relier ces données, en partant du plus petit dénominateur commun et en échangeant nos expériences nationales. C’est l’objectif du consortium d’origine canadienne CASRAI, qui réunit les financeurs de la recherche et les organismes de recherche de différents pays pour créer des standards permettant l’interopérabilité des informations de recherche. Par des ontologies, des taxonomies, etc. ils souhaitent faciliter l’échange de données et leur réutilisation entre les équipes de recherche, les institutions de recherche et les organismes de financement tout au long du cycle de vie de la recherche.

CASRAI a demandé à Deuxième labo d’organiser une présence française lors de la prochaine journée CASRAI Reconnect organisée le 16 mai 2014 à Rome — aux côtés de participants suédois, britanniques… déjà bien actifs. Nous invitons tous les établissements d’enseignement supérieur et de recherche intéressés par rejoindre ce mouvement à nous contacter sans tarder !

Un des objectifs de l’interopérabilité et de l’échange de données entre institutions est de permettre une meilleure compréhension du paysage de la recherche à l’échelle mondiale. Les politiques scientifiques nationales se mènent encore trop au doigt mouillé, et on ne sait encore évaluer parfaitement leur impact, ni les comparer aux politiques des voisins. Seule l’utilisation généralisée et intelligente des données sur la recherche permettra l’avènement d’une politique de la recherche fondée sur des preuves (evidence based).

Vers une politique de la recherche “evidence based”

Quand on conduit un projet et plus généralement une stratégie, il est recommandé de l’accompagner d’indicateurs de performance permettant de mesurer si les objectifs fixés ont été atteints. Le monde de la recherche n’échappe pas aux KPI (key performance indicators), et ceux-ci ne sont pas toujours un gros mot. Ainsi, les organismes qui financent la recherche donnent de plus en plus d’instructions pour un accès libre aux publications : reste à en évaluer l’efficacité ! Ceci nécessite d’avoir de bons systèmes d’information reliant les publications aux dotations… comme le système centralisé FundRef mis en place l’an dernier par l’organisation internationale CrossRef (celle qui assigne les identifiants DOI).

De leur côté, les administrateurs de la recherche ont des problèmes similaires : afin de mieux accompagner les équipes de recherche et d’optimiser la recherche de financements, ils aimeraient notamment pouvoir identifier les labos qui remportent le plus de dotations (pour collaborer avec eux !) et comparer leur performance avec celles des voisins (voir vidéo ci-dessous). Le projet institutionnel G4HE vise à répondre à leurs besoins, en offrant un accès par lot aux données du Gateway to Research et des outils d’aide à l’analyse.

C’est aussi l’objectif du logiciel Dimensions de la société Symplectic, lancé en septembre dernier. Ce logiciel permet de visualiser et naviguer (voir capture ci-dessous) dans les données de financement de la recherche de trois pays — l’Australie (ARC et NHMRC), les États-Unis (NIH) et le Royaume-Uni (RCUK) — en attendant de futures données en provenance d’Europe, du gouvernement fédéral américain et des organismes de bienfaisance britanniques. Alors que le projet FundRef a déjà recensé 4 000 organismes de financement de la recherche dans le monde, l’exhaustivité des données du logiciel Dimensions semble hors de portée (au moins à ce rythme) !

Visualisation des collaborations scientifiques de l'université de Melbourne dans le logiciel Dimensions.

Visualisation des collaborations scientifiques de l’université de Melbourne dans le logiciel Dimensions.

Enfin, on peut aller plus loin avec le projet STAR METRICS de l’économiste américaine Julia Lane, qui vise à donner des fondations empiriques aux politiques de recherche et d’innovation. Les études dont on dispose actuellement dans ce domaine sont en effet lacunaires, pas assez systématiques et pas assez fines — en particulier par manque de données permettant de retracer pas à pas les liens entre dotations de recherche, chercheurs qui les reçoivent et production de ces chercheurs. En réunissant autour de la même table des financeurs de la recherche, des gouvernements, des opérateurs de recherche, des organisations internationales comme CrossRef ou CASRAI et des économistes, il devient possible de :

  • comparer les approches et confronter les retours d’expérience
  • partager le code et les méthodes
  • discuter des problèmes de données et de métadonnées
  • de développer des approches comparatives à l’échelle internationale.

Un séminaire à ce sujet s’est tenu en septembre dernier au Ministère de l’enseignement supérieur et de la recherche, signe que l’on espère annonciateur de nouvelles à venir ! Il réunissait quelques français (représentant l’ANR, l’OST, le ministère et deux laboratoires d’économie de l’ENSAE et de l’université de Strasbourg) et de nombreux spécialistes étrangers dont Julia Lane et un représentant de CASRAI.

Sans tomber dans l’excès inverse de la mesure toute puissante, il nous semble que cette approche installe de bonnes pratiques de transparence et de collaboration, que nous encourageons. Puisse-t-elle sensibiliser nos institutions, toujours sensibles aux benchmarks et autres tableaux de bord, aux bienfaits de l’ouverture et du partage des données !

[MàJ 21 février 2014] Découvrez le deuxième volet de notre enquêtePour une meilleure visibilité de la recherche française 2/3 : Gestion des informations tout au long du cycle de vie de la recherche

21 réponses à Pour une meilleure visibilité de la recherche française 1/3 : Accès aux données sur la recherche

  1. […] Extension du domaine de la recherche  […]

    • maignien yannick dit :

      Excellent article et initiative. Je peux me tromper, mais je vous trouve optimiste sur la capacité de l’administration française a évoluer rapidement vers l’ouverture des donné”es publiques de (ou plutôt sur) la Recherche.
      Ayant été Directeur du TGE ADONIS (CNRS° et responsable de la création d’ISIDORE entre 2007 et 2011,(puis viré par le CNRS), sur ces même finalités de transparence et d’interopérabilité, mais en SHS, je ne peux que témoigner de l’importance des obstacles de tout genre, de la part des directions des institutions de la Recherche ou de l’Enseignement supérieur…mais aussi de nombreux protagonistes qui font leur fond de commerce de l’Open … (ce qui ne facilite pas les choses). Certains ont très bien compris que compétition, rivalités personnelles et carriérisme passaient par ce nouveau terrain de lutte !
      Cf un extrait : ” Les nouvelles frontières numériques des sciences” http://www.donneesdelarecherche.fr/spip.php?article186
      Cela dit, bravo pour votre étude et votre initiative, que je signe des deux bras.
      Yannick

  2. Dord-Crouslé Stéphanie dit :

    Bonjour,
    article très intéressant!
    Pour info, j’ai porté un projet financé par l’ANR (Corpus 2007) et il a fallu que je me batte pour faire un rapport final (ils m’avaient administrativement “perdue” depuis 2 ans et semblaient n’y accorder aucune importance!) et pour savoir si je pouvais bien le mettre sur HAL!
    Il y a en effet du boulot pour savoir qui est financé pour faire quoi et évaluer ce qui est effectivement produit au terme du financement…
    Cordialement,
    S.Dord-Crouslé

  3. […] Cet article rend compte d’une enquête en trois volets que nous avons menée pour comprendre d’où venait le manque de visibilité et de lisibilité de la recherche française. À défaut d’avoir pu tout couvrir, l’enquête nous a menés sur la voie de l’open data, mais pas au sens où on l’entend traditionnellement en science : ce qui nous intéresse ici ce sont les données sur la recherche récoltées par les administrateurs, et non pas les données scientifiques produites par les chercheur/ses. Cette distinction, qui devrait sauter aux yeux dès notre premier article, est reconnue notamment du Ministère de l’enseignement supérieur et de la recherche. Nous vous souhaitons une bonne lecture, en espérant ouvrir un chantier qui nous emmènera loin !  […]

  4. Dalb75 dit :

    Bonjour, Merci de ce travail.
    L’OST pour pouvoir produire des indicateurs, n’aurait-il pas ces données à la source – vu l’éventail des organismes regroupés au sein de ce GIP, il est aux premières loges pourrait-on dire (http://www.obs-ost.fr/fr/page/presentation).
    J’ai en mémoire sa création en 1990….

  5. Gaïa dit :

    Puisque que vous m’y avez invité, voici quelques commentaires. La lecture du billet m’a beaucoup intéressé et me parait contenir beaucoup d’éléments constructifs. D’autres sont plus discutables et je vais focaliser mes commentaires sur ces derniers.

    L’article précise bien que les données auxquelles vous voulez accéder ne sont pas des données scientifiques mais des données sur la recherche (données administratives). En tant que chercheur (et membre d’université, labo, école doctorale) je peux vous assurer qu’on nous sollicite beaucoup pour fournir ce genre de données, avec des formats différents et toujours avec des questions posées un peu différemment ; souvent aussi avec des informations stupides et inutiles et qui prennent beaucoup de temps à agréger. S’il pouvait y avoir une amélioration du système, ça serait d’avoir un service unique de collecte de données dans lequel les financeurs, administrateurs et contribuables viendraient prendre ce qui les intéresse.

    Vous voulez savoir « qui fait quoi » ou essayer de comprendre comment ça marche (la structure du système de la recherche). Je crois que vous vous faites de douces illusions. Mais je peux vous assurer que de l’intérieur personne n’y comprend rien (on fait juste illusion, pour ne pas paraitre idiot …). C’est devenu beaucoup trop compliqué. S’il y a là quelque chose à réclamer c’est d’abord un choc de simplification de grande ampleur.

    Vous avez l’air de penser que pour avoir des données quantitatives sur la recherche il suffirait que les chercheurs mettent leurs travaux sur un serveur « archives ouvertes ». Je n’ai rien contre cette idée, au contraire, mais vous n’allez pas en extraire grand-chose, mis à part de compter les publications (en termes de données « administratives » sur la recherche).

    Non les données quantitatives sur la recherche ne sont pas enfouies dans les organismes. Hormis les aspects financiers, la capitalisation des productions existent dans les moteurs de recherche (payants, de type Scopus ou Thompson Reuters). C’est là que vous trouverez beaucoup de choses sur la recherche française (et aussi partout ailleurs) ; selon les disciplines, les labos, les universités, les pays … Certaines sont gratuites (exemple : Scimago). Comme mentionné un peu plus haut dans les commentaires, l’OST est aussi un formidable outil, avec beaucoup de données (certes ce n’est que macroscopique, pas possible d’aller voir le projet bidule financé par l’agence truc).

    En filigrane, vous semblez reprocher à l’ANR des manquements. D’accord, critiquer l’ANR c’est de bon ton. Mais je pense que vous vous trompez de cible. L’ANR a fait un réel effort de transparence et d’incitation à ce que les projets et résultats soit disponibles et accessibles (obligation d’avoir un site web pour chaque projet, de rendre des compte périodiquement sur les résultats, etc …). Si le travail est mal fait c’est certainement un peu à cause de l’agence qui n’arrive pas à bien tout suivre mais c’est aussi à cause des chercheurs qui font rarement ce travail consciencieusement. Par ailleurs l’ANR n’est que petite partie de la recherche. Vous n’aurez qu’une vision très parcellaire de la recherche avec l’ANR.

    A mon sens la seule structure qui pourrait être adaptée à votre requête c’est l’AERES (agence d’évaluation). Cette agence a évalué tout le monde et a donc des données qualitatives et quantitatives sur tous les volets (financiers, production, effectifs, …), à une granulométrie qui va jusqu’à l’équipe de recherche (quelques personnes). C’est une mine formidable d’informations. Malheureusement on vient de la fermer …

    Voilà pour ces quelques commentaires « critiques », qui ne doivent en aucun cas occulter la qualité de votre travail très intéressant.

    • Merci Gaïa pour ce long commentaire 🙂

      Nous traiterons de la saisie des données et de l’optimisation de la paperasserie (un oxymore ?) dans notre second volet. C’est évident que les données existent, il faut rationaliser leur collecte et leur circulation.

      Le dépôt des publications dans une archive ouverte (green OA) est une (nécessaire) première étape, et une partie seulement de la solution aux problèmes, nombreux, évoqués ici.

      D’accord pour mêler l’AERES à cette histoire ! Même si ce serait un comble que l’AERES possède plus de données que l’ANR sur les projets financés par l’ANR. Pour reprendre l’exemple britannique, on s’aperçoit que les évaluation pluriannuelles du REF ont poussé les acteurs à s’organiser et mieux gérer leurs informations, au lieu de se dire que leur travail était terminé une fois les données en possession du REF. Il ne faudrait pas qu’en France on attende trop de l’AERES, comme maillon “final” de la chaîne de traitement.

      Concernant l’OST, vous dites bien que les données sont très macro. J’ajouterai qu’elles sont aussi privées (les “données bibliométriques OST” viennent d’abord de Thomson Reuters) et qu’elles ont été coûteuses à nettoyer (exemple du chantier NormAdresses, encore une preuve de notre manque d’optimisation de la chaîne de publication).

    • Gaïa, comme je te le disais, notre deuxième article traite de la bonne gestion des informations tout au long du cycle de vie de la recherche, pour éviter les lourdeurs administratives : http://www.deuxieme-labo.fr/article/gestion-des-informations-cycle-de-vie-de-la-recherche/

  6. […] Extension du domaine de la recherche  […]

  7. […] Extension du domaine de la recherche (Pour une meilleure visibilité de la recherche française 1/3 : Accès aux données sur la recherche http://t.co/NK4qSaNzDm)…  […]

  8. […] Accès aux données sur la recherche | Deuxième labo […]

  9. Bonsoir,

    cet article est très intéressant, riche et effectivement souligne la difficulté que tout observateur peut avoir quand il s’intéresse à la recherche française : obtenir une vision d’ensemble. Et effectivement, l’accès aux données quand il est possible est réservé à un petit nombre de privilégiés (en fait, pour le cas abordé de l’ANR, cela est très fortement lié à la jeunesse de l’agence – créée en 2005 – qui n’a intégré l’ensemble de ses programmes que sur le tard, et que la critique nourrie subie d’une part de la communauté scientifique française n’a pas favorisé un projet de normalisation des pratiques de financement).

    La transparence de l’utilisation de l’argent public, à partir du moment où il ne contribue pas à exposer trop facilement des chercheurs au feu de l’actualité, ne peut qu’être revendiquée. Je souhaiterais juste ouvrir un peu la discussion sur le risque de réifier l’objet “projet” auquel on pourrait attribuer une signification unique (sans pour autant prétendre ajouter des éléments neufs au débat, simplement rappeler quelques points qui semblent pertinents, car si la discussion sur les dérives de la scientométrie a déjà été fortement nourrie concernant la bibliographie, cela est moins le cas sur la question des financements). A moins de généraliser la feuille de temps et un suivi précis de la répartition des sommes sur l’ensemble des partenaires d’un projet (car souvent, il y a plus d’un laboratoire), on risque de créer une fiction au moment d’agréger les données. Ajouté à cela la balkanisation croissante des sources de financements (si on en reste à la recherche fondamentale qui ne bénéficie ni de fondations biomédicales, ni d’entreprises privées, la gamme de financement peut aller des appels internes aux organismes aux grands financeurs internationaux type HFSP en passant par les bourses de thèses ministérielles), l’ANR n’est ni négligeable, ni représentative dans beaucoup de situations. Sans même aborder le fait que le rapport à l’argent des différentes thématiques de recherche varie dans des proportions telles qu’à somme comparable, on compare des réalités radicalement différentes, et que des arrangements locaux plus ou moins importants contribuent à rendre flou la portée de telles données (entre les laboratoires qui mettent en commun tous leurs financements sur projets, et les laboratoires hautement compétitif où seule l’équipe est pertinente, comment identifier le niveau pertinent d’analyse). Et ça, c’est sans parler du problème de mesure d’impact, et de l’attribution de telle ou telle publication à un financement, ce qui pour certains domaines de recherche peut relever de la fiction pure et simple. A trop rationaliser, on risque de forcer les éléments à rentrer dans les cases des tableaux excel, dont j’attends avec impatience l’analyse dans le prochain volet de l’enquête

    Tout ça pour dire la trivialité suivante : l’evidence based policy menée à partir de constitution de base de données de ce type risque, à moins d’une vigilance constante sur les formes réelles d’interdépendance qui existent entre financements et pratiques de recherche, d’approfondir la dynamique de découplage déjà soulignée dans la tendance à la managerialisation de la recherche (Vilkas, 2009)

    Encore une fois, merci pour cette enquête qui soulève de très nombreuses questions.

    Vilkas, C. (2009). Des pairs aux experts: l’émergence d’un «nouveau management» de la recherche scientifique?. Cahiers internationaux de sociologie, (1), 61-79.

  10. Une version courte de cet article a été publiée dans Le Monde du 4 décembre, sous forme de tribune dans le cahier Sciences & Médecine. Les premiers commentaires sont également très intéressants !

  11. […] Cet article rend compte d’une enquête en trois volets que nous avons menée pour comprendre d’où venait le manque de visibilité et de lisibilité de la recherche française. À défaut d’avoir pu tout couvrir, l’enquête nous a menés sur la voie de l’open data, mais pas au sens où on l’entend traditionnellement en science : ce qui nous intéresse ici ce sont les données sur la recherche récoltées par les administrateurs, et non pas les données scientifiques produites par les chercheur/ses. Cette distinction, qui devrait sauter aux yeux dès notre premier article, est reconnue notamment du Ministère de l’enseignement supérieur et de la recherche.  […]

  12. […] Cet article rend compte d’une enquête en trois volets que nous avons menée pour comprendre d’où venait le manque de visibilité et de lisibilité de la recherche française. À défaut d’avoir pu tout couvrir, l’enquête nous a menés sur la voie de…  […]

  13. Dans leur rapport sur l’évaluation de la recherche et le passage de l’AERES au HCERES, Denise Pumain et Frédéric Dardel regrettent le manque d'”interopérabilité des données de base qui sont souvent dispersées ou
    dupliquées entre plusieurs lieux de production et d’utilisation. On peut évoquer à l’autre extrême l’exemple
    du Brésil, où chaque chercheur et enseignant chercheur dispose d’un registre qui contient l’ensemble de
    ses activités et de sa production… Sans viser une telle mise à plat exhaustive qui pourrait susciter des
    réactions de rejet justifiées par le besoin de liberté et de confidentialité des recherches, de substantiels
    gains de temps pourraient être réalisés par les évaluateurs et les évalués, en évitant de compiler plusieurs
    fois les mêmes informations élémentaires, pour répondre à une diversité de demandes.”

  14. […] … publications…) ? Dans ce premier volet d'une enquête en trois parties, plongez avec nous au pays des données (pas encore ouvertes) sur la recherche, de l'ANR au Ministère en passant par le Royaume-Uni et la Flandre !  […]

  15. […] Extension du domaine de la recherche (De la visibilité de la recherche … http://t.co/0jK0vay02H)  […]

  16. […] " Cet article rend compte d’une enquête en trois volets que nous avons menée pour comprendre d’où venait le manque de visibilité et de lisibilité de la recherche française. À défaut d’avoir pu tout couvrir, l’enquête nous a menés sur la voie de l’open data, mais pas au sens où on l’entend traditionnellement en science : ce qui nous intéresse ici ce sont les données sur la recherche récoltées par les administrateurs, et non pas les données scientifiques produites par les chercheur/ses. Cette distinction, qui devrait sauter aux yeux dès notre premier article, est reconnue notamment du Ministère de l’enseignement supérieur et de la recherche. "  […]

  17. […] aussi avec des informations stupides et inutiles et qui prennent beaucoup de temps à agréger” (Gaïa). Il ne faudrait pas non plus que nos préconisations conduisent les chercheurs à passer encore […]

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Pour une meilleure visibilité de la recherche française 1/3 : Accès aux données sur la recherche

Et si le manque de visibilité et de lisibilité de la recherche française venait aussi de la façon dont on gère les informations sur la recherche (dotations, laboratoires, publications…) ? Dans ce premier volet d’une enquête en trois parties, plongez avec nous au pays des données (pas encore ouvertes) sur la recherche, de l’ANR au Ministère en passant par le Royaume-Uni et la Flandre !