" "
Sciences Po | Library - New window

Guides thématiques

Données de la recherche

       DES DÉTAILS !

Rendre ses données Réutilisables

 Conformité RGPD, Loi Lemaire et Droit de la propriété intellectuelle actés

 Licences de diffusion autorisant la réutilisation clairement apposée, mention de provenance explicite et traçable, ancrage dans les standards de la communauté scientifique

 Data paper explicitant les implications du jeu de données rédigé.

►​ C'est quoi les données de la recherche ? C'est quoi les principes FAIR ?

Des données réutilisables = conformité RGPD

Avant tout, un petit logigramme créé par l'Institut Pasteur pour vous aider à situer votre cas dans la jungle des possibles.
 

Toute l'info en vidéo

Pour s'initier

[Vidéo] Données personnelles et vie privée : ce qui va changer avec le RGPD, Lionel Maurel (Calimaq), 2018, Sous Sol Productions


Toute l'info en quelques outils phares

Sciences Po met à votre disposition des outils [accès réservé] dédiés à la conformité et à la sécurité des traitements et mène des actions d'information, sensibilisation et d’accompagnement au respect de la réglementation.
Cher.e.s doctorant.e.s : vous n’avez pas accès à l’intranet. Vous pouvez demander l’accès à ces documents au secrétaire général de votre laboratoire ou vous adresser à 
data.bib@sciencespo.fr.

1. Données personnelles : formalités éthiques

 
|               

2. Déclaration de traitement


|               

3. Formulaire de
consentement


 |

4. Engagement de confidentialité


|               


5. Mentions légales
types

 


|

6. Modèles de contrats et conventions

Contacter la DAJAM

7. Modèle d’analyse d’impact sur la vie privée


|               

8. Analyse d'impact en cas de violation de données



Plus d'outils

 



Toute l'info en un principe (1/2) : 
protection des données

Les traitements de données à caractère personnel s'inscrivent dans un cadre juridique français et européen en matière de protection des données. Celui-ci a pour objectif de renforcer les droits des personnes et de responsabiliser les acteurs à qui il appartient d’assurer et de justifier la conformité et la sécurité des traitements de données personnelles tout au long de leur cycle de vie.

► C'est quoi une donnée à caractère personnel ?

Toute information relative à une personne physique susceptible d'être identifiée, directement ou indirectement, est une donnée à caractère personnel, peu importe que ces informations soient confidentielles ou publiques. Pour que ces données ne soient plus considérées comme personnelles, elles doivent être rendues anonymes de manière à rendre impossible toute identification de la personne concernée.

Attention : s'il est possible par recoupement de plusieurs informations (âge, sexe, ville, diplôme, etc.) ou par l'utilisation de moyens techniques divers, d'identifier une personne, les données sont toujours considérées comme personnelles. 
Source : CNIL – http://www.cnil.fr  (03/07/2018)  Licence Creative Commons

► C’est quoi une donnée sensible?
La CNIL vous propose une définition pour déterminer si votre projet comprend des données personnelles sensibles.

Quelles formalités ?

1 - Déclaration de traitement de données

Tous les traitements de données sont soumis aux formalités obligatoires et préalables prévues notamment par le Règlement européen à la protection des données, la loi Informatique et Libertés, la loi pour une République numérique et le Code du patrimoine.

Comment faire ? Remplir le registre des traitements de données de la recherche de Sciences Po (Obligation Art. 30 RGPD).

2 - Analyse d'impact sur la protection des données - AIPD (si vous traitez des données très sensibles)

Le projet est susceptible d'engendrer un risque élevé pour les droits et libertés des personnes physiques compte tenu de sa nature, de sa portée, du contexte et des finalités ? Le responsable du traitement effectue, avant la déclaration de traitement, une analyse de l'impact des opérations de traitement envisagées sur la protection des données à caractère personnel (Obligation Art. 35 RGPD).

Comment savoir si votre projet doit passer par la case AIPD ? C'est
par ici. 

Pour ce faire :
- un modèle 
d'Analyse d'Impact sur la Protection des Données (AIPD)
- un outil d'évaluation du niveau de risque de votre traitement de données personnelles ; le résultat viendra nourrir la rédaction de l'AIPD en lien avec la DPO.

Votre contact : Marion Lehmans et Nawale Lamrini, Déléguées à la protection des données (DPO). 

Vos ressources dédiées
- la page dédiée à la
protection des données
- un support de formation à la protection des données.
- 15 recommandations aux chercheurs produites par l'association SupDPO (Délégués à la protection des données de l'Enseignement Supérieur, de la Recherche et de l'Innovation), en partenariat avec le réseau R3Sup des responsables recherche ;
- les lignes directrices du Comité européen de protection des données (CEPD)en matière de consentement.

- un Guide pratique de la CNIL sur les obligations en matière de durée de conservation des données.



Toute l'info en un principe (2/2) : déontologie

Sciences Po a mis en place un comité de déontologie de la recherche (CDR) afin de s’assurer que les projets de recherche respectent la politique de déontologie qu’elle a fixée. Le comité se prononce sur les questions éthiques hors RGPD, sur les projets de recherche financés par des bailleurs de fonds nationaux, européens et internationaux uniquement. Il n'est pas en mesure de traiter les demandes des doctorant.e.s par exemple. Un chantier est en cours visant à nommer un référent scientifique sur ces questions et à rédiger une charte de déontologie de la recherche.

Votre contact  : Marinela Popa-Babay

Vos ressources dédiées
Pour en savoir plus sur le CDR, ses actions et la manière dont il peut être saisi, consulter la rubrique Déontologie sur le site de la recherche de Sciences Po.

Des données réutilisables = data paper explicitant les implications du jeu de données
 

Un data paper : ça sert à quoi ?

 

  • Cet article "peer reviewed", révisé par les pairs, est publié dans une revue scientifique classique publiant différentes formes d’articles dont des data papers ou dans un data journal, revue contenant exclusivement des data papers. Les critères de relecture sont classiques : qualité générale du manuscrit, citations appropriées, respect des instructions

  • Il informe sur la disponibilité du jeu de données, montre son originalité et son potentiel de réutilisation ; il rend les données intelligibles. Il donne accès aux données via des hyperliens pérennes. Il ne contient pas d'hypothèses, d'éléments d'interprétation ou de conclusions d'analyse. Il peut être très synthétique ou très complet.

  • Il décrit un ou plusieurs jeux de données scientifiques brutes, notamment à l’aide des métadonnées. De l’intérêt de réutiliser les métadonnées utilisées pour le dépôt du jeu dans un entrepôt de données : gain de temps. Il décrit de manière détaillée le protocole de recherche. Il décrit le contexte d’obtention des données, la fiabilité des données, un peu comme les fichiers "read me"/"lisez-moi" associés aux jeux de données ou les dictionnaires de données.

  • Il indique l'identifiant pérenne apposé au jeu de données grâce au dépôt dans un entrepôt comme data.sciencespo.

  • Il apporte une reconnaissance supplémentaire pour les travaux en cours (article citable). Or, la citation reste l'élément de base de l'évaluation (quantitative) de la recherche. Le data paper permet à l'auteur d'être mis en valeur comme créateur et gestionnaire de données dans la mesure où dans les faits, les données sont moins citées que les articles.

Exemples : Data in brief, Research Data Journal for the humanities and social sciences.

► Le potentiel de réutilisation de vos données par d'autres sciences peut constituer un argument majeur pour convaincre un.e rédacteur.trice en chef d'accepter votre data paper.


Comment rédiger un data paper ?

 

  • Construction comme un article classique 

  • Page de titre avec un titre se concentrant sur les données spécifiques et avec les noms, les affiliations, voire les e-mails des auteurs

  • Résumé, parfois des mots-clés,

  • Introduction présentant l’arrière-plan de l’étude (contexte, enjeux généraux et spécifiques comme dans un article classique) : les questions de recherche à l’origine de la collecte des données et la plus-value de cette collecte (originalité et potentiel d’utilisation en recherche), description des matériels et méthodes pour permettre de reproduire l’étude (protocole expérimental, méthode d’échantillonnage)…

  • Description des données pour permettre de les réutiliser : structure, format, état (brut, filtré, analysé), disponibilité, explication de données aberrantes, sources (ville, pays, coordonnées GPS)…

  • Des informations justifiant la fiabilité et la rigueur des données, avec figures et tableaux : validation, qualité et rigueur de la procédure de collecte de données (appropriée, actuelle, claire, reproductible), analyses statistiques de l'erreur expérimentale, évaluation d'échantillons, structure de la base de données, organisation logique, intégrité : vérification d'erreurs potentielles...

  • Si besoin, conseils pour la réutilisation des données

  • Remerciements, contributions des auteurs, mention d’éventuels conflits d’intérêt

  • Liste des références bibliographiques

  • Figures, tableaux, annexes relatifs à la méthodologie, à la qualité des données ou proposant une synthèse des données.

Conseil : lire les instructions aux auteurs des revues. Les revues proposent parfois des modèles de fichier, de présentation ou d'organisation (templates, tool kit...). Certaines revues possèdent leur propre entrepôt de données. Les petits jeux de données peuvent être accessibles directement sur le site de la revue sous la forme de fichiers supplémentaires.

Outils d'aide à la rédaction : Fonio, Arpha Writing tool...

Des données réutilisables = conformité Loi Lemaire



La Loi Lemaire : c'est quoi ?

La loi Lemaire vous donne le droit de déposer en archive ouverte la version post-print de vos publications de SHS (post-print = revue par les pairs, sans la mise en page éditeur), dans les 12 mois suivant publication.


Mais quid des données ?

Spécificités des données de la recherche in Loi pour une république numérique 2016, art. 30 : « Dès lors que les données issues d'une activité de recherche financée au moins pour moitié par des dotations de l’Etat (…) ne sont pas protégées par un droit spécifique ou une réglementation particulière et qu'elles ont été rendues publiques par le chercheur, l'établissement ou l'organisme de recherche.  L'éditeur d'un écrit scientifique mentionné ne peut limiter la réutilisation des données de la recherche rendues publiques dans le cadre de sa publication. » Leur réutilisation est donc libre.

Spécificités des données administratives : le principe d'ouverture s'applique particulièrement pour les données dont la publication présente un intérêt économique, social, sanitaire ou environnemental (Article L312-1 du Code des relations entre le public et l’administration).

La loi Lemaire acte donc le principe d’ouverture par défaut des données publiques. Par extension, les données de la recherche sont assimilées à des données publiques.


La Loi Lemaire règne-t-elle sans partage sur le partage des données ?

Non ! Par ici un guide d'analyse du cadre juridique de l'ouverture des données de recherche en France :
Becard, N., Castets-Renard, C., Chassang, G., Dantant, M., al. (2017). Ouverture des données de la recherche. Guide d'analyse du cadre juridique en France. 45 p., DOI:10.15454/1.481273124091092E12

Des données réutilisables = conformité Droit de la propriété intellectuelle


Qui a le droit de faire quoi ?

Un arbre pour vous aider à répondre à cette question épineuse : à qui appartiennent les données du chercheur ?

  • Aux chercheurs si elles sont transformées, sélectionnées ; les analyses sur les données sont au chercheur

  • Statut juridique des données brutes : les informations au sein d’une base de données sont dites de « libre parcours » : aucun monopole légal à son détenteur ; seule la structure de la base de données peut prétendre à être protégée par le droit de la propriété intellectuelle si elle est originale ; 15 ans de protection. C'est ce qu'on appelle le « droit sui generis des bases de données ».
    Plus d'infos sur le statut juridique des données brutes en Europe, en Allemagne, au Royaume-Uni dans le rapport de SURF. Pour ceux d'entre vous qui ont un partenaire hollandais, IXA peut vous appuyer sur ces sujets.

 

 



Le point de vue de Lionel Maurel


Votre contact (propriété intellectuelle, contrats, conventions)
 : nicole.paris@sciencespo.fr

C'est quoi la différence entre un contrat de cession et un contrat de licence ?

Contrat de cession

Dans un contrat de cession de droits à un éditeur par exemple, l’auteur ne cède pas ses droits moraux (paternité, divulgation, retrait) : le chercheur est toujours le créateur de l’enquête qu’il a mené, personne ne peut se réapproprier son travail. En revanche, il peut céder tout ou partie de ses droits patrimoniaux (représentation, reproduction) sur l’œuvre à un tiers de manière exclusive : un éditeur par exemple. Quelques attendus :

  • Exigence d’un écrit

  • Droits clairement rémunérés

  • Délimitation du nombre d’usages et du type d’usagers

  • Délimitation géographique et temporelle de la cession

  • Eventuellement rémunération de la cession qui peut être gratuite, l’exclusivité ou non de la cession.

Licence

L'auteur autorise l’usage de certaines prérogatives patrimoniales à un tiers de manière non exclusive. Ce tiers n’est pas pour autant titulaire de droits sur l’œuvre ; il cède son :

  • Droit de reproduire les données

  • Droit de réutiliser les données

  • Droit d’utiliser les données à des fins commerciales ou non

  • Partage des données à l’identique

Des données réutilisables = licence de diffusion clairement apposée


Licence ouverte/Open license


Licences Etalab : la licence ouverte est conçue par Etalab pour faciliter et encourager la réutilisation des données publiques mises à disposition gratuitement. Cette licence de diffusion ouverte des données publiques françaises vise à diffuser des données acquises grâce à des fonds publics : la reproduction, la modification, l'utilisation commerciale sont permises si la mention d’attribution et la date de dernière mise à jour sont précisées.

Ex : jeux de données de data.gouv.fr.
L'objectif de data.gouv.fr est de regrouper les informations dans une plateforme publique de données spécialisées, clairement identifiées et labellisées et de lutter ainsi contre les risques de gommage des frontières jusque-là assez claires entre information publique, officielle, privée et grand public et faciliter les recherches de l'internaute.
Lawrence Lessing, la créatrice de la licence Creative Commons (cf. ci-dessous), souligne le risque de contestation de la moindre décision ou ligne de dépense publique par des groupes d'intérêt et le risque de trafic des données et d'orientation en fonction des attendus du producteur de données.


Djibril CC vous présente les licences CC


►​ Licences CC = licences Creative Commons

La plus connue, la licence Creative commons, créée par la juriste Lawrence Lessing, permet d'accorder des droits de réutilisation et de reproduction à la personne qui consulte votre ressource. Elle enrichit le droit d'auteur qui s'applique par défaut. Elle fonctionne comme des briques que vous décidez d’apposer ou non à votre ressource
 

  • BY : mention d’attribution, créditer l’auteur

  • NC : usage non commercial, restreint les possibilités de réutilisation

  • ND (non derivative) : pas de modification, impossible d'intégrer tout ou partie dans une oeuvre composite

  • SA (share alike) : partage autorisé mais dans les mêmes conditions/la même licence que celle choisie par l’auteur original, réduit l'interopérabilité des données

Remarques :

Creative Commons est une organisation à but non lucratif.
 

►​ Licences CC adaptées aux données

  • Licence CC-BY-4.0 : équivalent CC-BY : possibilité de réutilisation large des données mais en créditant l'auteur

  • Licence CC-O : équivalent Etalab ou Licence Ouverte + : les données tombent dans le domaine public, réutilisation sans restriction, mention d’attribution fortement recommandée ; cette licence est imposée par quelques entrepôts de données ou éditeurs/revues : Dryad, Nature

  • Licence CC-SA : share alike, partage dans les mêmes conditions, selon la même licence, la même combinaison de briques.

 

Licence OKF Open Knowledge Foundation



Les
 Licences OKF Open Knowledge Fundation sont plutôt orientées bases de données :

  • Licence ODC-by : Open Database Commons : équivalent CC-by : indiquer le nom du créateur de la base de données originale. Elle est utilisée par l’éditeur Pensoft.

  • Licence ODC-ODBL Open database License : équivalent CC-SA

  • Licence PDDL Public domain dedication and license : équivalent CC-O

    Elle n’affecte pas les brevets, le droit à l’image ou le droit à la vie privée.


    Toute l'info en français.


Licence GNU


Licence GNU General Public License : elle concerne les logiciels (libres) et les programmes.
GNU = gnou = d’où le symbole adopté par les fans des logiciels libres.

Plus d'infos :

 

Dernière mise à jour: Jul 28, 2022 10:30 AM