" "
Vous êtes plutôt passionné.e?
Conformité RGPD, Loi Lemaire et Droit de la propriété intellectuelle actés
Licences de diffusion autorisant la réutilisation clairement apposée, mention de provenance explicite et traçable, ancrage dans les standards de la communauté scientifique
Data paper explicitant les implications du jeu de données rédigé.
► C'est quoi les données de la recherche ? C'est quoi les principes FAIR ?
► Avant tout, un petit logigramme créé par l'Institut Pasteur pour vous aider à situer votre cas dans la jungle des possibles.
[Vidéo] Données personnelles et vie privée : ce qui va changer avec le RGPD, Lionel Maurel (Calimaq), 2018, Sous Sol Productions
Sciences Po met à votre disposition des outils [accès réservé] dédiés à la conformité et à la sécurité des traitements et mène des actions d'information, sensibilisation et d’accompagnement au respect de la réglementation.
Cher.e.s doctorant.e.s : vous n’avez pas accès à l’intranet. Vous pouvez demander l’accès à ces documents au secrétaire général de votre laboratoire ou vous adresser à data.bib@sciencespo.fr.
Contacter la DAJAM
Les traitements de données à caractère personnel s'inscrivent dans un cadre juridique français et européen en matière de protection des données. Celui-ci a pour objectif de renforcer les droits des personnes et de responsabiliser les acteurs à qui il appartient d’assurer et de justifier la conformité et la sécurité des traitements de données personnelles tout au long de leur cycle de vie.
Toute information relative à une personne physique susceptible d'être identifiée, directement ou indirectement, est une donnée à caractère personnel, peu importe que ces informations soient confidentielles ou publiques. Pour que ces données ne soient plus considérées comme personnelles, elles doivent être rendues anonymes de manière à rendre impossible toute identification de la personne concernée.
Attention : s'il est possible par recoupement de plusieurs informations (âge, sexe, ville, diplôme, etc.) ou par l'utilisation de moyens techniques divers, d'identifier une personne, les données sont toujours considérées comme personnelles.
Source : CNIL – http://www.cnil.fr (03/07/2018)
► C’est quoi une donnée sensible?
La CNIL vous propose une définition pour déterminer si votre projet comprend des données personnelles sensibles.
► Quelles formalités ?
Tous les traitements de données sont soumis aux formalités obligatoires et préalables prévues notamment par le Règlement européen à la protection des données, la loi Informatique et Libertés, la loi pour une République numérique et le Code du patrimoine.
Comment faire ? Remplir le registre des traitements de données de la recherche de Sciences Po (Obligation Art. 30 RGPD).
2 - Analyse d'impact sur la protection des données - AIPD (si vous traitez des données très sensibles)
Le projet est susceptible d'engendrer un risque élevé pour les droits et libertés des personnes physiques compte tenu de sa nature, de sa portée, du contexte et des finalités ? Le responsable du traitement effectue, avant la déclaration de traitement, une analyse de l'impact des opérations de traitement envisagées sur la protection des données à caractère personnel (Obligation Art. 35 RGPD).
Comment savoir si votre projet doit passer par la case AIPD ? C'est par ici.
Pour ce faire :
- un modèle d'Analyse d'Impact sur la Protection des Données (AIPD)
- un outil d'évaluation du niveau de risque de votre traitement de données personnelles ; le résultat viendra nourrir la rédaction de l'AIPD en lien avec la DPO.
► Votre contact : Nawale Lamrini, Déléguées à la protection des données (DPO).
► Vos ressources dédiées
- la page dédiée à la protection des données
- 15 recommandations aux chercheurs produites par l'association SupDPO (Délégués à la protection des données de l'Enseignement Supérieur, de la Recherche et de l'Innovation), en partenariat avec le réseau R3Sup des responsables recherche ;
- les lignes directrices du Comité européen de protection des données (CEPD), en matière de consentement.
- un Guide pratique de la CNIL sur les obligations en matière de durée de conservation des données
- last but not least : le site dataguidance contient des fiches sur la règlementation en matière de protection des données de plus d'une centaine de pays.
► Nommé pour une durée de quatre ans auprès de la Direction scientifique, le référent à l’intégrité scientifique met en œuvre la politique d'intégrité scientifique de l'établissement, en élabore les procédures de prévention et de traitement, accompagne la communauté académique dans la gestion des risques éthiques en matière de recherche.
Ses principales missions sont la sensibilisation et la formation, l'accompagnement et le conseil, la délivrance d'avis éthiques, la gestion des risques de conflit d'intérêts en matière de recherche et le traitement préalable des allégations de manquement à l'intégrité scientifique.
Alain Chenu, professeur émérite des universités, sociologue, a été nommé RIS de Sciences Po en septembre 2021.
Votre contact : integrite.scientifique@sciencespo.fr
► Sciences Po a mis en place un comité de déontologie de la recherche (CDR) afin de s’assurer que les projets de recherche respectent la politique de déontologie qu’elle a fixée. Le comité se prononce sur les questions éthiques hors RGPD, sur les projets de recherche financés par des bailleurs de fonds nationaux, européens et internationaux uniquement. Il n'est pas en mesure de traiter les demandes des doctorant.e.s par exemple. Le référent scientifique est l'interlocuteur sur ces questions. Une charte de déontologie de la recherche apporte des éléments de réponse.
► Vos ressources dédiées
Mon projet pose-t-il des questions de déontologie ?
Toutes les solutions aux questions de déontologie de la recherche que vous vous posez.
Pour en savoir plus sur le CDR, ses actions et la manière dont il peut être saisi, consulter la rubrique Déontologie sur le site de la recherche de Sciences Po.
Cet article "peer reviewed", révisé par les pairs, est publié dans une revue scientifique classique publiant différentes formes d’articles dont des data papers ou dans un data journal, revue contenant exclusivement des data papers. Les critères de relecture sont classiques : qualité générale du manuscrit, citations appropriées, respect des instructions
Il informe sur la disponibilité du jeu de données, montre son originalité et son potentiel de réutilisation ; il rend les données intelligibles. Il donne accès aux données via des hyperliens pérennes. Il ne contient pas d'hypothèses, d'éléments d'interprétation ou de conclusions d'analyse. Il peut être très synthétique ou très complet.
Il décrit un ou plusieurs jeux de données scientifiques brutes, notamment à l’aide des métadonnées. De l’intérêt de réutiliser les métadonnées utilisées pour le dépôt du jeu dans un entrepôt de données pour gagner du temps. Il décrit de manière détaillée le protocole de recherche. Il décrit le contexte d’obtention des données, la fiabilité des données, un peu comme les fichiers "read me"/"lisez-moi" associés aux jeux de données ou les dictionnaires de données.
Il indique l'identifiant pérenne apposé au jeu de données grâce au dépôt dans un entrepôt comme data.sciencespo.
Il apporte une reconnaissance supplémentaire pour les travaux en cours (article citable). Or, la citation reste l'élément de base de l'évaluation (quantitative) de la recherche. Le data paper permet à l'auteur d'être mis en valeur comme créateur et gestionnaire de données dans la mesure où dans les faits, les données sont moins citées que les articles.
Exemples : Data in brief, Research Data Journal for the humanities and social sciences.
► Le potentiel de réutilisation de vos données par d'autres sciences peut constituer un argument majeur pour convaincre un.e rédacteur.trice en chef d'accepter votre data paper.
Construction comme un article classique
Page de titre avec un titre se concentrant sur les données spécifiques et avec les noms, les affiliations, voire les e-mails des auteurs
Résumé, parfois des mots-clés,
Introduction présentant l’arrière-plan de l’étude (contexte, enjeux généraux et spécifiques comme dans un article classique) : les questions de recherche à l’origine de la collecte des données et la plus-value de cette collecte (originalité et potentiel d’utilisation en recherche), description des matériels et méthodes pour permettre de reproduire l’étude (protocole expérimental, méthode d’échantillonnage)…
Description des données pour permettre de les réutiliser : structure, format, état (brut, filtré, analysé), disponibilité, explication de données aberrantes, sources (ville, pays, coordonnées GPS)…
Des informations justifiant la fiabilité et la rigueur des données, avec figures et tableaux : validation, qualité et rigueur de la procédure de collecte de données (appropriée, actuelle, claire, reproductible), analyses statistiques de l'erreur expérimentale, évaluation d'échantillons, structure de la base de données, organisation logique, intégrité : vérification d'erreurs potentielles...
Si besoin, conseils pour la réutilisation des données
Remerciements, contributions des auteurs, mention d’éventuels conflits d’intérêt
Liste des références bibliographiques
Figures, tableaux, annexes relatifs à la méthodologie, à la qualité des données ou proposant une synthèse des données.
Conseil : lire les instructions aux auteurs des revues. Les revues proposent parfois des modèles de fichier, de présentation ou d'organisation (templates, tool kit...). Certaines revues possèdent leur propre entrepôt de données. Les petits jeux de données peuvent être accessibles directement sur le site de la revue sous la forme de fichiers supplémentaires.
Outils d'aide à la rédaction : Fonio du medialab, Arpha Writing tool de Pensoft...
La loi Lemaire vous donne le droit de déposer en archive ouverte la version post-print de vos publications de SHS (post-print = revue par les pairs, sans la mise en page éditeur), dans les 12 mois suivant publication.
Spécificités des données de la recherche in Loi pour une république numérique 2016, art. 30 : « Dès lors que les données issues d'une activité de recherche financée au moins pour moitié par des dotations de l’Etat (…) ne sont pas protégées par un droit spécifique ou une réglementation particulière et qu'elles ont été rendues publiques par le chercheur, l'établissement ou l'organisme de recherche. L'éditeur d'un écrit scientifique mentionné ne peut limiter la réutilisation des données de la recherche rendues publiques dans le cadre de sa publication. » Leur réutilisation est donc libre.
Spécificités des données administratives : le principe d'ouverture s'applique particulièrement pour les données dont la publication présente un intérêt économique, social, sanitaire ou environnemental (Article L312-1 du Code des relations entre le public et l’administration).
La loi Lemaire acte donc le principe d’ouverture par défaut des données publiques. Par extension, les données de la recherche sont assimilées à des données publiques.
Non ! Par ici deux guides d'analyse du cadre juridique de l'ouverture des données de recherche en France :
Cécile Arènes, Lionel Maurel, Stephanie Rennes. Guide d’application de la Loi pour une République numérique pour les données de la recherche. Comité pour la science ouverte. 2022. ffhal-03968218f
Becard, N., Castets-Renard, C., Chassang, G., Dantant, M., al. (2017). Ouverture des données de la recherche. Guide d'analyse du cadre juridique en France. 45 p., DOI:10.15454/1.481273124091092E12
Un arbre pour vous aider à répondre à cette question épineuse : à qui appartiennent les données du chercheur ?
Aux chercheurs si elles sont transformées, sélectionnées ; les analyses sur les données sont au chercheur
Statut juridique des données brutes : les informations au sein d’une base de données sont dites de « libre parcours » : aucun monopole légal à son détenteur ; seule la structure de la base de données peut prétendre à être protégée par le droit de la propriété intellectuelle si elle est originale ; 15 ans de protection. C'est ce qu'on appelle le « droit sui generis des bases de données ».
Plus d'infos sur le statut juridique des données brutes en Europe, en Allemagne, au Royaume-Uni dans le rapport de SURF. Pour ceux d'entre vous qui ont un partenaire hollandais, IXA peut vous appuyer sur ces sujets.
► Votre contact (propriété intellectuelle, contrats, conventions) :
Romain Barberaud, Imane Kadraoui
Dans un contrat de cession de droits à un éditeur par exemple, l’auteur ne cède pas ses droits moraux (paternité, divulgation, retrait) : le chercheur est toujours le créateur de l’enquête qu’il a mené, personne ne peut se réapproprier son travail. En revanche, il peut céder tout ou partie de ses droits patrimoniaux (représentation, reproduction) sur l’œuvre à un tiers de manière exclusive : un éditeur par exemple. Quelques attendus :
Exigence d’un écrit
Droits clairement rémunérés
Délimitation du nombre d’usages et du type d’usagers
Délimitation géographique et temporelle de la cession
Eventuellement rémunération de la cession qui peut être gratuite, l’exclusivité ou non de la cession.
L'auteur autorise l’usage de certaines prérogatives patrimoniales à un tiers de manière non exclusive. Ce tiers n’est pas pour autant titulaire de droits sur l’œuvre ; il cède son :
Droit de reproduire les données
Droit de réutiliser les données
Droit d’utiliser les données à des fins commerciales ou non
Partage des données à l’identique
Licences Etalab : la licence ouverte est conçue par Etalab pour faciliter et encourager la réutilisation des données publiques mises à disposition gratuitement. Cette licence de diffusion ouverte des données publiques françaises vise à diffuser des données acquises grâce à des fonds publics : la reproduction, la modification, l'utilisation commerciale sont permises si la mention d’attribution et la date de dernière mise à jour sont précisées.
Ex : jeux de données de data.gouv.fr.
L'objectif de data.gouv.fr est de regrouper les informations dans une plateforme publique de données spécialisées, clairement identifiées et labellisées et de lutter ainsi contre les risques de gommage des frontières jusque-là assez claires entre information publique, officielle, privée et grand public et faciliter les recherches de l'internaute.
Lawrence Lessing, le créateur de la licence Creative Commons (cf. ci-dessous), souligne le risque de contestation de la moindre décision ou ligne de dépense publique par des groupes d'intérêt et le risque de trafic des données et d'orientation en fonction des attendus du producteur de données.
La plus connue, la licence Creative commons, créée par le juriste Lawrence Lessing, permet d'accorder des droits de réutilisation et de reproduction à la personne qui consulte votre ressource. Elle enrichit le droit d'auteur qui s'applique par défaut. Elle fonctionne comme des briques que vous décidez d’apposer ou non à votre ressource :
BY : mention d’attribution, créditer l’auteur
NC : usage non commercial, restreint les possibilités de réutilisation
ND (non derivative) : pas de modification, impossible d'intégrer tout ou partie dans une oeuvre composite
SA (share alike) : partage autorisé mais dans les mêmes conditions/la même licence que celle choisie par l’auteur original, réduit l'interopérabilité des données
Remarques :
Creative Commons est une organisation à but non lucratif.
Licence CC-BY-4.0 : équivalent CC-BY : possibilité de réutilisation large des données mais en créditant l'auteur
Licence CC-O : équivalent Etalab ou Licence Ouverte + : les données tombent dans le domaine public, réutilisation sans restriction, mention d’attribution fortement recommandée ; cette licence est imposée par quelques entrepôts de données ou éditeurs/revues : Dryad, Nature
Licence CC-SA : share alike, partage dans les mêmes conditions, selon la même licence, la même combinaison de briques.
Les Licences OKF Open Knowledge Fundation sont plutôt orientées bases de données :
Licence ODC-by : Open Database Commons : équivalent CC-by : indiquer le nom du créateur de la base de données originale. Elle est utilisée par l’éditeur Pensoft.
Licence ODC-ODBL Open database License : équivalent CC-SA
Licence PDDL Public domain dedication and license : équivalent CC-O
Elle n’affecte pas les brevets, le droit à l’image ou le droit à la vie privée.
Licence GNU General Public License : elle concerne les logiciels (libres) et les programmes.
GNU = gnou = d’où le symbole adopté par les fans des logiciels libres.
Plus d'infos :