Open data, quel avenir ?

p161

Construction de l’Open Data à venir.

L’Open Data du futur se partagera entre des données publiques produites par les institutions publiques – cadrées juridiquement pour retirer les données a caractères personnelles, données de défense entre autres – et les données partagée par les entreprises et les données co-produites ou améliorées par les utilisateurs eux-mêmes (exemple avec le projet open street map).

Une construction multi-acteurs.

La construction de l’open data passe d’un système propulsé par le législateur, avec une donnée est construite, détenue et partagée depuis l’acteur public à une construction collective regroupant en plus du contributeur historique un nombre croissant d’entreprises, associations, utilisateurs produisant des bases de données de plus en plus riche, diverses et variées, comprenant également des données personnelles.

Le phénomène de crowndsourcing est l’un des coeurs à venir de l’open data avec des exemples déjà bien concret, reprenant le plus souvent des projets open source qui sans cette aide de volontaire ne pourrait pas êtes économiquement viable alors qu’ils sont important pour le développement marchands et non marchand de la société. Les exemples ne manquent pas, de la complétion des cartes OpenStreetMap sur lequel nous reviendrons au recensement des arbres remarquables pour la ville de Rennes pour mettre en valeur le patrimoine local ou encore faire appel aux citoyens dans le cadre de la recherche (ex: piègeage de frelons asiatiques pour les envoyer au CRNS de Tours et aider des chercheurs sur cette problèmatique écologique/économique). Les domaines de crowsourcing ne manquent pas de thématiques.

Différents niveaux d’investissement dans l’open data

En plus du producteur de la donnée, il existe de nombreux autres contributeurs possibles pour enrichir les bases de données et les rendres les plus exacte possible. Les données peuvent être commentée, anotées afin d’afiner leurs appréciations ou corriger des erreurs, l’on peut ajouter un jeu de données qui était jusque là inacessible, maintenir une donnée à jour (un changement de nom de rue, de sens de circulation …) .

Importance du crowdsourcing

Faire appel aux utilisateurs pour enrichir une base de données et répondre aux besoins de tous existe déjà dans les secteurs privés avec l’action des utilisateurs Google Maps pour signaler des erreurs de cartes, sur waze pour signaler des anomalies de circulation. Le fait d’étendre le champs de la participation des citoyens aux données libres est indispensable pour permettre d’avoir des données « propres » qui deviennent des données de confiance pour l’utilisation à des tiers. Dans le Finistère la ville de Plouarzel a fait participer ses habitants lors de « carto-parties » pour créer leur carte sur le modèle OSM et en faire bénéficier l’office du tourisme. Celui-ci a réussi à capter des données qu’il lui aurait été impossible de constituer et permet de faire profiter les touristes de ces informations sans que la donnée soit bloqué, privé et réutilisable pour tous types d’usages.

 

Etalab et la Licence Ouverte / Open Licence

Personnes favorables open data : député Lionel Tardy (LR), sénatrice (EELV) Corinne Bouchoux

Missions Etalab.

La mission Etalab coordonne la politique d’ouverture et de partage des données publiques (« open data »). Etalab,  fait partie de la Direction interministérielle du numérique et du système d’information et de communication de l’Etat (DINSIC). Elle coordonne les actions des administrations de l’Etat et apporte son appui pour faciliter la diffusion et la réutilisation des informations publiques. Ses autres missions son le développement et l’anime la plateforme d’open data www.data.gouv.fr destinée à rassembler et à mettre à disposition librement l’ensemble des informations publiques de l’Etat, de ses établissements publics et, si elles le souhaitent, des collectivités territoriales et des personnes de droit public ou de droit privé chargées d’une mission de service public.La mission contribue également à la mise en oeuvre des principes de « gouvernement ouvert » : transparence de l’action publique, consultation et concertation avec la société civile, participation citoyenne, innovation ouverte….

La « Licence Ouverte / Open Licence » présente les caractéristiques suivantes :

  1. Une grande liberté de réutilisation des informations :
    • Une licence ouverte, libre et gratuite, qui apporte la sécurité juridique nécessaire aux producteurs et aux réutilisateurs des données publiques ;
    • Une licence qui promeut la réutilisation la plus large en autorisant la reproduction, la redistribution, l’adaptation et l’exploitation commerciale des données ;
    • Une licence qui s’inscrit dans un contexte international en étant compatible avec les standards des licences Open Data développées à l’étranger et notamment celles du gouvernement britannique (Open Government Licence) ainsi que les autres standards internationaux (ODC-BY, CC-BY 2.0).
  2. Une exigence forte de transparence de la donnée et de qualité des sources en rendant obligatoire la mention de la paternité.
  3. Une opportunité de mutualisation pour les autres données publiques en mettant en place un standard réutilisable par les collectivités territoriales qui souhaiteraient se lancer dans l’ouverture des données publiques.

La licence est un contrat devant permettre aux utilisateurs de connaître précisement les conditions de mise à disposition et de réutilisation des données. Son principe est de garantir des libertés aux réutilisateurs, et de leur assurer une sécurité juridique pour leur permettre de se soucier avant tout du développement de leur application, de leur visualisation de données ou des connaissances qu’ils en tirent plutôt que d’entrer dans de complexes et pénibles analyses juridiques.

Le lundi 20 mars, Etalab a mise en ligne la derniere version de la licence Open Data renommée « Licence Ouverte Administrations » utilisable par les administrations sans faire disparaitre pour autant la « Licence Ouverte » existant depuis 2011. La coexistence de ces deux licences seront compatibles et cette mise à jour était nécessaire pour permettre de clarifier les droits et obligations de l’utilisations des données en OpenData par les developpeurs qui doivent en outre veiller à ce que les données respectent les principes de respect de la vie privée dicté par la CNIL.

Cadre juridique autour de l’Open Data.

Le cadre juridique de la réutilisation des informations publiques à titre gratuit en France est principalement composé des lois n° 2015-1779 du 28 décembre 2015 relative à la gratuité et aux modalités de la réutilisation des informations du secteur public (appelée aussi Loi Valter) et n° 2016-1321 du 7 octobre 2016 pour une République numérique (loi Axelle Lemaire ou Loi pour une République Numérique, le code des relations entre le public et l’administration.

Loi Lemaire

Loi Valter

Cette loi voté le 17 décembre 2017 et porté par la secrétaire d’Etat en charge de la Réforme de l’Etat et de la Simplification, Clotilde Valter, offre l’un des principaux intérêt de l’open data gouvernemental en gratuites l’utilisation des données. Cependant ce texte est aussi critiquable et critiqué du fait des exceptions à la réutilisation libre et gratuite des données qu’il impose dans les domaines de la culture, l’enseignement et la recherche. Sur le choix des formats des données, le texte ne va pas assez loin en laissant optionnel le choix d’un “standard ouvert et aisément réutilisable (lisible par une machine) et du fait que les données ne sont pas obligatoirement livrées au formats électroniques. Ce texte de loi permet aussi le maintient des redevances dont des opérateurs tel l’Insee et l’IGN sont dépendant financièrement, rendant de facto la gratuité des données plus restreinte.

Loi Notre

Obligeant les collectivités de plus de 3500 habitants à ouvrir leurs données et l’ouverture des données de transport dans la loi Macron.

Code des relations entre le public et l’administration

Le code des relations entre le public et l’administration permet de clarifier le droit d’utilisations des données produites par les administrations publiques par tous dans les meilleures conditions tout en excluant certaines données du champs publique. Ce code est composé des deux articles suivant :

Article L321-1 : « Les informations figurant dans des documents produits ou reçus par les administrations mentionnées à l’article L. 300-2, quel que soit le support, peuvent être utilisées par toute personne qui le souhaite à d’autres fins que celles de la mission de service public pour les besoins de laquelle les documents ont été produits ou reçus.

Lorsqu’elles sont mises à disposition sous forme électronique, ces informations le sont, si possible, dans un standard ouvert et aisément réutilisable, c’est-à-dire lisible par une machine.

Les limites et conditions de cette réutilisation sont régies par le présent titre, même si ces informations ont été obtenues dans le cadre de l’exercice du droit d’accès aux documents administratifs régi par le titre Ier. »

Article L321-2 : « Ne sont pas considérées comme des informations publiques, pour l’application du présent titre, les informations contenues dans des documents :

a) Dont la communication ne constitue pas un droit en application du titre Ier ou d’autres dispositions législatives, sauf si ces informations font l’objet d’une diffusion publique ;

b) Ou produits ou reçus par les administrations mentionnées à l’article L. 300-2 dans l’exercice d’une mission de service public à caractère industriel ou commercial ;

c) Ou sur lesquels des tiers détiennent des droits de propriété intellectuelle.

L’échange d’informations publiques entre les administrations, aux fins de l’exercice de leur mission de service public, ne constitue pas une réutilisation au sens du présent titre. »

Open Data et E-gouvernance

Emmanuel Raviart, directeur technique de la mission etalab.

Open Data entre dans le processus d’open gouvernement, aussi appelé démocratie ouverte dans laquelle le gouvernement donne accès à ces citoyens à en ensemble de données et procédures afin de favoriser une transparance des gouvernements envers les citoyens et leur redonner plus de pouvoir de contrôle, supervisions ainsi que de prendre part aux décisions gouvernementales et locales. Demande pendant longtemps l’accès à disposition à tous de la base des codes SIRET dont ont besoins toutes les entreprises. Données indispensables mais payantes, incomplètes ou issues de bases piratés ne facilitait pas l’émergence de nouvelles sociétés. Les nouvelles lois en faveur de l’open data sont autant d’aides permettant de déverouiller une partie des démarches administrative obligatoire et donnent accès à un maximum d’acteur de données précises tout en encourageant de nouveaux usages volontairement méconnu. On ne préjuge pas de l’utilisation de la donnée.

La ville de Rennes en mode Open Data

Data visualisation

La ville de Rennes organise depuis l’ouverture des données une série de projets de visualisation permettant à chacun d’exploiter librement ses données. Depuis la plateforme http://dataviz.rennesmetropole.fr/quisommesnous/index-fr.php chaque Rennais peut obtenir des données comparatives selon son sexe, son âge, lieu de naissance, sa profession (selon les différents secteurs), la situation face au travail (contrat de travail, chômage, étudiant, retraité, au foyer…), les lieux de travail, transports, situation à l’état civil et diplôme le plus élevé.

capture-decran-1

Les données à destination des familles nous permettent de connaître les proportions de personnes selon leur logement, qu’ils soient propriétaire, locataire, logé gratuitement, dans quelle superficie vivent-ils, depuis combien de temps y vivent-ils ou encore le nombre de voitures que possèdes ces familles.

Capture d’écran.png

Carte Open Data Region Bretagne. http://kartenn.region-bretagne.fr/mviewer/

 

Loi Valter et Loi Numérique

Sources : https://www.nextinpact.com/news/103137-nouveaux-retards-pour-decrets-loi-numerique.htm

http://annuaire-juridique.lemondedudroit.fr/unes/225093-open-data-de-la-jurisprudence-les-decrets-seront-adoptes-dici-fin-mars-urisprudence-puisse-etre-mise-disposition-de-tousjean-jacques-urvoas.html

La Loi Valter votée fin 2015 est le préambule des nouvelles lois en faveurs de l’Open Data puisqu’elle garantit la gratuité – en principe, puisque nous verrons ensuite que ce n’est pas toujours le cas – des données.  La loi République Numérique ou loi Lemaire en référence à la ministre ayant défendu ce projet de loi a quand a elle été votée en octobre 2016 et impose la mise à disposition par défaut de ses données aux collectivités locales.

 

Blocages de la loi Numérique.

La « loi numérique » ou « loi Lemaire » du nom de la ministre portant le texte semble être bien retardé à cause des décrets d’applications bloqués par les administrations et autorités administratives dont certains décrets doivent être porté à la commission européenne ce qui à pour effet de bloquer la mise en place de cette loi dont une part s’intéresse à l’open data.

Les principaux points de blocage du texte concerne la publication des décrets sur les parties d’ouverture des données dans les domaines de la « justice » où les jugements rendus par les juridictions civiles et administratives doivent être  mis à la disposition du public à titre gratuit. Il est demandé que chaque affaire soit analysée avant d’être mises à disposition pour identifier les risques d’identification des personnes en prenant en compte l’anonymisation de certaines données pour protéger les justiciables, juges et auxiliaires de justice.

Le défi technique à résoudre est de permettre a constitution d’une base de données prenant en compte des données anonymes et constituée des arrêts, décisions,  prononcées par les différentes cours. Pour le garde des sceaux  Jean Jacques Urvoas, les décrets d’applications seront publiés au plus tard à la fin du mois de mars 2017 pour une mise en application progressive, « de 12 à 24 mois pour la mise à disposition des décisions civiles des cours d’appel, 24 à 36 mois pour la mise à disposition des décisions pénales des cours d’appel » et  « une période de 3 à 8 ans pour la mise à dispositions des décisions de première instance ».

La justice prédictive.

Source : https://www.franceinter.fr/emissions/le-zoom-de-la-redaction/le-zoom-de-la-redaction-15-fevrier-2017

Depuis la loi Lemaire, toutes les décisions de justice doivent être rendues accessibles, avec de gros bouleversement tant d’un point de vue technique pour le traitement – de manière progressive – jusqu’à 4 millions de décisions rendue chaque années.

Rendre ces données publiques permet la mise au point de nouvelles applications dites « prédictives » qui en se basant sur la jurisprudence antérieur peut prévoir les peines futures pour chaque type de délits ou de crime. Les avocats utilisant ce type de logiciel permet de mieux apprécier les risques lors des affaires civiles et ainsi favoriser les discussions pour régler les litiges à l’amiable. C’est l’organisation des tribunaux qui risque d’être revue, avec le risque que les décisions soient désormais toutes identiques (si dans 85% des cas une décision est appliquée, il devient difficile de justifier comment une décision puisse être différente en vertu de l’impartialité).  Les avocats en utilisant cette technologie pourront être plus efficace et traiter plus d’affaires pour ainsi être plus rapide et faire baisser leurs honoraires pour donner à un plus grand nombre un accès au droit plus efficace et accessible.

La mise en place effective des mesures de l’open data au monde judiciaire mettre arriver, à partir de janvier 2017 :

-De 12 à 24 mois pour la mise à disposition des décisions civiles des cours d’appel ;
-De 24 à 36 mois pour la mise à disposition des décisions pénales des cours d’appel ;
-Mise en œuvre progressive sur une période de 3 à 8 ans pour la mise à disposition des décisions de première instance .

Open Data : chemin vers la démocratie ouverte ?

Sources : podcast « Atelier des médias » sur RFI
http://www.cada.fr/

L’un des objectifs de l’open data est de permettre davantage de communication entre les acteurs public et la société civile. À travers l’exemple de Sylvain, journaliste chez DataGueule, la question de l’accès et l’utilisation des données se pose. Le principe de cette émission diffusée sur Youtube et financer par France 4 est d’illustrer en vidéo des faits sociétaux, en se basant sur une multitude de données parfois ouvertes souvent fermées et peu accessible.

La France affiche dans ses objectifs officiel des engagements en terme de gouvernement ouvert et souhaite la mise en place de l’ouverture des données publique (ou mise en place de l’open data) à travers une série de mesure dont l’instauration du site officiel du gouvernement : data.gouv.fr. Celui-ci n’est pas une base de donnée suffisante pour alimenter le travail des journalistes, avec des données trop générales et pas assez complètes pour pouvoir créer des informations pertinentes et intéressantes. En plus de ces données officielles, les équipes de DataGueule doivent chercher et trouver d’autres données à mettre ensuite en forme pour pouvoir créer des informations complètes.

Création de données ouvertes hors État

L’État n’est pas le seul contributeur à l’open data et des fondations tel OpenStreetMap se donne pour mission de collecter des données – dans ce cas des données de cartographie – et de donner un accès libre et gratuit à tous ceux qui le souhaitent. Les cartes « open street map » sont parfois plus détaillée que les cartes classiques fournies par des acteurs privés tels Google Map grace à la collaboration des habitants et des personnes présentes sur le terrain. Un des autres avantages d’une carte « libre » est qu’elle n’est pas sensible aux enjeux financiers et politiques que peuvent rencontrer la concurrence (problème des frontières changeantes selon le lieu de connexion dans le monde) et les utilisateurs du service peuvent être sur qu’ils ne sont pas suivis et que leurs recherches servent à alimenter des fichiers clients revendu à des publicitaires.

La « Fondation Open Knowledge » milite pour l’ouverture de la connaissance en générale et en particulier sur les données ouvertes. Cherche à fédérer les associations francophones qui s’intéressent à cette thématique, en profitant de la captation de jeux de données de manière participatives, avec des cartographies, de données en formats ouverts et accessibles. La banque mondiale est une institution financière internationale qui finance des projets de pays. En 2010 pour répondre aux critiques concernant les projets financés, à quels coûts, pour quels résultats, la Banque Mondiale à décider d’ouvrir en OpenData de données au niveau macro des pays et aide depuis les pays à ouvrir eux aussi leurs données.

En plus des associations et fondations à but non lucratifs, des sociétés privées, comme Uber, ont compris l’intérêt d’ouvrir une partie de leurs données qui bénéficie à tous et favorise également l’image de marque.

Limitations d’accès aux données

La CADA

Pour accéder à certaines informations, les équipes de journalistes doivent parfois faire appel à la CADA – Commission accès aux documents administratif – Site officiel de l’instance consultative et indépendante, qui informe sur le droit d’accès aux documents administratifs et aide les citoyens dans leurs démarches. Cependant la CADA ne donne pas accès à tous les documents, certains étant classés confidentiels, et surtout cette commission n’a qu’un pouvoir consultatif sur les institutions, elle ne peut pas obliger une autre administration à fournir un document.

Rétorsion de données aux seins des ministères

Chaque administration produit chaque jours des lots de données. Ces données dans le cadre de l’open data devraient être progressivement mises à disposition du public dès lors qu’elles sont anonymisées pour la sécurité de tous les acteurs judiciaires, allant des victimes aux coupables en passant par tout le personnel judiciaire. Cependant, certaines administrations comme la Direction des pêches maritimes et de l’aquaculture (DPMA) bloquent les requêtes de demandes de données. Bloom, une association militante pour la protection des océans, souhaite depuis plusieurs années avoir des données concernant les bénéficiaires des aides européennes aux pêcheurs le travail d’enquête mais à ce jour ces requêtes ont toujours étés refusées. Le ministère de la justice doit quand à lui ouvrir certaines de ses données au fur et à mesure sur – par exemple – toutes les questions concernant des délits et des peines de prison effectives. Avec plus de 2 618 374 décisions de justice civile et 1 203 339 décisions en matière pénale en 2014, ce ministère produit un grand nombre de données que les citoyens, chercheurs, journalistes pourraient étudier et mettre en forme pour pouvoir faire de nouvelles découvertes et gagner en efficacité.

Problématique de la vente des données

L’une des problématique de l’ouverture des données est qu’elle touche la plupart des administrations en obligeant certaines qui n’avaient aucune politique d’ouverture à se moderniser, mais aussi d’autres institutions qui ont l’habitude de produire de la donnée à des fins commerciales. L’open data touche le financement de ces dernières qui se retrouvent à devoir investir pour créer les bases de données sans pouvoir les vendre comme auparavant, causant de fait une volonté de freiner l’OD. L’Etat est dans un double discours illustrer par la publication de deux décrets de revendre les données qu’elles collectent dans le cadre de leurs missions de service public.

Intérêts des lobbies

Nous observons un paradoxe grandissant entre une volonté de plus en plus affirmée de la part des citoyens de reprendre leur place dans la démocratie avec l’aide de l’OD, des institutions qui adaptent leurs discours pour s’adapter à ces nouveaux changements tout en étant approcher par les lobbies. Le citoyen dans cette logique de double discours n’est que peu entendu des institutions publiques, démontrant l’un des mauvais usages pouvant être fait de la communication, outils modifiant les discours mais pas les usages de la vie politique. L’appropriation d’avantages – pas toujours moraux – comme l’utilisation très libre des réserves parlementaires n’aident pas ceux-ci qui profite d’une organisation à la remettre en question. En plus des questions de corruption, l’importance des données est également importante pour dévoiler certaines informations concernant les marchés public.

Formats inexploitables

En plus des données dites officielles, beaucoup d’informations ne sont disponibles au public que sous forme de PDF ou dans d’autres formats rendant l’exploitation des données plus compliqué, ce qui est contraire aux règles de l’open data. La logique de contrat de recherche publique du gouvernement avec Microsoft et des sociétés de logiciel payant à la place de logiciels libres pose là encore le problème des formats propriétaires qui limitent l’accès aux données à tous.