Les données ouvertes, futur eldorado du journalisme

Responsable des « projets d’anticipation » au pôle Télécoms et Médias de Sofrecom (filiale R&D de France Telecom), Valérie Peugeot passe ses journées à tenter d’imaginer le futur : medias sociaux, internet des objets, biens communs du web, etc. Une sorte d’Aldous Huxley moderne… dont les romans ne seraient pas de la fiction. Valérie intervenait jeudi 28 janvier à la Cantine sur le thème « Web des données, données ouvertes » . Je lui ai demandé quelle était sa vision d’un métier plein d’avenir, nous dit-on : le datajournalisme


Qu’on ne s’y trompe pas. Si le sujet des données « ouvertes » (ou « libérées ») passionne surtout les geeks -et déjà quelques marketteurs-, il ne devrait pas tarder à intéresser d’autres communautés. A commencer par les médias qui vont vite comprendre le formidable potentiel que constitue cette nouvelle matière première pour les métiers de l’info. Voilà que je me prends à rêver: dans le meilleur des mondes, les « open data » pourraient-elles nous offrir à nous journalistes l’occasion de nous réapproprier ce rôle d’intermédiaire qu’on a de plus en plus tendance à nous contester?


Mais écoutons plutôt notre spécialiste…


1) Qu’est-ce qu’une donnée « ouverte » ou « libérée » ?

(1:11)

2) On a beaucoup parlé de data.gov, le site américain de partage des données des collectivités et de l’Etat (suivi il y a peu de son équivalent britannique). En quoi consiste ce site et quel est l’intérêt de ces bases de données pour l’internaute, le citoyen?
(2:06)

3) Quel peut-être le rôle du journaliste face à ces masses de données ?
(1:00)

4) Qu’entendez-vous précisément par la notion d’ « intermédiaire » ou de « médiateur »?

(2:21)

5) Où en est l’Etat Français quant à l’ouverture des données publiques ?

(1:45)

6) Et pourquoi chez nous ça bloque ?

(2:00)

7) On a parlé des données publiques, provenant des différentes institutions dépendantes de l’Etat et des collectivités locales. Qu’en est-il des bases de données alimentées par les internautes eux-mêmes? Comment s’assurer de la fiabilité des données communiquées par des anonymes (là, le journaliste est forcément interpellé)?
(3:57)



Fin de l’entretien.

Voici maintenant, pour les plus passionnés d’entre-vous, l’intégralité du speech de Valérie Peugeot à La Cantine (où elle ne parlait pas spécifiquement de datajournalisme), ainsi que le diaporama qui l’accompagnait…

Eléments de contexte : la salle est minuscule mais bondée en ce jeudi matin. Le public : rien que des garçons munis de notebooks (on est bien à la Cantine). Mon voisin filme et retransmet en live avec son iPod via Ustream et twitte en même temps, hum. Je me sens plus dodo que jamais avec ma vieille camera Canon datant de 2001, mais passons. Deuxième étonnement : ce public est pointu, connaît bien le dossier et s’implique à fond dans le débat.

Si vous êtes prêts à enquiller ces vidéos, votre patience sera récompensée. Car ce thème des données ouvertes est plein de tiroirs et soulève une multitude de questions d’ordre technique, politique, sociologique et même philosophique. Et les réactions épidermiques de la salle à cet exposé donnent un bon avant goût des grands débats qui agiteront la vie publique française dans les années à venir, lorsque (on l’espère) l’APIE (Agence du patrimoine immatériel de l’Etat) se décidera à ouvrir les données « publiques »… au public.

J’attends vos commentaires !



Voici les premières vidéos, de 15 à 20 min chacune :

1/6 (15:18)



2/6 (19:41)



3/6 (19:57)



4/6 (19:50)



5/6 (16:36)



6/6 (18:03)



Pour aller plus loin :


Open Government data presents new journalism opportunities and legal challenges, un billet de l’avocate Hellen Fu, sur le blog Citizen Media Law Project.

Le database journalism pour nous sauver du « frogboiling », par Caroline Goulard, sur le blog Databasejournalism.

Pour un journalisme de données, par Nicolas Vanbremeersch (Versac), sur Slate.fr

A visiter : Windows on The Media, le blog de Nicolas Kayser-Bril, jeune pionnier du datajournalism à la française qui explique sa démarche et publie quelques unes de ses enquêtes. Vous pouvez aussi visionner son interview ici.

  • Facebook
  • Twitter
  • del.icio.us
  • Digg

14 Réponses à cet article

  1. Essayez d’appeler une administration en lui demandant un fichier excel plutôt qu’un pdf inexploitable, vous verrez la réaction…
    « - C’est hors de question, vos allez pouvoir modifier nos données !
    – Mais, euh, je suis journaliste. Mon but n’est pas de travestir vos chiffres…
    - Non, vous avez qu’à recopier les données du PDF ».
    En quoi ça les assure que je ne travestis pas leurs données ?

  2. Je trouve Valérie Peugeot un peu optimiste sur l’autorégulation des bases de données alimentées par les internautes, ou c’est moi qui suis trop pessimiste ? Elles demandent en tout état de cause un long travail de contrôle par les journalistes.
    Dans l’absolu, le data-based journalism est une activité chronophage, il me semble, dans le contexte actuel, les rédactions seront-elles prêtes à se lancer là-dedans ? Alors qu’une bon gros dossier sur les francs-maçons en politique, c’est si vite torché…

  3. Tiens, un comparatif entre data.gov (USA) et data.gov.uk :
    http://flowingdata.com/2010/02/04/data-gov-uk-versus-data-gov-which-wins/

  4. Merci Tatiana pour cette rencontre absolument passionnante. Vous avez mis le doigt sur un des enjeux essentiels du futur du journalisme. Plus qu’un potentiel eldorado du journalisme il s’agit surtout là d’une absolue nécessité pour conserver une démocratie vivante dans le champ saturé dune information factuelle de plus en plus axée sur l’émotionnel.

  5. En ce qui concerne l’accès, la France est un des premiers pays au monde à avoir inscrit dans la loi le droit à tous les citoyens d’accéder aux données publiques. La loi date de 1978 !! (oui, oui ca fait bien 32 ans).

    Pour simplifier cette loi dit que tout le monde à le droit d’accéder aux données publiques. Et, figurez vous qu’il y a même un tribunal spécialisé dans les cas où l’administration refuse de répondre à une demande (la CADA) et que ce tribunal donne quasiment toujours raison aux citoyens.

    Tout d’abord, le portail des données publiques anglais existe depuis bientôt 5 ans ! Même la province du Piémont en Italie a sortie son portail avant Obama. Et c’est pareil pour les australien etc.
    Mais c’est quoi ces journalistes qui vérifient même pas leurs sources !!??

    Ensuite les anglo saxon se la jouent « libérons les données » mais ce n’est qu’une façade.
    Évidemment, ils peuvent communiquer là dessus car chez eux l’accès aux données n’est pas un droit du citoyen, donc proposer 3 bases de données gratuites en accès libre et c’est la fiesta.
    Sans oublier que la plupart des données qu’ils proposent gratuitement n’ont quasiment aucune valeur informative, et que les vraies données qui ont de la valeur coûtent toujours des millions de livres.
    Allez voir les exemples de mash-up sur le site anglais, la plupart sont absurdes.
    Par exemple, c’est rigolo d’avoir la géolocalisation des parking les plus proche de soi, mais bon, c’est surement plus rapide de lever les yeux pour voir un panneau, que d’aller sur son smartphone, lancer l’appli, attendre que le GPS s’active, etc.

    Enfin, il faut vraiment arrêter avec ce délire des administrations françaises qui veulent gagner de l’argent sur le dos des honnêtes citoyens.
    En France, quasiment toutes les données publiques sont GRATUITES pour les citoyens, c’est ce qu’on appelle le droit d’accès aux informations publiques.
    Quand une administration fait payer quelque chose, il s’agit de coût de mise à disposition (par exemple quand un CD est envoyé, ils font payer le CD).

    Et c’est loin d’être le cas ailleurs en Europe. Par exemple en Grèce pour avoir son état civil il fait payer entre 10 et 20 €.

    Les seuls cas où les données publiques sont vraiment payantes c’est quand des entreprises privées les utilisent pour faire du BUSINESS. C’est ce qu’on appelle la réutilisation des informations publiques. Il ne faut pas confondre les deux, cela n’a aucun rapport. Il y a même des textes de loi qui définissent ces notions.

    Mais là je vois pas en quoi c’est choquant. Il ne manquerait plus que des entreprises puissent faire des bénéfices avec des données payées par nos impôts sans sortir un euro ! Sans compter que la plupart des boîtes qui exploitent les informations publiques ne sont même pas françaises…

    Donc par pitié, arrêtez de raconter n’importe quoi et faites vos métiers correctement. C’est la moindre des choses que vous devez à vos lecteurs, surtout quand on se prétend chercheur, ou journaliste …

  6. Ha oui, une dernière chose, les données publiques ne sont pas gérées par l’APIE mais directement par les administrations qui produisent les données.

    L’APIE n’a qu’un rôle de conseil auprès des producteur de données.

  7. @Vaev

    Je pense que tu n’as pas visionné les vidéo 3 où Valérie Peugeot explique justement que les premiers à ouvrir les données étaient les scientifiques, et que parmi les gouvernements, les US n’avaient précisément pas été les premiers. En Europe il y a eu par exemple le Danemark et la Finlande.

    J’apprécie beaucoup les précisions bienvenues de ton commentaire, notamment sur l’Apie, et tes opinions sur les entreprises faisant payer l’accès aux données publiques font tout a fait avancer le débat.

    Ce que je ne comprends moins c’est ton ton plutôt agressif qui me montre qu’il faut que je fasse plus de pédagogie sur mon travail. Je précise que ceci est une interview, d’une chercheuse qui plus est, qu’elle répond sur des questions précises que je me pose en tant que citoyenne et journaliste (pas en tant que spécialiste des données ouvertes), et que je n’ai certainement pas les moyens de la contredire sur des éléments aussi pointus que ceux que tu soulèves.

    En revanche, le fait de te permettre de répondre me semble un bon moyen de la « challenger » (pas trouvé d’équivalent français, désolée) voire même de la contredire. Et je l’informerai de ta réaction afin qu’elle puisse te répondre à son tour. Faut pas s’énerver :-)

    Concernant la loi de 1978 sur l’accès aux données publiques, elle a déjà été invoquée sur ce blog, dans l’interview de Nicolas Kayser-Bril, que je t’invite à visionner (et commenter) :
    http://www.lavoixdudodo.info/2009/11/05/interview-nicolas-kayser-bril-datajournaliste/

    Et pour te donner une idée de la facilité avec laquelle un journaliste accède aux données publiques en France, jette un oeil sur cet amusant billet, toujours de Nicolas KB, sur le site Owni :
    http://owni.fr/2009/12/17/%C2%AB-on-l%E2%80%99a-pas-en-format-ordinateur-%C2%BB/

    A bientôt !

  8. Bien évidement que je suis énervé quand je constate une succession d’énormité et d’erreurs dans les propos de la personne interviewée et dans les textes écrits de ta main.
    Tu as une responsabilité en tant que journaliste, et elle consiste à ne pas relayer d’informations fausses et mensongère.
    Alors que dans une interview une personne donne un avis subjectif ne me dérange pas, mais que tu écrives des choses fausses alors que ton travail consiste à vérifier tes informations m’énerve au plus haut point.

    Donc pour te répondre :

    Oui, j’ai bien visualisé la vidéo 3, mais ce qu’elle énonce n’est que partiellement vrai.

    Dans l’ordre chronologique cela donne ca :

    1- les scientifiques font des travaux sur le sujet
    2- les anglais de l’OPSI sortent leur première version d’un portail des données publiques
    3- la province du piémont sort un portail sur le modèle anglais
    4- Les australiens, les espagnol, sortent leurs versions
    5- Ensuite les américains
    6- les anglais revoient leur portail.

    Donc dire qu’après les scientifiques il y a eu Obama et que c’est lui qui a lancé le mouvement est juste faux.
    Toutes ces informations se trouvent aisément sur les sites des ministères de ces pays. Pourquoi ne pas vérifier ?

    De plus , quand vous dites : » lorsque (on l’espère) l’APIE (Agence du patrimoine immatériel de l’Etat) se décidera à ouvrir les données « publiques »… au public. »

    C’est faux et archi faux. L’APIE n’a strictement aucun pouvoir décisionnaire.

    Un journaliste qui fait son travail correctement prend au moins la peine de téléphoner aux organismes qu’il cite pour vérifier ses informations. Non ?

    Je pourrais faire le détail des autres erreurs, mais je n’ai plus le temps.
    C’est trop facile de sans arrêt attaquer l’administration sans essayer de comprendre quelles sont les problématiques qu’elle rencontre …

  9. Vaev, tu me semble vachement bien calé sur la question, alors je vais te demander un petit effort supplémentaire. Toi qui es si sourcilleux (sans doute à juste titre) pourrais-tu :

    1) développer chaque erreurs relevées dans le texte et les interview dans le détail : ce serait plus fair-play que de critiquer le billet dans sa globalité, non? Ensuite je ferait tout pour te répondre, promis.

    2) décliner ton nom et le nom de l’entreprise (ou institution) pour laquelle tu travailles, car je suis sûre que cela sera pertinent pour comprendre ton irritation sur ce dossier. Ensuite on avancera plus sereinement.

    A bientôt :-)

  10. Je suis assez d’accord avec le commentaire de vaev… Pas forcément de votre faute d’ailleurs, il y a tellement d’idées fausses (ou reçues?) qui circulent dans le microcosme des informations publiques. A commencer par le mythe que « zoro » Obama est arrivé et a libéré d’un coup de lasso les informations publiques des USA. Ensuite, les pays anglosaxons auraient suivis en masse, larguant les autres pays (dont la France bien sûr). Cette version se retrouve sur tous les blogs et articles et est devenue de fait la vérité absolue.
    Deuxième idée forte, mais fausse, est incarnée par votre phrase de conclusion « quand l’APIE se décidera-t-elle à libérer les informations publiques au public…? ». Cette phrase appelle l’image d’une agence gouvernementale assise sur un gros coffre fort contenant l’ensemble des informations publiques. Puis elle passe son temps à se demander « vais je libérer les données…? non, pas envie aujourd’hui, pê demain ».
    Arrêtons de traiter des informations publiques comme d’un vieux western où d’un côté les gentils, joués par les réutilisateurs, ne recherchent que le bonheur de l’ensemble des citoyens et puis de l’autre, l’Etat (représenté par l’APIE), le méchant, qui veut garder pour soi les informations publiques qu’il produit.
    Malheursement, la situation est bien plus complexe que ça. Une information objective suppose de donner à vos lecteurs l’ensemble des aspects de la problématique. Commencer déjà par le fait, qu’en France, l’accès aux informations publiques et un droit depuis 1978 (!), bref, on a une large avance sur tous les pays anglosaxons dans ce domaine. Les anglais ne peuvent que saliver quand ils voient des sites comme Légifrance, cadastre.gouv, INSEE, RGE, service.public.fr, et j’en passe. On y trouve une mine d’or en informations. Alors j’entends déjà les raleurs dire que ce n’est pas assez, qu’il faut plus, etc. Mais aller voir un petit peu du côté des USA, ce pays tellement en avance.
    Et depuis 2005, il existe également un droit à la réutilisation commerciale de ces données. Ce droit fait suite à une Directive européenne adoptée en 2003, transposé donc en droit français. D’où vient donc cette image tenace que l’Etat retient ces informations publiques? Alors oui, tout n’est pas parfait. Certains services rechnignent à transmettre des informations publiques. Mais il faut bien comprendre que ce n’est pas leur métier! Donnons leut le temps pour faire évoluer.
    C’est aussi ça l’action de l’APIE. Elle organise régulièrement des ateliers auprès des administration pour marteler le message que les informations sont une richesse pour l’économie dans son ensemble et qu’il faut les mettre à disposation au maximum. Si un réutilisateur n’obtient pas ce qu’il veut, il peut toujours s’adresser à la CADA qui donnera le plus souvent raison au demandeur en cas de litige. Si l’Etat a crée l’APIE et la CADA, ce n’est quand même pas pour garder ses données dans un coffre??
    D’ailleurs, l’APIE travaille actuellement sur la mise en place d’un portail d’accès aux données, recommandation du plan France Numérique 2012. De ce que j’ai pu en comprende, ca sera une petite merveille en matière de technologie. En matière de données disponibles, cela dépassera largement ce qui se trouve actuellement sur les portails américains et anglais. Précisons que les USA sont un pays fédéral et sur leur portail, il n’y a que des données du gouvernement central, c’est-à-dire pas grand chose (allez y faire un tour, vous verrez). Côté anglais, ils sont fiers d’annoncer 2.500 bases et un prix pour le meilleur mash-up, mais là encore, rien de vraiment très intéressant en matière de développement de l’économie numérique.
    Bref, arrêtons de pleurnicher 5 minutes en se disant que le gouvernement nous cache ses données. Mettant aussi en lumière ce que l’Etat essaie de faire en matière de réutilisation des informations publiques, cela ferait également un bel article, même si vos lecteurs préfèrent sans doute lire que tout est nul en France.

  11. @Christophe

    Ravie de ta contribution tout à fait précise et documentée. J’ai vraiment de la chance d’attirer de telles pointures sur mon bloug.

    Mais, au fait, ta thèse me rappelle étrangement cette excellente interview glanée sur le site d’EasyBourse (pas mal ce Kristof)…
    http://www.easybourse.com/bourse/interview/kristof-de-meulder-apie-1592

    Mais sans doute l’as-tu déjà lue ? ;-)

  12. Puisqu’on plaide pour plus de transparence, la moindre des choses est de réagir à visage découvert, vous avez raison! Je suis chef de projet à l’APIE, plutôt en charge des sujets de comptabilisation des actifs immatériels, mais par la force des choses, je m’intéresse de plus en plus aux informations publiques qui sont un sujet passionnant. Je ne voulais pas dire que tout était parfait en France, juste nuancer, il y a quand même des initiatives intéressantes. D’ailleurs, à l’APIE on n’a jamais refusé d’accueillir des personnes portant un projet sérieux en matière de réutiliastion des informations publiques.

  13. après les photos aériennes en Creative commons, Brest métropole océane va libérer ses données géographiques
    une délibération est en cours
    plus d’info sur a-brest.net

    les contenus ouverts au pays de Brest : http://www.wiki-brest.net/index.php/Contenus_ouverts_au_pays_de_Brest

    les projets de cartes citoyennes : http://www.a-brest.net/rubrique221.html

  14. Bonjour,

    La « libération des données » porte sur plusieurs critères, et nos correspondants de l’APIE cherchent à noyer le poisson:

    - ils confondent l’accès « individuel » (avec des raisons personnelles) des citoyens aux données « les concernant » qui sont gérées par la CADA ; et l’accès public, dans des formats ré-utilisables pour tout usage

    - la question actuelle est celle des « linked data », c’est-à-dire de l’accès aux données sur le web pour produire de nouveaux services. Et là, quoiqu’en dise l’APIE et ses membres, on est encore loin du compte.

    - parlons de « Légifrance », qui est certes maintenant ouvert et gratuit et ré-utilisable… mais quelle bataille, à laquelle il me plaît d’avoir participé, pour que ORT, devenu filiale de Reuters ne garde pas la mainmise sur l’expression internet de la LOI !!! une recherche internet devrait éclairer sur ce long chemin.

    - enfin, où est le rapport demandé à l’APIE sur les données publiques et les gisements de bases de données de l’Etat ? Au lieu de critiquer les journalistes sur les hésitations de leurs sources, il serait bien que l’APIE publie enfin sa vision des choses.

    - et tant qu’à faire, pourquoi le rapport du Ministère de la Culture sur la valorisation du Patrimoine (un autre aspect central des données publiques) n’est-il diffusé, plus d’un an après sa parution, que sur le site de Bernard Lang, membre du CSPLA, et non sur le site public du Ministère de la Culture ? L’APIE aurait des conseils de transparence à donner Rue de Valois avant de s’en prendre anonymement aux journalistes.
    (au fait, lisez ce rapport, il est fabuleux : http://pauillac.inria.fr/~lang/pla-doc/2009_Partager-notre-patrimoine-culturel_rapport-Culture_complet.pdf )

    Mais au fond, cette pratique des membres anonymes de l’APIE est tellement significative de la conception « paternaliste » de l’administration face à l’ouverture et la critique des citoyens. La « lettre »avant l’esprit, pauvre Montesquieu.

    Dernier point : en fait, ne pas rendre les données disponibles sur l’internet (le concept actuel de « ouverture des données », qui je le reconnais ne pouvait pas exister en 1978…) sous prétexte que les « entreprises privées » pourraient s’en servir pour offrir des services, c’est vraiment la tarte à la crème. Mais pourquoi ne pas proposer d’en finir avec le domaine public, puisqu’il y a bien des salaud d’éditeurs qui font du beurre sur le dos de Victor Hugo…

    On est vraiment dans une conception rétrograde des données publiques. J’ai été expert auprès de la Commission européenne sur le projet INFO 2000, et déjà on entendait ce discours dans l’administration française… seule en Europe.

    La question est simple :
    - s’il y a un service complémentaire pour lequel les gens sont prêts à payer, c’est un usage cohérent des gisements de données publiques
    - tant qu’il reste un accès direct aux données, afin que d’autres (autres entreprises, associations, réseaux citoyens, chercheurs,…) puissent proposer aussi les mêmes services, voire mieux…

    Mais l’administration nous protège du grand méchant loup entrepreunerial…. surtout l’APIE et ses partenaires à Abou Dhabi….

Laisser une réponse

Copyright © 2009 La voix du dodo est propulsé par WordPress
Suivez les parutions via RSS
Ou seulement les commentaires.

Sitemap