Clément Renaud

DDJ101 - Data Literacy for Journalists


Connaître les formats de données

Atelier par Clément Renaud - Fréquence Ecoles - 20 Février 2014

Objectifs du cours

  • Alphabétisation aux formats de données standard
  • Conversion de jeux de données
  • Extraction de données depuix le web

Vocabulaire de base

Type de données

  • données tabulaires
  • données relationnelles
  • données de réseaux

Présentation : la structure de la base de données d’un microblog

Type de sources

  • fichier
  • site
  • API : http://explorer.content.guardianapis.com

Anatomie d’une jeu de données

  • en-tête / header
  • colonne / column
  • ligne / row
  • valeur / value

  • base de données / database

  • clé primaire / primary key
  • table / table
  • matrice / matrix

EXERCICE : créer une description du groupe d’apprenants

Les formats de données

Afficher les extensions de données sous Windows

Général : Une liste des types de fichiers

Données

  • pdf
  • xls
  • doc
  • txt
  • json
  • xml
  • tsv
  • csv

Voir les exemples :

Cartographie

  • GIS, ARCGIS, etc.
  • shp : shapefile
  • kml : google maps
  • geojson : web map

Un exemple sur le site Smart Data du Grand Lyon

Images

  • bmp, jpeg, png, tiff, gif

plus d’infos et détails sur les formats d’images

Convertir les fichiers

Comment convetir un fichier dans un autre format

PDF > CSV

Solutions en ligne :

Le gagnant :

Outils plus avancés:

Extraire des données d’une page Web

Exemple : Banque de France, Endettement des Agents non financiers - Comparaisons internationales

Plugins Google Chrome :

Utiliser Google Drive :

Autres solutions :

Autres ressources

  • http://gijn.org/resources/data-journalism/
  • https://leanpub.com/scrapingforjournalists
  • http://clairemiller.net/blog/2012/01/huge-list-of-data-journalism-resources/