DDJ101 - Data Literacy for Journalists
Connaître les formats de données
Atelier par Clément Renaud - Fréquence Ecoles - 20 Février 2014
Objectifs du cours
- Alphabétisation aux formats de données standard
- Conversion de jeux de données
- Extraction de données depuix le web
Vocabulaire de base
Type de données
- données tabulaires
- données relationnelles
- données de réseaux
Présentation : la structure de la base de données d’un microblog
Type de sources
- fichier
- site
- API : http://explorer.content.guardianapis.com
Anatomie d’une jeu de données
- en-tête / header
- colonne / column
- ligne / row
-
valeur / value
-
base de données / database
- clé primaire / primary key
- table / table
- matrice / matrix
EXERCICE : créer une description du groupe d’apprenants
Les formats de données
Afficher les extensions de données sous Windows
Général : Une liste des types de fichiers
Données
- xls
- doc
- txt
- json
- xml
- tsv
- csv
Voir les exemples :
- Liste des bibliothèques publiques en 2011
- Liste des établissements d’enseignement des premier et second degrés
Cartographie
- GIS, ARCGIS, etc.
- shp : shapefile
- kml : google maps
- geojson : web map
Un exemple sur le site Smart Data du Grand Lyon
Images
- bmp, jpeg, png, tiff, gif
plus d’infos et détails sur les formats d’images
Convertir les fichiers
Comment convetir un fichier dans un autre format
PDF > CSV
Solutions en ligne :
- PDF to Excel online
- Zamzar
- Comet Docs
- DocumentCloud et OpenCalais
Le gagnant :
Outils plus avancés:
Extraire des données d’une page Web
Exemple : Banque de France, Endettement des Agents non financiers - Comparaisons internationales
Plugins Google Chrome :
Utiliser Google Drive :
- Comprendre la structure d’une page web à l’aide de la console de Chrome ou Safari
- Utiliser Google Drive et la commande ImportHtml()
Autres solutions :
- Extraire des données du web avec ScraperWiki (en anglais)
Autres ressources
- http://gijn.org/resources/data-journalism/
- https://leanpub.com/scrapingforjournalists
- http://clairemiller.net/blog/2012/01/huge-list-of-data-journalism-resources/