Métadonnées

Version imprimable

 

Données, Métadonnées

 

Données numériques. Les nouvelles usines du XXIe siècle sont des data centers qui fournissent de la puissance de calcul et de la capacité de stockage (ce qui ne se peut se faire sans une colossale dépense d’énergie et la pollution qui en découle). Après le règne du hardware (symbolisé par IBM) et du software (symbolisé par Microsoft) ce sont les données des utilisateurs qui font l’objet de tous les soins et de toute l’attention des entreprises du web 2.0, ce pourquoi nous parlons de dataware (symbolisé par Google).

La quantité de données disponibles dans les data centers est devenue telle que pour toutes les sciences qui travaillent avec des quantités de données importantes comme l’astronomie, la physique, la linguistique, la génomique ou la géologie, les ordinateurs pourraient extraire des modèles et schémas explicatifs en utilisant les mathématiques appliquées sur les pétaoctets de données. Telle est l’ère de l’algorithme.

 

Les métadonnées sont ce qui permet de mettre en relation des données.

Les métadonnées existent depuis la Mésopotamie, où l’on a trouvé des tablettes d’argiles qui décrivaient des stocks de tablettes et qui constituaient en cela des catalogues. Les métadonnées existent depuis 4000 ans. Il n’y a jamais eu de métadonnées qui n’aient pas été produites par des démarches de contrôle top down, c’est-à-dire hiérarchiques, descendantes et centralisées : contrôle impérial en Mésopotamie, puis royal, puis républicain, et finalement managérial, mais dans tous les cas exercé par des pouvoirs de synchronisation. Or, depuis 1992, depuis l’apparition du world wide web, la production de métadonnées – c’est à dire des éléments de base de la synchronisation – est devenue un processus bottom up, c’est à dire ascendant.

 

Épi-linguistique/méta-linguistique. Les savoirs épilinguistiques sont les savoirs spontanément produits par la pratique (parler l’anglais ou le russe). Un savoir méta-linguistique, est un savoir formé par un métalangage (une science du langage ne peut apparaître que comme l’après-coup d’une pratique). La catégorisation est une compétence du savoir épilinguistique (parler, c’est avant tout catégoriser). La métacatégorisation est le processus qui produit des catégories de catégories (avec le web 2.0, celles-ci peuvent paradoxalement émerger des pratiques épilinguistiques, sans référence explicite à des métalangages). Ces deux extrêmes de l’invention linguistique que sont l’activité épilinguistique et l’activité métalinguistique sont les deux pôles du processsus de transindividuation dans un milieu linguistique grammatisé.