Contrôle Qualité

by

L’un des plus grands challenges de la réalisation d’un annuaire est de garantir sa qualité. Pour y arriver, Dmoz a plusieurs moyens à disposition.

  1. Les éditeurs. Ce sont les premiers et principaux contrôleurs de qualité. Ils contrôlent tout site avant son éventuelle inclusion : ils vérifient qu’il a bien un contenu original et intéressant, chassent les sites miroirs, les affiliés, les marques-blanches, etc. Ils forment un filtre d’entrée très efficace. Néanmoins, ils ne sont pas parfaits, et un site peut évoluer au cours du temps, c’est pourquoi, ils peuvent revoir les sites listés à tout instant. C’est également la raison pour laquelle d’autres contrôleurs qualités sont nécessaires et bienvenus.
  2. Les utilisateurs. Eh oui! Les utilisateurs de Dmoz peuvent aider à l’amélioration de l’annuaire, et pas seulement en soumettant un ou plusieurs nouveaux sites. Il est possible de signaler les erreurs (fautes d’orthographe, site en erreur (404 ou autre), site dont le contenu à changé, site miroir, site reprenant des données en marque blanche). Pour le faire deux possibilités: soit le lien « Mettre à jour la notice », présent sur chaque page de Dmoz ayant des sites listés, idéal pour corriger une faute d’orthographe par exemple, soit en signalant le site sur le forum public, dans ce fil (inscription nécessaire pour y poster).
    Même si un éditeur connaît bien son domaine, il est un homme et peut se tromper. Une nouvelle marque-blanche ou un nouveau système d’affiliation peut faire son apparition, et il peut ne pas la connaître : il est alors très utile de signaler les sites qui ont passé entre les mailles du contrôle d’entrée.
  3. Robozilla. Il s’agit d’un robot, aujourd’hui suffisament célèbre pour avoir sa propre entrée dans l’encyclopédie Wikipédia en anglais. Trois ou quatre fois par année, il se réveille et parcours plusieurs fois tous les sites de l’annuaire. Les sites renvoyant une erreur, parce qu’ils ont disparus, changés de nom ou parce que la page listée a été déplacée, sont retirés de l’annuaire et remis en attente de validation par les éditeurs. Comme ils apparaissent en rouge dans la liste en attente des différentes catégories, les éditeurs s’en occupent rapidement et cherchent à les retrouver s’ils existent encore. Environ 5% des sites tombent chaque année sous les griffes de robozilla. Un tel robot, dont l’efficacité est régulièrement améliorée, est le seul moyen de contrôler régulièrement les 5 millions de sites listés dans tout l’annuaire.

C’est la combinaison de tous ces facteurs qui permet de garder le nombre de liens en erreurs de Dmoz en dessous de 1%, et c’est un des principaux challenges de tout annuaire maintenu par des humains. L’amélioration des contrôles de qualité est un point en permanence débattu dans la communauté : c’est un des éléments fondamentaux de Dmoz et un de ceux qui ont permis d’assurer sa pérennité, alors que beaucoup d’annuaires disparaissent après quelques mois ou années, s’écroulant sous la lourdeur de la maintenance.

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s


%d blogueurs aiment cette page :