Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
Kesako
25 avril 2005

De la difficulté à exploiter automatiquement les ressources du Web

Peggy Cadel et Eric Boutin ont publié un document de 8 pages sur les difficultés que soulèvent les informations issues d'Internet à être exploitées automatiquement. Le document est court, se lit donc rapidement et synthétise les différents blocages inhérents à l'exploitation du réseau des réseaux. Résumé : "Avec le développement d'Internet et des connexions à haut débit, les modes d'accès à l'information se sont automatisés. La documentation numérique via le réseau a si bien supplanté les autres supports d'information qu'aujourd'hui lorsque l'on a besoin d'un renseignement, le réflexe premier est la connexion au Web. Ce réflexe déjà acquis par les professionnels de la recherche d'information et de la veille intervient désormais dans le cadre de stratégies de surveillance automatisées. Or, parallèlement à cette systématisation, l'accès automatique au Web est devenu de plus en plus complexe à cause du caractère hétérogène des éléments qui le composent. La mixité des formats, les contraintes liées aux modes d'accès ainsi que la multitude de pratiques rédactionnelles sont autant d'obstacles à son traitement. Ses principales exploitations que sont l'acquisition de documents, la surveillance stratégique et technologique et l'analyse des tendances souffrent de manière inégale. Il convient aujourd'hui de connaître les limites des outils que l'on achète ainsi que les caractéristiques des sources que l'on exploite afin de mettre en place une surveillance Web efficace. " A consulter sur le site d'Archive SIC, au format .doc ou .pdf.

Publicité
Publicité
Commentaires
Archives
Publicité
Publicité