Partie 1 - Recherche d'information
L'information est une connaissance, inscrite (enregistrée) sous forme écrite (imprimée ou numérisée), orale ou audiovisuelle sur un support spatio-temporel.
L'information comporte un élément de sens.
C'est une signification transmise à un être conscient par le moyen d'un message inscrit sur un support : imprimé, signal électrique, onde sonore, etc.
Cette inscription est faite grâce à un système de signes (le langage), le signe étant un élément du langage qui associe un signifiant à un signifié : signe alphabétique, mot, signe de ponctuation."
Le Coadic (2004)
“Un système de recherche d’information retourne, en réponse à la requête d’un utilisateur, une liste de documents ordonnée selon une estimation de leur potentiel de pertinence.
Bien que ce type d’organisation des résultats soit encore adopté par la majorité des systèmes de recherche actuels, il n’apparaît pas nécessairement comme le plus à même d’aider l’utilisateur à appréhender les différentes informations retournées. Il impose en effet de parcourir linéairement la liste de résultats, en examinant un à un chacun des documents, jusqu’à avoir le sentiment que suffisamment d’informations ont été collectées.” (Lamprier, Amghar, Levrat et Saubion, 2010).
Collecte d'information
La collecte d'information a pour projet de chercher, rassembler, ordonner et faire sense d'un ensemble d'informations sur un sujet visé.
“L’utilisateur doit prendre la décision d’arrêter la collecte d’informations alors qu’il ne connaît pas la diversité des textes en relation avec sa requête.” (Lamprier, Amghar, Levrat et Saubion, 2010)
Les mots clés
Un "mot clé" est un terme ou un groupe de mots qui renvoie à une signification spécifique (e.g. une notion structurante d'un texte).
Partitionnement (clustering) de l'information
L'information peut être rassembler dans des groupes ou partitions (clusters) "signifiants" de manière non encadrée.
Techniques de groupement:
- Similarités de type (nature du document, origine, temporalité, status...)
- corrélation ou opposition argumentative
Reflexions
- Peut-on parler d’une classification de l’information sur le web ?
- Qu’est-ce que cette classification laisse entendre du web ?
- Pourquoi les algorithmes ne sont pas neutres ?
- Comment on entame une recherche d’information sur le web ?
- Comment on retrouve ces mots clés ?
La méthode de 5W
Méthode pragmatique et organisé d'analyse d'un sujet donné, ou de description d'une situation donnée. Elle permet une exploration consciencieuse du sujet, et donc à terme un traitement plus complet, pertinent et effective du sujet.
Cette méthode demande d'être factuel, objectif, et précis. Elle peut demander plusieurs itérations avant de donner des résultats forts.
Qui (who)
sujet(s) de l’information
Qui est impacté par le sujet? Quels sont les acteurs?
Quoi (what)
action
Quel est le sujet à analyser ou à résoudre?
Où (where)
Lieu
Où le sujet est localisé? Quel est l'envergure de son impact potentiel? i.e., quel est l'environnement d'observation?
Quand (when)
Moment D'où vient le sujet? sur quelle période le traite-on?
Pourquoi (why)
Causes, objectifs... Pourquoi les sujet est apparu et est-il pertinent? Pour quel moment le résultat est-il utile?
Extra
Comment? Comment le sujet est-il apparu? Comment peut-il être traité?
Et si... Qu'est-ce qui pourrait changer la donne?
Il est utilisé dans la recherche d'information en tant qu'il identifie une notion dans un système d'indexation d'un document.