Enquête diagnostique des connaissances en information-documentation des élèves du secondaire en France

Question 12. Notion ciblée : Langage documentaire

Remarque

Notion organisatrice : Indexation

Présentation de la question

Pour limiter les réponses hors-sujet lorsque j'interroge le catalogue informatisé du CDI, j'utilise :

a) Une phrase complète

b) Des mots courants

c) La liste des mots contrôlée par le logiciel documentaire

d) Un moteur de recherche (Google, Yahoo !...) (6ème, 3ème) // La liste des titres (2nde, Terminale)

e) Je ne sais pas

f) Autre

Question à choix unique

Connaissances évaluées et enjeu de la question

  • Thésaurus

  • Descripteur

  • Langage documentaire

  • Catalogue informatisé / Base de données

  • Index

  • Indexation

  • Stratégie de recherche

Le but de la question est de tester les connaissances des élèves concernant les différents outils et les différentes méthodes d'indexation, celles-ci étant souvent spécifiques à l'outil de recherche utilisé. Ainsi, la notion d'indexation appliquée aux moteurs de recherche du web ne recouvre pas les mêmes modalités que l'indexation dans un catalogue informatisé, tel que celui du CDI, ou dans une base de données spécialisée ; les méthodes d'indexation et les index utilisés ne sont pas les mêmes. Si les moteurs de recherche fonctionnent avec un index de mots-clés créé par balayage automatique des pages web visitées (crawling), les bases de données (dont le catalogue informatisé des CDI) utilisent des langages contrôlés, dont le thésaurus est un exemple.

De plus, les bases de données, et plus particulièrement le catalogue informatisé, utilisent plusieurs index : Titre, Auteur, Matière, Thésaurus, etc. De même, l'indexation ne se fait pas en plein texte sur le document primaire, mais à partir d'un document secondaire (une notice catalographique décrivant un document primaire) contenant des champs spécifiques qui vont alimenter les différents index (Titre, Auteur, Matière,...) ; l'indexation plein texte, si elle existe, ne se fait que sur certains champs et non sur l'ensemble du document.

Ce sont ces spécificités des différents types d'outils de recherche que les élèves doivent connaître et maîtriser afin d'adapter leur stratégie de recherche. L'intérêt du langage documentaire, et donc du thésaurus, est d'indiquer quels sont les termes utilisés par les concepteurs de la base de données pour décrire un sujet, chaque terme étant relié à un sens, ce qui facilite la recherche de documents pertinents tout en réduisant le bruit documentaire. De par sa structure hiérarchique organisée, la consultation du thésaurus permet aussi, à partir des mots-clés d'un sujet, d'en trouver d'autres par association thématique, d'élargir ou de restreindre la recherche. L'intérêt majeur étant de construire des requêtes basées sur le sens des mots utilisés et non seulement sur la chaîne de caractères.

La liste des réponses proposées permet de savoir si les élèves :

  • connaissent l'existence du thésaurus,

  • font la différence entre un descripteur (langage contrôlé) et un mot-clé (mot courant),

  • en collège : font la différence entre un moteur de recherche en ligne et un logiciel documentaire,

  • en lycée : connaissent l'existence et la spécificité d'utilisation des divers index du logiciel documentaire.

Cette différence entre collège et lycée est basée sur une progression attendue des apprentissages, selon laquelle les caractéristiques principales et la spécificité du logiciel documentaire sont abordées au collège, alors qu'un approfondissement des connaissances relatives au logiciel documentaire est visé au lycée.

La maîtrise du concept de langage documentaire participe à la construction du concept d'indexation. Avec l'émergence du web, ce concept est sorti du vocabulaire spécialisé des professionnels de l'information pour irriguer toutes les pratiques informationnelles courantes de l'internaute lambda. Ainsi, la notion de langage documentaire, avec toutes ses spécificités selon les outils utilisés (moteur de recherche, logiciel documentaire,...), doit être maîtrisée pour mettre en œuvre une bonne stratégie de recherche.

Résultats

Question 12 : résultats
Question 12 : graphique
Question 12 : graphique

Analyse des résultats

Les scores atteints par les différentes propositions restent inférieurs à 45%. Au collège, les choix de réponses faits par les élèves se répartissent de façon assez égale entre les différentes propositions (entre 10% et 35%). Au lycée, un clivage un peu plus grand s'opère entre la proposition « Des mots courants » et la réponse exacte d'une part, et les autres propositions d'autre part, avec un écart de 15 points en 2de et de plus de 20 points en Terminale, entre les deux groupes de réponses.

Le degré d'incertitude tient une place non négligeable dans ces résultats : de près de 14% en 6ème, il baisse à plus ou moins 9% en 2de, mais s'il descend à 7,89% en Terminale LGT, il remonte à 16,19% en Terminale LP, dépassant le score obtenu à l'entrée du collège.

Ce tableau donne à voir un état des connaissances peu stabilisé. Si la réponse exacte finit par arriver en rang 1 en LGT, elle ne concerne que moins d'un élève sur deux (44,88%).

En LP la situation est encore moins bonne. Dès l'entrée en 2de les scores sont plus bas qu'en fin de 3ème et la réponse exacte reste en deuxième position , 33% de élèves de 2nde LP et 30% de ceux de Terminale LP plébiscitant la proposition « Des mots courants ».

C'est en début de 6ème que les connaissances sont les moins bonnes, ce qui n'est pas surprenant dans la mesure où les élèves sont, pour la plupart d'entre eux, encore vierges de toute formation ; la fréquentation des BCD, en Primaire, étant souvent inexistante, les élèves n'ont quasiment jamais utilisé un logiciel documentaire. Dès lors, les réponses sont influencées par l'utilisation des moteurs de recherche, ce qui donne un classement des réponses significatif, avec par ordre décroissant :

  1. Une phrase complète

  2. Des mots courants

  3. Un moteur de recherche

  4. Je ne sais pas

  5. La liste des mots contrôlée

La réponse exacte, dont la formulation ne signifie sans doute pas grand chose pour eux, venant en dernier, avec un pourcentage de « Autre » quasiment nul.

Le constat devient plus inquiétant par la suite si l'on considère que des formations au logiciel documentaire sont généralement mises en place au collège. Mais il est vrai que celles-ci ont lieu plus souvent en 6ème que dans les autres niveaux ; les acquis n'étant pas stabilisés et encore moins renforcés, les connaissances se sont diluées une fois qu'ils sont arrivés en fin de collège.

Les « mots courants » continuent à être préférés par les élèves de 2nde et de Terminale LP ; cette expression a pu être rapprochée du mot-clé par les élèves, mais elle a un sens beaucoup plus général qui exclut le travail de conceptualisation effectué dans l'élaboration des mots-clés. Lors de l'utilisation d'un logiciel documentaire avec thésaurus, les mots-clés sont ensuite traduits en « descripteurs » afin de mener une recherche prenant en compte le sens du terme utilisé ainsi que son environnement thématique. Toutes ces nuances concernant le passage du langage ordinaire, utilisant des « mots courants », à un langage documentaire (mots-clés puis descripteurs) n'est pas maîtrisé par les élèves du secondaire, qui utilisent le logiciel documentaire comme ils utilisent un moteur de recherche.

Comparaison avec les enquêtes CREPUQ 2003 et EDUDOC 2008

Question 12 : Comparaison avec les enquêtes CREPUQ et EDUDOC
Question 12 : Comparaison avec les enquêtes CREPUQ et EDUDOC

Comparés aux résultats obtenus par les enquêtes menées auprès des étudiants québécois et belges, ceux des élèves français sont bien meilleurs. Les étudiants sondés ont eu bien plus de mal à comprendre les subtilités des logiciels documentaires utilisés dans les bases de données spécialisées.

Les taux d'incertitude sont aussi beaucoup plus élevés (58,2% pour le CREPUQ et 50,5% pour EDUDOC).

Le même constat est fait concernant l'influence exercée ici par l'utilisation croissante des moteurs de recherche : « Les étudiants sont peut-être moins familiers avec cette notion du fait qu'ils utilisent beaucoup les moteurs de recherche Internet où l'on ne retrouve pas de thésaurus » (CREPUQ, 2003).

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)