La recherche bibliographique sur le Web

mercredi 13 juin 2012 par Mehdi Khaneboubi

Mehdi Khaneboubi — Université de Cergy-Pontoise – 2012

Dans la réalisation d’un travail bibliographique, il est important d’avoir une méthode recherche de document rigoureuse. Dans un premier temps nous allons voir comment construire une requête, puis quelles sont les bases de données utiles lors de la réalisation d’une recherche en sciences de l’éducation.

Construire une requête

Comment choisir les mots d’une requête ? Dans un premier temps, il est nécessaire d’identifier les mots-clés du sujet ou de la problématique qui nous intéressent. Ensuite, on réitère la requête avec les synonymes de ces mots. On peut aussi, grâce aux outils de recherche avancée, produire des requêtes complexes panachant mots-clés et leurs synonymes. Il est aussi fructueux de consulter les index des sujets et des thèmes quand cela est possible pour voir comment ils ont été indexés par les documentalistes.

De façon générale, quels que soient les outils informatisés utilisés pour faire une recherche documentaire, il faut bien saisir la nature de la base que l’on interroge de façon à adapter la recherche aux types de documents qui constituent la base. C’est ce que nous allons voir dans la section suivante.

Les opérateurs « et », « ou » « sauf »

Quelle que soit l’application que l’on utilise, il est nécessaire de comprendre comment construire une requête. Une requête bien construite évite d’avoir trop de réponses de la part du logiciel qui ne correspondent pas à l’objet de recherche, c’est ce que l’on appelle du bruit. Inversement, une requête efficace permet aussi d’éviter d’avoir trop peu de résultats de recherche ce que l’on appelle du silence.

Pour contrôler ces phénomènes il faut faire appel à des outils appelés opérateurs booléens : « et » « ou » « sauf ». Dans une base de données, pour trouver des documents qui traitent d’un sujet A et d’un sujet B on utilise l’opérateur « ET » ou « AND ». Ainsi, en recherchant des documents sur l’apprentissage informel de la musique, on va taper la requête : « apprentissage ET musique ».

Pour consulter les documents qui traitent d’un sujet A ou d’un sujet B on utilise l’opérateur « OU » ou « OR ». Pour consulter tous les documents qui traitent d’un sujet A, mais pas d’un sujet B je vais utiliser l’opérateur « SAUF » ou « NOT ». La figure suivante présente cette idée.

Exemple :

Je recherche des documents sur l’apprentissage informel de la musique. Je ne m’intéresse donc pas à l’enseignement de la musique ni à l’apprentissage de la musique dans une institution.

Dans le catalogue du Sudoc je vais taper la requête : « apprentissageET musique » le logiciel renvoie une réponse de 383 résultats [1]. En consultant les premiers résultats on remarque qu’un grand nombre porte sur l’enseignement de la musique, on peut donc reformuler la requête ainsi : apprentissageET musique SAUFenseignement l’application renvoie 198 résultats. On a donc ainsi réduit le bruit, c’est-à-dire trié les réponses non pertinentes par rapport au sujet qui nous intéresse.

Remarque : Souvent, par défaut le symbole « espace », correspond au « ET » booléen. Pour éviter toutes ambiguïtés, il est fortement conseillé d’utiliser les fonctions de recherche avancée que l’on trouve sur tous les catalogues, bases de données et moteurs de recherche.

La sélection des résultats de recherche

Parmi les résultats de recherches effectuées dans ces bases, comment repérer les documents pertinents ?

Tout d’abord, il faut toujours porter une attention particulière sur la date de publication des documents. Pour les publications scientifiques, en particulier pour les recherches empiriques, il est considéré que plus l’article est récent plus son contenu est valide. Ce n’est pas toujours vrai, mais ce n’est pas complètement erroné non plus, il faut toujours consulter les documents les plus récents sans négliger les documents de références les plus anciens.

Moteurs de recherche

Pour effectuer une recherche de document sur le web, il existe notamment deux types d’instruments : les moteurs de recherche et les annuaires. Ces applications référencent des documents généraux, ils sont donc peu adaptés pour trouver des documents scientifiques, mais restent utile pour rechercher des informations généralistes et pour affiner un sujet, à la condition de toujours identifier les sources, les auteurs et les dates de publications des documents.

Les moteurs de recherche (google, exalead, voila.fr, bing…) sont des applications produites avec des logiciels appelés « bots » qui scannent le web. Lorsque l’on interroge un moteur de recherche, l’application renvoie des résultats de recherche qui sont le produit d’une activité logicielle. Les index des moteurs de recherche sont donc conçus pour recenser la plus grande quantité de pages web possible.

Pour plus d’information sur ce sujet vous vous trouverez ici la liste des principaux moteurs et annuaires. Sur cette page, vous pourrez consulter un petit guide expliquant comment faire référencer une page web dans un moteur de recherche.

Citons un instrument important : le moteur de recherche Google Scholar consacré aux documents scientifiques. Google Scholar permet de réaliser une recherche portant sur des travaux universitaires : articles de revues à comités de lecture, thèses, livres, résumés analytiques et rapports de recherche.

Google Scholar, comme d’autre base de données que nous allons voir par la suite, présente une fonctionnalité : il trie les résultats de recherche en fonction du nombre de fois où les documents ont été cités dans d’autres documents universitaires. Cela présente l’intérêt d’avoir un critère utilisé dans le champ scientifique pour évaluer la pertinence du contenu d’un document : en théorie plus un document est cité plus son contenu est important. Il est particulièrement utile de pouvoir, en un seul clic, consulter les documents qui citent un des résultats de recherche.

Les bases de données pour les Sciences Humaines

Dans les disciplines des sciences humaines, un grand nombre d’ouvrages et de revues ont été numérisés, mis en ligne et indexés au point de constituer aujourd’hui en ensemble de ressources incontournables pour les étudiants et les chercheurs. Nous allons voir dans cette partie quelques-unes de ces ressources et services en ligne permettant de collecter de la documentation scientifique (ouvrages, articles, communications…).

Il existe au moins quatre types d’instruments : les catalogues en texte intégral de revues, les bases de références bibliographiques, les bibliothèques en ligne et les entrepôts.

Les catalogues de revues en texte intégral

Ce type de base de données constitue des archives en ligne de revues scientifiques. Les revues scientifiques constituent un ensemble de publications important dans le champ scientifique. Leur particularité est de publier des articles dont le contenu scientifique a été validé par un comité de lecture composé d’autres chercheurs (Peer review process). Il est souvent utile de se rendre directement sur les sites des revues pour consulter les résumés des dernières publications voire le texte intégral. De plus sur le site de la bibliothèque de l’université de Cergy-Pontoise on trouve un recensement de bases qui ne seront pas présentées ci-dessous.

Des Portails gratuits

Un projet incontournable en langue française est le portail Persée.fr. Persée.fr est un projet qui assure un libre accès aux collections des principales revues françaises. Plus de 93 revues en texte intégral étaient accessibles gratuitement en novembre 2010. On y trouve les archives des revues importantes en SHS comme Les Actes de la Recherche en Sciences sociales, L’Homme ou La Revue française de sociologie. Pour l’éducation, on trouvera les archives de La Revue française de pédagogie, dans le domaine des TIC la revue Réseaux – Communication – Technologie – Société.

Un autre projet francophone important est celui de la plateforme Érudit.org produit de l’initiative des Presses de l’Université de Montréal. Ce portail donne accès gratuitement à des articles de revues francophones en texte intégral. On peut donc y consulter les archives de La Revue des sciences de l’éducation ou celles d’Ethnologies.

http://www.revues.org/

Revues.org est un portail publiant 247 revues en SHS qui propose en sus un certain nombre de services comme Calenda permettant de suivre l’actualité des sciences sociales sur internet. Cette plateforme recense et permet un accès gratuit à des revues de sciences de l’éducation comme Penser l’éducation ou Éducation et didactiques, mais aussi des revues portant sur les technologies de l’information et de la communication comme TIC et société.

http://www.eric.ed.gov/

Parmi les ressources anglophones, il est important de mentionner l’existence depuis longtemps sur le web de la base de données Eric qui est constituée de plus d’un million de documents de natures diverses comme des articles de revues à comité de lecture, des ouvrages, des rapports de recherches, des actes de colloques…

Des ressources payantes

Dans ce type de ressources, tous les articles ne sont pas toujours payants, mais les ressources les plus récentes le sont souvent.

http://www.cairn.info/

Le portail Cairn est une ressource particulièrement utile pour les chercheurs en Sciences humaines puisqu’on y trouve les dernières parutions de revues importantes du champ comme Les Actes de la recherche en Sciences sociales, l’Homme, etc. En sciences de l’éducation, on y trouve les revues Distances et Savoirs, Histoire de l’éducation, Éducation et sociétés, Carrefours de l’éducation…

Le groupe Taylor et Francis est un consortium d’éditeurs proposant un grand nombre de documents scientifiques dont la plupart sont en anglais. Néanmoins, on trouve beaucoup de textes en français sur cette base.

Jstor, Journal storage est une base de revues en ligne dans laquelle on trouve quelques documents en français.

Les bases de références bibliographiques

Jusqu’ici, nous avons présenté des bases qui permettent de consulter, de voir et de télécharger des documents intégralement. Mais il existe aussi des bases de données constituées avec des notices documentaires. Elles sont souvent bien mieux fournies et sont utiles pour repérer des documents que l’on se procurera par la suite.

On a brièvement présenté le Sudoc (Système universitaire de documentation) qui est un catalogue constitué en France par les bibliothèques et centres de documentation de l’enseignement supérieur. Il comprend plus de 9 millions de notices bibliographiques qui décrivent différents types de documents : livres, thèses, revues, ressources électroniques, documents audiovisuels, cartes, partitions, manuscrits et livres anciens…

On citera aussi les cataloguesde la Bibliothèque nationale de France (BNF) qui est un catalogue important référençant une très grande partie des documents publiés en français depuis longtemps. Il faut aussi citer le catalogue de la Bibliothèque publique d’information qui est situé au-dessus du musée Beaubourg à Paris, et qui est très innovante dans son champ.

Les catalogues des bibliothèques universitaires constituent des bases de référence bibliographique à titre d’exemple vous trouverez ici le catalogue de la bibliothèque de l’université de Cergy-Pontoise, ici celui des universités de la ville de Bordeaux, ici celui de l’université Paris Descartes.

Les bibliothèques en ligne

Nous avons vu une sélection de bases de données permettant de trouver des articles de revues scientifiques et des documents universitaires. Voyons maintenant quelques bibliothèques en ligne. Il s’agit encore de bases de données, mais elles ont une majorité d’ouvrages dans leurs fonds.

http://gallica.bnf.fr/

Le site des classiques en sciences sociales est un site canadien produit par des bénévoles. On y trouve les ouvrages des auteurs francophones passés dans le domaine public au Canada. C’est une ressource précieuse, car il est possible d’y consulter les livres de grands scientifiques, mais aussi les auteurs classiques des Lumières : Rousseau, Voltaire…

Le projet Gallica propose l’accès à plus d’un million de documents numérisés par la BNF. C’est une ressource considérable, mais qui présente des ouvrages anciens.

http://gallica.bnf.fr/

Le projet Google books ou Google recherche de livres vise à numériser et à mettre en ligne les ouvrages des plus grandes bibliothèques universitaires. C’est une base riche dans laquelle vous trouverez beaucoup d’ouvrages qui ne sont consultables que partiellement. Ce projet a beaucoup fait parler de lui dans les milieux des bibliothèques : vous pouvez notamment lire une analyse sur le sujet ici.

Les archives ouvertes

Les archives ouvertes constituent un moyen pour les chercheurs de diffuser une information scientifique rapidement. Un auteur dépose lui-même dans une base ses propres publications acceptées à la publication sur des supports-papier. Les archives ouvertes sont très utilisées dans le champ des sciences de la nature comme la base HAL (Hyper Article en Ligne), mais il existe la base HALSHS. Il faut mentionner un dépôt spécialisé dans la recherche sur les technologies de l’information et de la communication (TICE) l’archive EduTice. Vous trouverez plus d’information sur les archives ouvertes en vous rendant sur ce site dédié mis en place par le Consortium universitaire de publication numérique (COUPERIN).

Pour plus d’information sur les archives ouvertes, consultez l’article de Wikipédia sur le sujet.

Avec une relecture soigneuse et des remarques éclairantes de la part de Rebecca Freund, qu’elle en soit remerciée ici.

[1Au moment où j’écris ce texte, mais cela a probablement changé depuis.


Accueil | Contact | En résumé | | Statistiques du site | Crédits photo | Visiteurs : 897 / 1072990

Suivre la vie du site fr  Suivre la vie du site Outils et méthodologies  Suivre la vie du site Outils et techniques de recherches   ?    |    titre sites syndiques OPML   ?

Site réalisé avec SPIP 3.0.20 + AHUNTSIC

Creative Commons License