Mener une recherche internet efficacement

Au cours de votre apprentissage et de vos différents projets, vous aurez souvent besoin d’effectuer des recherches internet pour élargir votre culture générale, acquérir de nouvelles connaissances ou compétences, résoudre des erreurs dans vos programmes ou encore chercher de l’aide pour la réalisation de vos projets. Internet est en effet l’outil parfait pour cela, c’est une vraie mine d’or qui regorge d’informations.

Mais c’est là son principal défaut : pour n’importe quelle recherche, il y aura toujours trop de résultats. Essayez, par exemple, de chercher ‘chocolat’ sur Google, 1 580 000 000 résultats vous seront proposés. Vous ne pourrez jamais consulter toutes ces pages web dans un temps raisonnable. Il est donc primordial de savoir cibler ses recherches et filtrer les résultats. Il peut être aussi pratique de sauvegarder certains d’entre eux pour les consulter plus tard ou les intégrer dans une synthèse par exemple.

Nous aborderons en premier lieu dans la suite de cette rubrique les points clés importants pour mener une bonne recherche. Ensuite, nous verrons les outils pratiques pour restreindre le champ d’une recherche. Nous vous présenterons ensuite des solutions pour sauvegarder et organiser des résultats.



Sommaire

  • 1-Méthodes de recherches

  • 2-Outils pratiques

  • 3-Un point sur l’outil GitHub

  • 4-Bien utiliser son navigateur

  • 5-Cas pratiques


1 - Méthodes de recherche

Voici une liste (non-exhaustive) rassemblant les principaux conseils à respecter pour obtenir des informations pertinentes, complètes et fiables.

  • Evitez de polluer vos recherches : Cherchez par mots-clé, éliminez les mots superflus

    • Ne cherchez pas “pourquoi mon message ne s’affiche-t-il pas dans la console” mais “problème affichage console”, les résultats seront plus pertinents car aucun mot ne vient perturber la recherche.

  • Si les résultats sont peu satisfaisants, ne pas hésiter à reformuler, réutiliser les expressions que vous pouvez lire sur les sites que vous avez déjà trouvé. Cela permet d’élargir le champ de la recherche sans vous éloigner de l’information que vous cherchez.

  • Utilisez la langue de Shakespeare : n’hésitez pas à passer par l’anglais, les résultats seront très nombreux (Pour ceux qui auraient du mal avec la langue, les services de traduction automatique sont très performants de nos jours, pensez-y !).

  • Vérifiez la qualité de l’information :

    • Pensez toujours à chercher plusieurs sources différentes pour recouper et affiner les informations.

    • Pensez également à vérifier la date des articles que vous lisez. Une information n’est utile que si elle est encore à jour. Pour les conventions de codage ou documentations, vérifiez que la version dont il est question est la même que celle que vous devez utiliser.

  • Ne pas hésiter à lire des reviews, critiques sur un article donné. C’est très instructif pour comprendre les limites et les différents avis de la communauté scientifique.

  • Utilisez les outils de votre navigateur :

    • Sur une longue page, vous pouvez chercher les occurences d’une expression en utilisant le raccourci ‘Ctrl+F’.

    • Vous pouvez traduire les résultats:
      ‘Clic droit >> traduire’ sur Google Chrome
      En utilisant des extensions sur Mozilla Firefox

    • Les opérateurs de recherche (nous aborderons cela dans la partie suivante)

  • Pour des recherches orientées sciences, vous pouvez utiliser des moteurs de recherche spécialisé comme :

    • Google Scholar qui permet de rechercher des expression parmi un grand nombre de livres et articles scientifiques ( Cet outil propose d’utiliser les opérateurs de recherche de Google pour affiner vos recherches).

    • arXiv qui permet de chercher des articles scientifiques parmi des archives de différents domaines des sciences.

    • Si vous êtes étudiant, les écoles et universités proposent souvent un accès à une bibliothèque en ligne qui vousdonne accès à de nombreux livres et article de la littérteur scientifique. Profitez-en !

  • Pensez à enregistrer les résultats les plus pertinents que vous avez pu trouver. Enregistrez les et organisez les de manière à facilement retrouver les informations importantes. Pour cela, vous pouvez vous aider d’outils spécialisés :

    • Les favoris dans votre navigateur de recherche : vous pouvez créer des dossiers et organiser vos favoris. C’est la manière la plus rapide de sauvegarder les résultats de vos recherches.

    • Zotero vous propose de télécharger les articles scientifiques sur votre pc et de les classer facilement.

    • Mendeley … est un service semblable à Zotero.

    • Research Rabbit propose en plus de visualiser le lien entre les articles enregistrés et d’autres fonctionnalités avancées.

2 - Outils pratiques

Outils de recherche :

  • Google scholar : Lancé par Google en 2004, c’est un moteur de recherche spécialisé qui regroupe un immense base de données de livres et d’articles scientifiques dont la plupart sont gratuitement accessibles. Ce service permet de rechercher dans expressions dans ces ouvrages mais permet aussi par exemple de lister le citations d’un article. Il propose également d’enregistrer des articles ou de recevoir une notification par mail lorsqu’une publication paraît. NB : A noter que les ouvrages répertoriés par Google scholar ne sont pas seulement scientifiques, le moteur recense aussi des archives historiques par exemple.

    Pour en savoir plus sur Google Scholar, voici quelques ressources intéressantes :


  • ArXiv : Un moteur de recherche regroupant également de nombreux articles scientifiques. On y retrouve notamment beaucoup de publications en intelligence artificielle. Il faut toutefois noter que ces publications ne sont pas soumises à une révision par les pairs, mais que lorsqu’un article est publié dans un journal scientifique qui l’impose, cela est généralement précisé sur la page de l’article.

  • StackOverflow : Un forum sur le thème de l’informatique qui est majoritairement connu pour regrouper une immense base de données de questions/réponses en informatique. Pour faire simple, l’intégralité des erreurs ou problèmes que vous pourriez rencontrer en programmation ont déjà été posté sur ce site, et bien souvent il y a une solution fonctionnelle parmi les réponses. Attention toutefois aux dates des posts. De vieux posts peuvent proposer des solutions qui ne sont plus valables aujourd’hui. Ce site est généralement référencé parmi les premiers résultats, parfois même avant les documentations officielles. Pour l’utiliser, il suffit de copier/coller votre erreur ou l’énoncé de votre problème dans la barre de recherche. Le site tombera parmi les premiers résultats.

  • Sci-Hub : C’est un service qui vous donne accès à des papiers de recherche en renseignant le DOI de l’article dans la barre de recherche.

  • GitHub : C’est un service web basé sur l’outil Git qui permet de stocker des documents, faire de la gestion de version en ligne, en public ou dans entre quelques membres d’une équipe.

    • annotated research papers : Un repository (= un post) Github rassemblant un grand nombre d’articles de recherche annotés et classés.

  • Papers with code : Ce site web recense de nombreux papiers de recherche ainsi que le code et, en général, le(s) dataset(s) utilisé(s) utilisé par les chercheurs.

Outils de gestion des ressources :

Lors de vos recherches il peut être utile d’enregistrer et d’organiser des ressources pour les retrouver facilement ou les consulter plus tard par exemple. C’est ce que proposent les outils suivants.

  • Zotero : Logiciel installé en local sur votre machine. Il permet d’enregistrer des articles, des vidéos, des pages webs et des les organiser dans une bibliothèque pour vous aider à gérer vos ressources. Le logiciel est capable de détecter le titre et les auteurs des articles enregistrés (il peut y avoir quelques problèmes avec des articles anciens). Il existe également une extension web pour enregistrer vos ressources depuis votre navigateur sans avoir à ouvrir l’application.

  • Researchrabbit : Un service qui propose les mêmes fonctionnalités que zotero directement dans un navigateur web. Votre compte vous permet de vous connecter à votre bibliothèque depuis une autre machine que votre pc. L’application propose également des fonctions supplémentaires très utiles comme la recherche des citations des articles et la création de graphes de relations entre ces derniers. N’hésitez pas à aller jeter un oeil par vous même. Notez tout de même que, proposant plus de fonctionnalités, cette application est plus difficile à prendre en main.

  • Mendeley : Un logiciel équivalent à Zotero, qui propose cependant des outils facilitant l’annotation d’articles dans l’application, un peu à la manière d’Acrobat Reader(lecteur de pdf).

3 - Un point sur l’outil GitHub

GitHub est un service web basé sur le logiciel Git qui permet de faire de la gestion de versions logicielles ainsi que du stockage de fichiers sur le net. Il suffit de se créer un compte pour pouvoir créer des dossiers pour stocker vos projets, on appelle cela des ‘repository’ abrégés en ‘repo’. Chaque modification est enregistrée et vous permet de revenir en arrière à tout moment du développement. Github permet également de collaborer avec les autres utilisateurs sur les projets publics, mais vous pouvez également restreindre un projet à seulement quelques collaborateurs.

Github est très pratique car il permet de partager et stocker son code très facilement, mais c’est surtout une mine de ressources incroyable. Le site recense de nombreux cours de programmation pour tous les langages. Mais vous y trouverez également des modules, encore une fois pour tous les langages de programmation. Vous y trouverez des banques d’articles de recherche ainsi que les codes utilisés par les chercheurs. Et ce ne sont là que quelques exemples.

4 - Bien utiliser son navigateur

Utilisez les outils offerts par votre navigateur pour filtrer les résultats et ne garder que les plus pertinents. Nous allons découvrir maintenant les mots-clés réservés ou opérateurs de recherche. Les moteurs de recherche modernes (Google, Duckduckgo, …) proposent de cibler votre recherche grâce à des mots clés ou des opérateurs spécifiques. Vous pouvez ainsi sélectionner les résultats suivant leur date de publication, le type de fichier qu’il contient (html, pdf, …), filtrer par nom de domaine. Nous allons vous présenter dans la suite les mots-clé les plus utiles.

Les opérateurs

  • “” : Pour rechercher une expression exacte, par exemple une citation, mettez cette requête entre guillemets.

  • rechercher ‘petit papa noël’ vous renverra en premier vers des vidéos d’une célèbre comptine de noël quand rechercher ‘“petit papa noël”’ mettra en avant les résultats contenant les paroles de la chanson.

  • AND / OR : Opérateurs bouléens qui permettent de renvoyer les résultats qui contiennent les expressions X ET Y (AND) ou X OU Y (OR). Vous pouvez combiner les expressions

  • () : Vous permet de rassembler des termes ensemble pour former des expressions (comme en maths). Cela vous permet de combiner les opérateurs logiques vus ci-dessus

    • ‘(X AND Y) OR Z’ sélectionnera à la fois les résultats contenant X ET Y, et les résultats contenant Z.

  • .. : Permet de chercher sur une plage de nombres.

    • ‘voiture 2000..2010’ vous retournera des résultats à propos des voitures des années 2000 à 2010.

  • - : Remplacer des mots manquants. Si vous cherchez une phrase particulière mais qu’il vous manque certains mots, vous pouvez combler les trous avec “-“

    • ‘En - te découvre pas d’un fil’ vous retournera directement le fameux dicton ‘En avril ne te découvre pas d’un fil’.

  • - : Vous pouvez exclure certains termes avec ‘-‘(moins).

    • ‘Lyon -ville’ vous renverra des résultats sur les clubs de sport lyonnais par exemple, mais rien qui ne contienne le terme ville.

Les mots-clé

Pour utiliser les mots-clé, il suffit de les placer à la fin de votre requête et suivis de “:” : ‘ce que je recherche <mot-clé>:<valeur mot-clé> <autre mot-clé>:<valeur autre mot-clé>’.

  • ‘filetype:’ : Spécifiez un type de fichier. Le navigateur ne vous retournera que des résultats contenant ce type de fichier.

  • ‘site:’ : Ne sélectionnez que les résultats provenant d’un nom de domaine spécifique.

  • ‘before/after:’ : Sélectionnez les résultats publiés avant/après une certaine date.

    • ‘before:21/12/2012’ ne vous renverra que des résultats antérieurs à la fin du monde.

  • ‘related:’ : Cherchez les résultats en lien avec une url.

    • ‘related:google.fr’ vous permettra de chercher les principaux moteurs de recherche.

  • ‘inURL:<mot-clé>’ : Permet de chercher les résultats contenant <mot-clé> dans leur url.

  • ‘intitle:<mot-clé>’ : Même principe avec le titre du résultat.

  • ‘intext:<mot-clé>’ : Idem mais dans le corps de la page.

Pour plus de précidions, voici les pages qui ont servi de base pour écrire cette rubrique. Elles sont très complètes et très accessibles :

5 - Cas pratiques

Voici quelques conseils pour réaliser deux types de recherches que vous aurez souvent l’occasion de mener au long de votre apprentissage des sciences de la donnée et de votre parcours de programmeur

1. L’état de l’art

Avant chaque projet, il est important de rechercher ce qu’on appelle “l’état de l’art” (ou State of the Art, abrégé SOT en anglais). Il s’agit lors de cette étape de chercher et de comprendre ce qui a déjà été fait ainsi que les usages actuels dans le domaine lié à notre projet. L’intérêt de ce travail est de bien cromprendre le domaine que l’on étudie, de prendre connaissance des solutions déjà existantes et souvent de déterminer une première piste de réflexion. En cherchant cet état de l’art, on veut tout d’abord une information globale et générale à propos du sujet traité, pour bien le comprendre (historique, vocabulaire spécifique …). L’idée n’est pas de devenir un expert dans un domaine mais de balayer large pour ne rien rater d’important, tout en s’assurant de bien maîtriser les bases.

Voici quelques conseils pour vous orienter vos recherches :

  • Cherchez le nom du sujet sur internet.

  • Wikipédia apporte une vision d’ensemble du sujet et une base de vocabulaire. C’est bien de commencer par là. N’hésitez pas à aller lire les pages connexes ou relatives aux mots de vocabulaire de la page.

  • Si les ressources sont peu nombreuses, n’hésitez pas à aller chercher des sources en anglais (Si vous n’êtes pas bilingues, les traductions automatiques sont plutôt efficaces, pensez à les utiliser). Pour être sûr d’avoir la bonne traduction pour des termes techniques, vous pouvez chercher l’article français sur wikipédia puis sélectionner la version anglaise.

Il peut être utile de garder les résultats de vos recherches dans un coin pour les classer, les relire, les annoter. Pour cela il existe des outils comme –Zotero– qui permet d’enregistrer des articles depuis le web sur votre pc et de les organiser.

2. Pour des recherches liées à une notion d’un langage de programmation

  • Pour comprendre comment utiliser une fonction/librairie :

    • Pour chercher la documentation relative à une librairie, tapez : < nom du module > documentation (éventuellement < nom du langage >)

    • Pour chercher la documentation relative à une fonction, tapez : < nom de la fonction > (< nom du module > si la fonction provient d’une librairie externe) < nom du langage >

    • Certains sites regroupent des documentations non officielles avec des exemples, voire dans certains cas proposent la possibilité de tester une fonction sur le site ou des exercices d’entraînement. A titre d’exemple, on peut citer W3School ou geekforgeeks.org.

    • Cherchez des exemples d’utilisation de la fonction, pour cela, tapez : < nom de la fonction > exemples (ou “examples” pour une recherche en anglais). N’hésitez pas à consulter les sites suivants qui regorgent d’exemples et d’explications : Stackoverflow, Github, pythonexamples.org, Grepper.

  • Pour résoudre les erreurs (si la lecture de l’erreur ne vous permet pas de résoudre le problème) :

    • copier coller l’erreur dans la barre de recherche

    • Cherchez des solutions soit dans la documentation du langage ou de la librairie, soit sur les forums comme Stackoverflow.

Le plus important ici est de vérifier que la version dont il est question est la même que celle que vous utilisez. Vérifiez également les dates des posts sur les forums, si la solution proposée ne fonctionne pas, cela peut venir du fait qu’il s’agit d’une ancienne version.




En résumé

Points-clés d’une recherche réussie :

  • Chercher par mots-clé, c’est la clé du succès !

  • Varier les expressions, reformuler c’est c’est la clé pour avancer !

  • Croisez vos sources pour une information fiable !

  • Une bonne information est une information à jour !

  • Sauvegardez les ressources dignes d’intérêt !

Liste des outils pratiques :

  • Problèmes de programmation :

    • StackOverflow

    • GitHub

    • Les documentations officielles

    • Openclassroom : le forum et les cours

    • W3School : Cours, extraits de documentation avec des exemples et la possibilité de tester sur le site

  • Recherche d’informations générales :

    • Wikipédia

  • Recherche d’informations spécifiques et techniques:

    • Google Scholar : recherchez des articles ou des livres dans une large base de données

    • arXiv : Cherchez des articles scientifiques parmi des archives de différentes disciplines scientifiques

    • Paper with code

    • Github (encore)

  • Sauvegarder vos recherches :

    • Zotero

    • Research Rabbit

    • Mendeley

    • Favoris du navigateur

Les tips utiles :

  • Pour obtenir la bonne traduction d’un terme technique, cherchez le dans une langue sur Wikipédia et changez la langue de l’article.

  • Avant de vous intéresser à une information très précise, il est bien de comprendre le contexte qui l’entoure. Soyez curieux lors de vos recherches !