Comment utiliser Google Ngram plus efficacement

Un exemple de Google Ngram

Les études linguistiques nécessitent souvent des données sur l’utilisation des mots, en particulier au fil du temps. Bien que la recherche soit une nécessité, avoir des outils pour vous fournir les données dont vous avez besoin est appréciable. Le Google Ngram Viewer est un excellent moyen de trouver rapidement les tendances des mots dans la bibliothèque Google Books.

Dans cet article, nous vous montrons comment utiliser Google Ngram plus efficacement. Tout d’abord, présentons l’outil.

Lisez aussi : Applications Google utiles qui tirent pleinement parti de votre compte Google

Présentation de Google Ngram

Google maintient une base de données multilingue de la langue publiée. En scannant des livres en masse, le géant de la recherche est capable de traiter le texte et de fournir des statistiques basées sur la fréquence des mots.

Avec l’outil de recherche Google Ngram Viewer, vous pouvez rechercher dans ces données. En comparant la popularité relative des mots, vous pouvez cartographier comment la langue et la culture ont évolué au fil du temps.

Cependant, l’outil Google Ngram peut faire beaucoup plus que simplement rapporter la fréquence des mots, comme nous allons le voir.

Comment effectuer des recherches de base

Avant de passer aux “tactiques” avancées, passons en revue comment effectuer une recherche de base. Depuis la page Google Ngram, tapez un mot-clé dans la zone de recherche.

Si vous souhaitez inclure toutes les capitalisations d’un mot, cochez le bouton Insensible à la casse. Cette recherche inclurait “Tech” et “tech.”

Sous la zone de recherche, vous pouvez également définir des paramètres tels que la plage de dates et le “lissage”. Cette dernière valeur élimine les pics et les creux atypiques de vos données. Des valeurs de lissage plus faibles sont plus précises, tandis que des valeurs plus élevées révèlent uniquement des tendances plus profondes.

Comment sélectionner un “Corpus”

Le corpus est la collection de textes que le Ngram Viewer examinera. Le défaut de “l’anglais” est acceptable pour une navigation occasionnelle mais peut être très académique.

Choisir un corpus dans Google Ngram.

“Fiction anglaise” reflétera plus fidèlement la langue courante. Le corpus standard “anglais” peut être lourd en non-fiction avec beaucoup de mots techniques.

Bien que la signification plus profonde de votre choix de corpus dépasse le cadre de cet article, Google offre un aperçu bref du bon choix pour vous.

Effectuer des recherches avancées

En utilisant des mots de recherche supplémentaires, vous pouvez créer des comparaisons complexes. Pour ce faire, séparez chaque terme par une virgule.

Recherche de plusieurs mots-clés.

Le Ngram Viewer affichera la fréquence relative de vos termes de recherche dans un seul graphique. Ici, vous pouvez survoler les lignes du graphique pour voir des points de données précis.

Ciblage d'un seul point de données.

Vous pouvez également utiliser un astérisque dans vos termes de recherche comme caractère générique. Par exemple, “Bachelor of *” renverrait des résultats pour de nombreux diplômes de Bachelor.

Utilisation de caractères génériques dans les termes de recherche.

Pour trouver toutes les inflexions d’un terme, ajoutez le modificateur “_INF”.

Trouver des inflexions dans Google Ngram.

Si un mot comprend de nombreuses parties du discours, vous pouvez être plus spécifique en utilisant des opérateurs de texte. Les parties du discours valides dans la base de données de Google incluent toutes les suivantes :

  • ADJ : adjectif (rapide, grand, intelligent)
  • ADV : adverbe (rapidement, plus tard, toujours)
  • PRON : pronom (leur, cela, nous)
  • DET : déterminant ou article (un, une, le)
  • ADP : adposition (prépositions et postpositions)
  • NUM : numérique (premier, deuxième, cinquième)
  • CONJ : conjonction (et, ni, mais)
  • PRT : particule, qui est une catégorie fourre-tout, rarement utilisée pour d’autres fonctions de mots

Chacune de ces parties peut être combinée en phrases. Par exemple, “ADJ garçon” renverrait des paires de mots pour l’adjectif et “garçon.”

Pour spécifier une partie du discours spécifique pour un terme de recherche, ajoutez-la à la fin. Par exemple, “water_VERB” sans un trait de soulignement à la fin. Pour inclure chaque partie du discours pour un mot donné, utilisez l’opérateur générique après le trait de soulignement.

Variables fonctionnelles, compositions et dépendances

Utilisation de variables fonctionnelles dans Google Ngram.

Les variables fonctionnelles vous permettent de rechercher par la fonction ou le placement des mots.

  • ROOT est un espace réservé pour la racine de l’arbre de parse de la phrase. C’est généralement le sujet principal ou le mot modifié par le verbe.
  • START indique le début d’une phrase. (“START Président Obama” ne renvoie que des phrases qui commencent par l’expression “Président Obama.”)
  • END indique la fin d’une phrase. (“ADP END“ renvoie des phrases qui se terminent par des prépositions.)

En combinant des termes de recherche avec des opérateurs arithmétiques, vous pouvez effectuer une analyse mathématique simple avec des valeurs pour la fréquence des termes :

  • + ajoute plusieurs expressions en un seul terme de recherche
  • soustrait l’expression de droite de l’expression de gauche, fournissant un moyen rapide de comparer l’utilisation relative de deux termes de recherche.
  • / divise l’expression de gauche par l’expression de droite
  • * multiplie l’expression pour comparer les ngrams de fréquence très variée. Assurez-vous d’encadrer tout le ngram entre parenthèses pour éviter que l’astérisque soit analysé comme un caractère générique.
  • : (un deux-points) recherche le ngram à gauche dans le corpus à droite.

Enfin, vous pouvez définir des dépendances avec “=>” pour rechercher des relations linguistiques.

Utilisation de dépendances dans Google Ngram.

Par exemple, “car=>rapide” renverrait des résultats où “rapide” était grammaticalement dépendant de, ou modifiant, le mot “car.” Cela peut être mélangé librement avec n’importe lesquelles des opérations de recherche avancées.

Conclusion

Rechercher des tendances de mots a de nombreuses applications académiques. Un moyen rapide de trouver les informations dont vous avez besoin est l’outil Ngram de Google. La bonne nouvelle est qu’il ne vous permet pas seulement d’effectuer des recherches de base. Vous pouvez appliquer des modificateurs puissants pour affiner les informations dont vous avez besoin.

Aucune des fonctionnalités de Google Ngram ne serait possible sans la puissance avancée du moteur de recherche. Êtes-vous impressionné par ce que l’outil Google Ngram peut faire ? Faites-le nous savoir dans la section des commentaires ci-dessous !