Como Usar o Google Ngram de Forma Mais Eficiente

Um exemplo de um Google Ngram

Estudos de linguagem e linguística frequentemente precisarão de dados sobre como as palavras são usadas, especialmente ao longo do tempo. Enquanto a pesquisa é uma necessidade, ter ferramentas que fornecem os dados necessários é bem-vindo. O Google Ngram Viewer é uma ótima maneira de encontrar rapidamente tendências de palavras na biblioteca do Google Books.

Neste post, mostramos como usar o Google Ngram de forma mais eficaz. Primeiro, vamos apresentar a ferramenta.

Leia também: Aplicativos do Google Úteis que Aproveitam ao Máximo Sua Conta do Google

Apresentando o Google Ngram

O Google mantém um banco de dados multilíngue de linguagem publicada. Ao escanear livros em massa, o gigante da busca consegue processar o texto e fornecer estatísticas com base na frequência das palavras.

Com a ferramenta de busca Google Ngram Viewer, você pode pesquisar esses dados. Comparando a popularidade relativa das palavras, você pode mapear como a linguagem e a cultura mudaram ao longo do tempo.

No entanto, a ferramenta Google Ngram pode fazer muito mais do que simplesmente relatar a frequência das palavras, como veremos a seguir.

Como Realizar Pesquisas Básicas

Antes de entrarmos em “táticas” avançadas, vamos passar por como realizar uma pesquisa básica. Na página do Google Ngram, digite uma palavra-chave na caixa de pesquisa.

Se você quiser incluir todas as capitalizações de uma palavra, marque o botão Ignorar Maiúsculas. Essa pesquisa incluiria “Tech” e “tech.”

Abaixo da caixa de pesquisa, você também pode definir parâmetros como o intervalo de datas e “suavização.” Este último valor remove picos e quedas atípicas dos seus dados. Valores de suavização mais baixos são mais precisos, enquanto valores mais altos revelam tendências mais profundas apenas.

Como Selecionar um “Corpus”

O corpus é a coleção de textos que o Ngram Viewer irá examinar. O padrão de “Inglês” é aceitável para navegação casual, mas pode ser altamente acadêmico.

Escolhendo um corpus no Google Ngram.

“Ficção em Inglês” refletirá mais de perto a linguagem comum. O corpus padrão de “Inglês” pode ser pesado em não-ficção, com muitas palavras técnicas.

Embora o significado mais profundo por trás da sua escolha de corpus esteja além do escopo deste artigo, o Google oferece uma breve visão sobre a escolha certa para você.

Realizando Pesquisas Avançadas

Ao usar palavras de pesquisa adicionais, você pode criar comparações complexas. Para fazer isso, separa cada termo com uma vírgula.

Pesquisando por várias palavras-chave.

O Ngram Viewer exibirá a frequência relativa dos seus termos de pesquisa em um único gráfico. Aqui, você pode passar o mouse sobre as linhas do gráfico para ver pontos de dados precisos.

Focando em um único ponto de dados.

Você também pode usar um asterisco em seus termos de pesquisa como um caractere curinga. Por exemplo, “Bacharel em *” retornaria resultados para muitos graus de Bacharel.

Usando curingas em termos de pesquisa.

Para encontrar todas as inflexões de um termo, adicione o modificador “_INF”.

Encontrando inflexões no Google Ngram.

Se uma palavra incluir muitas partes do discurso, você pode ser mais específico usando operadores de texto. As partes do discurso válidas no banco de dados do Google incluem todas as seguintes:

  • ADJ: adjetivo (rápido, grande, inteligente)
  • ADV: advérbio (rapidamente, depois, sempre)
  • PRON: pronome (seus, ele, nós)
  • DET: determinante ou artigo (um, uma, o)
  • ADP: adposição (preposições e pós-posições)
  • NUM: numeral (primeiro, segundo, quinto)
  • CONJ: conjunção (e, nem, mas)
  • PRT: partícula, que é uma categoria abrangente e raramente usada para outras funções de palavras

Cada um desses pode ser combinado em frases. Por exemplo, “ADJ menino” retornaria pares de palavras para o adjetivo e “menino.”

Para especificar uma parte específica do discurso para um termo de pesquisa, adicione-a ao final. Por exemplo, “água_VERBO” sem um sublinhado no final. Para incluir todas as partes do discurso para uma determinada palavra, use o operador curinga após o sublinhado.

Variáveis Funcionais, Composições e Dependências

Usando variáveis funcionais no Google Ngram.

Variáveis funcionais permitem que você pesquise pela função ou colocação das palavras.

  • ROOT é um espaço reservado para a raiz da árvore de análise da frase. Este é tipicamente o sujeito principal ou a palavra modificada pelo verbo.
  • START indica o início de uma frase. (“START Presidente Obama” retorna apenas frases que começam com a frase “Presidente Obama.”)
  • END indica o final de uma frase. (“ADP END” retorna frases que terminam em preposições.)

Ao combinar termos de pesquisa com operadores aritméticos, você pode realizar uma análise matemática simples com valores para a frequência dos termos:

  • + adiciona múltiplas expressões em um único termo de pesquisa
  • subtrai a expressão à direita da expressão à esquerda, fornecendo uma maneira rápida de comparar o uso relativo de dois termos de pesquisa.
  • / divide a expressão à esquerda pela expressão à direita
  • * multiplica a expressão para comparar ngrams de frequência amplamente variada. Certifique-se de colocar todo o ngram entre parênteses para evitar que o asterisco seja interpretado como um caractere curinga.
  • : (um dois-pontos) pesquisa o ngram à esquerda dentro do corpus à direita.

Finalmente, você pode definir dependências com “=>” para pesquisar relações linguísticas.

Usando dependências no Google Ngram.

Por exemplo, “carro=>rápido” retornaria resultados onde “rápido” era gramaticalmente dependente de, ou modificando, a palavra “carro.” Isso pode ser misturado livremente com qualquer uma das operações de pesquisa avançadas.

Conclusão

Pesquisar tendências de palavras tem muitas aplicações acadêmicas. Uma maneira rápida de encontrar as informações que você precisa é a ferramenta Ngram do Google. A boa notícia é que ela não apenas permite que você realize pesquisas básicas. Você pode aplicar modificadores poderosos para se concentrar nas informações que precisa.

Nenhuma das funcionalidades do Google Ngram seria possível sem o trabalho avançado do mecanismo de busca por trás das cenas. Você está impressionado com o que a ferramenta Google Ngram pode fazer? Deixe-nos saber na seção de comentários abaixo!