Cómo usar Google Ngram de manera más efectiva

Los estudios de lenguaje y lingüística a menudo necesitarán datos sobre cómo se utilizan las palabras, especialmente a lo largo del tiempo. Si bien la investigación es una necesidad, tener herramientas que te proporcionen los datos que necesitas es bienvenido. El Google Ngram Viewer es una excelente manera de encontrar tendencias de palabras en la biblioteca de Google Books rápidamente.
En esta publicación, te mostramos cómo usar Google Ngram de manera más efectiva. Primero, vamos a presentarte la herramienta.
También lee: Aplicaciones útiles de Google que aprovechan al máximo tu cuenta de Google
Presentando Google Ngram
Google mantiene una base de datos multilingüe de lenguaje publicado. Al escanear libros en masa, el gigante de las búsquedas puede procesar el texto y proporcionar estadísticas basadas en la frecuencia de las palabras.
Con la herramienta de búsqueda Google Ngram Viewer, puedes buscar a través de estos datos. Al comparar la popularidad relativa de las palabras, puedes mapear cómo el lenguaje y la cultura han cambiado a lo largo del tiempo.
Sin embargo, la herramienta Google Ngram puede hacer mucho más que simplemente informar la frecuencia de las palabras, como veremos a continuación.
Cómo realizar búsquedas básicas
Antes de entrar en “tácticas” avanzadas, repasemos cómo llevar a cabo una búsqueda básica. Desde la página de Google Ngram, escribe una palabra clave en el cuadro de búsqueda.
Si deseas incluir todas las capitalizaciones de una palabra, marca el botón Sin distinción de mayúsculas. Esta búsqueda incluiría “Tech” y “tech.”
Debajo del cuadro de búsqueda, también puedes establecer parámetros como el rango de fechas y el “suavizado.” Este último valor elimina picos y caídas atípicas de tus datos. Los valores de suavizado más bajos son más precisos, mientras que los valores más altos revelan tendencias más profundas.
Cómo seleccionar un “Corpus”
El corpus es la colección de textos que el Ngram Viewer examinará. El valor predeterminado de “Inglés” es aceptable para la navegación casual, pero puede ser muy académico.

“Ficción en inglés” reflejará más de cerca el lenguaje común. El corpus estándar de “Inglés” puede estar cargado de no ficción con muchas palabras técnicas.
Si bien el significado más profundo detrás de tu elección de corpus está más allá del alcance de este artículo, Google ofrece una breve visión sobre la elección correcta para ti.
Realizando búsquedas avanzadas
Al usar palabras de búsqueda adicionales, puedes crear comparaciones complejas. Para hacer esto, separa cada término con una coma.

El Ngram Viewer mostrará la frecuencia relativa de tus términos de búsqueda en un solo gráfico. Aquí, puedes pasar el cursor sobre las líneas del gráfico para ver puntos de datos precisos.

También puedes usar un asterisco en tus términos de búsqueda como un comodín. Por ejemplo, “Bachelor of *” devolvería resultados para muchos títulos de Bachelor.

Para encontrar todas las inflexiones de un término, agrega el modificador “_INF”.

Si una palabra incluye muchas partes del habla, puedes ser más específico usando operadores de texto. Las partes del habla válidas en la base de datos de Google incluyen todas las siguientes:
- ADJ: adjetivo (rápido, grande, inteligente)
- ADV: adverbio (rápidamente, después, siempre)
- PRON: pronombre (su, ello, nosotros)
- DET: determinante o artículo (un, una, el)
- ADP: adposición (preposiciones y posposiciones)
- NUM: numeral (primero, segundo, quinto)
- CONJ: conjunción (y, ni, pero)
- PRT: partícula, que es una categoría de uso raro para otras funciones de palabras
Cada uno de estos puede combinarse en frases. Por ejemplo, “ADJ boy” devolvería pares de palabras para el adjetivo y “boy.”
Para especificar una parte del habla específica para un término de búsqueda, agrégala al final. Por ejemplo, “water_VERB” sin un guion bajo al final. Para incluir cada parte del habla para una palabra dada, usa el operador comodín después del guion bajo.
Variables funcionales, composiciones y dependencias

Las variables funcionales te permiten buscar por la función o colocación de las palabras.
- ROOT es un marcador de posición para la raíz del árbol de análisis de la oración. Este es típicamente el sujeto principal o la palabra modificada por el verbo.
- START indica el comienzo de una oración. (“START Presidente Obama” devuelve solo oraciones que comienzan con la frase “Presidente Obama.”)
- END indica el final de una oración. (“ADP END“ devuelve oraciones que terminan en preposiciones.)
Al combinar términos de búsqueda con operadores aritméticos, puedes realizar un análisis matemático simple con valores para la frecuencia de términos:
- + agrega múltiples expresiones en un término de búsqueda
- – resta la expresión de la derecha de la expresión de la izquierda, proporcionando una forma rápida de comparar el uso relativo de dos términos de búsqueda.
- / divide la expresión de la izquierda por la expresión de la derecha
- * multiplica la expresión para comparar ngrams de frecuencia muy variada. Asegúrate de encerrar todo el ngram entre paréntesis para evitar que el asterisco se interprete como un carácter comodín.
- : (dos puntos) busca el ngram a la izquierda dentro del corpus a la derecha.
Finalmente, puedes establecer dependencias con “=>” para buscar relaciones lingüísticas.

Por ejemplo, “car=>fast” devolvería resultados donde “fast” dependía gramaticalmente de, o modificaba, la palabra “car.” Esto se puede mezclar libremente con cualquiera de las operaciones de búsqueda avanzadas.
Conclusión
Buscar tendencias de palabras tiene muchas aplicaciones académicas. Una forma rápida de encontrar la información que necesitas es la herramienta Ngram de Google. La buena noticia es que no solo te permite realizar búsquedas básicas. Puedes aplicar modificadores poderosos para afinar la información que necesitas.
Ninguna de las funcionalidades de Google Ngram sería posible sin el avanzado motor de búsqueda que hay detrás. ¿Te impresiona lo que puede hacer la herramienta Google Ngram? ¡Déjanos saber en la sección de comentarios a continuación!