5 Maneras de Obtener Salida de Voz Desde Tu Terminal de Linux

Texto de Imagen de Característica Texto a Voz Linux Ubuntu

Siempre estoy buscando comandos o herramientas de Linux divertidos e interesantes que me ayuden a realizar diversas tareas sin salir del terminal. Por ejemplo, hay varias herramientas de línea de comandos que permiten que tu terminal de Linux hable contigo. Exploremos estas herramientas y demos una voz a tu terminal.

1. ESpeak

eSpeak es un sintetizador de voz ligero y de código abierto que ha sido un favorito durante años. Lo que hace que eSpeak se destaque es su velocidad y bajo uso de recursos. Además, incluye múltiples idiomas y acentos, lo que lo hace conveniente para usuarios internacionales.

Hacer que eSpeak funcione es sencillo. En la mayoría de los sistemas basados en Debian/Ubuntu, simplemente puedes abrir tu terminal y escribir:

sudo apt install espeak

Instalando la Herramienta de Línea de Comandos Espeak en el terminal de Ubuntu.

Para otras distribuciones, usa el gestor de paquetes de tu sistema, como DNF, YUM o Pacman.

Una vez instalado, usar eSpeak es increíblemente simple. Solo puedes escribir espeak, seguido del texto que deseas que diga:

espeak "¡Hola desde tu terminal de Linux!"

¡Eso es todo! Tu computadora ahora debería saludarte (o lo que sea que escribiste) en voz alta. Si tienes un archivo de texto almacenado en cualquier parte de tu sistema y deseas leer su contenido en voz alta, usa la opción -f junto con el nombre del archivo.

espeak -f filename.txt

También puedes ajustar parámetros como el tono (-p) y la velocidad (-s) para una salida robótica pero personalizable.

espeak "Tarea completada con éxito"-p=30-s=150

¿No eres fan de la voz predeterminada? eSpeak admite diferentes voces. Puedes listar las voces disponibles usando la opción --voices:

espeak --voices

Lista de Voces de Espeak mostrando en el terminal de Ubuntu.

Después de seleccionar una voz específica, puedes especificar el nombre de la voz con el comando eSpeak:

espeak -v en-us "Hola, esto es eSpeak"

Además, puedes canalizar salidas de comandos directamente a voz, como:

ls-l| espeak --stdin

Nota: Hay muchas otras opciones y personalizaciones que puedes explorar. Para ver todas las opciones disponibles, te recomiendo que consultes la página del manual de la herramienta eSpeak con el comando espeak --help.

2. Festival

¿Buscas una herramienta altamente personalizable? Festival podría ser justo lo que necesitas. Proporciona un sistema completo de texto a voz con una amplia gama de voces. Es más avanzado que eSpeak, ofreciendo un mayor control sobre las voces y la síntesis de voz.

Puedes instalar Festival con el gestor de paquetes predeterminado en tu sistema Linux, como Debian, o los usuarios de Ubuntu pueden obtenerlo del gestor de paquetes APT.

sudo apt install festival

Para usar Festival desde la línea de comandos para texto a voz básico, ejecuta esto:

echo"Festival es un poderoso sistema de texto a voz."| festival --tts

Además, puedes leer cualquier archivo de texto con el festival ejecutando esto:

festival --tts textfile.txt

Las herramientas de línea de comandos de Festival permiten la personalización de voces, ajustes de pronunciación y mucho más. Consulta la página del manual festival --help para detalles sobre varias opciones. Es una alternativa perfecta si deseas más control sobre la síntesis de voz.

3. Google Speech (gTTS)

A diferencia de las herramientas tradicionales fuera de línea, esta opción aprovecha la nube, aprovechando las robustas capacidades de síntesis de voz de Google. Con una pronunciación clara y voces que suenan naturales, Google Speech es perfecto para aquellos que priorizan una salida de alta calidad y no les importa una conexión a internet.

Sin embargo, no es un comando directo como eSpeak. En su lugar, utilizaremos una biblioteca de Python llamada gTTS (Google Text-to-Speech). Primero, asegúrate de que Python y pipx (el instalador de paquetes de Python) estén instalados. Si lo están, instalar gTTS es tan simple como:

pipx install gtts

También necesitarás un reproductor de audio como mpg123 o VLC. Si no tienes ningún reproductor, puedes instalarlo con esto:

sudo apt install mpg123

Una vez que gTTS y mpg123 estén instalados, puedes usar una línea de comando en tu terminal para hacer que la voz de Google hable:

gtts-cli "¡Hola y Bienvenido a Linux!" --output.txt temp.mp3 && mpg123 temp.mp3

Para listar todos los idiomas disponibles, usa la opción --all, y después puedes especificar un idioma con la opción --lang. Por ejemplo, para cambiar a francés, usa la opción --lang fr antes de la opción --output:

gtts-cli "¡Hola y Bienvenido a Linux!"--lang fr --output.txt temp.mp3 && mpg123 temp.mp3

Google Speech requiere un poco más de configuración que herramientas más sencillas, ¡pero si la calidad de la voz es una prioridad, gTTS es una opción fantástica!

4. Say (Speech Dispatcher)

Si has usado macOS, es posible que estés familiarizado con el comando say. Aunque no es un comando estándar de Linux, puedes lograr una funcionalidad similar utilizando Speech Dispatcher y su comando spd-say.

Para hacer que spd-say funcione, probablemente necesitarás instalar Speech Dispatcher y potencialmente un motor de voz como eSpeak si no tienes uno ya. Para obtenerlo en Debian/Ubuntu, usa el gestor de paquetes APT predeterminado:

sudo apt install speech-dispatcher

Speech Dispatcher actúa como una interfaz unificada para diferentes sintetizadores de voz, permitiéndote usar varios motores TTS (incluyendo eSpeak y Festival) con una estructura de comando consistente. Esto facilita el cambio entre motores TTS sin modificar significativamente los scripts.

Una vez instalado, usa spd-say para hacer que tu terminal de Linux hable:

spd-say "¡Hola y Bienvenido a Linux!"

Este comando debería usar Speech Dispatcher para hablar el texto utilizando el motor de voz predeterminado configurado en Speech Dispatcher.

También puedes ajustar la tasa de habla, el tono y el volumen utilizando las opciones -r, -p y -v junto con el comando spd-say. Si deseas acceder a las opciones de personalización adicionales, consulta su página de manual ejecutando spd-say --help.

Nota: También hay una herramienta de GNUstep llamada say que te permite transformar el texto dado en voz audible y reproducirlo a través del dispositivo de sonido. Desafortunadamente, esta herramienta tiene opciones limitadas disponibles y no tiene opciones de personalización avanzadas.

5. Flite

¿Buscas algo aún más ligero que eSpeak? Conoce Flite. Está diseñado para ser un motor de ejecución pequeño y rápido para la síntesis de voz. Es básicamente una versión más pequeña de Festival, lo que lo hace ideal para situaciones donde los recursos son limitados, como sistemas embebidos o computadoras más antiguas.

Para la instalación, puedes usar el gestor de paquetes predeterminado como Apt, Dnf, Pacman. Por ejemplo, en Debian/Ubuntu, escribe esto:

sudo apt install flite

Instalando Flite Tts

Usar Flite es muy similar a eSpeak en su simplicidad. Solo escribe flite seguido del texto que deseas que hable:

flite -t"Flite es un motor de síntesis de voz pequeño y rápido."

Flite lee el texto directamente en tu terminal. Si estás trabajando en una Raspberry Pi o en un sistema de bajos recursos, Flite vale la pena considerar.

¡Así que ahí lo tienes! Ahora tienes múltiples maneras de hacer que tu terminal de Linux hable. Ya sea que desees crear un sistema accesible, automatizar anuncios o simplemente divertirte, estas herramientas ofrecen algo para todos.

Te recomiendo comenzar con eSpeak o Flite por su simplicidad. Luego, explora otras opciones según tus necesidades. Además, puedes hacer que tu terminal sea más divertida utilizando otras herramientas o jugando con varios comandos divertidos.

Crédito de la imagen: Frederick Medina a través de Unsplash. Todas las alteraciones y capturas de pantalla por Haroon Javed.