Você agora pode usar o Gemini para transformar documentos em conversas de áudio envolventes

O Google tem trabalhado arduamente para melhorar seu modelo de IA Gemini. Para aprimorar ainda mais suas habilidades, o Google adicionou um novo recurso chamado Visão Geral de Áudio ao Gemini. Agora você pode usar Visões Gerais de Áudio para transformar documentos, slides e relatórios em discussões de áudio envolventes, no estilo de podcast, entre os dois anfitriões de IA.
Gere Visões Gerais de Áudio no Gemini
Para começar a gerar discussões de áudio no estilo de podcast, abra o site (ou aplicativo) do Gemini. Clique no ícone ‘+’ (localizado ao lado do botão Deep Research) e selecione Arquivos.
O Gemini suporta uma ampla variedade de tipos de arquivos, desde arquivos de documento como .DOC ou .PDF até formas de dados tabulares como .CSV. No entanto, você pode precisar considerar o Gemini Advanced para trabalhar com arquivos de código como .PHP ou .JAVA.

Depois que o arquivo for carregado e processado, o botão Gerar Visão Geral de Áudio aparecerá. Clique em Gerar Visão Geral de Áudio para iniciar o processo.

O Gemini começará a gerar uma Visão Geral de Áudio, o que pode levar alguns minutos para ser concluído, dependendo do comprimento do seu documento. Enquanto isso, você pode deixar a janela de chat ou sair do Gemini.
Quando a visão geral de áudio estiver pronta, você receberá uma notificação do site do Gemini no seu PC (se você tiver permitido notificações do site) e no seu celular.

Para tocar a visão geral de áudio, pressione o botão Play no player de mídia. O player de mídia da Visão Geral de Áudio permite que os usuários saltem entre os timestamps usando a barra de progresso, utilizem botões de 10 segundos para frente ou para trás e ajustem a velocidade do áudio.

No aplicativo Gemini, toque no botão Plus e selecione Arquivos. Escolha o arquivo que você gostaria de converter na conversa de áudio.

Após o arquivo ser carregado, clique no botão Gerar Visão Geral de Áudio que aparecerá.

Uma vez que a Visão Geral de Áudio for gerada, clique na saída gerada. O aplicativo Gemini redirecionará você para o seu navegador padrão e exibirá um Player de Áudio. Clique no botão Play para começar o áudio.

Até agora, você não pode tocar a Visão Geral de Áudio diretamente dentro do próprio aplicativo.
Compartilhando e Baixando Visões Gerais de Áudio
Agora que você transformou seu documento em um podcast, pode compartilhar esta Visão Geral de Áudio e até baixá-la para uso posterior. Clique no botão Menu de Transbordo (três pontos) e escolha Compartilhar Conversa.

No menu pop-up, copie o link compartilhável e distribua conforme desejado.

Caso você prefira ouvir offline, pode baixar essas conversas de áudio. Clique no botão Download no Menu de Transbordo e o download começará imediatamente.

O recurso de Visões Gerais de Áudio do Google Gemini pode ser muito útil, especialmente para aqueles que lidam com uma grande quantidade de informações. Embora o Gemini já tenha incluído alguns recursos para aumentar sua produtividade, você pode considerar usar as extensões do Gemini e aumentar suas capacidades.
imagem crédito: Unsplash. Todas as capturas de tela por Jay Kakade.