文書を魅力的な音声対話に変換するために、Geminiを利用できるようになりました

Googleは、Gemini AIモデルの改善に取り組んできました。さらなる機能向上のために、GoogleはGeminiに「Audio Overview」と呼ばれる新機能を追加しました。これにより、文書、スライド、レポートを2人のAIホストによる魅力的なポッドキャストスタイルの音声対話に変換することができます。
Geminiで音声概要を生成する
ポッドキャストスタイルの音声対話を生成するには、Geminiのウェブサイト(またはアプリ)を開きます。「+」アイコン(Deep Researchボタンの隣にあります)をクリックして、Filesを選択します。
Geminiは、.DOCや.PDFのような文書ファイルから、.CSVのような表形式データまで、幅広いファイルタイプをサポートしています。ただし、.PHPや.JAVAのようなコードファイルを扱うには、Gemini Advancedが必要になる場合があります。

ファイルがアップロードされ、処理が完了すると、「Generate Audio Overview」ボタンが表示されます。Generate Audio Overviewをクリックしてプロセスを開始します。

Geminiは音声概要の生成を開始します。これは文書の長さによって数分かかることがあります。その間、チャットウィンドウを閉じることも、Geminiを終了することもできます。
音声概要が準備できると、PCのGeminiウェブサイト(ウェブサイト通知を許可している場合)や携帯電話に通知が届きます。

音声概要を再生するには、メディアプレーヤーの再生ボタンを押します。音声概要のメディアプレーヤーでは、進捗バーを使ってタイムスタンプ間をジャンプしたり、10秒進んだり戻ったりするボタンを使用したり、音声の速度を調整したりできます。

Geminiアプリでは、プラスボタンをタップし、Filesを選択します。音声対話に変換したいファイルを選びます。

ファイルがアップロードされたら、表示されるGenerate Audio Overviewボタンをクリックします。

音声概要が生成されたら、生成された出力をクリックします。Geminiアプリはデフォルトのブラウザにリダイレクトし、オーディオプレーヤーを表示します。再生ボタンをクリックして音声を開始します。

現在のところ、アプリ内で直接音声概要を再生することはできません。
音声概要の共有とダウンロード
文書をポッドキャストに変換したので、今度はこの音声概要を共有したり、後で使用するためにダウンロードしたりできます。オーバーフローメニュー(三点リーダーのボタン)をクリックし、Share Conversationを選択します。

ポップアップメニューから、共有可能なリンクをコピーして、必要に応じて配布します。

オフラインで聞きたい場合は、この音声対話をダウンロードできます。オーバーフローメニューからDownloadボタンをクリックすると、すぐにダウンロードが開始されます。

Google Geminiの音声概要機能は、大量の情報を扱う人々にとって非常に便利かもしれません。Geminiは既に生産性を向上させるいくつかの機能を含んでいますが、Geminiの拡張機能を使用してその能力を高めることを検討しても良いでしょう。
画像クレジット:Unsplash。すべてのスクリーンショットはJay Kakadeによるものです。