こんにちは、AIニュースアプリ Morning AI 開発者の矢野哲平です。この記事では、Googleの情報管理ツール「NotebookLM」と、最近話題になっている音声概要機能について触れます。

音声概要は、簡単に言うと、自分がアップロードしたソースからポッドキャスト風の音声を作れる機能です。論文をアップロードすればその論文に基づいたポッドキャストを、YouTube動画をアップロードすればその内容に基づいたポッドキャストを作成できます。つまり、自分専用のポッドキャストを作れるわけです。

この機能はけっこう前から実装されていましたが、これまで英語版のみの対応でした。それが先日、日本語版にも対応しました。普段から耳で情報をインプットしている人には、特に面白い機能だと思います。

この記事で解説するポイントは主に次の3つです。

  1. NotebookLM周辺の最新ニュース
  2. どのような音声が作れるか
  3. 音声概要機能のユースケース

NotebookLMとは?

まずNotebookLMについて軽く説明します。NotebookLMは、Googleが開発しているAI搭載の情報管理ツールです。

PDFやYouTubeなどのソースをアップロードでき、その内容を要約したり、ソースに基づいて質問したりできます。内部ではGeminiのモデルが使われていて、性能もシンプルに高いです。

世の中にはChatGPTやGeminiなど、いろいろな生成AIツールがあります。それらを1番手のツールだとすると、NotebookLMは2番手くらいにおすすめしたいツールです。

実際、企業の導入も進んでいます。たとえばワークマンも、NotebookLMやGeminiの活用に期待を寄せていることを公表しています。Google Cloudのインタビュー記事から引用します。

特に NotebookLM は、ドキュメントの読み込みと対話を通じて、情報整理や組織内のナレッジ共有を効率化するポテンシャルがあると考えられています。例えば経営企画部では、会議の音声データを取り込み、NotebookLM で議事録の自動作成や必要な情報の発掘ができないか、倉庫部門では、業務マニュアルや関連資料を NotebookLM にインプットし、新人スタッフ、パートスタッフが業務中に不明な点を自己解決できる環境を構築しています。

このように、業務効率化の面でもおすすめのツールです。NotebookLMの具体的な活用アイデアはNotebookLMの活用アイデア6選でも詳しく紹介しています。

NotebookLMの2つのニュース

前置きが長くなりましたが、直近でNotebookLMには2つのニュースがあります。1つはアプリ版の公開、もう1つが今回深掘りする音声概要機能の日本語対応です。

アプリ版の公開

もともとNotebookLMはWeb版のみの提供で、スマホから使うにもWebページにアクセスする必要がありました。これが、5月20日あたりにアプリが公開される予定です。iOSとAndroidの両方ですね。私はNotebookLMを外で使うことが多いので、モバイルアプリが出るのは楽しみです。

音声概要機能の日本語対応

そして本題が、音声概要機能の日本語対応です。もともと英語版は導入されていましたが、いよいよ日本語にも対応してきました。

自分がアップロードしたソースから、ポッドキャスト風の音声を作成できる機能です。実際に生成された音源を聞くと、「えーと」のような間も含めて、人間が会話しているような自然さがあります。

しかも、音源を作るのは非常に簡単です。ソースをアップロードして生成ボタンを押すだけ。これだけでポッドキャスト風の音声ができあがります。

音声概要のユースケース

使い方次第で、いろいろなことができます。特に、日頃からポッドキャストのように耳で情報をインプットする人に向いていると思います。

たとえば、論文をアップロードして、その論文に基づくポッドキャストを作って理解を深める。私自身は、海外のYouTube動画をアップロードして音声化し、情報のキャッチアップに使っています。ほかにも、出かける前に複数のニュースを渡しておいて、自分だけのニュースポッドキャストを作る、といった使い方もできます。

細かいプロンプトを書かなくても、AIがソースをいろいろな視点から会話してくれるのが便利な点です。

現状の課題

便利な一方で、現時点では手間もかかります。具体的には次の3ステップが必要です。

  1. ソースをアップロードする
  2. 音声化する
  3. ダウンロードする

一つひとつの作業は簡単ですが、ポッドキャストのような利便性には届きません。ポッドキャストは番組登録しておけば、新しいエピソードが自動で通知されますよね。この「自動的にプッシュされる仕組み」がないのが、現時点でのネックです。

作った音源を何で再生するか、という問題もあります。アプリ版がリリースされて、ポッドキャストのような再生プレイヤーが内蔵されれば、劇的に使いやすくなりそうです。

ポッドキャスターから見た音声概要

私自身ポッドキャストを配信しているので、この機能の登場が配信者にどう影響するかも少し考えてみます。

正直、初めて音源を聞いたときは「予想以上に精度が高いな」と思いました。Googleは他言語への展開があまり早くない印象だったので、日本語対応はまだ先か、なんなら英語版のまま実装されない可能性もあると思っていました。それが先週いきなり実装されてきて、少し驚きました。

いよいよAI音声の真打が登場してきた、という印象です。すべての番組がAI音声に変わることはないと思いますが、今後はAI音声を使った番組が増えていくと予想します。特にニュース系、英語系、そしてうちのようなナレッジ系の番組は、領域として重なってきそうです。

実は私も過去にAIポッドキャスト番組を作ったことがあります。英語系の番組でしたが、結果としてはあまり跳ねず、エンゲージメントは低めでした。他のAIポッドキャスト番組を見てもランキングが落ちていく傾向があり、AIで簡単に作れる一方で、リスナーがそこまで求めていない側面もあるのかな、という印象です。

自分専用の音声教材として

AIポッドキャストが人間のポッドキャストのシェアを奪うかどうかはいったん置いておくとして、自分のソースから簡単にポッドキャストを作れること自体は、面白い体験だと思います。

個人が、自分がインプットしたい情報を音源化して、自分だけで楽しむ。たとえば勉強のときにノートを作るのと同じ感覚で、自分専用のポッドキャストを作って学習する、というイメージです。英語の学習動画からポッドキャストを作って、自分専用のオーディオ教材にする、といった使い方もできます。

音声概要が広く認知され、多くの人が使うようになれば、耳で情報をインプットする習慣が根付くかもしれません。結果として、ポッドキャスト人口が増えていく可能性もあります。日本のポッドキャスト利用者は年々増えていて、2024年時点で約1680万人。日本の人口が約1億2000万人なので、まだまだ伸びしろがあります。

作業自体は簡単なので、興味のある方はぜひ試してみてください。

まとめ

最後に、今回のポイントをまとめます。

  1. NotebookLMに2つのニュースがあった。アプリ版の公開予定と、音声概要機能の日本語対応
  2. 音声概要機能では、アップロードしたソースに基づいてポッドキャスト風の音源を作成できる
  3. 音声概要機能を抜きにしても便利なツールなので、興味のある方はぜひ一度触ってみてほしい

耳が空いている時間は、意外と多いものです。NotebookLMの音声概要を使えば、その時間を自分専用のインプットに変えられます。