こんにちは、AIニュースアプリ Morning AI 開発者の矢野哲平です。この記事では、少し聞き慣れないかもしれない2つの言葉、「RAG(ラグ)」と「埋め込み(エンベディング)」について解説します。

どちらも仕組みの話に入ると難しく感じますが、ここでは細かい理屈よりも「これを使うと何ができるようになるのか」を中心に、できるだけやさしく整理していきます。RAGと埋め込みは、以前 生成AIによく登場するキーワード でも少し触れたテーマで、今回はそれを掘り下げる内容です。

この記事では、主に次の3つのポイントを解説します。

  1. そもそも今のAIは何が苦手なのか
  2. その解決策となる「RAG」と「埋め込み」とは何か
  3. 実際のビジネスでどう活用されているのか

今のAIは何が苦手なのか

ChatGPTやGemini、Claude。最近のAIは本当にすごくて、ビジネスでも歴史でも科学でも、たいていのことは答えてくれます。

ですが、こんな経験はないでしょうか。会社でAIに「うちの会社の経費精算のルールを教えて」と質問しても、まともな答えが返ってこない。これは当然で、AIはあなたの会社の経費精算のルールを学習していないからです。

今のAIは、世の中に広く出回っている一般的な知識を勉強して賢くなっています。逆に言うと、学習している範囲の外、たとえば社内規定や業務マニュアル、自社の商品データといった「その会社だけが持っている情報」には答えられません。

一言でたとえるなら、今のAIは**「世の中のことは何でも知っている物知りな人。でも、あなたの会社の中のことは何も知らない、入社したばかりの新人」**のような存在です。

では、この「知らないこと」をどうやってAIに答えさせればよいのか。ここで登場するのが、RAGと埋め込みです。

RAGとは?AIにカンニングペーパーを渡す

RAGは「ラグ」と読みます。一言で言うと、AIが回答する前に関連する資料を探してきて、その資料を見ながら答える仕組みです。

学生の頃のテストを思い出してみてください。普通のテストは、自分の頭の中にある知識だけで答えます。でも、もし「資料を持ち込んでもいい」テストだったらどうでしょうか。分からないことがあっても、手元の資料を見ながら回答できますよね。

RAGはちょうどこれと同じイメージです。AIが回答する前に参考資料を渡してあげて、AIはその資料をもとに回答する。いわば、AIにカンニングペーパーを渡してあげるようなものです。

先ほどの新入社員のたとえなら、こうなります。新入社員が「経費精算のルールが分かりません」と困っているところに、上司が「これがうちの経費精算のマニュアルだよ」と資料を手渡す。新入社員はその資料を読んで、ちゃんと答えられるようになります。

RAGがやっているのは、まさにこれです。AIが質問を受け取ったら、まず関連する社内の資料を探してくる。そしてその資料を読んだ上で回答する。だから、AIがもともと知らなかった社内のことでも、ちゃんと答えられるようになるのです。

埋め込みとは?意味の地図で資料を探す

ここで一つ疑問が浮かびます。RAGは「関連する資料を探してくる」と言いましたが、その"探す"はどうやっているのでしょうか。

そこで活躍するのが、もう一人の主役「埋め込み(エンベディング)」です。

埋め込みとは、文章や画像といった情報を、AIが扱える数値に変換することです。数値と言われてもピンと来ないと思うので、シンプルにこう覚えてください。埋め込みとは「意味が近いものほど、近くに置かれる仕組み」です。よく「意味の地図」とも例えられます。

体育館いっぱいに大きな地図を広げて、その上にいろんな言葉を書いたコーンを置いていくとイメージしてください。このとき、意味が似ているものは近くに、違うものは遠くに置かれます。たとえば「犬」と「猫」はどちらも動物でペットなので近くに、「犬」と「新幹線」は意味が全然違うので遠くに置かれます。

昔ながらの検索との違い

これがRAGの"探す"とどうつながるのか。ここが一番大事なところです。

昔ながらの検索は、言葉がぴったり一致しないと見つけられません。たとえば「犬」というキーワードで資料を探したとき、資料に「ワンちゃん」と書かれていたら、文字が違うのでヒットしません。人間からすれば同じ意味なのに、です。

ところが埋め込みを使うと、「犬」と「ワンちゃん」はほとんど同じ意味なので、地図の上では近くに置かれています。つまり、検索のキーワードがぴったり一致していなくても、意味が近いものをちゃんと見つけ出せるのです。これは「類似度検索」とも呼ばれます。

ビジネスの場面に置き換えると、さらに実用的です。社員がAIに「経費の精算ってどうやるんだっけ?」と聞いたとき、社内マニュアルには「立替金の申請手順」というタイトルで書かれていたとします。言葉はぴったり一致していませんが、「経費の精算」と「立替金の申請」は意味がとても近い。だから埋め込みのおかげで、AIは正しいマニュアルを見つけ出してくれるわけです。

整理すると、RAGは資料を探して見ながら答える仕組み、埋め込みは意味が近いものを探せるようにする「意味の地図」。この2つがセットになることで、AIが自分の会社のことにも答えられるようになります。

なお、埋め込みは画像や音声など文章以外にも使えます。マルチモーダルに対応したGemini Embedding 2のようなモデルも登場しており、扱える対象は広がっています。

RAGと埋め込みはどう使われているのか

ここからは、タイプの違う2つの使われ方を紹介します。

①社内で、社員が使うパターン

1つ目は、会社の中で社員が使うパターンです。社内向けのAIアシスタントを用意して、全社員が使えるようにする取り組みは、実際にどんどん増えています。

ただし、AIアシスタントを用意しても、AIは社内の情報を知らないという問題が出てきます。そこでRAGの出番です。自分たちの会社のデータをAIにつないでおけば、社員が「これってどうすればいいんだっけ?」と聞いたときに、社内の資料をもとにAIがパッと答えてくれます。社内のことなら何でも相談できるアシスタント、というイメージです。

この使い方は比較的導入しやすいのもポイントです。使うのが社内の人間なので、導入の初期段階で多少精度が低くても、社員からのフィードバックをもらって改善するサイクルを回しやすいからです。

②社外で、お客様が直接使うパターン

2つ目は、ガラッとタイプが変わって、社外のお客様が直接使うパターンです。分かりやすいのはカスタマーサポートで、お客様からの問い合わせにAIが応対します。最近では、電話での問い合わせにAIが音声で会話しながら応対する事例も出てきています(この仕組みについてはAIエージェントでコールセンターを自動化する方法で詳しく紹介しています)。

ここでもRAGが効いてきます。その会社がもともと持っている「よくあるご質問」やオンラインのヘルプ、マニュアルといった自社の資料をAIが参照し、それをもとにお客様に回答する。まさに「資料を見ながら答える」、RAGの考え方そのものです。

同じRAGという仕組みでも、社内向け・社外向けで、このように応用できます。ちなみに私自身も、AIエージェントがスライド用の画像を探しやすいように、埋め込みを使った画像検索の仕組みを作ったことがあります。「複数の男女が戦略立案をしている会議の画像」「人が写っていない会議室だけの画像」といった微妙な違いを、自然言語で検索できるようになりました。アイデア次第で、RAGや埋め込みはさまざまなタスクに応用できます(AIエージェントそのものについてはAIエージェントの活用事例も参考にしてみてください)。

どう始めればいいか

「では、RAGはどうやって実践するの?」という話になりますが、実は私たちはすでにRAGっぽいことを体験できる状態にあります。

たとえばChatGPTに資料のファイルを添付して、その内容について質問する。これも広い意味では「資料を渡して、それを見ながら答えてもらう」、RAGと同じ発想です。また、NotebookLMも、自分が入れた資料をもとにAIが答えてくれるツールで、RAG的な仕組みを取り入れた一例です(NotebookLMの活用アイデアも合わせてどうぞ)。

いきなり大がかりなシステムを作る必要はありません。まずは手元のChatGPTに資料を添付してみる、NotebookLMに気になる資料を入れて聞いてみる。そこから「資料を渡してAIに答えてもらう」という使い方の感覚をつかんでいくのがおすすめです。すると、「会社のこの業務に使えそうだな」というアイデアもどんどん湧いてきます。

ローカルLLMと組み合わせる

もう一歩進んだアプローチとして、ローカルLLM(手元のパソコンの中だけでAIを動かす仕組み)の環境でRAGを構築する方法もあります。

これを使えば、社内の文章を一切外に出すことなく、そしてAIに学習させることもなく、RAGの環境を構築できます。セキュリティが気になる情報を扱う場合に有力な選択肢です。なお、ローカル環境で使える埋め込みモデルとしては、Googleが提供するEmbeddingGemmaなどがあります。

RAGを実践するときのファイル管理のコツ

RAGを実際に運用していくと、AIに参照させる資料をどう管理するか、という点が気になってきます。ここで私のやり方を少し紹介します。

参照させる資料は、基本的にマークダウン形式で管理するのがおすすめです。シンプルで扱いやすく、人間にもAIにも読みやすいからです。一方で、先ほど触れた画像検索のように、情報を構造的にまとめたいケースではJSON形式を使うこともあります。どの形式が向いているかはプロジェクトによって変わるので、扱う情報に合わせて選ぶとよいでしょう。

また、資料が増えてきたら、1つの大きなファイルにまとめるのではなく、トピックごとにファイルを分けるのがおすすめです。これはとても理にかなっていて、AIに質問して答えさせる用途が増えてくるほど効いてきます。埋め込みを使えば、質問に関連する該当箇所だけを引っ張ってこられるので、ファイルが整理されているほど、必要な部分だけを渡せてコスト面でも有利になります。

まとめ

最後に、今回のポイントをまとめます。

  1. 今のAIは、物知りだけど自分の会社のことは知らない「新人」のような存在
  2. それを解決するのがRAGと埋め込み。関連する資料を探してきて、見ながら答える仕組み
  3. RAGは社内の問い合わせ対応でも、社外のカスタマー対応でも使える。アイデア次第で応用は広がる

RAGや埋め込みは、聞き慣れない言葉かもしれません。それでも、知識として頭の片隅に置いておくだけで、AI活用の選択肢はぐっと広がります。まずは手元のChatGPTやNotebookLMで「資料を渡して答えてもらう」感覚から、ぜひ試してみてください。