「社内のマニュアル、誰も読んでくれない…」
「同じような質問に何度も答えるチャット対応を自動化したい…」
その悩み、Difyの「ナレッジベース(Knowledge Base)」機能を使えば、最短10分で解決できます。
プログラミングは一切不要。手元にあるPDFやWordファイルをドラッグ&ドロップするだけで、その内容を熟知した「社内専用のAIアドバイザー」が完成します。
本記事では、初心者でも迷わないDifyでのナレッジベース構築手順と、回答精度を劇的に高める「データ加工のコツ」までを徹底解説します。
【仕組み】なぜAIが「社内のこと」を答えられるのか?(RAG)
通常、ChatGPTなどのAIは社内の就業規則や製品仕様を知りません。
そこで使うのが「RAG(検索拡張生成)」という技術です。
イメージとしては、「AIに教科書(マニュアル)を持たせて、カンニングしながら答えさせる」仕組みです。
- ユーザー: 「交通費の申請方法は?」
- Dify (検索): 渡されたマニュアルの15ページ目にある「交通費規定」を探し出す。
- Dify (生成): その内容を要約して、「申請には領収書が必要です」と回答する。
この「検索」の部分を担うのがナレッジベースです。
[Image of diagram illustrating RAG retrieval augmented generation process]
【実践】社内ナレッジBot作成の3ステップ
Step 1: ナレッジを作成してファイルをアップロード
- Difyのトップ画面上部のメニューから [ナレッジ (Knowledge)] を選択します。
- [ナレッジを作成] ボタンをクリックします。
- [テキストファイルからインポート] を選び、読み込ませたいファイル(PDF, Word, Markdown, Excelなど)をアップロードします。
※NotionやWebサイトのURLを同期させることも可能です。
Step 2: データの「分割(Chunking)」設定
ここが最も重要です。AIは長い文章を一気に読むのが苦手なため、データを適切なサイズに「切り分け」ます。
- 自動設定(Automatic): 初心者はこれでOK。Difyがいい感じに分割してくれます。
- カスタム(Custom): 精度にこだわるならこちら。
- セグメント設定: 親子チャンク(Parent-Child)などが選べますが、基本はデフォルトでOK。
- インデックスモード: 「高品質(High Quality)」を推奨します。埋め込みモデル(Embedding Model)を使って、意味に基づいた賢い検索を行います。
設定したら [保存して処理] をクリック。データの解析(ベクトル化)が始まります。
Step 3: チャットボットアプリと紐付ける
ナレッジの準備ができたら、それを使うボットを作ります。
- メニューの [スタジオ (Studio)] から [アプリを作成] → [チャットボット] を選択。
- 設定画面左側の [コンテキスト (Context)] という項目の [追加] ボタンを押します。
- 先ほど作ったナレッジベースを選択して追加します。
これで連携完了です!右側のプレビュー画面で「交通費について教えて」と聞いてみてください。アップロードした資料に基づいた回答が返ってくるはずです。
【上級編】回答精度を「爆上げ」する3つのテクニック
「なんかトンチンカンな答えが返ってくる…」という場合、原因の9割はデータの質にあります。
1. 「Q&A形式」に加工してから食わせる
AIにとって最も理解しやすいのは、マニュアルそのものではなく「質問と回答のセット」です。
- 悪い例: 長文の就業規則PDFをそのまま入れる。
- 良い例: 「Q: 交通費の上限は? A: 月額3万円です。」というExcelやCSVリストを作って入れる。
これだけで検索ヒット率が格段に向上します。
2. 「ハイブリッド検索」を有効にする
ナレッジの設定で、検索設定(Retrieval Setting)を調整できます。
- ベクトル検索: 「意味」で探す(例:「PC」で検索して「パソコン」もヒットする)。
- キーワード検索: 「文字」で探す(型番や社員番号などの完全一致に強い)。
この2つを組み合わせた「ハイブリッド検索(Hybrid Search)」にし、さらにRerank(再ランク付け)モデルを有効にすると、最強の検索精度になります。
3. 「引用元」を表示させる
アプリの機能設定(Features)で [引用と帰属 (Citation)] をONにしましょう。
回答の下に「どのファイルのどこを見て答えたか」が表示されるため、嘘(ハルシネーション)をつかれてもすぐに確認でき、業務での信頼性が上がります。
よくある質問 (Q&A)
Q: 無料版(Sandbox)でもできますか?
はい、お試し程度なら可能です。ただし、アップロードできるデータ量(ベクトルストレージ容量)に厳しい制限があります。本格的に社内運用するなら、有料プランか、制限のないローカル構築(Self-hosted)がおすすめです。
Q: データの内容を更新したらどうなりますか?
ナレッジの設定画面から、ドキュメントリストを開き、[更新] ボタンから新しいファイルを上げ直すか、テキストを直接編集して [再処理] する必要があります。自動では反映されません。
まとめ
Difyのナレッジベース機能は、まさに「自社専用のChatGPT」を作るための最短ルートです。
- 資料を集める
- Difyに放り込む(高品質モード推奨)
- ボットと紐付ける
まずは手元にあるPDFを1つアップロードして、AIがその内容をペラペラと語り出す感動を体験してみてください。


コメント