企業向け生成AIがつまずくのは、会話の上手さではなく「根拠の弱さ」だ
生成AIを企業で使おうとすると、多くの現場で最初にぶつかる壁は同じである。
文章は自然だ。受け答えも速い。だが、その答えが本当に自社文書に基づいているのか分からない。あるいは、社内規程や製品マニュアルのような“正確さが命”の情報になるほど、答えがあいまいになったり、もっともらしい誤答が混ざったりする。つまり、企業向けAIで本当に問題になるのは、流暢さではなく根拠の弱さだ。
その意味で、RAG型AIチャットボット「chai+」が取得した今回の特許は、かなり本質的なところを突いている。デフィデ株式会社は2026年4月28日、chai+において特許第7851525号「ユーザーの質問文に対して、文書を検索して回答するプログラム」を取得したと発表した。この特許の中核は、ベクトル検索、キーワード検索、意味的再ランキングを組み合わせた「3段階ハイブリッド検索エンジン」にある。会社側は、この構成によって従来型RAGで起きがちだった取りこぼしとハルシネーションを同時に抑える技術だと位置づけている。
従来型RAGの弱点は、「意味」と「言葉」のどちらかしか見ていないことだった
RAGは、検索拡張生成と呼ばれる通り、まず関連文書を探し、その文書を根拠として生成AIに回答させる仕組みである。
理屈の上ではかなり筋がいい。
学習済みモデルの曖昧な記憶に頼らず、自社文書やFAQ、規程集、マニュアルをその都度引いて答えられるからだ。 chai+自体も、社内外ナレッジから各社に特化した応答を作る法人向けRAGとして提供されている。
だが、RAGを入れればすべて解決するわけではない。今回の発表でも、従来型RAGの限界として三つが挙げられている。第一に、ベクトル検索だけでは専門用語や固有名詞を含む質問に弱いこと。第二に、キーワード検索だけでは言い回しが変わると関連文書を拾いにくいこと。第三に、こうした検索精度の不足が、最終的にハルシネーションの原因になることだ。つまり、RAGの問題は生成AIの文章力より前に、検索そのものの取りこぼしにあった。
ここが重要である。
企業が生成AIを「使えない」と感じるとき、原因はしばしばモデルの性能不足ではない。
本当は、答える前段階の検索で、必要な文書をうまく引けていないだけなのだ。
意味だけを見る検索、単語だけを見る検索、そのどちらか一方に偏ると、企業文書のようなクセの強い情報では精度が一気に崩れる。
chai+の特許が狙うのは、「検索の穴」を三段で埋めることだ
今回の特許でおもしろいのは、派手な新概念を持ち出しているわけではないことだ。
やっていることはむしろ極めて実務的である。
文書をページ単位などでチャンク化し、各チャンクに対して埋込ベクトルとトークン情報の二つを並列で持たせる。そして質問が来たら、まず意味的に近いものをベクトル検索で拾い、次にキーワード一致をキーワード検索で拾い、最後に両者を統合して意味的再ランキングで最終候補を絞る。発表では、この三段階を経たチャンクだけを根拠として回答を生成し、さらに元文書をユーザーに明示すると説明している。
要するに、この特許の価値は「ベクトル検索かキーワード検索か」という二択をやめたことにある。
意味が近いが用語が違うケースはベクトル検索で拾う。
専門用語や固有名詞の厳密一致はキーワード検索で拾う。
そのうえで、最後に“本当に質問意図に近いか”をもう一段意味的に並べ直す。
この設計は、検索エンジンとしてはとても地に足がついている。
これは「AIが賢くなった」のではなく、「探し方が賢くなった」話だ
生成AIのニュースは、ついモデルそのものの能力向上に話が寄りがちだ。
だが、企業の実務で効く改善は、案外こういう地味な部分から生まれる。
今回のchai+の特許も、本質的には「AIが急に天才になった」という話ではない。
正しい文書を引っ張ってくる確率を上げたという話だ。
この違いは大きい。
企業向けAIでは、自由な創作力よりも、決められた範囲で正確に答える能力のほうが価値を持つ。
人事規程、法務文書、製品仕様書、医療・金融・行政のような高精度領域では、とくにそうだ。実際、デフィデは別の発表でも、FAQ型チャットボット機能を「回答の一字一句」が求められる業界向けに展開している。つまりchai+全体としても、「何でも答えるAI」より「正しく答えるAI」へ軸足を置いていることがうかがえる。
だから今回の3段階ハイブリッド検索エンジンは、RAGの延長というより、
企業向けAIを“使える道具”に寄せるための再設計として見るべきだろう。
AIの会話力ではなく、検索の信頼性を先に立てている点に、かなり実務的な思想がある。
ハルシネーション対策の本丸は、生成の後処理ではなく「検索前提」にある
企業向け生成AIでは、ハルシネーション対策がしばしば後処理として語られる。
禁止ワードを置く、出力制約をかける、最終承認を人に戻す。
もちろんそれらも必要だ。
だが今回の発表が示しているのは、ハルシネーションの本丸は実はもっと手前、検索精度の不足にあるということだ。デフィデは、3段階検索を経て選ばれたチャンクのみを根拠に回答することで、AIが「知らないことを知っているように答える」リスクを構造的に抑制すると説明している。
この考え方はかなり重要である。
生成AIの誤答は、モデルが暴走しているから起きる場合もあるが、そもそも参照元がずれているから起きる場合も多い。
検索が弱いまま生成だけ賢くしても、結局はもっともらしい誤答を量産するだけになりかねない。
だからこそ、ハルシネーション対策を「生成制御」より先に「検索強化」として捉える発想には説得力がある。
特許取得の意味は、検索手法そのものより「品質の説明責任」にある
今回の特許取得が持つ意味は、技術的な独自性だけではない。
企業向けAI市場では、ベクトル検索もBM25も再ランキングも、それぞれ単独では珍しい要素ではない。
それでも特許として認められたことが重要なのは、デフィデがこの品質設計を自社の中核価値として明確に言語化したことにある。特許番号、発明名称、検索の三段構造、根拠文書の明示まで、一つの品質アーキテクチャとして説明できるようになった。
これは営業や導入提案の現場でも効く。
企業がRAG製品を選ぶとき、「うちもベクトル検索やってます」では差がつきにくい。
だが「専門用語の取りこぼしはここで拾い、言い換え対応はここで拾い、最後に意味で並べ直す」と説明できれば、導入側は品質の理由を理解しやすい。
つまり特許は、模倣防止だけでなく、品質の説明責任を果たすための言葉にもなっている。
RAGの次の競争は、「生成能力」ではなく「検索設計能力」になる
このニュースから見えてくるのは、RAG型AI市場の競争軸が変わりつつあることだ。
これまでは、生成AIをつないだだけで一定の新規性があった。
だが今後はそれでは足りない。
企業が本当に見たいのは、
どんな文書を対象にできるか、
専門用語にどれだけ強いか、
根拠をどこまで明示できるか、
誤答率をどれだけ下げられるか、
という検索設計と運用品質の部分になる。
chai+の今回の特許は、その流れをよく表している。
ベクトル検索だけでは足りない。
キーワード検索だけでも足りない。
両方をつなぎ、最後に意味的再ランキングでしめる。
派手ではないが、企業向けRAGとしてはかなり王道の答えに近い。
だからこそ、この特許は単なるお知らせ以上に、RAG市場の成熟を示すニュースだと感じる。