Knowledge熱狂化とは何か|AIに食わせるデータを書き換える
- Published
- Updated
- Reading
- 11 min
- Knowledge熱狂化
- AIに食わせるデータ
- Knowledge層
- 整っていない情報
- Crazy Intelligence
- Field Intelligence
- RAG
- ファインチューニング
- プライベートAI 違い
私はこの操作を、書籍のなかで Knowledge熱狂化(Knowledge Intensification)と呼ぶことにしました。AIに食わせるデータを書き換える、というだけの話に見えるかもしれません。しかし、ここに何を食わせるかが、その先にAIから返ってくる答えの輪郭を決めます。「AIは効率化から、収益の創造へ」というブランドメッセージの核心は、まさにこの食材選びの判断のなかに宿っています。
Knowledge熱狂化の定義
Knowledge熱狂化とは、AI Mutation を成立させる2つの経路のうち、Knowledge側、つまりAIが参照するデータの中身そのものを書き換えていく経路を指します。もう片方の経路である Instruction深化が「AIへの指示の質を理論化する」のに対し、Knowledge熱狂化は「AIに何を読ませるか」を経営判断として再設計する行為です。
書き換えの対象になるのは、AIが事前学習で取り込んだ汎用的なWebデータでも、整理された社内マニュアルでもありません。そこに、整っていない、感情の混じった、断片的な、それでも商売の温度を含んでいる情報を、意図的に混ぜ込む。そのデータの性格を私は「熱を帯びている」と表現しています。
ここで扱う「Knowledge」は、PI(Primal Intelligence)の Crazy Intelligence と Field Intelligence のうち、特に Field Intelligence 側との親和性が高い。現場の身体感覚と経験のなかにだけ宿る情報を、AIが参照可能な形に変換していく作業だからです(麻生要一『AI収益進化論』第6-3章)。
整った文書では、似た味の料理しかできない
ここで、ひとつの素朴な比喩を使います。同じ食材を使えば、誰が作っても料理は似た味になる。AIに与えるKnowledgeも、同じです。
世の中の多くの企業が、AIにどんなデータを食わせているか。事前学習済みの大規模言語モデルに、自社のマニュアル、製品仕様書、過去のFAQ、業務手順書、整理された顧客データを足す。これは正しい仕事です。問い合わせ対応は速くなり、新人教育は効率化され、文書検索は飛躍的に楽になる。
しかし、ここで立ち止まって考えてほしい。
その食材は、競合他社が手に入れている食材と、本質的にどれくらい違うでしょうか。マニュアルの体裁、FAQの整理粒度、業務手順書の書き方は、業界内でかなり似通っている。整った文書ほど、書き手の個性は削られ、業界標準に寄っていく性質がある。
整った食材だけで料理を作ると、同じような味になる。AIから返ってくる答えも、同じような輪郭を持つ。これが、効率化AIの世界で多くの企業が直面している景色だと、私は見ています。
新しい売上の作り方は、同じ食材から似た味の料理を作っているところには立ち上がらない。誰も使っていない食材を、自社の現場のなかから見つけ出して持ち込む。Knowledge熱狂化が問うているのは、その食材選びの判断です。
ここに混ぜ込む「熱狂」とは何か
では、何を混ぜ込むのか。書籍では具体的に5つの種類を挙げています。
- 営業担当者が客先で書きとめた、整っていない手書きの感触メモ
- 失敗したプロジェクトの、なぜダメだったかが本音で書かれている社内議事録
- 10年前にボツになった、当時は誰にも理解されなかった企画書
- 一部の熱狂的なお客様だけが、しかし熱量を持って繰り返し書いているレビューや問い合わせの言葉
- 長年の付き合いのある取引先が、ふとした瞬間に漏らす世間話のなかの一節
これらに共通するのは、整っていないこと、感情が混じっていること、断片的であること。整理されたデータベースには載らない。CRMにも入っていない。それでも、商売の温度が確かに刻まれている情報です。
なぜこの種類の情報が大事か。整った文書は、書かれる過程で「業界の常識」というフィルターを通ります。フィルターを通った情報は安全で扱いやすい一方、AIが学習しているWebデータに既に類似のものが大量に存在する。AIから返ってくる答えは、結局、業界の平均値の周辺に収束する。
熱を帯びた整っていない情報は、フィルターを通っていない。だからこそ、AIが事前学習で取り込んでいない確率が高く、そのまま自社固有の文脈になる。
学術的に何が支えているのか
Knowledge熱狂化の方向性は、いくつかの研究によって側面から支えられています。
代表的なのが、Microsoft Research の phi-1 研究です(Gunasekar et al., "Textbooks Are All You Need", arXiv:2306.11644, 2023)。13億パラメータという小型モデルを、教科書品質に絞った高品質な小規模データセットで学習させたところ、HumanEval pass@1 で 50.6% という、桁違いに大きいモデルに匹敵する性能を示した、という研究です。
この研究のメッセージは、Knowledge熱狂化の核心と重なります。データの量ではなく、データの密度と文脈の質が、AIから返ってくる答えの質を決める。
もう一つ、Microsoft Research の EmotionPrompt 研究は、感情的な刺激をプロンプトに加えることで LLM の性能が向上することを示しています(最大 115% の性能向上、Li et al., 2023)。こちらは Instruction深化の側に直接効く研究ですが、「整っていない、感情の混じった情報」が AI の出力に影響を与える、という構造は Knowledge熱狂化とも通底します。
ここで強調しておきたいのは、これらは支柱であって証明ではない、ということです。Knowledge熱狂化が必ず売上を生む、と学術的に証明されているわけではありません。いまの私の見立てとして、方向性が支持されている、という整理です。
プライベートAI / 社内RAG とは、何が違うのか
ここからが、本記事のいちばん大事な節です。
私が Knowledge熱狂化 という概念を社外で話すと、ほぼ確実にこう返されます。「それは、社内データを食わせるプライベートAI や社内RAG の話と、同じことなのではないか?」
技術的に重なる部分は確かにあります。社内のデータをAIに参照させる、という外形上の動作は同じです。しかし、目的とデータの性格と求める出力が違うので、別物として捉えるのが正確だ、というのが私の整理です。
3軸で並べてみます。
| 観点 | プライベートAI / 社内RAG | Knowledge熱狂化 |
|---|---|---|
| データの性格 | 整った社内文書(マニュアル、FAQ、業務手順書、製品仕様書、整理済み顧客データ) | 整っていない、感情の混じった、断片的な、現場の熱量を含む情報 |
| 目的 | 既存業務の効率化(問い合わせ対応自動化、ヘルプデスク省力化、新人教育効率化、文書検索高速化) | まだ存在しない売上の作り方の発見 |
| 求める出力 | 社内に存在する情報への正確なアクセス(既知の答えを高速取り出し) | 社内文書のどこにも書かれていない、まだ誰も気づいていない発想や仮説 |
ここに 効率化AIと収益進化AI の対比を重ねると、整理がさらに明確になります。プライベートAI / 社内RAG はほぼすべて効率化AI の側に属する。Knowledge熱狂化 は収益進化AI の側で起きる現象。同じ技術スタックの上に立っていても、設計思想の側で2つに分かれている、というのが私の見立てです。
ひとつ、補足が必要です。プライベートAIを構築する取り組みのなかで、結果的にAI Mutation的な現象が起きることはあり得る、と私は考えています。整った社内文書のなかにも、まれに熱を帯びたものが紛れ込んでいる場合がある。私が言いたいのは、その偶然を意図的に起こしに行こう、ということです(麻生要一『AI収益進化論』第6-6章)。
プライベートAI / 社内RAG はダメなものではありません。多くの企業が取り組むべき効率化AI の中核施策です。ただ、それを入れただけで AI Mutation が起きると期待してしまうと、段階3の徒労感に直接接続します。「コスト削減数字は出たが、売上が動かない」という景色は、ここから来ています。
技術手法には深入りしない、しかし「何を食わせるか」は経営判断
Knowledge熱狂化を実装する技術手法には、いくつかの選択肢があります。Retrieval-Augmented Generation(RAG)でベクトルDBから検索する形、ファインチューニングで重みそのものを書き換える形、長いコンテキストウィンドウに直接埋め込む形、それらの組み合わせ。
ここでは技術手法には深入りしません。理由は単純で、技術手法の選択は、何を食わせるかが決まったあとの工程だからです。
経営判断の本丸は、技術手法の側ではない。社内のどの情報が Crazy なのか、どの情報が Field なのか、どれを混ぜると変化が起きそうか、どの組み合わせは効果が薄そうか。この判断は、データサイエンティストにも、AIベンダーにも、外部コンサルタントにも、最後の最後では委ねられない。
なぜか。整っていない情報のなかから「これは熱を帯びている」と見抜く感覚は、自社の商売の温度を肌で知っている人間のなかにしか宿っていないからです。技術手法は、判断のあとを実装が引き受ける工程に過ぎません。
経営者が直接手を下す仕事
ここまで書いてきて、私が最後に強調したいのは、Knowledge熱狂化は経営者が直接手を下す仕事だ、ということです。
書籍の第6-7章で、私はこう整理しました。AI Mutation の核心は、経営者自身が現場に降りて、Crazy と Field を選び取り、AI に注ぎ込む作業である。なぜなら、何が金脈候補で何がノイズかを判別するのは、経営者のセンスでしかないからです。
これを部下に丸投げしたとき、何が起きるか。部下は安全側に倒します。整った情報、業界標準に近い情報、「これを上司に見せても叱られない」情報を選んで持ち込む。結果、AIに食わされるのは、フィルターを通った似た味の食材ばかりになる。
経営者本人が現場に降り、整っていない情報のなかに手を突っ込み、「これかもしれない」と感じた断片を選び取る。この身体的な作業が、Knowledge熱狂化 の出発点です。
実装の入口として、私が現時点で見ている順路は、以下のような形です。
- 自社の整った社内文書のなかから、特に整理されている領域を1つ選ぶ
- その領域の周辺で、整理されずに散在している「熱を帯びた」情報を3〜5種類拾い上げる
- AIに、整った情報と熱を帯びた情報の両方を読ませた上で、業務上の問いをぶつける
- 返ってくる答えが、整った情報だけを読ませたときと比べてどう違うかを観察する
- 違いが立ち上がった食材を中心に、Knowledge層を組み直す
この一連を、PI Injection のサイクルのなかで何度も回す。半年、1年と続けると、自社のAIは、競合のAIとは別の存在に育っていく。これが、いまの私の整理です。
そして、ここで起きていることは、効率化AI の延長ではない。効率化AI の世界では、整った食材を使って似た味の料理を効率よく作る。Knowledge熱狂化 は、まったく別の食材を持ち込んで、まだ誰も作ったことのない料理を生み出そうとする経営行為です。「AIは効率化から、収益の創造へ」というブランドメッセージは、この食材選びの判断のなかで、はじめて経営の現実になります。
よくある質問
Q1. うちはすでにプライベートAI / 社内RAG を導入済みです。Knowledge熱狂化もできていることになりますか?
別物です。プライベートAI / 社内RAG が食わせているのは、ほぼ整った社内文書である場合が多く、目的は既存業務の効率化に置かれています。これは効率化AIの中核施策であり、必要な仕事です。Knowledge熱狂化 は、そこに整っていない感情の混じった情報を意図的に混ぜ込み、まだ存在しない売上の作り方を発見しに行く別の経路です。同じ技術スタックの上に両方を載せることは可能ですが、設計思想の側で分けて考えてください。
Q2. 整っていない情報を AI に食わせて大丈夫ですか?
ここで「大丈夫か」が指しているのが、情報セキュリティとコンプライアンスの話であれば、大事な問いです。整っていない情報には、個人情報、未公開の事業情報、取引先との機密性の高いやりとりが含まれることがある。攻めの層と奥の守りの層を分け、適切に匿名化と権限制御を経た上で扱う必要があります。一方、「整っていない情報を食わせるとAIの精度が落ちるのでは」という懸念であれば、phi-1 研究が示すように、データの量ではなく密度と文脈の質が AI 出力を決めます。整っているかどうかと、文脈が濃いかどうかは別軸の話です。
Q3. Knowledge熱狂化は何から始めればよいですか?
最初の一歩は、自社のなかで「整理されていないが、商売の温度が高い情報」が眠っている場所を1つだけ特定することです。営業の手書きメモ、失敗プロジェクトの議事録、熱狂的な顧客の問い合わせログ、いずれでも構いません。次に、経営者本人がそこに目を通す時間を確保する。データサイエンティストや AI ベンダーに渡す前に、自分の感覚で「これは熱がある」と感じる断片を3〜5個選び取る。ここまでが経営者の仕事です。実装はそのあとに考えればよい、というのが現時点の私の整理です。
Q4. データサイエンティストや AI ベンダーに任せられますか?
実装工程は任せられます。ベクトルDBの構築、ファインチューニングの実行、評価指標の設計などは専門家の領分です。任せられないのは、「どの情報を食わせるか」の判断です。何が Crazy で、何が Field で、どれを混ぜると自社の商売が動くかを判別できるのは、自社の現場の温度を肌で知っている経営者と事業責任者だけです。判断と実装は別の工程として切り分けてください。
Q5. Instruction深化との違いは?
両方とも AI Mutation を起こす経路ですが、操作する場所が違います。Knowledge熱狂化 は AI に食わせるデータの側、Instruction深化 は AI への指示の側を書き換えます。食材を変えるのが Knowledge熱狂化、料理人への指示書を書き換えるのが Instruction深化、という比喩がわかりやすいかもしれません。実際の実装では、両方を同時に動かすことが多くなります。詳細は Instruction深化 を参照してください。
関連概念
Knowledge熱狂化 は、AX for Revenue の体系のなかで以下の概念と直接接続します。記事を書いている時点で公開済みのものから順に挙げます。
- AI Mutation ── Knowledge熱狂化 が起こす現象の全体像
- PI(Primal Intelligence) ── 食材の源泉
- Crazy Intelligence ── 食材の片側
- Field Intelligence ── 食材のもう片側
- Instruction深化 ── AI Mutation を起こすもう一つの経路
- PI Injection ── Knowledge熱狂化 を含む実装サイクル
書籍『AI収益進化論』では、Knowledge熱狂化 の整理を第6章全体を通して行っています。本記事で触れきれなかった論点は、本書 第6章を参照してください。
出典
- Microsoft Research / CAS (Chinese Academy of Sciences) / William and Mary「Large Language Models Understand and Can be Enhanced by Emotional Stimuli」(2023)https://arxiv.org/abs/2307.11760
- Microsoft Research「Textbooks Are All You Need」(2023)https://arxiv.org/abs/2306.11644
関連記事
- DEFINITION
HITL(Human-in-the-loop)とは何か|AI を人間が回し続ける設計原理
HITL(Human-in-the-loop)とは、AIを人間が回し続ける設計原理である。設計・運用・例外処理・責任の4層に必ず人間を組み込み、AIの自律性を成立させる。AIで売上を創るための前提条件を解説する。
- DEFINITION
Revenue ROIとは何か|効率化のROIでは測れない投資の物差し
Revenue ROIとは、まだ存在しない売上を創造する投資を測るための物差しです。効率化のROIでは答えられないAI投資の経営判断について、書籍『AI収益進化論』の整理を踏まえ、計算式を意図的に提示しない理由とともに論じます。
- DEFINITION
Field Sensor とは何か|PI Injection を継続させる運用ツール
Field Sensor とは、PI Injection を継続的に回すために現場の Field Intelligence を枯らさず経営者の手元に届ける運用ツール。AX for Revenue Loop の Step ではなく、収益進化AIシステムを支える仕組みとしての位置付けと具体例を整理する。