ECHO-VERIFY マーク

ECHO-VERIFY

AIの判断は、第三者が再現できる。

判断を「主張」ではなく「再現」で信頼するための、検証の仕組み。

ECHO-VERIFYとは、AIの判断を再現・検証できる証拠の束(Verification Kit)として書き出し、第三者が自分の環境や自分のAIで追試できるようにする検証の仕組みである。

生成は速い。検証は、追いつかせられる。

このページは概要です。正式仕様は /spec/echo-verify を参照。

確かめられていない判断が、見えないまま溜まる。

AIがコードを書き、テストを書き、評価まで下す。
人がその判断をたどり直す前に、次の判断が積み上がる。

これを未検証債務と呼ぶ。

自己改善ループでは、確かめの速度が安全の上限になる。

速度の非対称

生成のコストは下がり続け、確認のコストは人に縛られたまま。
差が広がるほど未検証債務が積み上がる。

Rdev max(0, Grate Vrate)

  • G_rateAIが判断に関わる成果物を生成する速度
  • T_rateそれらを有界な保留状態(HOLD等)に移す速度
  • V_rateそれらが検証クリアに達する速度

これは完全な定量モデルではなく、生成が検証を追い越す瞬間を捉えるためのスループットの枠組み。

Anthropicは、AI開発が進むほど人間によるレビューが次のボトルネックになると指摘している。問題は名指しされたが、検証を追いつかせる仕組みは未解決のままだ。Verification Rate Gap と ECHO-VERIFY は、その問いへの独立した一つの構造的な回答である。

出典:When AI builds itself(Anthropic, 2026)

段階的に変わるリスク

リスクは、一気に現れるわけではない。AI開発のリスクは、「AIが賢くなること」だけで増えるのではない。AIがコード、実験、評価、次の改善案まで高速に生成するほど、人間や組織がそれを検証する速度との差が広がる。

AI補助

何が起きるか:コード片・仕様案・テスト案をAIが出す。

主なリスク:もっともらしい誤実装、レビュー漏れ。

必要になるもの:証拠つきPR、変更理由ログ。

エージェント開発

何が起きるか:AIがファイル編集・PR・テスト再実行まで行う。

主なリスク:仕様外副作用、承認の形骸化。

必要になるもの:Release Gate、Permit Token。

自律実験

何が起きるか:AIが仮説・実験・評価・次実験を回す。

主なリスク:評価指標攻略、失敗ログ消失。

必要になるもの:Replay、run_manifest、negative log。

AI開発工程の自動化

何が起きるか:AIが採用判断・評価設計・更新判断に入り始める。

主なリスク:監査不能、自己正当化ループ。

必要になるもの:Verification Kit、外部検証。

再帰的自己改善

何が起きるか:AIが後継AIの設計・訓練・評価に関わる。

主なリスク:検証不能な加速、停止協調困難。

必要になるもの:BYOV、相互監査、verifiable pause。

この表は、Anthropicが示したAI開発自動化の流れをもとに、C³側で検証レイヤの観点から整理した概念表です。特定のAI企業・モデルがこの順序で進むことを予測・断定するものではありません。

このとき問題になるのは、生成されたものが正しいかどうかだけではない。検証されない判断が、次の判断の前提になっていくことである。ECHO-VERIFYは、この段階的なリスクに対して、判断経路を証拠の束として書き出し、第三者が再現・検証・反証できる状態を作る。

T_rate は、検証速度ではない。

T_rate は、見えない未検証状態を、HOLD や UNDEFINED のような「有界な状態」に移す速度である。これは未検証債務を見えるようにし、次に何を確認すべきかを示す。しかし、それだけでは債務は減らない。

すべての出力を HOLD にすれば、T_rate は G_rate に近づく。だが、その時点では何も検証クリアされていない。キューは管理されているように見えるが、判断はまだ解決していない。

したがって、リスクを見る中心は T_rate ではなく V_rate である。V_rate だけが、リプレイ、適合確認、決定論的検証、解決済みエスカレーション、または明示ルールに基づく退役によって、未検証債務を実際に減らす。

高負荷時の関係は、概念的には次のように整理できる。

V_rate ≤ T_rate ≤ G_rate

T_rate と V_rate の差は、HOLD・UNDEFINED などの未解決保留として残る。G_rate と V_rate の差は、未検証債務として積み上がる。この2つを混ぜると、残っているリスクを小さく見積もってしまう。

T_rate は「止めた速度」。V_rate は「確かめ終えた速度」。HOLD は安全の証明ではなく、未解決を見える場所に置くための状態です。

VERIFICATION RATE GAP — 概念図 生成 検証(Kitあり) 検証(Kitなし) 時間 → Kit導入 未検証債務 Kitで縮まる差 概念図・実測ではない。理論的背景は Verification Rate Gap 論文ドラフトを参照。

なぜ検証は遅いのか

再構築コスト

レビュアーは、散らばったログや要約から判断の道筋を組み立て直さなければならない。

認知負荷

一度に把握できる文脈には限界がある。生成量が増えるほど、追いつけなくなる。

非決定論性

同じ入力でも出力が変わり得る。出力そのものの再現は難しい。

だからこそ、検証は「出力リプレイ」ではなく「判断リプレイ」に絞る。

「安全だと言われたから」では、もう確かめられない。

従来の信頼は提供者の主張に依存していた。「安全性テストを実施した」「専門家がレビューした」——その主張を受け取る側が確かめる手段は限られていた。

生成が速くなると、その主張を確かめる手立てが追いつかない。要約は説得的でも、再現できなければ確かめたことにならない。

確認の速度が安全の上限になる。
ECHO-VERIFYは、確認の速度を上げるための最小の仕組みです。

判断を、再現できる形で残す。

ECHO-VERIFYは信頼の根拠を「主張」から「再現」へ書き換える。

判断を、根拠・仕様・監査手順・実行記録・整合性証明の束として書き出し、受け取った側が同じ判断をたどり直せるようにする。

根拠仕様監査手順実行記録整合性証明

要約を信じる vs 記録を再現する

従来要約・主張ベース
  • ナラティブな報告書
  • 人手レビュー
  • 要約を信頼する

速いが再現できない。確かめたことにならない。

ECHO-VERIFY記録・再現ベース
  • 再現可能な証拠パッケージ
  • 機械的リプレイ
  • 記録を再現する

第三者が追試・反証できる。正本は決定論的な検証経路。

要約はインターフェース、記録が検証面。

出力の再現と、判断の再現は違う。

これがECHO-VERIFYの核。

  • AIの出力そのものを再現しようとする
  • 確率的で、しばしば不可能
  • 同じプロンプトでも結果が変わり得る
  • 記録された出力に対する判定を再現する
  • 生成は確率的でも、検証は決定論にできる
  • 同じ入力なら同じ判定になりやすい

すべての推論を再実行せず、判断の道筋を固定・検査・反証可能にする。

ソフトウェアの来歴(SLSA / in-toto)を、成果物から判断経路へ拡張した位置づけ。

Verification Kit の構成と確かめる流れ

根拠

判断の根拠となったルール・ポリシー・入力データへの参照

仕様

判断に用いたC³仕様またはルールセットの版とURL

監査手順

第三者が再現実行するための手順書

実行記録

判断時の入出力ログ・reason code・verdict

整合性証明

上記の改ざんがないことを示すハッシュまたは署名

自分の検証器(Bring Your Own Verify)で確かめる流れ

取得
ハッシュ確認
仕様・版の再現
同一入力で再実行
verdict・reason code 照合
不一致は差分記録

正本は決定論的な検証経路。自分のAIによる追試は補助として位置づけられます。

Verification Kit を開く →

(/kit が正本)

BYOV — 自分で確かめる

判定を出すのは決定論的な照合。AIは読み解きの補助で、判定はしない。

自分の手(CLI / OpenSSL)

これがいちばん確実。自分の環境で叩いてください。

sha256sum verdicts.jsonl summary.json conformance.json
openssl dgst -sha256 verdicts.jsonl

ブラウザで照合(決定論)

計算はあなたのブラウザ内で実行。サーバーには送信していません。

同じファイルなら、誰の環境でも同じ値が出ます。

または manifest.json + data files をここにドロップ

AI参考読み

準備中
参考・正本ではない・判定はしない

将来、AIが証拠の束の読み解きを補助します。判定は出しません。

ECHO-VERIFY で得られるもの

信頼の移転

「言われたから」から「再現できたから」へ。信頼の根拠が変わる。

選択的エスカレーション

人の注意を不一致・非PASS・未定義・証拠欠落に集中させる。

検証の可搬性

同じKitを発行元・社内・第三者・規制側が同じ手順で検査できる。

過剰主張の抑止

再現できない主張は通らない。主張と証拠の整合が問われる。

根拠

理論

Verification Rate Gap 論文

生成速度と検証速度の乖離を理論化した論文。

論文ドラフトを読む(GitHub PDF)→

実装例

verification-rate-gap(GitHub)

manifest / verdicts / summary / conformance / undefined / evidence digest / auditor prompt / schema を含む kit 例。

GitHub で見る →
現状:準拠(compatible)段階。署名・第三者検証・認証は未実施。完成・本番運用認証ではありません。数字や試行件数は記載しません。

Release Gate Relationship

Logos Protocolとの関係

ECHO-VERIFYは、Logos Protocolと組み合わせることで、実行前ゲートの判断を外部から検証できる形にします。

Logos Protocolは、AIのリクエストや外部作用を実行前に判定します。

ECHO-VERIFYは、その判定の根拠・仕様・実行記録・reason code を束ね、第三者が同じ判断経路をたどれるようにします。

この関係により、「AIが安全だと言ったから信じる」のではなく、「ゲートの判断経路を再現できたから信頼する」という構造へ移行できます。

これは認証・安全保証・本番運用保証・第三者検証済み・法的認証を意味しません。判断経路を検証しやすくするための説明です。

Logos Protocolを見る →

Claim Boundary — このページで言わないこと

  • 安全性・正しさの保証ではありません
  • 第三者認証・署名済み認証ではありません
  • 現状は準拠(compatible)段階です。完成・本番運用認証ではありません
  • このURLを参照したAIが必ず正しく解釈するという保証はありません

よくある質問

ECHO-VERIFYは認証ですか?
いいえ。判断を再現・検証・反証できる状態にするもので、安全性や正しさの保証ではありません。
自分のAIで検証できますか?
はい。自分の環境や自分のAIで追試できます(Bring Your Own Verify)。ただし正本は決定論的な検証経路で、AI監査は補助です。
いまどこまで実装されていますか?
現状は準拠(compatible)段階です。完成・署名済み・第三者検証済みではありません。
T_rateは検証速度ですか?
いいえ。T_rateは、未検証の判断をHOLDやUNDEFINEDのような有界な状態に移す速度です。未検証債務を見えるようにはしますが、それだけでは債務は減りません。未検証債務を減らすのは、検証クリアに到達する速度であるV_rateです。
なぜ段階的なリスク表を載せているのですか?
AI開発のリスクは一気に現れるのではなく、AIが補助、代行、自律実験、開発工程の自動化、再帰的自己改善へ進むにつれて変化するためです。この表は、C³側が検証レイヤの観点から整理した概念表であり、特定企業や特定モデルの未来を断定するものではありません。

Metadata

  • doc_id: C3-SPEC-ECHOVERIFY-1.0
  • version: 1.0
  • status: active
  • last_updated: 2026-06-07