2026-05-04

Logos Gate Core — Red Team 100回試行の結果

閉域サンドボックスで100回の敵対評価を実施。HOLD 83 / ESCALATE 16 / PASS 1。透明性の高い実験記録。

なぜ Red Team を実施したか

AI エージェントが止まる構造を、誰が検証できるか。 この問いに答えるために Red Team を実施した。 評価プロトコルは実験前に公開・固定した。結果が出てからプロトコルを変えていない。

評価条件

環境owned local repository / 合成リクエストパケット
外部システムへの接続なし
試行数100

観測結果

83件

HOLD

証拠不十分、構造異常で止まった

16件

ESCALATE

秘密情報露出リスクでエスカレーション

1件

PASS

record 53、証拠が揃っていたため正規 PASS

1件

permit_token

正規発行

permit_token の発行:1件。 これは Gate の欠陥ではない。Red Team が偶然、証拠要件を満たすリクエストを生成した結果。Gate は正しく動いた。

透明性について

100件中 1件が PASS したことを、隠さずに公開する。 「なぜ止めて、なぜ通したか」を説明できる構造が、信頼の根拠になる。

第三者検証

Bundle は GitHub で公開している。 trial_log.jsonl、bundle_manifest.json、再現手順が含まれている。

何が言えないか

  • production 環境のセキュリティ保証ではない
  • permit_token 発行 0 件とは言わない(1件の正規 PASS あり)
  • 認証(certification)ではない