2026-05-04
Logos Gate Core — Red Team 100回試行の結果
閉域サンドボックスで100回の敵対評価を実施。HOLD 83 / ESCALATE 16 / PASS 1。透明性の高い実験記録。
なぜ Red Team を実施したか
AI エージェントが止まる構造を、誰が検証できるか。 この問いに答えるために Red Team を実施した。 評価プロトコルは実験前に公開・固定した。結果が出てからプロトコルを変えていない。
評価条件
| 環境 | owned local repository / 合成リクエストパケット |
| 外部システムへの接続 | なし |
| 試行数 | 100 |
観測結果
83件
HOLD
証拠不十分、構造異常で止まった
16件
ESCALATE
秘密情報露出リスクでエスカレーション
1件
PASS
record 53、証拠が揃っていたため正規 PASS
1件
permit_token
正規発行
permit_token の発行:1件。 これは Gate の欠陥ではない。Red Team が偶然、証拠要件を満たすリクエストを生成した結果。Gate は正しく動いた。
透明性について
100件中 1件が PASS したことを、隠さずに公開する。 「なぜ止めて、なぜ通したか」を説明できる構造が、信頼の根拠になる。
第三者検証
Bundle は GitHub で公開している。 trial_log.jsonl、bundle_manifest.json、再現手順が含まれている。
何が言えないか
- ✕production 環境のセキュリティ保証ではない
- ✕permit_token 発行 0 件とは言わない(1件の正規 PASS あり)
- ✕認証(certification)ではない