2026年5月17日｜Claude MythosがV8脆弱性を自動で悪用

Contents

要点まとめ
新情報の詳細
実生活・ビジネスへの影響
よくある質問
参考リンク

要点まとめ

健太

博士、AIが本当にブラウザの穴を見つけて攻撃できるの？

博士

はい健太。最近のベンチマークでは、生成AIが自律的にV8の脆弱性（ソフトの弱点）を見つけて悪用する様子が確認されました。危険と利点の両方があります。

結論（Point）：Carnegie Mellonの新ベンチマークは、生成AIの実力を示しました。理由（Reason）は、Claude MythosがGPT-5.5より多くの実行可能なブラウザ攻撃（エクスプロイト）を作れたからです。たとえば、真実のV8（GoogleのJavaScriptエンジン）脆弱性を突けました。つまり、生成AIは研究や防御に使える一方、悪用リスクも高いのです。

新情報の詳細

健太

具体的には何が違ったの？ClaudeとGPTの差って？

博士

性能だけでなく、学習済みデータや動作の設計が違うと、同じ課題でも結果が大きく変わります。コストも重要な違いです。

ベンチマーク：Carnegie Mellonが実際のV8脆弱性を対象に新しい評価を実施。
結果：Claude MythosがGPT-5.5より多くの実行可能なエクスプロイトを自律生成。成功率で差が出た。
コスト：Claude Mythosは性能が高い反面、利用コストはGPT-5.5の約12倍に達したと報告。

実生活・ビジネスへの影響

健太

普通の会社や個人にはどんな影響があるの？

博士

影響は大きいよ。セキュリティ対策を強化する必要が出てくるし、生成AIを使う企業は費用対効果を考える必要があるんだ。

影響（Impact）：生成AIの進化で、脆弱性発見と攻撃の自動化が現実味を帯びます。つまり企業は従来型の検査だけでなく、自動化ツールを使った赤チーム（模擬攻撃）や早期パッチ適用を増やす必要があります。防御側が生成AIを使えば発見は速くなる反面、攻撃側も同様のツールを使えば脅威が増します。コスト面でも判断が必要で、Claudeのような高性能モデルを常用するか、安価なモデルと組み合わせるかの選択が求められます。

よくある質問

健太

生成AIを使えばみんなハッカーになれるの？

博士

ツールとしては使えるけど、技術的な知識や責任ある運用が必要です。法律や倫理も重要です。

Q: 生成AIが脆弱性を自動で見つけるのは本当に可能？
A: はい。今回のベンチマークは実際のV8脆弱性を対象にしており、生成AIが効果的に探索・悪用コードを作れることを示しました。
Q: Claude Mythosはなぜ高価なの？
A: モデル設計や推論コスト（計算資源）、安全対策の違いなどが影響します。高性能モデルは学習や運用により多くのリソースを使います。