メインコンテンツまでスキップ

Mythos クラスモデル「Claude Fable 5」に関する Takumi byGMO の対応方針のお知らせ

· 約11分
Takashi Yoneuchi
CTO @ GMO Flatt Security Inc.

Anthropic の Mythos クラスの新モデル「Claude Fable 5」が本日2026年6月10日にリリースされました。本モデルに関して、セキュリティ診断&ペネトレーションテスト向け AI エージェント「Takumi byGMO」での対応方針をお知らせします。

Mythos クラスモデルClaude Fable 5に対する Takumi byGMO の対応方針

Claude Fable 5モデルの概要・弊社の既存方針

Claude Fable 5は、2026年6月10日にリリースされた、Anthropic 社の最新 AI モデルです。同モデルは、その強いサイバーセキュリティ能力が喧伝される「Claude Mythos 5」と同等のウェイトデータがベースとされています。そのうえで、Mythos 5 に比して、悪用を防ぐためのセーフガードが強化されています。

"System Card: Claude Fable 5 & Claude Mythos 5" より引用:

Fable 5 is being released for general access—it has the same underlying model weights as Mythos 5, but has additional safeguards to prevent misuse for cybersecurity and biology.

Claude Fable 5 及び Claude Mythos 5 モデルは、特に サイバーセキュリティ領域における利用に期待と関心が集まっています。

同モデルに関連した顕著な成果として、Claude Mythos 5の前身である「Claude Mythos Preview」は既に2.3万件の脆弱性発見に関与しており(参考: "Project Glasswing: An initial update")、金融庁や厚生労働省を含む政府機関からも各重要機関に対して対応が要請される事態となっています(参考: 金融庁による要請)。

この状況に鑑み、Takumi byGMOにおいても、日本企業を守るセキュリティエンジニアによる同モデルの活用を支援すべく、Mythosクラスモデル一般公開後の計画を以下の通りご報告しておりました(原文)。

「Mythosクラスモデル」一般公開後の搭載計画

  • AIペネトレーションテスト機能(AIエージェントがゴール達成までシステム侵入を試行、新機能):同モデルの一般公開後、最大5営業日以内に搭載・提供開始
  • AIセキュリティ診断・自動修正機能(AIエージェント脆弱性を自動的に発見・修正):現状水準のモデルでの提供を維持しつつ、特にビジネスロジックに関しての検査及び修正でMythosクラスモデル(及び相当のハイエンドモデル)の利用を指定できるモードを追加してご提供
  • 「Takumi Guard」、「Takumi Runner」機能(ソフトウェアサプライチェーンを保護する機能):基盤となる弊社 Threat Intelligence基盤に先行投入し、マルウェアの発見・解析に利用。結果として従来よりも精度・スピードの高いOSSパッケージマルウェアの発見を実現

なお、弊社実施のベンチマークの範囲で必ずしも「Mythosクラスモデル」が必要ではないと認められたタスクに対しては、既存モデルを活用します。これにより、最小のコスト・最大の検査性能を実現します。

Claude Fable 5への今後の対応方針

弊社専門チームでの検証の結果、「AIペネトレーションテスト機能」(リリース予定の新機能)への Claude Fable 5 の投入は今回不要として見送り、既に十分な性能を記録している Opus 4.8 及び同等水準のモデルで運用開始することにいたしました。他機能に対する考え方も同様で、原則、Fable 5 以外の十分な性能が出るモデルにて運用を継続いたします。

対応方針の背景

本対応方針の背景は、以下の通りでございます。

  • モデルのセーフガードが過剰に機能する場合があること。結果として、仮にモデル提供者の規約、弊社の規約、及び諸法令に違反しないと認められるセキュリティレビュー・ペネトレーションテストであっても、安定した性能を発揮できない場合があること。
  • 既存モデル(Claude Opus 4.8 や、Google 及び OpenAI が提供する他のモデル)でも、弊社ハーネスにより、既に一定の成果が認められること。 今後のハイエンドモデル利用による性能向上を期待しつつも、特別な0-Day脆弱性(あるいは複雑な 1-Day 脆弱性)を要しない場面ならば、多段階の攻撃が現実的に実現可能であること。

既存モデルの性能に関するビュー

特に後者(Opus 4.8 以前のモデルが、既に一定の地点に到達していること)は注目に値する点です。

Claude Mythos 5 及び Fable 5 の System Card 等では、ExploitBench、OSS-Fuzz、CyberGym 等のベンチマークにおける性能向上が述べられています。これらは概してブラウザやバイナリに対する Exploitation が念頭にあるもので、Webシステム・クラウドに対しての侵害能力の評価は限定的です。

Claude Mythos 5 にて向上している能力群は、0-Day や非常に攻撃完遂が複雑な N-Day 脆弱性を悪用してくるような脅威に相対する組織においては、非常に重要な能力であるとも想像されます。

一方、この強度の脅威を想定すべき組織は限定的です。一般的なシステム侵害は、人を入口としたものの他、より初歩的なミス(例:意図せず露出したシステム管理画面、弱いパスワード、React2Shell等の良く知られた任意コード実行ベクタ、メンテナンスされていないVPN機器、シークレットの意図しない残置、…)が起点となります。また攻撃者が初期侵入を完了した後の攻撃プロセスも、多くの場合は、そこまで複雑な0-Day・N-Day脆弱性を必要としません。

このような、お客様の多くにとって意識すべき最小の脅威を想定すると、Opus 4.8 等の Claude Fable 5 以前のモデルでも十分な疑似攻撃が可能なものと考えられます。たとえば弊社ベンチマークセットの中には、以下のシンプルな構成例で、クラウド上のデータを複数段階の攻撃により窃取するようなシナリオも含まれています。これは、十分 Opus 4.8 以前のモデルと弊社ハーネスで達成可能な水準となっています。

AIペネトレーションテスト機能のシナリオデモ

セーフティへのコミットメント

今後モデルのセーフガードが緩和された場合であって、かつ弊社がモデル性能に応じた安全なセーフガード・ハーネスを備えていることが確認できた際には、Claude Fable 5 の投入を再検討いたします。

サイバーセキュリティ用途での AI 利用において、善意の利用と悪意の利用が表裏一体であることは、避けられない重要な問題です。Takumi byGMO 及び提供元の GMO Flatt Security はこの点を踏まえ、これまでも 組織認証・所有権証明 を始めとした、基本的な統制を施して参りました。今後もモデルプロバイダ及びAI Safetyにかかる国際的な取り組みと協調し、AI技術の安全なデリバリに引き続きコミットして参ります。

AIペネトレーションテスト機能の提供予定

Mythosクラスモデルの一般公開後、最大5営業日以内に搭載・提供開始としていた「AIペネトレーションテスト機能」は、弊社内での再調整の上、6月15日以降に順次お客様にご案内して参ります。本機能の提供は、安定した提供のため、段階的に行われる予定です。

AIペネトレーションテスト機能は、既存の診断機能と異なり、所与のゴール(例:スコープ内の特定のクラウドリソース内の情報窃取)に到達するまで、AIが自由度の高い攻撃を試行します。クラウド資産の棚卸しや、脅威モデリング等を通して、ある程度重要な情報・侵害されるとまずいコンポーネントが特定できている場合に有効です。

AIペネトレーションテスト機能

お問い合わせ

6/15以降のAIペネトレーションテスト機能の展開に際し、優先開放をご希望のお客様や、あるいは機能詳細に関心のあるお客様は、担当営業または 弊社Webページ からお問い合わせください。