- ある小規模な非公開のDiscordグループが、第三者委託業者の環境を通じて、Claude Mythos Previewへの不正アクセスを取得した疑いがある。
- Mythosは、Project Glasswingの下で、ごく一部の企業および機関パートナー向けに提供されるAIサイバーセキュリティモデルです。
- 報道によると、このグループは命名規則、流出したデータ、請負業者の特権などを利用して、モデルのオンライン上の場所を推測したという。
- Anthropic社は調査を進めており、現時点では同社のコアシステムへの影響を示す証拠はないとしているが、今回の件はサプライチェーンとアクセス制御に関する懸念を引き起こしている。
最近明らかになった Discord経由でAnthropicのClaude Mythosモデルに不正アクセスした疑い AI業界では、攻撃者に必要なものを正確に提供することなく、強力なサイバーセキュリティツールをどのように共有するかという難しい議論が再燃している。ある小規模なオンライングループは、システムが厳しく管理されたプレビュー版に限定されていたにもかかわらず、Mythosを数週間使用できたと主張している。
複数の報道によると、この事件はハリウッド映画のような派手なハッキングではなく、 請負業者の許可、オンラインでの調査、そして推測の組み合わせ Anthropicが最も機密性の高いシステムをホストしている場所について。大規模なソフトウェアの脆弱性を発見して悪用するように設計されたモデルにとって、部外者がそれを実験的に利用する可能性があるという示唆だけでも、セキュリティ専門家、企業、政府などから注目を集めている。
クロード・ミトスとは何か、そしてなぜそれが重要なのか
Claude Mythos Previewは、サイバーセキュリティに特化したAnthropicの新しいAIシステムです。これは、オペレーティングシステムやウェブブラウザの脆弱性を検出し、さらには悪用する高度な機能を備えた汎用モデルとして提示された。しかし、Anthropic社はMythosを一般公開するのではなく、重要インフラを防御するための限定的なツールとして位置づけた。
4月上旬、同社は「Mythos」を「 プロジェクト・グラスウィングこのプログラムでは、信頼できる少数の組織のみがモデルのテストに招待された。報道によると、アマゾン、マイクロソフト、アップル、シスコ、NVIDIAといった大手テクノロジー企業や企業、そしてゴールドマン・サックスなどの金融機関が、管理された実験への早期アクセス権を与えられたという。
パートナー企業は、Mythosが多数のセキュリティ問題を発見したと評価している。この事件の報道で繰り返し引用されている顕著な例の1つはMozillaで、同社はこのモデルを使用して Firefoxの数百もの脆弱性を特定し、修正するAnthropic社は同様に、Mythosが広く使用されているソフトウェア全体にわたる数千もの深刻な欠陥を明らかにするのに役立ったと主張している。
これらの結果は、楽観論と不安論の両方を生んだ。一方では、 微妙なバグや設定ミスを自動的に検出する 防御側が攻撃側の一歩先を行くのに役立つ可能性がある。一方で、複雑な攻撃手法を効率化するシステムは、特にその安全対策やアクセスモデルが機能しない場合、サイバー犯罪の力を増幅させるリスクがある。
規制当局は既に注目している。英国のAI安全研究所はMythosを評価し、 限られた人的介入で多段階のサイバー攻撃を実行する時には、経験豊富な専門家であれば数日を要するような模擬攻撃チェーンを完了させることもあった。この評価は、サイバーリスクの基準を塗り替えるモデルとしてMythosが認識される一因となった。

Discordグループがどのようにして侵入したか
こうした背景のもと、 Mythosへのアクセス権を主張する、緩やかに組織されたDiscordグループ これは当然ながら懸念を引き起こしている。ブルームバーグなどのメディアが収集した情報によると、好奇心、内部関係者とのつながり、そしてオープンソースの情報収集が組み合わさって、厳重に管理されているはずのアクセス制限を回避したというシナリオが明らかになった。
グループのメンバーは 未公開のAIモデルを追跡するためのプライベートDiscordチャンネル彼らの公的な目標は、一般にはまだ利用できない最先端システムを実験することである。関係者は正式には特定されていないが、メンバーの一人はアントロピック社にサービスを提供する請負業者に勤務しているとされている。
その請負業者とのつながりが鍵だったようだ。報道によると、その人物は 外部ベンダーとしての特権アクセス それはパズルのピースの一つだった。その内部情報という足がかりに加え、メンバーは一般的なインターネット調査手法を用いてAnthropicのインフラを解明し、さらに同社がモデルに名前を付け、展開する方法に関する事前の知識も活用した。
別のAIスタートアップであるMercorでの最近のデータ漏洩により、さらなる手がかりが得られたとされている。その漏洩からの情報と、Anthropicモデルで使用されていた以前の命名規則を組み合わせることで、Discordグループは クロード・ミトスのオンライン上の所在地に関する「情報に基づいた推測」彼らは力ずくで侵入するのではなく、効果的に正しい扉を推測し、請負業者の環境に紐づいた認証情報を使ってそこを通り抜けた。
アクセス権を取得した後、このグループは2週間以上にわたりMythosを定期的に使用していたと報じられている。ブルームバーグは調査を行ったと述べている。 スクリーンショットとライブデモ これは、モデルが実際に稼働しており、不正ユーザーからのプロンプトに応答していたことを裏付けるものと思われる。また、同じ手法を用いて他の未公開のAnthropicモデルにもアクセスできたという主張もあるが、それらのシステムに関する詳細はほとんど明らかにされていない。
グループが神話で何をしたと主張しているか
公には、Discordの参加者たちは自分たちがサイバー犯罪者であるという考えから距離を置こうとしてきた。この事件の報道で引用されたあるメンバーは、グループの関心は 攻撃を仕掛けるのではなく、新しいAIモデルを試す彼らの説明によると、Mythosは、シンプルなウェブサイトの生成やプロンプトのテストなど、比較的無害な実験に使用されていた。
彼らはまた、Anthropicの監視システム内で警報を発する可能性のある高リスクな行動を避けたと示唆している。このグループは明らかに悪意のあるクエリや目立つ活動量を控え、代わりに モデルの能力を探る間は「目立たないように行動する」入手可能な報道からは、このグループがMythosを使って現実世界の標的を侵害したという具体的な証拠は今のところ見つかっていない。
たとえそれらの自己説明が正確であったとしても、この事件はセキュリティ専門家の間で不安を引き起こした。制限されたシステムへの有効な侵入経路が実証されると、 模倣者はその技術を再現しようとする可能性がある動機は大きく異なる可能性がある。この最初の不正利用者の波が悪意のない意図を主張しているという事実は、次に何が起こるかを考える防衛側にとって、ほとんど安心材料にはならない。
このエピソードは、機密情報へのアクセスが少数の個人の行動にどれほど左右されるかを浮き彫りにしました。部分的な権限を持ち、規則を曲げる意思のある請負業者1人が、プライベートなDiscordで粘り強く働きかけたことで、 高リスクAIモデルの意図された隔離を破る.
人間活動の反応とベンダーチェーンの問題
アンスロピック社はこれらの報道を認め、正式な調査を実施していると述べている。同社は報道機関に配布した声明の中で、次のように述べている。 「当社は、サードパーティベンダーの環境の一つを通じて、Claude Mythos Previewへの不正アクセスがあったとする報告について調査中です。」 その表現は慎重だが、重要な意味を持っている。
同社は、現段階では その活動が中核的な企業システムにまで及んだという証拠はない。 あるいは、社内インフラが直接侵害されたという可能性も否定できない。問題をベンダー環境に限定することで、Anthropicは自社の中央業務と、Discordグループに関与した請負業者が使用する環境との間に事実上の境界線を引いている。
しかし、その区別こそが多くの観察者を不安にさせている点である。もしMythosがサードパーティ環境からアクセスできるのであれば、 外部パートナーのセキュリティ体制はすべて攻撃対象領域の一部となる。この状況は、典型的なサプライチェーンリスクを示している。企業が自社のネットワークを強化したとしても、ベンダー間の弱点や設定ミスによって予期せぬ事態が発生する可能性があるのだ。
この事件は、プロジェクト・グラスウィングの宣伝方法とも矛盾している。このプログラムの論理は、 アクセスを厳選された組織のみに厳しく制限する これにより、Mythosを敵対勢力から遠ざけつつ、有益なテストとフィードバックを可能にすることができた。排他性という考え方が中心であり、主要な、厳選された組織のみがモデルを検証できるため、悪用される可能性が低減される。
非公式のDiscordグループが発表されたその日にMythosを使い始めたとしたら、その物語を維持するのは難しくなる。たとえこのモデルに起因する現実世界での攻撃の兆候がまだないとしても、このエピソードは示唆している。 機密性の高いAIシステムの周囲は、想定以上に脆弱である可能性がある。特に、外部の請負業者やパートナーが関与している場合はなおさらです。
「強力すぎる」サイバーセキュリティAIに関するより広範な懸念
この事件の具体的な詳細を超えて、クトゥルフ神話の物語は、より広い議論へとつながっています。 防御と攻撃の境界線を曖昧にするAIツールMythosは、複雑な攻撃者をシミュレートし、人間の敵が弱点に気づくずっと前に弱点を発見できる、いわば「箱の中のレッドチーム」として宣伝されてきた。
セキュリティ研究者の間では、この宣伝文句の解釈について意見が分かれている。一部の研究者は、どれほど高度なAIシステムであっても、宣伝資料で示唆されているペースで新たな脆弱性を確実に発見できるとは考えていない。また、主張がたとえ部分的にでも正確であれば、 AIを活用したサイバー攻撃は、より速く、より安価に、より大規模に行われるようになっている。 これは政策立案者が規制に考慮に入れるべき事項である。
クラウドセキュリティ企業の幹部を含む業界関係者のコメントは、好奇心と懸念が入り混じったものとなっている。一方では、防御側は 現実的な攻撃シナリオの下で、面倒な分析とソフトウェアのストレステストを自動化する一方で、彼らは、同様のモデルが意図的に攻撃用に調整されてより広く流通した場合、あるいは有害な使用を防ぐための安全装置が簡単に回避されてしまった場合に何が起こるかを想像している。
政府機関はこれらの問題を純粋に技術的な問題としてではなく、戦略的な問題として扱い始めている。人間活動は、 米国国防総省による「サプライチェーンリスク」そのラベルに何を含めるべきか、また改訂可能かどうかについて、現在も議論が続いている。国際的な安全機関も同様に、Mythosのようなシステムを、軍民両用AI技術の取り扱い方に関するテストケースと捉えている。
そのため、Discordへのアクセスに関するインシデントはデリケートな時期に発生した。規制当局にとっては、強力なAIモデルを誰が使用できるかを監視することの難しさを示す初期の事例となるかもしれない。 アクセスがどのように監査されるか、またプロバイダーにはどのような義務があるか 問題が発生した場合。同様のツールを検討している企業にとっては、文書化、ログ記録、機密環境の分離といった実際的な問題が提起される。
企業、ユーザー、そしてAIガバナンスにとって、これは何を意味するのか
Mythosや類似システムを検討していた組織にとって、今回の出来事は新たなリスク評価を促す可能性が高い。根本的な問題は単純明快だ。 防衛用途において魅力的な特徴を持つモデルであっても、取り扱いを誤れば危険なものになり得る。制限付きのプレビュー版でさえ非公式なコミュニティに漏洩する可能性があるとすれば、これらのツールを実際に誰が利用しているのかについての想定は更新する必要があるかもしれない。
企業セキュリティの観点から、この事例は、 請負業者や小規模ベンダーを含む、アクセスチェーン全体 AIエージェントチームの本番環境への展開紙面上では堅牢に見えるポリシーも、人々が認証情報を使い回したり、利便性のために手順を省略したり、プレビュー環境をリスクの低いものとして扱ったりする現実世界では、崩壊する可能性があります。組織によっては、ライブコードやインフラストラクチャと直接やり取りするAIシステムに対して、より厳格なセグメンテーションが必要だと判断するかもしれません。
一般ユーザーや従業員にとって、この話はAIが単なるエンタープライズソフトウェアではないことを改めて認識させるものです。Mythosのようなシステムは 弱点を探るために必要な時間と専門知識を圧縮するこれは、情報漏洩や不正使用が発生した場合の影響を増幅させる。こうした現実を踏まえると、誰がどのような条件下で高リスクモデルに照会できるかについて、新たな社内研修やガバナンスの枠組みが必要となる可能性がある。
AIガバナンスの面では、自主的なガイドラインを超えるよう求める圧力が高まっている。このような事例は、 アクセス制御、インシデント開示、および独立監査に関する正式な基準 最も高性能なモデルの場合。政策立案者が緩やかな監視を選択するにせよ、より厳格な規制を選択するにせよ、制限されたツールが非公式な経路に紛れ込んだ事例を正当化の根拠として挙げる可能性が高い。
Anthropic自体にとっては、進行中の調査で何が明らかになるかに大きく左右される。アクセス経路が具体的にどのように機能していたか、何人が関与していたか、そしてその後どのような技術的または手続き上の変更が実施されるかなどだ。結果がどうであれ、Mythosのエピソードはすでに議論の基準点となっている。 高度なサイバーセキュリティAIを、開発者が意図した役割に限定する方法そして、その監禁状態が限界に達したときに何が起こるのか。
これらの要素をすべて合わせると、Claude Mythosへの不正なDiscordアクセス疑惑は、最先端のAIがいかに迅速に発表時に引かれた明確な境界線を越え、ベンダーのセキュリティの欠陥を露呈させ、「招待制」という約束の堅牢性をテストし、企業、規制当局、ユーザーに、依存しているデジタル防御を強化すると同時に弱体化させる可能性のあるツールをどのように管理するかを再考させるものであることが浮き彫りになる。