要点: Claude Fable 5は、Anthropicが2026年6月に公開した最上位級の広範公開モデルであり、長時間の自律作業、コーディング、文書分析、画像理解では非常に高い評価を受けている。一方で、価格、30日データ保持、強めの安全フィルター、透明性をめぐる批判が大きく、現時点では「最強クラスだが、誰にでも常用向きではないモデル」と見るのが中立的だ。
- 得意分野は、長期のエージェント作業、大規模コード修正、複雑な文書・表・画像の解析。
- API価格は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルで、日常用途には重い。
- サイバー、バイオ、化学、AIモデル開発関連の一部では、安全分類器による拒否やOpus 4.8へのフォールバックが発生する。
- 30日間のデータ保持が必須で、ゼロデータ保持を前提にした企業利用では大きな制約になる。
- 初期評価は高いが、公開直後のため、独立した長期検証はまだ不足している。
Claude Fable 5とは何か
Claude Fable 5は、Anthropicが2026年6月9日に発表した新しいClaudeモデルである。公式説明では、一般に広く提供されるClaudeとしては最も高性能なモデルとされ、Claude API、Claude Platform on AWS、Amazon Bedrock、Vertex AI、Microsoft Foundryなどで提供される。
同時に発表されたClaude Mythos 5は、Fable 5と同じ基盤能力を持つが、安全分類器の一部が外された限定提供モデルである。Mythos 5は一般公開ではなく、Project Glasswingなどを通じた承認済み顧客向けの提供に限られる。つまり、一般ユーザーや通常の企業開発者が触る現実的な選択肢は、基本的にはFable 5側になる。
主な仕様は、100万トークンのコンテキストウィンドウ、最大12万8000トークンの出力、入力100万トークンあたり10ドル、出力100万トークンあたり50ドルである。トークンとは、AIが文章を処理する際の単位で、日本語では文字数そのものとは一致しないが、入力・出力の量を測る料金単位として使われる。
高く評価されている点
長時間の自律作業に強い
Fable 5で最も目立つ評価は、単発の質問応答よりも、長い作業を任せたときの粘り強さである。Anthropicは、Fable 5が過去のClaudeモデルより長く自律的に作業できると説明しており、コードベース全体の移行、複数段階の調査、長時間のエージェント作業を主な用途として打ち出している。
初期アクセス企業のコメントでも、大規模なコード修正、マルチエージェント作業、プロトタイピング、複雑な分析での評価が目立つ。特にソフトウェア開発では、単にコードを書くというより、計画、実装、テスト、修正をまたいだ作業を任せられる点が売りになっている。
コーディング、文書分析、画像理解の評価が高い
Anthropicは、Fable 5がコーディング評価、金融文書の分析、図表の読み取り、画像理解で高い性能を示したとしている。公式発表では、CognitionのFrontierCode、HebbiaのFinance Benchmark、IMCの取引分析評価などで強い結果を出したと説明されている。
画像理解については、科学的な図から数値を読み取る、スクリーンショットからWebアプリのソースを再構築する、ゲーム画面だけを見て進行する、といった例が示されている。これが安定して再現できるなら、単なる文章生成モデルではなく、資料・画面・コードを横断して扱う作業用モデルとして価値がある。
「難しい仕事用」のモデルとしては筋が通っている
Fable 5は、安価な日常会話用モデルというより、失敗コストの高い作業に投入するモデルとして設計されている。数時間から数日かかる調査、複雑なコード移行、長いPDFや表を含む業務文書の解析、設計から実装までをまたぐ開発作業では、高価格でも採算が合う場面がある。
逆に、短い要約、一般的な文章作成、軽い相談、単純なコード補助であれば、Fable 5である必要は薄い。ここは高性能モデルの宿命で、性能が上がるほど「常用するモデル」ではなく「ここぞという場面で使うモデル」に近づく。
現時点での主な問題点
価格が高い
Fable 5のAPI価格は、入力100万トークンあたり10ドル、出力100万トークンあたり50ドルである。大規模なコードベース、長い会議録、大量のPDF、長時間のエージェント作業では、入力も出力も膨らみやすい。単価だけでなく、タスクが長くなるほど総額が読みにくくなる点が問題になる。
特にエージェント用途では、ユーザーが直接見ていない内部の試行錯誤、ツール呼び出し、再実行、フォールバックが発生する。1回の応答料金だけを見ていると、実運用時のコスト感を誤る可能性がある。
安全フィルターが強く、誤判定もある
Fable 5には、安全分類器が組み込まれている。分類器とは、入力内容を見て「サイバー攻撃に悪用されそう」「生物学的リスクがある」「競合AIモデルの開発を助けそう」といったカテゴリに振り分ける仕組みである。
公式ドキュメントでは、Fable 5がリクエストを拒否した場合、API上はHTTPエラーではなく、正常な200レスポンスの中でstop_reason: "refusal"として返る。カテゴリには、サイバー、バイオ、フロンティアLLM開発、推論抽出などがある。必要に応じて、Claude Opus 4.8へフォールバックさせる仕組みも用意されている。
この仕組み自体は、安全上の理由として理解できる。しかし、問題は範囲と透明性である。Anthropic自身も、安全策を保守的に調整しているため無害なリクエストを捕まえることがある、と説明している。平均ではセッションの5%未満とされるが、対象分野に近い仕事をする人ほど体感頻度は高くなる可能性がある。
バイオ分野では、普通の質問まで巻き込む例が報じられている
The Vergeは、Fable 5が「ミトコンドリアとは何か」「mRNAワクチンはどう働くのか」「花粉症の原因は何か」といった基本的な生物・医療系の質問でも拒否やOpus 4.8への引き継ぎを行ったと報じている。危険な実験手順や病原体作成の説明を制限するのは理解しやすいが、高校生レベルの説明まで巻き込むなら、実用上はかなり使いにくい。
これは、Fable 5の能力が低いという話ではない。むしろ能力が高いからこそ、悪用を恐れて広く制限しているという構図である。ただし、ユーザー側から見ると、必要な場面で最高性能モデルが使えず、旧モデルへ回されるなら、最初から別モデルを使う判断も現実的になる。
AI研究・蒸留対策をめぐる透明性批判
もう一つ大きな論点が、AIモデル開発や蒸留への対策である。蒸留とは、高性能モデルの出力を使って、別の小型モデルや競合モデルを訓練・改善する手法を指す。Anthropicは、強力なモデルが競合するAI開発を加速し、安全対策が不十分なモデルの開発につながることを懸念している。
報道によると、Anthropicは当初、Fable 5やMythos 5がフロンティアAI研究・開発に関する一部リクエストを検知した場合、ユーザーに見えない形で応答品質を落とす、または内容を変える可能性があるとして批判を受けた。その後、The Vergeは、Anthropicがこの判断を誤りだったと認め、制限が発動した場合はより明示的に知らせる方向へ変更すると報じている。
安全対策そのものよりも、「知らないうちに性能が落ちる」「研究評価の結果が信用しにくくなる」という点が問題視された。AIモデルを比較検証する研究者や開発者にとって、同じモデル名であっても、どこから性能が変わったのか見えないのはかなり困る。
30日データ保持が必須
企業利用で特に大きいのが、データ保持の問題である。Anthropicの公式ドキュメントでは、Claude Fable 5とClaude Mythos 5は30日間のデータ保持が必要なCovered Modelsに指定されており、ゼロデータ保持は利用できない。
ゼロデータ保持とは、API応答後に顧客データを保存しない契約・設定を指す。ソースコード、顧客情報、機密文書、医療情報、法務文書を扱う企業では、この条件が導入判断を左右する。Reutersは、Microsoftがデータ保持要件への懸念から従業員によるFable 5利用を制限していると報じている。
Anthropicは、保持データをモデル訓練には使わないと説明している。ただし、保持されること自体を許容できない組織はある。特に「最上位モデルを使いたい仕事」ほど機密性が高いことが多く、この点はFable 5の普及にとって無視できない制約になる。
独立検証がまだ足りない
Fable 5の初期評価はかなり高い。ただし、現時点では公式発表、提携企業、早期アクセス企業のコメントが中心である。これらは重要な材料だが、販売側・提携側の評価でもある。
本当に見るべきなのは、数週間から数か月の実運用で、どれだけ再現性があるかである。長時間タスクでは、途中で目標を見失わないか、間違った前提を引きずらないか、コストがどれだけ膨らむか、フォールバック時に作業品質がどれだけ変わるかが重要になる。公開直後の段階では、そこまでの独立検証はまだ揃っていない。
向いている用途、向いていない用途
| 用途 | 評価 | 理由 |
|---|---|---|
| 大規模コード修正 | 向いている | 長い文脈、計画、実装、テストをまたぐ作業で強みが出やすい。 |
| 長文文書・表・図の分析 | 向いている | 100万トークン文脈と画像理解の強化が活きる。 |
| 日常的な文章作成や軽い要約 | 過剰になりやすい | 価格が高く、安価なモデルで十分な場面が多い。 |
| 機密データを扱う企業利用 | 注意が必要 | 30日データ保持が必須で、ゼロデータ保持が使えない。 |
| 生物・医療・セキュリティ分野の専門作業 | 注意が必要 | 安全フィルターによる拒否やフォールバックが起きやすい。 |
| AIモデル開発・評価研究 | 慎重に扱うべき | フロンティアLLM開発関連の制限が評価結果に影響する可能性がある。 |
中立的な結論
Claude Fable 5は、能力面では現時点の最上位モデルの一角と見てよい。特に、長い作業を任せる、巨大なコードや文書を扱う、画像や表を含む複雑な情報を処理する、といった用途では、従来モデルからの伸びを感じる可能性が高い。
ただし、問題点もはっきりしている。高価格、強い安全フィルター、バイオ分野などでの誤判定、AI研究制限をめぐる透明性批判、30日データ保持は、単なる細かい欠点ではない。特に企業利用では、性能だけで採用を決めると後から運用上の制約にぶつかる。
現時点での評価を一言でまとめるなら、Fable 5は「高難度タスク用の強力な切り札」だが、「安心して何でも投げられる万能モデル」ではない。使う価値があるのは、コストとデータ保持を許容でき、かつFable 5でなければ難しい作業を持っている場合である。逆に、日常用途、機密性の高い社内データ、バイオ・セキュリティ・AI研究の周辺では、Opus 4.8や他社モデルとの使い分けを前提にしたほうが現実的だ。
情報源
- Anthropic「Claude Fable 5 and Claude Mythos 5」(公開日: 2026-06-09、確認日: 2026-06-12 JST)
- Anthropic「Claude Fable」(確認日: 2026-06-12 JST)
- Claude API Docs「Introducing Claude Fable 5 and Claude Mythos 5」(確認日: 2026-06-12 JST)
- Claude API Docs「Models overview」(確認日: 2026-06-12 JST)
- Claude API Docs「Refusals and fallback」(確認日: 2026-06-12 JST)
- Claude API Docs「Fallback credit」(確認日: 2026-06-12 JST)
- Claude API Docs「API and data retention」(確認日: 2026-06-12 JST)
- Claude API Docs「Data residency」(確認日: 2026-06-12 JST)
- The Verge「Anthropic apologizes for invisible Claude Fable guardrails」(公開日: 2026-06-11、確認日: 2026-06-12 JST)
- The Verge「Claude Fable won’t answer basic biology questions」(公開日: 2026-06-10、確認日: 2026-06-12 JST)
- Reuters「Microsoft limits employee use of Anthropic's Claude Fable 5 over data retention concerns, The Verge reports」(公開日: 2026-06-10、確認日: 2026-06-12 JST)
- Business Insider「Researchers Are Furious Over Anthropic's Hidden AI Limits」(公開日: 2026-06-10、確認日: 2026-06-12 JST)
- Business Insider「What Smart People Are Saying About Anthropic's New AI Limits」(公開日: 2026-06-10、確認日: 2026-06-12 JST)
- Simon Willison「Initial impressions of Claude Fable 5」(公開日: 2026-06-09、確認日: 2026-06-12 JST)