結論:Claude Fable 5は出力$50/100万トークン(Opus 4.8の約2倍)。だから「全部Fable 5」は悪手。①長距離タスクだけFable 5②調査はOpus 4.8③プロンプトキャッシュ④コンテキストを絞る、の4つでコストは大きく下げられる。
- 料金:入力 $10/出力 $50(per 100万トークン)。Opus 4.8の約2倍。思考が常時オンなので軽い用途は割高
- 節約の核:「タスクの長さ」で使い分ける。長距離自律タスク=Fable 5、それ以外=Opus 4.8 / Sonnet 4.6
- 効く技:プロンプトキャッシュ/調査と実行のモデル分離/.claudeignoreで文脈を絞る/1セッションで完結
- 対象読者:Fable 5をAPI・Claude Codeで業務利用し、コストを抑えたいエンジニア・開発リード
- 今日やること:日常作業をOpus 4.8に戻し、Fable 5は「数時間かかる重いタスク」専用に切り替える
Claude Fable 5は長距離の自律タスクに圧倒的に強い一方で、料金はOpus 4.8の約2倍。「最強だから全部Fable 5でいいや」とデフォルトにすると、軽い質問や定型作業にも2倍のコストがかかり、しかも思考(thinking)が常時オンなので無駄に待たされます。Fable 5は「使いどころを絞ってこそコスパが出る」モデルです。
この記事では、Fable 5の料金構造を踏まえ、コストを抑えながら性能を活かす実践的な節約術を、API・Claude Code利用者向けに整理します。モデルの全体像はClaude Fable 5完全ガイド、Claude Codeでの使い分けはClaude CodeでFable 5を使う方法もどうぞ。
Fable 5の料金構造:なぜ「全部Fable 5」が高くつくのか
Fable 5のAPI料金は入力100万トークンあたり$10、出力100万トークンあたり$50。Opus 4.8(入力$5/出力$25相当)のちょうど2倍です。さらにFable 5は思考(extended thinking)が常時オンのため、同じ作業でも出力(思考分を含む)トークンが増えがちです。
つまり、軽い質問・定型文・短い修正までFable 5で処理すると、Opus 4.8の2倍以上のコストがかかります。節約の第一歩は「Fable 5を常用しない」ことです。
節約術1:タスクの長さでモデルを使い分ける(最大の効果)
コスト最適化で最も効くのがこれです。判断軸は「1Mトークンを跨ぐ長距離タスクか?」のひとつ。
| 作業 | 推奨モデル | 理由 |
|---|---|---|
| 数時間の自律タスク(大規模リファクタ・移行) | Fable 5 | 長距離で精度を保つ本領。2倍払う価値あり |
| 日常のコーディング・複数ファイル編集 | Opus 4.8 | 十分賢く、速くて半額 |
| 軽い質問・定型生成・一括置換 | Sonnet 4.6 | 速度とコスト最優先 |
「ここぞ」だけFable 5に切り替えるだけで、月のトークン費は大きく変わります。Claude Codeなら /model fable ↔ /model opus で都度切り替えられます。
節約術2:プロンプトキャッシュを使う
同じ長い前提(コードベース、ドキュメント、システムプロンプト)を繰り返し送る場合、プロンプトキャッシュでキャッシュ部分の入力コストを大幅に下げられます。長い文脈を何度も参照する長距離タスクほど効果が大きく、Fable 5の「1Mトークンを跨いで作業する」使い方と相性が良いです。繰り返し送る固定部分はキャッシュ対象に置くのがコツです。
節約術3:調査はOpus 4.8、実行だけFable 5に分離する
大きなタスクでも、最初の「どこに何があるか調査する」段階はOpus 4.8で十分です。調査結果が出たらFable 5に切り替えて、実際の実装・移行という長距離パートだけ任せる。最も賢く高いモデルを、本当に必要な実行部分だけに集中投下することで、全体のコストを抑えられます。
節約術4:コンテキストを絞ってから渡す(.claudeignore)
Fable 5は1Mトークンを扱えますが、料金は使ったトークン量に比例します。関係ないディレクトリまで読み込ませると入力トークンが膨らみます。.claudeignore で不要なファイル(node_modules、ビルド成果物、ログ、巨大データ等)を除外してから渡せば、精度を保ったまま入力コストを削減できます。
節約術5:タスクを細切れにせず1セッションで完結させる
長距離タスクを複数セッションに分割すると、そのたびにコンテキストを再読み込みするため入力トークンが重複してかかります。Fable 5の本領は「1セッションで最後まで走り切る」こと。細切れにせず、まとめて1回で任せる方がトークン効率が良く、Fable 5の設計思想とも合致します。
節約術6:バッチ処理を使う(急がない大量処理)
リアルタイム性が不要な大量処理(大量ファイルの一括変換・分析など)は、Batch APIを使うと通常より低コストで処理できます。「今すぐ答えが要らない」処理はバッチに回すのがコスト面で有利です。
コスト試算:使い分けでどれだけ変わるか(想定モデル)
以下は考え方を示す想定例です(実際の消費はタスク量で変動)。仮に月のAI作業のうち、重い長距離タスクが2割、日常作業が8割だとします。
- 全部Fable 5:8割の日常作業まで2倍料金 → 高コスト
- 使い分け(重い2割だけFable 5・8割はOpus 4.8):日常分が半額になり、全体コストを大きく圧縮しつつ、重いタスクの品質は維持
ポイントは「Fable 5の性能が必要な場面か」を毎回問うこと。必要ないなら安いモデルに戻すだけで、品質を落とさずコストが下がります。
【要注意】コスト最適化でやりがちな失敗3つ
失敗1:安さ優先で長距離タスクまで下位モデルにする
❌ 数時間の大規模リファクタをコスト優先でSonnetに → 途中で破綻して人間の手戻りが増え、結局高くつく。
⭕ 長距離タスクはFable 5。ここはケチらない。
失敗2:思考オンのFable 5を即答用途に使う
❌ 「この変数の型は?」をFable 5に聞いて、思考分のトークンと待ち時間を浪費。
⭕ 即答系はOpus 4.8 / Sonnet 4.6。
失敗3:無料期間が終わったのに使い方を見直さない
❌ プラン内無料期間(〜2026年6月22日)の感覚のまま、クレジット制移行後も全部Fable 5。
⭕ クレジット制では「使った分だけ消費」。移行後こそ使い分けが効く。
よくある質問(FAQ)
Q. Fable 5はいつまで無料で使えますか?
Claude Pro/Max/Teamプランなら2026年6月22日まではプラン内で追加課金なし。6月23日以降はクレジット制(使った分だけ消費)に移行予定です。移行前に自分の使い分けを最適化しておくのが賢明です。
Q. 結局いちばん効く節約は?
「タスクの長さでモデルを使い分ける」(節約術1)です。日常作業をOpus 4.8に戻すだけで、多くの場合コストは大きく下がります。
Q. Claude Codeでもこれらは使えますか?
はい。/model での切り替え、.claudeignore での文脈削減、1セッション完結はClaude Codeで有効です。詳しくはClaude CodeでFable 5を使う方法を参照。
まとめ:Fable 5は「絞って使う」とコスパが出る
- ① 出力$50=Opus 4.8の2倍。全部Fable 5は悪手
- ② 長距離タスクだけFable 5、日常はOpus 4.8、軽作業はSonnet 4.6
- ③ キャッシュ・調査分離・.claudeignore・1セッション完結・バッチで入力コストを削る
Fable 5は「ここぞ」で使えば2倍料金以上の価値を出しますが、常用すると無駄が増えます。タスクの長さで使い分け、入力トークンを絞る——この2つだけで、性能を落とさずコストを大きく下げられます。まずは日常作業をOpus 4.8に戻すところから始めてください。
参考・出典
- Anthropic「Pricing」公式ページ(入力$10/出力$50 per 1M tokens、2026年6月12日参照)
- Anthropic「Prompt caching / Batch API」Docs(2026年6月12日参照)
- Anthropic「Introducing Claude Fable 5」公式発表(2026年6月12日参照)
佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。X(@SuguruKun_ai)フォロワー約10万人。100社以上の企業向けAI研修・導入支援。著書『AIエージェント仕事術』(SBクリエイティブ)。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。
100社以上の支援実績|30分の無料相談で導入設計を一緒に組みます
Claude Code / Codex の社内展開・チーム導入・セキュリティ設計まで、貴社の業務と組織に合わせて伴走支援します。
- 100社以上の企業支援実績
- 初回30分無料・即日返信
- 導入後3ヶ月の伴走付き
お問い合わせフォームから24時間以内にUravation担当者がご返信します。




