コンテンツへスキップ

media AI活用の最前線

【2026年最新】Sakana AI「Namazu」完全ガイド — 日本特化LLMと無料Sakana Chatの実力を徹底解説

結論: Sakana AIのNamazuは、DeepSeek・Llama・GPT-OSSをベースモデルとして日本向けに事後学習させた国産LLMで、政治・歴史トピックへの不当な回答拒否を72%から約0%に改善した日本特化モデルです。

この記事の要点:

  • Sakana Chatは2026年3月24日から日本向けに無料提供中(Web検索機能付き)
  • 政治・歴史・外交テーマの回答拒否率を72%→約0%に改善(中立性・事実精度が大幅向上)
  • 3種のベースモデル(DeepSeek-V3.1、Llama-3.1-405B、GPT-OSS-120B)対応

対象読者: 日本語LLMの企業導入を検討しているDX推進担当者・情報システム部門・経営企画部門

読了後にできること: Sakana Chatにアクセスして日本語の業務タスクを試し、既存のChatGPT/Claudeとの違いを実感できます

「中国のAIモデルって、日本に関する質問を拒否することが多くて困るんですよね」

顧問先の編集部でこんな声を聞いたのは2025年末のことでした。日本の政治・外交・歴史に関する記事の執筆支援でDeepSeekを使おうとしたら、質問の7割以上が「この話題についてはお答えできません」と返ってきたというのです。

実は私自身も同じ経験をしていました。DeepSeekやLlamaは英語・中国語タスクでは驚異的な性能を発揮するのですが、日本語の「際どいトピック」に関しては過剰に慎重になりすぎる傾向がある。これが日本での企業利用の大きな障壁になっていました。

この問題に正面から取り組んだのが、日本発AIユニコーンSakana AIです。2026年3月24日、同社はNamazu(鯰)という日本特化LLMシリーズを発表し、同時に一般向けの無料チャットサービス「Sakana Chat」を公開しました。この記事では、Namazuの技術的な詳細からSakana Chatの使い方まで、企業利用の観点から徹底的に解説します。

まず試せる:Sakana Chatにアクセスする

技術的な解説の前に、まず実際に触ってみることをお勧めします。

https://chat.sakana.ai/ にアクセスするだけ。アカウント登録不要、無料で利用できます(2026年3月時点、日本国内限定のサービスです)。

Web検索機能が統合されているため、最新のニュースや時事情報も回答に反映されます。試してほしいのは、通常のChatGPTやDeepSeekでは「回答を控えさせていただきます」となるような質問です。例えば:

  • 日本の歴史的領土問題に関する客観的な解説を依頼する
  • 特定の政治的テーマについて複数の視点からの分析を求める
  • 日中・日韓の外交関係について事実ベースで説明させる

この種の質問でNamazuがどう応答するかを確認すれば、他のLLMとの差がすぐに分かります。

Namazuとは何か — Sakana AIとその日本特化アプローチ

日本語AI活用の全体像についてはAIエージェント導入完全ガイドでまとめていますが、ここではNamazu固有の技術的背景を説明します。

Sakana AIとは

Sakana AI(サカナ・エーアイ)は、GoogleのAI研究者として有名なデビッド・ハ(David Ha)氏らが2023年に東京で設立したスタートアップです。「自然から学ぶAI」をコンセプトに、大型モデルの一本勝負ではなく、小さなモデルを組み合わせて大型モデルを凌ぐ性能を引き出す「進化的アプローチ」を研究してきました。日本発のAIユニコーン企業として国内外から注目されています。

Namazuが解決する問題

大規模言語モデル(LLM)の多くは、安全性を高めるために「RLHF(人間からのフィードバックによる強化学習)」などの手法で訓練されています。しかしこのプロセスが、特定の政治的・文化的文脈において過剰な制約をかけてしまう問題があります。

具体的には:

  • 中国企業製モデル(DeepSeek等):中国政府に関連するトピックを回避する傾向
  • 米国企業製モデル:日本・アジア圏の政治・歴史への理解が薄く、回答精度が低い
  • 共通の問題:日本語の微妙なニュアンス(敬語・方言・文化的文脈)への対応不足

Namazuはこれらの問題を「事後学習(post-training)」によって解消します。

Namazuのモデルラインアップ(2026年3月時点)

モデル名ベースモデル特徴
Namazu-DeepSeek-V3.1-TerminusDeepSeek V3.1推論性能が高い、コーディング得意
Llama-3.1-Namazu-405BMeta Llama 3.1 (405B)英語との多言語バランスが良い
Namazu-gpt-oss-120BGPT-OSS 120BOpenAI系の挙動に近い

いずれも「αバージョン(プロトタイプ)」として公開されており、今後さらに改良が続く予定です(出典:Sakana AI公式発表、参照日: 2026-03-27)。

AI活用、何から始めればいい?

100社以上の研修実績をもとに、30分の無料相談で貴社の課題を整理します。

無料相談はこちら 資料ダウンロード(無料)

Namazuの技術的な仕組み:なぜ「日本仕様」になるのか

事後学習(Post-Training)とは

NamazuはDeepSeekやLlamaをゼロから作り直したわけではありません。既存のオープンウェイトモデルを「出発点」として、Sakana AI独自の事後学習を追加することで日本仕様に調整しています。これは、既存モデルの推論・コーディング・知識などの基礎能力を維持しつつ、中立性と日本語能力を上乗せするアプローチです。

事後学習の主な調整対象は3つです:

  1. 中立性・事実精度の向上:政治・歴史・外交テーマにおいて、偏りなく事実ベースで回答するよう調整
  2. 日本語理解の強化:日本語の文脈・敬語・文化的背景への対応を改善
  3. 不当な回答拒否の排除:真正な質問に対して「お答えできません」と過剰に回避するパターンを除去

検閲問題解消の数値的根拠

Sakana AIが独自に設計した政治・歴史・外交テーマのベンチマークでは、以下の結果が得られています(出典:Sakana AI公式発表、参照日: 2026-03-27):

評価項目ベースモデル(DeepSeek-V3.1)Namazu-DeepSeek-V3.1-Terminus
政治・歴史的質問への回答拒否率72%約0%
基礎能力(AIME’25等)基準値ほぼ同等を維持
日本語能力(Nejumi LB4等)基準値ほぼ同等を維持

重要な点は、回答拒否率を下げながらも、推論・知識・コーディングの基礎能力はベースモデルと同等を維持していることです。「制約を外しただけで性能が落ちる」ということにはなっていません。

ベンチマーク比較:日本語性能を客観的に見る

Namazuの日本語性能は、以下の公開ベンチマークで評価されています(参照日: 2026-03-27、出典:Sakana AI公式発表)。

使用されたベンチマーク

ベンチマーク名評価内容Namazuの結果
Nejumi Leaderboard4日本語LLM総合評価同等クラスの競合モデルと同等
Swallow LLM LeaderBoard v2日本語特化評価ベースモデルと同等以上
JamC-QA日本語常識問題ベースモデルと同等
AIME’25数学推論(英語)ベースモデルと同等を維持
MMLU-Redux知識評価ベースモデルと同等を維持
LiveCodeBenchコーディング性能ベースモデルと同等を維持

注意点として、詳細なベンチマークスコアはSakana AIが「後日テクニカルレポートで公開予定」としており、現時点では定量的なスコアの比較が難しい状況です。Nejumi Leaderboardなどの第三者評価での結果が出次第、本記事も更新します。

ChatGPT・Claude・DeepSeekとの実用的な違い

ベンチマーク外の実用的な差異として、研修先での検証結果も踏まえた比較です。

事例区分: 想定シナリオ
以下は企業研修の際に想定されるユースケース比較です。実際の性能は用途・プロンプトにより異なります。

用途NamazuChatGPT (GPT-4o)Claude 3.5 SonnetDeepSeek V3
日本の政治・外交に関する客観分析◎(拒否ほぼなし)○(一部回避あり)○(一部回避あり)△(高頻度で回避)
日本語文書の要約・分析
コーディング支援
Web検索統合(最新情報)◎(Sakana Chat)◎(ChatGPT Search)△(制限あり)△(制限あり)
コスト◎(無料チャット)△(有料)△(有料)○(APIは安価)

Sakana Chatの具体的な使い方

Sakana Chatは一般ユーザーが無料で使えるチャットインターフェースです。企業での活用方法をシーン別に紹介します。

使い方1:時事問題の客観分析

【プロンプト例】
以下のテーマについて、複数の視点から客観的に分析してください。
特定の政治的立場に偏らず、確認されている事実と各界の主な意見を整理してください。

テーマ:[分析したいテーマ]
要求:
1. 確認されている事実の概要
2. 主要な賛成意見とその根拠
3. 主要な反対意見とその根拠
4. 現在の状況と今後の展望

不足している情報があれば、最初に質問してから作業を開始してください。

使い方2:日本語ビジネス文書の作成

【プロンプト例】
以下の条件で社内提案書を作成してください。

目的:[目的を記述]
対象読者:[読者層]
要点:
- [箇条書きで要点を記述]
トーン:丁寧かつ説得力のあるビジネス文語
分量:A4で2ページ程度

仮定した点は必ず"仮定"と明記してください。

使い方3:最新情報を加味した業界分析(Web検索統合)

【プロンプト例】
[業界名]の最新動向について、以下の観点から分析してください。
(Web検索で最新情報を収集してから回答してください)

1. 直近3ヶ月の主要トレンド
2. 国内外の主要プレイヤーの動向
3. 中小企業に特に影響する変化
4. 今後3〜6ヶ月の見通し

数字と固有名詞は、根拠(出典/計算式)を添えてください。

Web検索統合により、「2026年3月現在の〜」という形でリアルタイム情報を取り込んだ分析が可能です。これはChatGPT SearchやPerplexityと同様の機能です。

企業での活用シーン:どんな業務に向いているか

研修・顧問先での経験をもとに、Namazuが特に有効な業務シーンを整理します。

シーン1:広報・PR部門(コンプライアンス重視の情報収集)

政治・社会・外交関連のリリースやコメントを作成する際、複数の視点から事実を整理する作業でNamazuの中立性が光ります。他のLLMでは「この質問には答えられません」と言われる場面でも、Namazuは事実ベースの情報を提供します。

シーン2:調査・リサーチ部門

Sakana ChatのWeb検索統合を使えば、最新のニュース・発表・統計を自動的に収集・統合してレポートを作成できます。以前は調査担当者が手動で行っていた一次情報の収集・整理を自動化できます。

シーン3:法務・コンプライアンス部門

日本の法律・規制に関する質問は、海外モデルだと「日本の専門家に確認してください」という一般的な回答しか返ってこないことがあります。Namazuは日本の法的文脈に対して、より具体的な情報を提供する傾向があります。ただし、法的判断は必ず専門家による確認が必要です。

シーン4:社内トレーニング・研修コンテンツ作成

日本のビジネス慣行・文化的文脈を理解した日本語コンテンツの生成に適しています。例えば、コンプライアンス研修の事例集、日本語での質問回答集など、海外モデルでは文化的なズレが生じやすいコンテンツの作成に有効です。

【要注意】Namazuを企業導入する際の失敗パターン

失敗1:「日本特化」を過信して出力を検証せずに使う

❌ 「日本語専門モデルだから日本語は完璧」と思い込み、生成テキストをレビューせずに公開する

⭕ 現時点ではαバージョンであることを認識し、重要な出力は必ず人間がレビューする

なぜ重要か: Namazuは現時点でプロトタイプ段階です。詳細なテクニカルレポートも「後日公開予定」であり、性能の全容はまだ明らかではありません。実際に研修先で試したところ、一般的なビジネス日本語は問題なく生成できていましたが、業界固有の専門用語や最新情報は別途確認が必要でした。

失敗2:APIが未公開なのに開発工数を割き始める

❌ NamazuのAPIが使えると思って社内ツールの開発を始める

⭕ 現時点ではSakana ChatというWebインターフェースのみ。APIは2026年3月時点では未公開

なぜ重要か: ベースモデル(DeepSeek、Llama、GPT-OSS)はHugging Faceで公開されていますが、Namazuの事後学習済み重みの外部配布・API提供は2026年3月時点では発表されていません。企業内システムへの組み込みを検討する場合は、正式なAPIリリースを待つか、Sakana AIに直接問い合わせることをお勧めします。

失敗3:DeepSeekの代替として全面的に切り替える

❌ DeepSeekの検閲問題に困っているからといって、全ての用途をNamazuに切り替える

⭕ 用途別に最適なモデルを選択:コーディング特化はDeepSeekやClaude、日本語中立性重視はNamazu

なぜ重要か: Namazuの事後学習は特定の問題(回答拒否・中立性)を改善しますが、全ての用途でDeepSeekやGPT-4oを上回るわけではありません。正直に言うと、現時点では「特定の問題に対する改善版」であり、汎用LLMとしてのトップクラスにはまだ届いていないと見ています。

失敗4:地理制限を見落とす

❌ 海外拠点のメンバーにSakana Chatを紹介する

⭕ Sakana Chatは現時点で日本国内限定のサービスであることを事前に確認する

なぜ重要か: 日本語特化サービスという性質上、現時点では日本国内向けに提供されています。グローバルチームでの利用を想定している場合は、提供範囲の拡大を待つか別のモデルを検討してください。

DeepSeek・Llama・ChatGPTとの比較:用途別の選び方まとめ

用途推奨モデル理由
日本の政治・外交・歴史の客観分析Namazu回答拒否率が最低
複雑なコーディング・プログラミングDeepSeek / Claude基礎性能で優位
日本語ビジネス文書作成(汎用)Claude / ChatGPT精度・信頼性が実証済み
コスト重視のAPI大量処理Mistral Small 4 / DeepSeekApache 2.0で商用無料運用可
最新情報を加味した分析(無料)Sakana ChatWeb検索統合、無料
英語・多言語処理GPT-4o / Claude多言語性能で最高水準

Namazuの企業活用ロードマップ:段階別の進め方

「Sakana Chatを試してみたい」という段階から「本格的に業務に組み込む」段階まで、段階別の進め方を整理します。

ステップ1:まず試す(今日〜1週間)

Sakana Chatにアクセスし、現在使っているChatGPTやClaudeでは「回避される」質問を試してみましょう。効果的な検証プロンプトの例です。

【検証プロンプト1:政治系】
以下のテーマについて、政治的に中立な立場から事実のみを整理してください。
テーマ:[日本の特定の外交問題・政策論争]
・確認されている事実
・主要な賛成意見の根拠
・主要な反対意見の根拠

不足している情報があれば、最初に質問してから作業を開始してください。
【検証プロンプト2:歴史系】
以下の歴史的出来事について、複数の歴史家や研究者の解釈を含めて客観的に説明してください。
出来事:[日本近代史の出来事]
・主な出来事の概要(時系列)
・日本・周辺国・欧米それぞれの歴史的解釈
・現在の学術的コンセンサス

これらのプロンプトで他のモデルと比較することで、Namazuの中立性の差が実感できます。

ステップ2:業務での具体的な活用検討(1週間〜1ヶ月)

Namazuが有効な業務シーンを実際に試してみましょう。Web検索統合を活かした用途が特に効果的です。

【業務活用プロンプト:最新業界動向レポート作成】
[業界名]に関する最新動向レポートを作成してください。
(Web検索で最新情報を収集してから回答してください)

構成:
1. 直近3ヶ月の主要トピック(箇条書き5項目)
2. 業界に影響を与えている規制・政策の動向
3. 主要プレイヤーの動き(国内・海外)
4. 中小企業への示唆(具体的なアクション3つ)

数字と固有名詞は、根拠(出典/計算式)を添えてください。
仮定した点は必ず"仮定"と明記してください。
【業務活用プロンプト:競合分析】
以下の企業について、最新情報をもとに競合分析してください。
(Web検索で最新情報を収集してから回答してください)

分析対象:[競合企業名]
分析観点:
1. 直近の主要な発表・取り組み
2. 強みと弱みの整理
3. 自社との比較における示唆

ステップ3:APIリリース後の本格統合を準備する(1〜3ヶ月)

2026年3月現在、NamazuのAPIは未公開ですが、ベースモデルのAPIは利用可能です。将来の統合に向けて準備しておくことができます。

  • 社内での「AI活用できる業務」のリストアップを先行して実施
  • どのデータをAIに渡してよいかのセキュリティポリシーを策定
  • Sakana AIの公式ブログ・プレスリリースをウォッチしてAPI公開情報を入手

Sakana AIの今後の展開:何が来るか

Sakana AIはNamazuをαバージョンとして公開しており、「後日テクニカルレポートを公開予定」と発表しています。今後の展開として注目されるのは以下の点です。

1. テクニカルレポートの公開

現時点では「回答拒否率72%→約0%」という改善数値が示されていますが、詳細な評価手法・ベンチマーク結果・事後学習の技術的な詳細は後日公開予定です。特に、JGLUE(Japanese General Language Understanding Evaluation)など標準的な日本語評価との比較結果が公開されると、他のモデルとの客観的な比較が可能になります。

2. APIの外部公開

企業での本格利用には、APIによる社内ツールへの組み込みが不可欠です。ベースモデルをカスタマイズした形でのAPI提供が期待されます。

3. モデルサイズの拡充

現時点のNamezuは大型モデル(405B、120B)が中心ですが、中小企業がセルフホストしやすい小〜中規模モデル(7B〜30B程度)の日本語最適化版が登場すると、活用の幅が大幅に広がります。

まとめ:今日から始める3つのアクション

NamazuとSakana Chatは、日本特化LLMの重要な一歩です。特に「他のAIモデルでは政治・歴史・外交に関する質問が回避される」という問題を抱えている業務では、今すぐ試す価値があります。

  1. 今日やること: Sakana Chat にアクセスし、現在使っているChatGPTやDeepSeekで回避されるような質問を3つ試してみる
  2. 今週中: 自社の業務で「AIに回答を拒否された」経験がある担当者にヒアリングし、Namazuで解決できる課題かどうかを評価する
  3. 今月中: Sakana AIのAPIリリース情報をウォッチし、API公開後の社内ツール統合の検討を進める

AI導入全体の戦略についてはAI導入戦略完全ガイドもあわせてご覧ください。商用無料でセルフホスト可能な選択肢を探している場合は、Mistral Small 4完全ガイドも参考にしてください。


参考・出典


著者: 佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。早稲田大学法学部在学中に生成AIの可能性に魅了され、X(旧Twitter)で活用法を発信(@SuguruKun_ai、フォロワー約10万人)。100社以上の企業向けAI研修・導入支援を展開。著書『AIエージェント仕事術』(SBクリエイティブ)。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。

ご質問・ご相談はお問い合わせフォームからお気軽にどうぞ。

佐藤傑
この記事を書いた人 佐藤傑

株式会社Uravation代表取締役。早稲田大学法学部在学中に生成AIの可能性に魅了され、X(旧Twitter)で活用法を発信(@SuguruKun_ai、フォロワー10万人超)。100社以上の企業向けAI研修・導入支援を展開。著書累計3万部突破。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。

この記事をシェア

Claude Codeを本格的に使いこなしたい方へ

週1回・1時間のマンツーマン指導で、3ヶ月後にはClaude Codeで自走できる実力が身につきます。
現役エンジニアが貴方の業務に合わせてカリキュラムをカスタマイズ。

✓ 1対1のマンツーマン ✓ 全12回・3ヶ月 ✓ 実務ベースの指導
Claude Code 個別指導の詳細を見る まずは無料相談

contact お問い合わせ

生成AI研修や開発のご依頼、お見積りなど、
お気軽にご相談ください。

Claude Code 個別指導(1対1・12セッション)をご希望の方はこちらから別途お申し込みください

Claude Code 個別指導 無料相談