DeepSeekやGLM/Z.aiはなぜ安いのか？中国AIモデルの低価格戦略と蒸留の話

前回の記事では、中国のAI企業Z.aiが公開しているGLM-5.2について整理しました。GLM-5.2は、1Mトークンの長文コンテキストに対応したオープンウェイトモデルです。性能も高く、料金も米国系の高性能AIモデルと比べるとかなり抑えられています。

そうなると、自然に気になるのが次の疑問です。なぜDeepSeekやGLM/Z.aiのような中国AIモデルは、ここまで安く提供できるのでしょうか。

ChatGPT、Claude、GeminiのようなAIサービスに慣れていると、高性能なAIモデルは高いものだという感覚があります。ところがDeepSeekやGLM/Z.aiを見ると、かなり低い価格で大量のテキストを処理できるモデルが出てきています。

安いのは利用者にとってありがたい話です。ただ、あまりに安いと「裏で何か怪しいことをしているのでは？」と感じる人もいると思います。この疑問は自然です。AIに何かを入力する以上、データの扱いや利用規約を気にするのは大事ですし、個人情報、顧客情報、契約書、社外秘資料を外部AIにそのまま投げるのは、中国AIに限らず慎重になるべきです。

ただし、「中国AIは怪しいから安い」とだけ考えると、かなり大事な部分を見落とします。低価格の背景には、蒸留、MoE、推論効率化、長文処理の最適化、キャッシュ、中国国内の価格競争、オープンウェイト戦略など、いくつもの要素があります。

この記事では、そのあたりをAIに詳しくない人にも分かるように整理してみます。

まず、DeepSeekやGLM/Z.aiはどれくらい安いのか
蒸留とは、大きなモデルの知識を小さなモデルへ移す方法
DeepSeek-R1-DistillとOpenAIの蒸留疑惑は分けて考える
安さを支えるのは蒸留だけではない
MoEは巨大モデルを効率よく動かす仕組み
長文処理とキャッシュも料金に効いてくる
低コスト学習の話は、少し冷静に見る必要がある
中国国内の価格競争も安さを生んでいる
オープンウェイトは普及のための戦略でもある
中国AIは使っても大丈夫なのか
DeepSeekとGLM/Z.aiは同じではない
まとめ
FAQ
参考サイト

まず、DeepSeekやGLM/Z.aiはどれくらい安いのか

DeepSeekは低価格API、GLM/Z.aiは長文処理に強い高性能モデルとして価格競争力があることを示す比較イラスト

最初に、実際の価格感を見ておきます。AI APIの料金は変わりやすいので、2026年6月22日時点で確認した公開情報をもとにしています。いずれも100万トークンあたりの価格です。

モデル	通常入力	キャッシュ入力	出力
DeepSeek V4 Flash	$0.14	$0.0028	$0.28
DeepSeek V4 Pro	$0.435	$0.003625	$0.87
GLM-5.2	$1.40	$0.26	$4.40

特にDeepSeek V4 Flashの安さが目立ちます。記事の下書き、要約、分類、コード補助、ログ分析のように大量のテキストを処理する用途では、この差はかなり効いてきます。1回のチャットでは小さな差でも、何万回、何十万回と処理するなら話は変わります。

一方で、GLM-5.2はDeepSeek V4 Flashほどの激安モデルではありません。ただし、1Mトークンの長文コンテキスト対応、MITライセンスのオープンウェイト、長文処理の効率化を打ち出しているモデルとして見ると、価格面でも競争力があります。

つまり、DeepSeekとGLM/Z.aiは同じ「中国AI」として並べられることが多いですが、立ち位置は少し違います。DeepSeekは低価格APIのインパクトが強く、GLM-5.2は長文処理に強い高性能なオープンウェイトモデルとして存在感があります。

AIモデルの料金は、モデルを作るコスト、実際に動かすコスト、そして企業がどう売るかという価格戦略で決まります。DeepSeekやGLM/Z.aiの安さも、この3つを分けて見ると理解しやすくなります。

蒸留とは、大きなモデルの知識を小さなモデルへ移す方法

大きなAIモデルの出力を使って小さなAIモデルを育てる蒸留の仕組みを示すイラスト

中国AIの安さを語るときによく出てくる言葉が「蒸留」です。蒸留というと化学の話みたいですが、AIの世界では、大きなモデルの出力を使って小さなモデルを育てる方法を指します。

イメージとしては、大きな先生モデルが作った解答例を使って、生徒モデルを育てるようなものです。ゼロから全部を学ばせるより、すでに強いモデルの答え方を手がかりにしたほうが、効率よく性能を上げられる場合があります。

ただし、蒸留そのものが悪い技術というわけではありません。自社の大きなモデルを使って自社の小さなモデルを育てることは、AI開発では自然な手法です。問題になりやすいのは、他社の利用規約に反する形で、他社モデルの出力を大量に使って訓練した疑いがある場合です。

「蒸留」と「不正」は同じ意味ではありません。ここを混同すると、中国AIの話が一気に雑になります。

DeepSeek-R1-DistillとOpenAIの蒸留疑惑は分けて考える

DeepSeek-R1-Distillの公式公開とOpenAI側の蒸留疑惑報道を分けて考えることを示すイラスト

DeepSeekについては、蒸留の話をするときに事実と疑いを分けて考える必要があります。

まず、DeepSeekがDeepSeek-R1-Distill系のモデルを公式に公開していることは事実です。QwenやLlama系のモデルをベースに、DeepSeek-R1が生成した推論データでファインチューニングしたものとして説明されており、1.5B、7B、8B、14B、32B、70B級のモデルが公開されています。DeepSeekが自分たちの大きなモデルを先生として使い、小さなモデルに推論パターンを移した、という話です。

一方で、「DeepSeekはOpenAIを不正に蒸留した」と断定するのは、まったく別の話です。Reutersは2026年2月、OpenAIが米国の議員に対して、DeepSeekがOpenAIなど米国AI企業のモデルを蒸留に使った疑いがあると警告した、と報じています。ただし、これはOpenAI側の主張や疑いとして扱うべき話であり、公開情報だけで第三者が断定できるわけではありません。

DeepSeekが公式にR1-Distill系モデルを公開していることは事実です。OpenAIが問題視している蒸留疑惑は、あくまで報道されている疑いの段階として、分けて考える必要があります。

安さを支えるのは蒸留だけではない

蒸留は、小さなモデルを強くする近道になり得ます。ただ、DeepSeekやGLM/Z.aiの安さを「蒸留したから」で全部説明しようとすると、かなり大事なものを見落とします。

たとえばDeepSeek-V3は、671Bという巨大なパラメータを持ちながら、1回の処理でアクティブになるのは37B分だけという設計になっています。14.8兆トークンで事前学習され、Multi-head Latent AttentionやDeepSeekMoEといった効率化の仕組みも組み込まれています。最新のDeepSeek V4系でも、V4 Proは1.6T総パラメータに対してアクティブが49B、V4 Flashは284B総パラメータに対してアクティブが13Bです。どちらも1Mトークンのコンテキストに対応しています。

GLM-5.2も同じ方向で、Z.aiのGitHubでは「744B-A40B」、つまり総パラメータ744Bに対してアクティブが40Bと案内されています。

数字が並びましたが、伝えたいことはシンプルです。巨大なモデルを丸ごと動かすのではなく、必要な部分だけを動かす設計になっている。それがコストを下げる大きな理由のひとつです。単に他のモデルの答えをまねしたから安い、という話ではありません。モデルの設計、学習データ、推論エンジン、GPU運用、長文処理の最適化、API価格戦略が重なって、はじめて低価格が成り立ちます。蒸留はそのうちのひとつに過ぎません。

MoEは巨大モデルを効率よく動かす仕組み

MoEが巨大モデルの中から必要な専門家部分だけを使って推論コストを抑える仕組みを示すイラスト

DeepSeekやGLM/Z.aiの安さを考えるうえで、MoEも重要です。MoEはMixture of Expertsの略で、日本語にすると「専門家の混合」のような意味になります。

普通の巨大モデルでは、質問が来るたびにモデル全体を広く使います。一方MoEでは、モデルの中に複数の専門家のような部分を用意しておき、入力に応じて必要な部分だけを呼び出します。

巨大な倉庫の中から、必要な棚だけを開けるイメージです。倉庫全体は大きいけれど、毎回すべての棚を開けるわけではない。これによって、巨大モデルの表現力を持ちながら、推論時の計算量を抑えやすくなります。

ただし、MoEなら何でも安く簡単に動くわけではありません。モデル全体の重みを保持するメモリは必要ですし、GPU、通信、サーバー設計、推論エンジンの最適化も必要です。「MoEだから普通のMacでも楽に動く」という話ではなく、企業が大規模なサーバー上でAIを効率よく動かすための設計、と見たほうが自然です。

長文処理とキャッシュも料金に効いてくる

長文コンテキストとキャッシュ入力によってAIの処理コストを抑える仕組みを示すイラスト

最近のAIモデルでは、長い文章を扱えることが大きな売りになっています。GLM-5.2もDeepSeek V4も、1Mトークンのコンテキストを標準対応として打ち出しています。

ただ、長い文章を扱えるということは、それだけ計算量やメモリ消費が増えやすいということでもあります。100万トークン級の長文を毎回そのまま重く処理していたら、API料金はすぐ高くなります。

そこで重要になるのが、長文処理の効率化です。GLM-5.2では、IndexShareという仕組みによって長文処理時の計算量を抑える工夫が説明されており、MTP層の改善によって生成の効率も上げているとされています。DeepSeek V4でも、token-wise compressionやSparse Attentionによって、長文処理に必要な計算量とメモリを減らす方向の説明がされています。細かい仕組みまで理解しなくても大丈夫です。大事なのは、長文対応モデルほど裏側では「どうやって長文を安く処理するか」が重要になっている、ということです。

もうひとつ見逃せないのが、キャッシュ入力です。毎回同じ長い指示文、同じ仕様書、同じドキュメントを読み込ませる場合、全部を毎回フル料金で処理するとコストが膨らみます。同じ内容をキャッシュとして扱えると、繰り返し使う部分の料金をかなり抑えられます。DeepSeekもGLM-5.2も、キャッシュ入力は通常入力よりかなり安く設定されています。

1回のチャットではキャッシュのありがたみは分かりにくいかもしれません。でも、社内ドキュメントを前提に何度も質問する、同じコードベースを参照しながら修正する、同じ業務ルールを前提に大量処理する、といった使い方では、キャッシュの有無がコストに大きく効いてきます。

低コスト学習の話は、少し冷静に見る必要がある

DeepSeekが注目された理由のひとつに、「高性能モデルを低コストで作った」とされる話があります。DeepSeek-V3の技術報告では、2.788M H800 GPU時間で学習したことが説明されており、そこから「DeepSeekは数百万ドルで最先端級モデルを作った」という話が広まりました。

ただし、この数字は少し注意が必要です。ここで語られているのは、特定の学習工程に関するGPU時間の話です。会社全体の研究開発費、人件費、失敗した実験、データ整備、インフラ構築、過去モデルの開発費まで全部含めた総額ではありません。「DeepSeekは数百万ドルだけで全部作った」と言い切るのは危険です。

それでも、DeepSeekが限られた計算資源をどう使うかという工夫をモデル開発の中心に置いていることは確かです。ひたすら巨大な計算資源を積み上げるのではなく、設計と運用の工夫でコストを下げようとしている。この点がDeepSeekの大きな特徴です。

中国国内の価格競争も安さを生んでいる

ここまでは技術の話をしてきました。ただ、安さの理由は技術だけではありません。価格戦略もかなり大きいです。

中国では、Alibaba、Baidu、Tencent、ByteDance、Moonshot、MiniMax、Z.ai、DeepSeekなど、多くの企業がAIモデルやAIサービスを展開し、開発者や企業ユーザーを取り込むための激しい競争が起きています。Reutersは2024年5月、Alibaba CloudがTongyi Qwen系モデルの価格を最大97%引き下げ、BaiduもErnie SpeedやErnie Liteを企業ユーザー向けに無料化したと報じています。ByteDanceもDoubao系モデルの価格を大きく下げたとされています。

安く売ることで開発者に使ってもらい、企業のシステムに入り込み、クラウド利用や業務導入につなげる。AIモデルは一度アプリや業務フローに組み込まれると乗り換えが面倒になるので、最初の入口を安くしてシェアを取りに行く意味があります。

ただし、「赤字覚悟でやっている」と断定するのは難しいです。外から見えるのは、低価格でシェア獲得を狙っている可能性がある、というところまでです。

オープンウェイトは普及のための戦略でもある

DeepSeek-R1、DeepSeek-V3、DeepSeek V4、GLM-5.2は、いずれもオープンウェイトモデルとして公開されています。GLM-5.2はMITライセンスで案内されています。

オープンウェイトとは、モデルの重みを公開し、外部の開発者や企業が自分たちの環境で使えるようにする考え方です。公開すると、他の企業がそのモデルをホストしたり自社サーバーで動かしたりできるようになるため、APIだけで独占的に高い料金を取り続けるのは難しくなります。

では、なぜ公開するのでしょうか。大きな理由は普及です。開発者が試しやすくなり、研究者が評価しやすくなり、ベンチマークにも載りやすくなります。企業のPoCにも入りやすくなりますし、ツールやライブラリにも組み込まれやすくなります。

モデルそのものを高く売るというより、モデルを入口にして企業導入、クラウド提供、業務アプリ化につなげる戦略です。使われてこそ影響力が出る、という考え方です。

中国AIは使っても大丈夫なのか

ここまで見ると、DeepSeekやGLM/Z.aiの安さを「中国AIだから怪しい」とだけ見るのは、かなり単純化しすぎだと思います。安くできる技術があり、安く動かすための設計があり、長文処理を効率化する工夫があり、激しい価格競争があり、オープンウェイトで広げる戦略もある。

ただし、だからといって何でも安心して使えばよい、という話でもありません。

外部AIサービスに入れる情報は慎重に選ぶべきです。これは中国AIに限りません。ChatGPTでもClaudeでもGeminiでも、個人情報、顧客情報、契約書、社外秘資料、未公開の事業計画、APIキーやパスワードを入れるときは、利用規約やデータの扱いを確認する必要があります。

一方で、公開予定のブログ記事、一般的なコード、公開情報の要約、アイデア出し、FAQ作成のような用途であれば、安価なAIモデルを試す価値は十分あります。大事なのは「中国AIだから全部危険」と決めつけることではなく、自分が何を入力するのかを考えることです。どのAIサービスを使うときにも必要な感覚だと思います。

DeepSeekとGLM/Z.aiは同じではない

DeepSeekとGLM/Z.aiは、どちらも中国系AIモデルとして並べられることがあります。ただし、同じものではありません。

DeepSeekは低価格APIとオープンウェイトモデルで強い印象があり、特にDeepSeek V4 FlashはAPI料金の安さが目立ちます。DeepSeek-R1-Distill系のように、蒸留モデルの公開でも注目されました。

GLM/Z.aiは、GLM-5.2のような長文処理に強い大型MoEモデルを打ち出しています。1Mトークンのコンテキスト、MITライセンスのオープンウェイト、IndexShareなどの長文処理効率化が特徴です。

どちらも中国AIという大きなくくりでは似ていますが、DeepSeekは「かなり安いAPI」として目立ち、GLM-5.2は「長文処理に強い高性能なオープンウェイトモデル」として存在感がある、という見方ができます。

まとめ

DeepSeekやGLM/Z.aiが安い理由は、ひとことで説明できません。蒸留によって小さなモデルを強くする方法があります。MoEによって巨大モデルの必要な部分だけを使う設計があります。長文処理の効率化やキャッシュ入力によるコスト削減もあります。中国国内の激しい価格競争があり、オープンウェイトで普及を狙う戦略もあります。

結論としてはこうです。DeepSeekやGLM/Z.aiが安いのは、「怪しいから」だけではありません。MoEや長文処理の効率化のように安く動かす技術があり、低価格で広く使ってもらう戦略があります。さらにDeepSeek-R1-Distillのように、自社モデルを使った蒸留で小型モデルを強くする方法もあります。

ただし、安いから何でも使えばよいわけでもありません。公開情報やブログ記事、一般的なコードの相談には試す価値がありますが、個人情報や顧客情報、契約書、社外秘資料を入れるときは慎重になるべきです。

AIモデルそのものが低価格化していくなら、ChatGPT、Claude、Geminiのような米国系AI企業は、いったいどこで利益を出していくのでしょうか。この話は、次の記事で整理したいと思います。

FAQ

DeepSeekはなぜ安いのですか？

MoEによる効率的なモデル設計、長文処理を軽くする仕組み、キャッシュ入力の低価格化、オープンウェイト戦略、中国国内の価格競争などが重なっているためです。単に「中国AIだから怪しい」と見るより、技術と価格戦略の両方で見たほうが分かりやすいです。

GLM/Z.aiはなぜ安いのですか？

GLM-5.2はDeepSeek V4 Flashほどの激安モデルではありませんが、1Mトークンの長文コンテキスト、MITライセンスのオープンウェイト、IndexShareなどの長文処理効率化を打ち出しています。高性能な長文対応モデルとして見ると、価格面でもかなり競争力があります。

AIの蒸留とは何ですか？

大きなモデルの出力を使って、小さなモデルを育てる方法です。大きな先生モデルが作った答え方を学習材料にして、生徒モデルを訓練するようなイメージです。これにより、小さめのモデルでも高い性能を出しやすくなります。

DeepSeekは蒸留モデルを出しているのですか？

はい。DeepSeekは公式にDeepSeek-R1-Distill系のモデルを公開しています。DeepSeek-R1の出力を使って、QwenやLlama系の小型・中型モデルをファインチューニングしたものとして説明されています。

DeepSeekはOpenAIを蒸留したのですか？

公開情報だけで断定することはできません。Reutersは、OpenAIが米国の議員に対して、DeepSeekがOpenAIなど米国AI企業のモデルを蒸留に使った疑いがあると警告した、と報じています。ただし、これはOpenAI側の主張や疑いとして扱うべき話です。DeepSeekが公式に公開しているR1-Distill系モデルの話とは分けて考える必要があります。

MoEとは何ですか？

MoEはMixture of Expertsの略で、モデルの中に複数の専門家のような部分を持たせ、入力に応じて必要な部分だけを使う仕組みです。巨大なモデル全体を毎回すべて動かすのではなく、必要な部分だけを選んで使うことで、推論コストを抑えやすくなります。

中国AIは使っても大丈夫ですか？

用途によります。公開予定のブログ記事、一般的なコード、公開情報の要約、アイデア出し、FAQ作成などであれば試す価値はあります。一方で、個人情報、顧客情報、契約書、社外秘資料、APIキー、パスワードなどを入れるのは慎重に考えるべきです。これは中国AIに限らず、外部AIサービス全般に言えることです。

安いAIモデルだけで十分になりますか？

用途によっては十分な場面が増えています。要約、分類、下書き、コード補助、FAQ作成のような作業では、低価格モデルでもかなり役立ちます。ただし、難しい推論、信頼性が必要な業務、最新情報の確認、アプリ全体の使いやすさまで含めると、高価格帯のAIサービスにもまだ役割があります。

参考サイト

DeepSeek公式：Models & Pricing
https://api-docs.deepseek.com/quick_start/pricing
閲覧日：2026年6月22日

DeepSeek公式：DeepSeek V4 Preview Release
https://api-docs.deepseek.com/news/news260424
閲覧日：2026年6月22日

DeepSeek公式：Introducing DeepSeek-V3
https://api-docs.deepseek.com/news/news1226
閲覧日：2026年6月22日

Hugging Face：DeepSeek-R1
https://huggingface.co/deepseek-ai/DeepSeek-R1
閲覧日：2026年6月22日

Hugging Face：DeepSeek-V4-Pro
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro
閲覧日：2026年6月22日

Z.ai Developer Document：Pricing
https://docs.z.ai/guides/overview/pricing
閲覧日：2026年6月22日

Hugging Face：zai-org/GLM-5.2
https://huggingface.co/zai-org/GLM-5.2
閲覧日：2026年6月22日

Z.ai：GLM-5.2: Built for Long-Horizon Tasks
https://z.ai/blog/glm-5.2
閲覧日：2026年6月22日

GitHub：zai-org/GLM-5
https://github.com/zai-org/GLM-5
閲覧日：2026年6月22日

Reuters：Chinese tech giants slash prices of language models used to power AI chatbots
https://www.reuters.com/technology/chinese-tech-giants-slash-prices-language-models-used-power-ai-chatbots-2024-05-21/
閲覧日：2026年6月22日

Reuters：OpenAI says China’s DeepSeek trained its AI by distilling US models, memo shows
https://www.reuters.com/world/china/openai-accuses-deepseek-distilling-us-models-gain-advantage-bloomberg-news-2026-02-12/
閲覧日：2026年6月22日

arXiv：DeepSeek-V3 Technical Report
https://arxiv.org/abs/2412.19437
閲覧日：2026年6月22日