AIは「空の読み方」を変えるか――気象予測モデルの静かなパラダイムシフト

問いの提起

2025年の台風シーズン、ある変化が起きていた。

気象庁が発表する進路予報円の横に、民間気象会社が独自のAIモデルで算出した予測トラックが並ぶようになったのだ。SNS上では「どちらを信じればいいのか」という声が飛び交った。正直なところ、私自身も同じ疑問を抱いた。

GoogleのGraphCast、NVIDIAのEarth-2、HuaweiのPangu-Weather。ここ数年、テック大手が相次いで気象予測AIを発表している。いずれも従来の数値予報モデル（NWP：物理方程式をスーパーコンピュータで解く手法）とはまったく異なるアプローチをとる。過去40年分の大気データからパターンを学び取り、未来の天気を「推論」するという方法だ。

しかも速い。NWPが数時間かけて回す計算を、AIはわずか数分で終わらせる。欧州中期予報センター（ECMWF）が2023年に公開した検証では、GraphCastが中期予報（5〜10日先）の精度で同センターのENSモデルを上回る指標を複数記録した（Lam et al., Science, 2023）。

ここで一つ、問いを立ててみたい。

「予測が速く、精度も高い」——それだけで、私たちはAI気象予測を信頼してよいのだろうか。

もう少し掘り下げて考えてみる。天気予報は単なる情報提供ではない。避難勧告の発令、物流の停止判断、電力供給の調整。人命とインフラに直結する意思決定の根拠となるものだ。つまり「当たるかどうか」だけでなく、「なぜその予測になったのかを説明できるか」が問われる領域でもある。

見落とされているのは、この点だ。AIモデルの多くは深層学習ベースのブラックボックスである。物理方程式に基づくNWPなら、予報が外れた原因を方程式の初期値や解像度に遡って検証できる。一方、AIモデルが「なぜ台風を右に曲げたのか」を人間が理解するのは極めて難しい。

速さと精度の革新。その裏にある説明可能性の欠如。この二つの間に横たわる溝を、私たちはどう受け止めるべきなのか。技術への期待と、社会が求める信頼性のあいだで、AI気象予測はいま岐路に立っている。

視点1：肯定的見方

まず、数字を見てほしい。

GraphCastは10日先の大気の状態を予測するのに、わずか60秒しかかからない。ECMWFの従来型NWPモデル（HRES）が同じ計算をこなすには、数百ノードのスーパーコンピュータで約8時間を要する（Lam et al., Science, 2023）。計算コストの差は数千倍にのぼる。

この速度差が意味するものは、単なる効率化ではない。「誰が天気を予測できるか」の門戸が大きく広がるということだ。

従来、高精度な気象予測は国家機関や巨大研究センターの独占領域だった。スーパーコンピュータを持つ組織だけがアクセスできる、いわば特権的な知識。しかしAIモデルはGPU1基でも動く。実際、GraphCastの学習済みモデルはGitHub上でオープンソースとして公開されている。自治体や中小の気象ベンチャーが、自前の予測を回せる時代が来つつある。

ここで一つ、社会学者・東浩紀の議論を借りたい。東は著書『一般意志2.0』の中で、情報技術が専門家の閉じた意思決定を市民に開放する可能性を論じた。AI気象予測にも同じ力学が働いている。予測の民主化、とでも呼ぶべき動きだ。

精度の面でも、肯定材料は多い。

HuaweiのPangu-Weatherは、2023年の西太平洋における台風進路予測でECMWFのENSモデルと同等以上のトラック精度を達成した（Bi et al., Nature, 2023）。特に注目すべきは、72時間先の進路予測誤差が平均で約15%改善された点だ。72時間といえば、自治体が避難準備情報を出すかどうかを判断するタイミングにあたる。この時間帯での精度向上は、防災上きわめて大きい。

NVIDIAのEarth-2も見逃せない。同社はデジタルツイン技術（地球全体を仮想空間に再現する技術）を活用し、複数のAIモデルを同時に走らせるアンサンブル予測を提案している。1回の計算が軽いからこそ、100通り、1000通りのシナリオを一度に生成できる。結果として、「台風がどの経路をたどる可能性が何%あるか」という確率分布を、従来よりはるかに細かく描き出せるようになった。

正直、これは大きな前進だと思う。

従来のアンサンブル予測は計算コストの制約から50メンバー程度が上限だった。AIモデルなら、その20倍のシナリオを同じ時間内に走らせられる。不確実性の「幅」が見えるようになるということは、意思決定者が最悪ケースと最善ケースの両方を把握した上で判断できるということだ。避難勧告を早く出しすぎて空振りになるリスクと、遅すぎて被害が拡大するリスク。その綱引きに、より精緻な確率情報を持ち込める。

計算コストの劇的削減。予測精度の向上。そして予測能力の民主化。

AI気象予測を肯定する論理は、この三つの柱で成り立っている。技術の恩恵が一部の専門機関から社会全体へと広がる。その未来図は、確かに魅力的だ。

だが、本当にそうだろうか？話はそう単純ではない。

視点2：批判的見方

速さと精度。その二つだけで技術を評価してよいのか。

もう少し掘り下げて考えてみる。AI気象モデルが抱える根本的な弱点は、「極端現象への対応力」にある。GraphCastもPangu-Weatherも、過去の再解析データ（ERA5）を教師データとして学習している。ERA5はECMWFが過去約40年分の観測データを再処理して作った大気の記録だ。つまり、AIが学んでいるのは「過去に起きたことのあるパターン」に限られる。

ここで一つ、問いを立ててみたい。過去に例のない気象現象を、過去のパターンだけで予測できるのだろうか。

実は、この懸念はすでに現実のものとなっている。2024年、GraphCastの開発チーム自身が論文の中で、急速に発達する爆弾低気圧や記録的な降水イベントに対してモデルの予測値が「平均回帰」する傾向を認めている（Lam et al., Science, 2023の補足資料）。平均回帰とは、極端な値を出すべき場面で予測が穏やかな方向に引っ張られる現象だ。要するに、最も危険な状況で予測が甘くなる。

防災の文脈で、これは致命的な欠陥となりうる。

避難勧告を出すかどうかの判断は、最悪ケースの想定に基づく。「風速60メートルの可能性がある」と「風速45メートル程度だろう」では、自治体の対応がまったく変わる。AIモデルが極端値を過小評価する傾向を持つなら、それは人命に関わるバイアスだ。

もう一つ、見落とされているのは、この点だ。説明可能性の問題。

NWP（数値予報モデル）は、大気の運動方程式・熱力学方程式・水蒸気の相変化といった物理法則に基づいて計算を進める。予測が外れたとき、「初期値のここが不正確だった」「解像度が足りず地形の影響を捉えられなかった」と原因を特定できる。予報官はその検証を積み重ねて、次の予測に人間の判断を加える。

一方、深層学習モデルはグラフニューラルネットワーク（データ間の関係性を網目状に学習するAI手法）の数億個のパラメータが出力を決める。台風の進路を北寄りに予測した理由を、誰も説明できない。正直、これは「信頼」の土台を揺るがす問題だと思う。

気象庁が2025年度の「数値予報開発センター年報」で述べた方針は示唆的だ。同庁はAI気象モデルを「参考情報」として位置づけつつ、公式予報にはNWPベースのモデルを引き続き使用するとしている。理由は明快で、「予報の根拠を国民に説明する責任がある」からだ。

技術的な精度と、社会制度としての信頼性。この二つは別物である。

計算コストが安いからこそ、誰でも予測を出せるようになる。だが裏を返せば、検証されていない予測が乱立するリスクでもある。2025年の台風シーズンにSNSで飛び交った複数の予測トラックは、まさにその混乱の予兆だった。

速さは武器になる。精度も向上している。しかし、その予測を社会の意思決定にどう組み込むかという制度設計は、技術の進歩にまったく追いついていない。AIモデルが出した数字を、誰が、どの権限で、どう使うのか。その問いに答えられない限り、技術の革新は宙に浮いたままだ。

読者と共に思索する

肯定と批判。どちらの論理にも、確かな根拠がある。

AI気象予測は速く、安く、精度も高い。一方で、極端現象に弱く、判断の根拠を説明できない。この二つの事実は矛盾しない。同じ技術の表と裏だ。

ここで一つ、問いを立ててみたい。私たちは「完璧な予測」を待つべきなのだろうか。

実は、従来のNWPモデルも万能ではない。気象庁の台風進路予報の72時間先平均誤差は、2024年時点で約150km前後とされる（気象庁「台風予報の精度検証」）。これはここ10年で着実に改善されてきたが、それでも150kmという幅は、ある沿岸都市に直撃するか、沖合を通過するかの違いを生む距離だ。つまり、NWPもまた「不完全な予測」である。

問題の核心は、不完全さの性質が異なるという点にある。

NWPの不完全さは、計算資源と観測網の限界から来る。原因が特定でき、改善の方向も見える。AIモデルの不完全さは、学習データの偏りとブラックボックス性から来る。原因の特定が難しく、改善の道筋も不透明。同じ「外れる」でも、外れ方の質がまったく違う。

正直、ここに簡単な答えはないと思う。

だが、もう少し掘り下げて考えてみる。実際の防災現場では、すでに「どちらか一方を選ぶ」という発想自体が古くなりつつある。ECMWFは2024年、自前のAIモデル「AIFS（Artificial Intelligence Forecasting System）」を開発し、NWPとの併用運用を開始した（ECMWF公式ブログ, 2024年3月）。AIモデルの出力をNWPの初期値補正に使う。あるいはNWPの物理的制約をAIモデルに組み込む。ハイブリッドという選択肢。

ただ、技術的な統合だけで問題は解決しない。見落とされているのは、この点だ。AIモデルが出す確率情報を「受け取る側」の準備が整っていないという事実である。

たとえば、「台風直撃の確率35%」という情報を、自治体の防災担当者はどう扱うべきか。避難勧告を出すのか、出さないのか。35%は高いのか、低いのか。その判断基準は、技術者ではなく、現場の人間と住民が決めるものだ。

読者諸氏はどう感じるだろうか。

AIが1000通りのシナリオを数分で描き出す未来。それは確かに強力な武器だ。しかし、1000通りの可能性を前にして、避難するかしないかを決めるのは、結局一人ひとりの人間である。技術が提供するのは「材料」であり、「判断」ではない。

問いはこうなる。私たちが本当に必要としているのは、より正確な予測なのか。それとも、不確実な予測を受け止めて行動できる社会の仕組みなのか。

AIの進化が突きつけているのは、技術の問題ではなく、私たち自身の問題だ。

開かれた結論

答えを出すつもりはない。

ここまで見てきたように、AI気象予測は「速さ・精度・コスト」の三点で従来のNWPを凌駕しうる力を持っている。同時に、極端現象への脆弱性と説明可能性の欠如という、防災の根幹に関わる弱点も抱えている。どちらか一方だけを見て結論を急ぐのは、誠実な態度ではないだろう。

ここで一つ、問いを立ててみたい。私たちは技術に「正解」を求めすぎてはいないか。

正直、気象予測は本質的に不確実なものだ。大気はカオス系（わずかな初期条件の違いが結果を大きく変える系）であり、完全な予測は原理的に不可能とされている。NWPもAIも、その不確実性と向き合うための道具にすぎない。道具が変わっても、不確実性そのものは消えない。

変わるべきは、むしろ道具を使う側かもしれない。

AIが1000通りの未来を描き出す時代に、「当たるか外れるか」の二択で予報を評価し続けるのは、もう限界がある。確率で示された幅のある情報を、行政も住民も受け止め、判断に変換する力。それを社会全体で鍛えていく必要がある。

技術の進化と、社会の受容力。この二つが噛み合ったとき、AI気象予測は初めて「信頼できる防災インフラ」になりうる。そう考えることもできる。

ただし、それがいつ、どのような形で実現するかは、まだ誰にもわからない。技術者だけの問題でもなく、行政だけの問題でもない。天気予報を毎朝確認する、私たち一人ひとりの問題だ。

開かれたままの問い。それを抱え続けること自体が、この技術と向き合う出発点になる。