米エヌビディアが築く「AI王朝」、ソフト充実・GPU処理最適化
米エヌビディアはAI(人工知能)開発向けのソフトウエアを拡充した。AIが自律的に命令を処理する「AIエージェント」のような推論型AIにおいて、複数の画像処理半導体(GPU)を効率良く分散処理するソフトなどを発表。高性能なGPUと使い勝手の良いソフトをソリューションとして提供する。AI時代のデファクトスタンダード(事実上の標準)を維持し“王朝”を築く。(小林健人)
エヌビディアはデータセンター(DC)が大量のデータから価値を生み出す「AIファクトリー」構想を掲げる。具体的には大規模なデータ処理を少数のユーザーが行うAI処理の特性に合わせて、DCの計算や通信などを最適化していく構想だ。
重要になるのがGPUなどのハードウエアに加え、ソフトだ。特に推論型AIではユーザーのプロンプト(指示・質問)に直感的に回答するのではなく、プロンプトが意味する内容をAIが深掘りし、新たな問いを自ら立ててそれに答えるというプロセスを繰り返すことで、より優れた回答を生み出す。この際、AIモデルの入出力単位であるトークンが多く生成される。
エヌビディアが3月のAIカンファレンス「GTC2025」で発表したソフト「ダイナモ」は、AIモデルの処理フェーズと生成フェーズを異なるGPUに割り当て、特定のニーズに合わせてGPU処理を最適化して、生成するトークンを最大化する。同社によればダイナモにより処理を最適化すると、中国のAI企業ディープシークのAIモデル「R1」で生成されるトークン数はGPU一つ当たりの処理できる量が30倍以上に高まるという。
エヌビディアのジェンスン・フアン最高経営責任者(CEO)はGTCで、AIのスケーリング則は三つの局面で進むと強調した。AIトレーニングのスケーリング、トレーニング後のスケーリング、推論のスケーリングだ。特に複雑な推論型AIが普及するほど、膨大な計算力が必要になるのは間違いない。フアンCEOは「世界がこの1年、誤解していた。推論型AIが現時点で必要な計算量は、24年の今ごろに必要だと考えていた量の100倍をはるかに超えている」と話した。より複雑化するAIモデルに対し、ハードでは新型GPUを投入。ソフトで複雑な処理を最適化し、コスト性を向上させる。「AI王朝」の維持に余念がない。
【関連記事】 AIでコストの削減を支援する注目の企業