このページの本文へ

さらなる高セキュア/低遅延/広帯域のクラウドネットワークを目指すオラクルの発表

巨大AIクラスタを実現するネットワーク技術、「Oracle Acceleron」とは?

2025年11月07日 19時30分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 前回のレポート記事でお伝えしたとおり、オラクルは10月に米国で開催した年次イベント「Oracle AI World 2025」で「AI changes everything.(AIがすべてを変える)」というキーメッセージを掲げ、多数のAI関連の新製品/新機能を発表した。

 その中でやや異色だったのが「Oracle Acceleron(アクセレロン)」の発表だ。オラクルの発表文によると、これはOracle Cloud Infrastructure(OCI)向けの新たなネットワークソフトウェア/アーキテクチャであり、AIというテーマとはあまり関係ないようにも思える。

 だが、このAcceleronは、規模拡大を続けるAIワークロードのインフラを支えるうえでも重要な役割を果たすようだ。同時に発表された、AIワークロード向けの巨大クラスタアーキテクチャ「OCI Zettascale10」においても、超低遅延/広帯域/セキュアなRDMAネットワークを実現する構成要素として、Acceleronの名前が挙がっている。

 本記事では、オラクルでCEOを務めるクレイ・マグワイク氏の基調講演における発言を中心に、Acceleronアーキテクチャの構成や特徴を説明する。

米オラクル・コーポーレーションCEOのクレイ・マグワイク(Cray Magouyrk)氏が「Oracle Acceleron」を発表した

Stargate Projectが米国で建設中のAIデータセンターキャンパス。Zettascale10は「半径2km以内の」データセンター間をRDMAネットワークで接続し、巨大なGPUクラスタを構成するという

Oracle Acceleronを構成する5つの特徴的な要素

 マグワイク氏は、Acceleronを開発した目的は「パフォーマンス、効率性、セキュリティという、OCIの重要なミッションに直接フォーカスするため」だと述べる。

 また、AIワークロード向けインフラに限られたものではなく、たとえばWebアプリケーション、ストリーミング配信なども含む、あらゆるタイプのワークロードにメリットを与えるものであり、コスト効率も向上させるという。

マグワイク氏の基調講演では、OCIを利用する顧客企業として、バイトダンス(TikTok)やOpenAIが登壇した

 具体的にはどのようなものなのか。マグワイク氏は、Acceleronは「すべての入力/出力をセキュアにし、高速化するための、ソフトウェアとアーキテクチャ」により構成されると語り、5つの特徴的な要素を紹介した。

●専用ネットワークファブリックアーキテクチャ:専用の高性能ファブリックを使用することで、トラフィックを明確に分離し、必要に応じて複数のファブリックをサポートする。どのようなスケールでも、予測可能な低遅延性、あるいは高スループットの接続を実現する。これにより、大規模なAIクラスタのほか、「Oracle Exadata」やHPCワークロードをサポートする。

●非仲介型設計:ホスト間をつなぐミドルボックス(スイッチなど)を排除したネットワーク設計とすることで、ボトルネックによる遅延を低減させつつ、効率性とセキュリティを高める。

 「われわれはこの課題に何年も取り組んできており、すでにOCIの多くの場所で導入されている。その結果、大幅に(ネットワーク機器にかかる)コストが削減できた。OCIにおけるネットワーク料金の価格優位性は、非仲介型設計に取り組んで来たからだ」

●コンバージドNIC:ホストに搭載する1つのスマートNIC上に、互いにパーティショニング(隔離)された「ユーザープレーン」と「プロバイダー(オラクル側)プレーン」を内包することで、スループットの向上とコスト削減を実現する。

 「従来のOCIでは、強固なセキュリティを優先して、ホストNIC(ユーザープレーン)と、オフボックスのスマートNIC(プロバイダープレーン)という2つのNICを用意し、両者間をEthernetケーブルを通じて接続していた。この場合、NICのコストが2倍かかるほか、スループット低下の原因にもなっていた」

 「新しいスマートNICでは、ユーザープレーン、プロバイダープレーンにそれぞれ専用のコアとメモリを割り当てつつ、間をつなぐ共有バッファを通じてネットワークパケットを処理する」

 また、従来のNICでは実現できなかったNVMe over TCPによるブロックストレージ接続の高速化、ラインレートでの通信暗号化、ベアメタルホストNICへのパッチ適用が可能になり、「パケットを二重に処理しないためスループットを2倍に向上できる」という。同時に、NICの個数が減ることで電力効率も改善される。

(左)従来のOCIで採用してきたNICの構成 (右)Acceleronで採用したスマートNICの構成(出典:オラクルブログ)

●Zero-Trust Packet Routing(ZPR):一昨年発表され、昨年からOCIへの実装を進めてきたZPRでは、機能強化が発表された。マグワイク氏は、OCIのオブジェクトストレージに保存されたデータに対するアクセスの許可/拒否を例に、そのポリシー設定が容易にできることを示した。

●マルチプレーンネットワーク:前出のユーザーNICを通じて、1台のホストを複数の独立したネットワークプレーンに接続させることで、特定のプレーンに障害が発生した場合でも、接続先プレーンの切り替えで迅速に回復させることができる。同時に、スループットの向上やテールレイテンシ(わずかに発生する異常遅延)の影響軽減にもつながり、クラスタの停止や再起動を回避するという。

 マグワイク氏は、通常、ホストを単一プレーンに接続する場合は単一障害点(SPOF)が発生する一方で、ホストを複数プレーンに接続すると構成が複雑になり、管理が難しく、高コストになっていたと説明。そこでAcceleronでは、ホストには単一プレーンのように見せながら、NICがトラフィックを複数プレーンに分散して転送する処理を行う。これにより、シンプルさを維持しながら可用性を向上させ、コスト削減を可能にしていると説明した。

マルチプレーンネットワークの模式図。NIC上の処理でトラフィックを複数のプレーンに分散し送信、受信したNICはそれを1つに再結合する(出典:オラクルブログ)

 これら5つの特徴的な要素を説明したのち、マグワイク氏は、Acceleronによって「大幅なピークパフォーマンスの向上」「インフラコストの削減(=サービスコストの低減)」「使いやすさと機能性の向上」「セキュリティ強化」といったメリットが享受できるとまとめた。

 なお、オラクル製品サイトのFAQによると、Oracle AcceleronはOCIのインフラへ段階的に導入され、将来的にはすべてのリージョンで利用できるようになるという。ユーザーは、Oracle Acceleron対応のコンピュートシェイプ(インスタンス)を選択することで、追加料金なしで利用できるとしている。

■関連サイト

カテゴリートップへ

  • 角川アスキー総合研究所