ホットチップはクールなARMを採用

ホット・チップは、ARMについて最初に期待されるものではありません。今年で26年目になる年次会議は、世界で最速のサーバの背後にある、電力を必要とする「ビッグアイアン」の報道で知られている名前のとおりです。対照的に、ARMはほぼすべての携帯電話とタブレットに搭載されている小型で低消費電力のチップの技術を提供しています。

今週初めにARMが今年の番組に浸透した度合いを知ることは面白かったです。両方の基調講演は、ARM CTOのMike Muller氏(センサーからサーバー、そしてクアルコムのRob Chandhok氏がInternet of Thingsで行ったもの)の電力制約に関するもので、2日間のアジェンダにはARMベースチップ。

これは、モバイルコンピューティングの重要性が高まっていることを一部反映しています。スマートフォンとタブレットの急速な成長は、すべての消費者やビジネス技術に大きな影響を与えました。しかし、これはまた、ARM技術が「スタックアップ」して、サーバやネットワーク、通信機器などの新しい分野でx86やその他のプラットフォームに挑戦し始めているという兆候です。

おそらく、Hot Chips社の最も大きなARMニュースは、NvidiaがDenverとして知られるカスタムコアを搭載したTegra K1モバイルプロセッサの次期バージョンに関するプレゼンテーションでした。 Xiaomi MiPadとAcer Chromebook 13のShieldタブレットで使用されている現在の32ビットTegra K1には、4つのCortex A15 CPUコアが搭載されています。 2番目のバージョンは、ARMv8 64ビット命令セットに基づいて2つのDenver CPUコアを備えています。両方とも192のCUDAコアを備えた同じKepler GPUを使用します。

NvidiaのCPUアーキテクチャーとプリンシパルアーキテクト担当ディレクター、Darrell Boggsは、DenverベースのTegra K1は、エントリーレベルのHaswell Coreプロセッサ(Celeron 2955U)の性能に匹敵し、クアルコムのSnapdragon 801、Apple A7とインテルのベイトレイルの原子。 (私は詳細については、デンバーの別の記事を書いた。)

Nvidiaは、Tegra K1の「デスクトップクラス」グラフィックスとデュアルイメージプロセッサーが、ゲームやビデオ処理などのモバイルデバイスに新しい機能をもたらし、自動車の高度なドライバーアシスタンスシステムのコンピュータビジョンを実現する方法についても話しました。 NividiaのTegraアーキテクチャー・マネージャーであるMichael Dittyは、2ビットTegra K1を搭載したXiaomi Mi Padがモバイルベンチマークの「最速の競合相手」よりも1.2〜1.6倍優れていることを示唆するテスト結果を示しました。

競合他社のAMDは、ARMも採用していますが、モバイルは受け入れていません。 Hot Chips社では、AMDが現在サンプリングしており、今年末にAMDのSeaMicroラインを含むサーバーで利用できるはずのコードネームのSeattleというOpteron A1100に関する新しい詳細を提供しました。シアトルは、GlobalFoundriesの28nmプロセスで製造された8つの64ビットCortex A57 CPUコア、4MBのL2キャッシュ、8MBのL3キャッシュ、最大128GBのDDR3用の2つのメモリチャネル、またはエラー訂正付きのDDR4メモリ、 O(8レーンのPCIe Gen3および6Gbps SATAおよび2つの10Gbpsイーサネットポート)、セキュアブート用のCortex A5「システム制御プロセッサ」、および暗号化および復号化のスピードアップ用のアクセラレータを備えています。

時には、最も深刻な解決策は、問題全体を変更することです。

AMDのエンジニア、ショーン・ホワイト氏は、特定の顧客向けに最適化されたセミカスタム版の製品を提供すると発表した。インテルやIBMのような製品も同様だ。残念ながら、AMDはOpteron A1100の周波数、消費電力、性能については詳細を述べていませんでした。なぜなら、「実際の製品発売からまだまだ短い間です。

AppliedMicroは、最初の64ビットARMサーバチップでAMDと他の多くの人たちを打ち負かすと主張しているが、X-Geneはまだ主要な公的設計優勝を達成していないため、幾分学術的だ(HPはタイヤを蹴ったが、そのProLiant Moonshotサーバーは依然としてAMD OpteronまたはIntel Atomsに依存しています)。

Hot Chips社でAppliedMicro社が初めてX-Geneの性能と機能をどのように強化するかについての詳細なロードマップを提供しました。短い答え:より多くのコアとより速い相互接続。 AppliedMicroの技術戦略担当バイスプレジデントであるGuarav Singh氏によると、Webサービスのホスティング、Web検索、NoSQLデータベース、およびWebサービスのホスティングなど、高帯域幅、低遅延ネットワーク上で数千の効率的な接続を持つシステムに適した、分析およびメディアサービスを提供します。

現在生産中のX-Gene 1(Storm)は、TSMCが40nmプロセスで製造し、8個の2.4GHz ARMv8コア、4個のDDR3メモリコントローラ、PCIe Gen3および6Gbps SATA、および10Gbps Ethernetを備えています。より進化した28nmプロセスで製造され、コアデザインが強化されたX-Gene 2(Shadowcat)は、現在サンプリングされています。 2.4〜2.8GHzの速度で動作する8つまたは16つのコアで利用できます。しかし、大きな変化は、RoCEホストチャネルアダプタの追加です。 RoCE、またはRDMA over Converged Ethernetは、標準のイーサネットハードウェアとソフトウェアでInfinibandのRDMAプロトコルのレイテンシを低減します。これは、数百または数千のマイクロサーバのクラスタのための重要なビルディングブロックです。

AppliedMicroは、低性能と低コストを両立する競合マイクロサーバ(Cavium ThunderX、Intel Atom C2000「Avoton」、AMD Opteron A1100「Seattle」)とXeon E5-2600 v2は、より高いパフォーマンスを提供しますが、より高い価格で提供されます。 (もちろん、インテルにもこのギャップを埋める独自のXeon E3ファミリがあり、AMDのARMサーバーには野心的なロードマップがある).X-Gene 1と比較して、8コアX-Gene 2は約60%同社によれば、整数パフォーマンス(SPECint 2006)、Memcachedのパフォーマンスの2倍、Apache Webサービスの約25%のパフォーマンス向上を実現しています。

1台のサーバラック(42U)のX-Gene 2サーバは、最大6,480スレッドと50TBのメモリ(ピーク帯域幅48TBps)を備えています。 Singh氏は、RoCEの相互接続のために、サーバーはローカルストレージのように見える単一のストレージプールを共有できるようになると語った。

第3世代のX-Geneは、FinFETとして知られている16nmの3Dトランジスタを初めて使用する予定です(現在のところ、インテルのみがこのタイプのトランジスタを使用していますが、競合するファウンドリは来年にはFinFETに移行する予定です)。 X-Gene 3(Skylark)は、最大3GHzで動作する16-64世代の第3世代のARMv8 CPUコア、第2世代のRoCEインターコネクトと新しいラック相互接続を備えています。 2015年にサンプリングされる予定です。

BYODポリシー、新しいタブレット購入チェックリスト、マイクロソフトの最新モバイルプラットフォームはビジネスフレンドリーな機能をもたらします;アップルデバイスの職場への流入の管理

プロセッサー、4K UHDを普及させるための第7世代プロセッサーの発売、プロセッサー、ビジョンとニューラルネットによるより強力なチップの需要の推進、データセンター、NVIDIAの仮想GPU監視、分析、ハードウェア、AMDのZen

最後に、ARMとAvagoは、ARMのCortex CPUコアとCoreLinkインターコネクトのメリットをネットワーク化するための共同プレゼンテーションを行いました。 CoreLink CCN-504に接続された16コアのCortex A15 CPUコアを搭載した28nm通信プロセッサのラインであるAvagoのAxxia 5500は、携帯基地局やその他のネットワーキング/通信機器向けに設計されています。 ARMベースのAxxiaラインはLSIによって開発されたもので、Avagoは5月に66億ドルを買収した。 ARMが新しい分野に進出しているのは興味深いですが、インテルがAxxiaビジネスを650万ドルで買収する計画を発表したこの週の後半に、ストーリーはさらに面白くなりました。

インテル、4K UHDを大衆に押しつける第7世代プロセッサを発表

ビジョンとニューラルネットがより強力なチップの需要を押し上げる

NVIDIA、仮想GPU監視、分析を開始

AMD、IntelとZenの優位性を打ち消す