Reprints from my posting to SAN-Tech Mailing List and ...

2011/07/09

[san-tech][02886] ARM with GPU (CEC 2011の NVIDIAとは違うお話)

Date: Wed, 12 Jan 2011 19:02:51 +0900
--------------------------------------------------
GPUと ARMと言えば、先日 (1/5) の CECでの NVIDIAの発表がありました

"【CES 2011レポート】NVIDIAカンファレンス編 
 ~GPU統合型ARMベースCPU「Project Denver」の開発を表明"
 2011年 1月 6日

"3.NVIDIAが高性能ARMプロセサの開発を表明"
 最近の話題 2011年1月8日, Ando's Processor Information Page

NVIDIAのプレスリリース等:
"NVIDIA、「Project Denver」を発表- パーソナル・コンピューターから
 スーパーコンピュータまでをターゲットに、ARMアーキテクチャ採用の
 カスタムCPUコアを開発"
 2011年1月5日
"NVIDIA Announces "Project Denver" to Build Custom CPU Cores Based
 on ARM Architecture, Targeting Personal Computers to Supercomputers"
 01/05/2011

"Project Denver" Processor to Usher in New Era of Computing"
 Bill Dally, Posted on Jan 5 2011 

調べてみたら ARMでは、既に GPUコアを提供してました (携帯電話等用です)。

例えば

"Mobile and embedded computing on Mali GPUs"
 Anton Lokhmotov, Media Processing Division, ARM
 2nd UK GPU Computing Conference
 December 13-14 2010

2nd UK GPU Computing Conference
 December 13-14 2010

※AMD, Intel, Microsoft等の発表資料が公開されています。個人的には:
"Directive-based programming for GPUs, accelerators and HPC"
 Alistair Hart (Cray)
※こういう流れもあるのですね・・・

上記 ARM発表資料に既存 GPU (6ページ) と、ARM-based (7ページ) の比較が
あります。
既存 GPUの場合、CPUのメインメモリと GPUローカルメモリに多くの時間が
さかれます。ターゲットによりますが、転送時間が処理全体の半分位要する
とはよく聞きます。このコンファレンスでの Mathworksの発表とか

"Accelerating Matlab with NVIDIA GPUs"
 Jos Martin (Mathworks)

姫野ベンチマークテストでも、データ転送に工夫をしてスコアを上げている
報告があります (すいません、ソースはちょっと忘れました)。


で、ARMの 7ページに戻りますが、この構成だと ARM CPUと GPUでメイン
メモリーの共有が実現しますが、この図には重要なパーツが抜けています。

実際には以下のような構成になるそうです (出荷は 2011年後半位?)
Mali-T604 (ARM製第五世代 GPU) は、MMU-400経由で全体の Cache Coherent
Interconnectと接続されています。MMU-400は、TLB搭載と共に ARMの仮想化に
対応していますので、CCI-400に接続されているメモリコントローラ:DMC-400
経由でメインメモリを共有出来ます (ARM A15論理メモリ空間とメインメモリ
の物理アドレスの変換は ARM A15で、Mali-T604の論理メモリ空間とメイン
メモリの物理アドレス MMU-400で変換)。

CoreLink System IP & Design Tools for AMBA
CoreLink System Controllers for AMBA

ARMの仮想化と System Memory Management Unit (SMMU: MMU-400) の解説:
"Virtualization is Coming to a Platform Near You"

  "To address this ARM is introducing the Virtualization Extensions
   to its ARM v7 architecture and the System Memory Management Unit
   (SMMU) Architecture. This paper examines the rationale behind this,
   and explores how SMMU will enable vast reductions in software costs
   and complexity, and at the same time aligning with the ARM's ethos
   of low power, high performance designs." (Page 1)

  "A System MMU is a hardware device designed to provide address
   translation services and protection functionalities to any DMA
   capable agent in the system other than the main CPU." ... "The SMMU
   can be implemented as a standalone device or integrated with an
   existing DMA capable processing unit." (Page 9)


AMBAは ARMによる on-chip communication仕様です。最新版は上記 AMBA 4ですが
Mali-T604のライセンス化は 2011年後半なようです。
AMBA Open Specifications
CoreLink Interconnect - AMBA on-chip connectivity
CoreLink Network Interconnect for AMBA AXI
※上記 2つは現行の AMBA 3系がメイン


Mali-T604 (GPU)
ARM Mali Developer Center
Mali Graphics Hardware
※ライブラリは OpenCLに対応


CoreLinkは組み込み用通信メカニズムなので、QoSを重視しています。
CoreLink Advanced Quality of Service
"QoS for High-Performance and Power-Efficient HD Multimedia
 April 2010
"Traffic Management for Optimizing Media-Intensive SoCs"


最新 ARMコア (出荷/ライセンス化はまだ)
Cortex-A15 Processor
  "full hardware virtualization, Large Physical Address Extensions (LPAE)
   addressing up to 1TB of memory as well as error correction capability
   for fault-tolerance and soft-fault recovery."

  "Hardware support for floating point operations in half-, single- and
   double-precision floating point arithmetic."
※Floating Pointについては "Specification" から

CoreLink 400 (AMBA 4系)プレスリリース:
"ARM Announces Corelink 400 System IP to Unleash High Performance CPU and
 GPU Systems", 10 November 2010


長々と書きましたが、
が実現されると、GPUの演算能力によりますが、これをディスクコントローラ
に採用すればディスク側の独立した CPUチップ搭載は不要になり:

重複データ処理やいろいろなアルゴリズが低消費電力で可能になるのかなぁ
と思ったりします。


ちなみに冒頭の NVIDIAのプレスリリースですが、本文には:

"同じく本日、発表された戦略的パートナーシップがありました。"
"This new processor stems from a strategic partnership, also announced
today,"

とありますが、NVIDIA、ARM両社ともパートナーシップついてのプレスリリース
はありません。個人的には、ARMコアだけでなく、CoreLinkライセンスも含まれ
ているのではと思います。
NVIDIAとしては、自社 GPUコアと MMU-400とのインタフェースを設計すれば、
ARMコア (ARM-15最大 8コア) との共有メモリシステムチップが構築できますね。


以下は参考です:

ARM関係者の Blog、特に GPU関連
"GPU Computing, the OpenCL debate and performance measurement"
 Jem Davies, ARM Fellow, 18 August 2010 

"CPUs Have Been Doing GPU Computing Badly for Years"
 Jem Davies, ARM Fellow, 03 November 2010 

"ARM Mali-T604: New GPU & Architecture For Highest Performance &
 Flexibility"
 Jem Davies, ARM Fellow, 10 November 2010
  The Background
  "Over 5 years ago, my boss asked me to go buy a graphics company to
   kick-start our entry into the graphics market which was clearly
   ready for ARM-quality IP."

"Embedded and Desktop - Similarities and Differences"
 Jem Davies, ARM Fellow, 11 November 2010

"Visual Computing Will Be Powered By ARM Mali Graphics"
 Ian Smythe, Director of Marketing - Media Processing Division, 
 15 November 2010

"Historical Look at the Makings of the Newest ARM Mali-T604 GPU"
 Edvard Sorgard, Consultant Graphics Architect, ARM
 17 November 2010 
  The initial dream: GPU chip company
  "To think it's over 10 years since we started tinkering with GPU
   design while still students at the Norwegian University of Science
   and Technology in Trondheim, it sure doesn't feel that long."
...
  Mali: GPU architecture and philosophy for embedded graphics
  "Years of hard work and a lot of brick-by-brick building later,
   our humble start-up was acquired by ARM and taken to the next level."

"ARM Strengthens Its 3D Graphics IP Portfolio Through Falanx Acquisition"
 23 June 2006

"ARM Mali-T604 GPU Ready for Post-32-bit World and Real Computing"
 Jem Davies, ARM Fellow, 08 December 2010
  "Just like the ARM Cortex-A15, it has its own MMU and it uses the
   same page table formats as the Cortex-A15. The MMU and page
   tables present external 40-bit addresses and are ready for
   a fully 64-bit world."
...
  ... "so Mali-T604 has native FP64 support" ...

ARM Community> ARM Blogs> Multimedia

ARM Information Center
※各種資料・仕様が大量に公開されています。


以下は YouTubeから:

"Meet the ARM Mali-T604"
 2010/11/10
"ARM Technology Conference 2010 - DAY 2 UPDATE"
 2010/11/10
※メインは ARM Mali-T604 GPU

"ARM Mali-T604 GPU -- Bringing Visual Computing To Life",
 2010/12/16
オフィシャルコマーシャルビデオ

"ARM Cortex-A15 MPcore processor"
 2010/09/08

ARMflix さんのチャンネル


"ARM Mali-T604, the next generation GPU for ARM Powered devices"
 2010/11/12
"ARM CoreLink 400 Series"
 2010/11/12


Date: Fri, 04 Feb 2011 21:36:33 +0900
--------------------------------------------------
ARM関連の記事です

"ARM Processors Set to Challenge x86 On Its Own Turf"
 February 02, 2011


以下はこの記事で引用

"Intel won't be dominant, ARM president says"
 Feb. 1, 2011


David Patterson教授が ARMの Blogに投稿

"RISC versus CISC Wars in the PrePC and PC Eras - Part 1"
 Posted by David Patterson
 18 January 2011
"RISC versus CISC Wars in the PostPC Eras - Part 2"
 Posted by David Patterson
 24 January 2011

  "This two-part blog gives a historical perspective on the ARM vs. 80x86
   instruction set competition for three eras: PrePC (late 1970s/early 
   1980s), PC (mid 1980s to mid 2000s), and PostPC (late 2000s onward)."
--------------------------------------------------
2011/07/09

"ARM Mali-T604 tips mobile graphics, computing, and IP trends"
 7/5/2011, EETimes
  http://www.eetimes.com/design/eda-design/4217557/ARM-Mali-T604-tips-mobile-graphics--computing--and-IP-trends
--------------------------------------------------
2011/07/29

"ARM、GPU戦略と今後のロードマップを紹介
 ~2012年にWindows 8向け製品が登場"
 2011年 7月 26日, PC Watch
  http://pc.watch.impress.co.jp/docs/news/20110726_463064.html

"ARMがGPUコアのロードマップを発表,消費電力が同じで500倍の処理能力の提供を
 目指す"
 2011/07/26, Tech-On!
  http://techon.nikkeibp.co.jp/article/NEWS/20110726/193673

0 件のコメント:

コメントを投稿