ARM-Prozessoren

Neue CPU/GPU-Technologien in Tablet und Smartphone erklärt

Der Siegeszug der Smartphones und Tablets brachte auch einen gigantischen Aufschwung für ARM-Prozessoren mit sich. Wir werfen einen Blick hinter die Kulissen der extrem sparsamen SoCs und vor allem auf deren integrierte GPUs.

ARM Prozessoren

© Edelweiss - Fotolia.com

ARM Prozessoren

Die Abkürzung ARM steht für Advanced RISC Machines und bezeichnet ein Prozessordesign, das von der britischen Firma ARM entwickelt wurde. Im Prinzip begann die Entwicklung der ARM-Prozessoren bereits 1983, die Abkürzung stand damals aber noch für Acorn RISC Machine.

Der erste vollständig auf ARM-Architektur basierende Rechner war 1987 der Acorn Archimedes, der sich aber letztlich gegen die IBM-kompatiblen PCs nicht durchsetzen konnte. 1990 wurde schließlich die Firma ARM Limited als Joint Venture von Acorn, Apple und dem Prozessorhersteller VLSI gegründet, der die Fertigung der Prozessoren übernahm. Apple war mit von der Partie, da der Newton mit einer ARM-CPU ausgestattet war. Apple hält aber seit einigen Jahren keine Anteile mehr an der ARM Holding, so nennt sich die Firma heute.

ARM-Prozessoren wurden in den folgenden Jahren primär in Settop-Boxen und im Embedded-Bereich eingesetzt, 1998 ging ARM als Holding an die Börse. Die Firma stellt heute selbst keine Prozessoren mehr her, sondern ist ein reines Entwicklungsstudio, das Lizenzen an andere Hersteller vergibt, die damit Prozessoren auf Basis der ARM-Architektur bauen dürfen.

Dabei hat ARM verschiedene Lizenzmodelle im Angebot, das von Blaupausen für komplette Prozessoren oder Prozessorkomponenten bis hin zu IP-Lizenzen reicht, auf deren Basis die CPU-Hersteller eigenständige Designs entwickeln können. Das ist vor allem bei großen Prozessorherstellern wie Samsung, Qualcomm, Texas Instruments oder auch Apple der Fall.

Samsung Exynos 5 Octa Prozessor

© Hersteller

Der Exynos 5 Octa mit PowerVR-Grafik ist das neue Topmodell unter den Samsung-SoCs.

Prozessorbaukästen

Die ARM-Prozessoren in aktuellen Tablets oder Smartphones gehören alle zum SoC-Typ (System-ona-Chip), sind also hochintegrierte, kompakte und damit sparsame Bauteile, bei denen auf dem "Die" neben den CPU-Kernen mit dem Speichercontroller auch der Grafikprozessor (GPU), der Audioprozessor und Peripherieeinheiten wie die Schnittstellen zu Display und Touchscreen, der WLAN-Controller, ein GPSModul oder der USB-Controller untergebracht sind. Oft ist auch noch ein 3G- oder sogar LTE-Modul mit integriert.

Da diese ganzen Komponenten über genau definierte Bussysteme kommunizieren, können ARM-Prozessoren beim Design wie ein Bausatz aus verschiedenen Funktionsblöcken zusammengesetzt werden, die selbst entwickelt oder von Drittanbietern lizenziert sein können. So nutzt Samsung beispielsweise für die meisten ARM-Prozessoren der Exynos-Reihe bisher die Mali-GPUs von ARM, schwenkte aber beim Exynos 5 Octa auf eine PowerVR-GPU um; auch Apple nutzt in den eigenen ARM-Prozessoren eine PowerVR-Grafik.

Apples ARM-Prozessoren: Eigene Cores mit PowerVR-GPU

Bei den ersten drei iPhone-Generationen verwendete Apple noch Samsung-Prozessoren. Mit dem Erwerb von ARM-Lizenzen und vor allem der Übernahme des kalifornischen Prozessorherstellers P.A. Semi stieg Apple selbst in die Prozessorentwicklung ein. Der erste eigene Prozessor auf ARM-Basis war der A4, der im iPhone 4 und dem ersten iPad eingesetzt wurde. Samsung ist seitdem nur noch Lohnfertiger für Apple.

Aktuell ist Apple beim A6X als aktuellem Spitzenmodell unter den eigenen ARM-Prozessoren angelangt, er wird im aktuellen iPad der vierten Generation mit Retina-Display eingesetzt. Der in einem 32-Nanometer-Prozess hergestellte A6X ist ein von Apple selbst entwickelter Prozessor mit zwei CPUCores und einem PowerVR SGX 554MP4 als Grafikprozessor. Die PowerVR-Grafik im A6X besteht aus vier Kernen, im iPhone 5 arbeitet als Prozessor der A6 mit niedrigerer Taktfrequenz und der Triple-Core-Grafik SGX 553MP3.

iPad 4

© Hersteller

Eine schnelle PowerVR-GPU mit vier Cores sorgt im Apple-Prozessor A6X dafür, dass das iPad 4 trotz Retina-Display eine gute Grafikperfomance bietet.

Da Apple bei technischen Interna sehr verschlossen ist, kann über den Typ der ARM-Cores und die Taktfrequenz der Prozessoren nur spekuliert werden. Aber es ist anzunehmen, dass A6 und A6X höher getaktete und damit leistungsfähigere Varianten der Vorgänger A5 und A5X sind, die auf dem Cortex A9 von ARM basieren. Der höhere Takt wurde durch den Umstieg von 45- auf 32-Nanometer-Transistoren möglich. Die kleineren Transistoren können bei gleicher Kernspannung schneller schalten und erreichen so eine höhere Taktfrequenz.

Auch der A5 wurde inzwischen einem Die-Shrink auf 32 Nanometer unterzogen und kommt so bei gleicher Leistung mit weniger Strom aus. Er wird im iPad 2 und im iPad Mini eingesetzt. Als GPU dient hier ein PowerVR GSX 543MP2 mit zwei Kernen.

Die PowerVR-GPU in den Apple-Prozessoren ist ein später Nachfahre der PowerVR-Chips, die Ende der 90er-Jahre auf der damals allerdings erfolglosen PC-Grafikkarte Kyro II und der Sega-Konsole Dreamcast zu finden waren. Sie setzen das damals entwickelte Tile-based-Redering-Verfahren ein, das auch bei der schmalen Speicherbandbreite der stromsparenden ARM-Prozessoren für eine relativ hohe 3D-Leistung sorgt. Auch andere GPUs in ARM-Prozessoren setzen auf diese Technik.

Unter den GPUs für ARM-Prozessoren spielt der im Apple A6X eingesetzte Quadcore-PowerVR auf jeden Fall ganz vorne mit, wie die 17,2 fps beim OpenGLBenchmark GFXBench 2.7 (T-Rex HD Offscreen) belegen. Die PowerVR-GPUs der 5X-Serie unterstützen nur OpenGL ES 2.0, OpenGL 3.0 ES kommt erst mit den neuen GPUs der sechsten Generation.

Samsung Exynos: Von Mali zu PowerVR

Auf eine leistungsstarke PowerVR-GPU setzt auch Samsung beim neuen Exynos 5 Octa. In dem Octacore-SoC steckt als GPU ein SGX 544MP3 mit den Kernen. Das Samsung nutzt für die CPU-Cores bei diesem 8-Kern-Prozessor die von ARM entwickelte big.Little-Technik.

big.KLITTLE-Technik

© Hersteller

Samsung setzt bei dem Prozessor die big-LITTLE-Technik von ARM ein. Je nach Anwendung sind die schnellen Cortex-A15- oder die sparsamen A7-Cores aktiv. Die Umschaltung erfolgt automatisch.

Er besteht im Prinzip aus zwei Quadcore-Prozessoren: Der eine rechnet mit schnellen, aber hungrigen 1,8-GHz-A15-Kernen und ist für rechenintensive Anwendungen wie Spiele oder HD-Videos zuständig. Die Grundfunktionen des Betriebssystems und genügsame Apps laufen auf vier sparsamen A7-Kernen mit 1,2 GHz Taktfrequenz, um so eine ordentliche Akkulaufzeit zu ermöglichen.

Samsung Galaxy S4

© Hersteller

Samsung setzt in der deutschen LTE-Version des Galaxy S4 keinen Exynos-Prozessor ein, sondern den Snapdragon 600 von Qualcomm.

Um das alles auf einem Chip unterzubringen, der nicht zu groß ist, nutzt Samsung für die Produktion des Prozessors erstmals ein 28-Nanometer- statt des bisherigen 32-Nanometer-Verfahrens. Mit seinen schnellen A15-Cores und der PowerVR-Grafik dürften Geräte mit dem Exynos 5 Octa auch sehr gute Werte in 3DBenchmarks liefern. Ob es auch reicht, um Apple A6X, Qualcomm Snapdragon 800 oder Nvidia Tegra 4 abzuhängen, bleibt abzuwarten.

Testen kann man es derzeit noch nicht, denn das Galaxy S4 mit dem Exynos 5 Octa wird in Deutschland nicht angeboten, da dem Prozessor die hier gewünschte LTE-Unterstützung fehlt. Beim Exynos 5 Dual und den Exynos-4-Prozessoren mit zwei oder vier Kernen nutzt Samsung langsamere Mali-GPUs von ARM. Die Mali-GPU wurde ursprünglich von dem norwegischen Hersteller Falanx entwickelt, den ARM 2006 übernommen hat.

Nvidia Tegra 3 und Tegra 4: ARM-SoCs vom Grafikspezialisten

Toshiba Excite Pro

© Hersteller

Das Toshiba Excite Pro ist eines der ersten Android-Tablets mit dem Nvidia Tegra 4. Sein 10,1-Zoll-Screen liefert 2560x1600 Bildpunkte, daher braucht das Tablet einen schnellen Grafikprozessor.

Nvidia hatte mit dem ARM-Prozessor Tegra 3 vor allem Erfolg bei Android-Tablets, auch der Verkaufsschlager Nexus 7 basiert auf dem Nvidia-Prozessor. Allerdings ist der Ende 2011 vorgestellte Tegra 3 im Vergleich zu den Spitzenmodellen von Apple, Samsung und Qualcomm inzwischen nicht mehr konkurrenzfähig, auch bei der 3D-Leistung liegt der Tegra 3 nur noch im Mittelfeld.

Daher hat Nvidia mit dem Tegra 4 einen modernen Nachfolger vorgestellt, der nun mit vier Cortex-A15-Cores und bis zu 1,9 GHz rechnet und über eine deutlich stärkere GPU mit 72 Shadern verfügt, der Tegra 3 muss hier noch mit 12 Shadern auskommen.

Nvidia Tegra 4

© Hersteller

Unter dem Mikroskop kann man die 72 GPU-Kerne beim Nvidia Tegra 4 bewundern. Dazu kommen vier Cortex-A15-Cores und eine sparsame Zusatz-CPU.

Neben dem Tegra 4 bringt Nvidia auch noch einen Tegra 4i mit integriertem LTEModem, vier Cortex-A9-Cores und einer GPU mit nur 60 Shadern. Dieser deutlich kleinere Chip ist wohl primär für Smartphones bestimmt. Der "große" Tegra 4 kann auch mit einem LTE-Modem von Nvidia kombiniert werden, der dann allerdings als zusätzlicher Chip Platz auf der Hauptplatine belegt. Verwirrend: Nvidia bezeichnet dabei die Shader als Cores.

Im Vergleich zu den ARM-GPUs anderer Hersteller kann die Anzahl der GPU-Kerne aber nicht als Anhaltspunkt für die Leistung dienen, da sie sich in ihrer Architektur erheblich unterscheiden. Im Gegensatz zu den GeForce-Chips für Notebooks und PCs unterstützen die GPUs in den Tegra-SoCs nur OpenGL 2.0 für Embedded Systems. Bei der 3D-Performance spielt Nvidia mit dem Tegra 4 wieder in einer Liga mit den Top-ARM-Prozessoren von Apple, Samsung und Qualcomm.

Nvidia nutzt bei Tegra 3 und Tegra 4 zudem einen ähnlichen Trick wie Samsung mit dem Exynos 5 Octa, um eine längere Akkulaufzeit zu erreichen. Hierbei werden Aufgaben, die keine starke CPU erfordern, einem einzelnen sparsamen Companion-Core zugewiesen, der sie erledigt, während die vier leistungsstarken Cores komplett abgeschaltet sind. Der Tegra 4 wird bei TSMC in 28-Nanometer-Technik hergestellt, der Tegra 3 ist noch ein 40-Nanometer-Chip.

Qualcomm Snapdragon: Mit eigender Adreno-Grafik

Qualcomm setzt bei den ARM-Prozessoren der Snapdragon-Baureihe selbst entwickelte GPUs ein, die den Namen Adreno tragen. Beim Qualcomm-Spitzenmodell Snapdragon 800 mit vier Kernen dient die Adreno-330-Grafik als GPU. Sie bringt als erste ARM-GPU eine OpenGL-ES-3.0-Unterstützung, die laut Qualcomm auch von Unity3D genutzt werden wird, Unity3D ist die wichtigste Engine für mobile 3D-Games.

Aktuelle Benchmarks wie der GFXBench 2.7 oder der Futuremark 3DMark nutzen derzeit bei ARM-Geräten nur OpenGL ES 2.0. Trotzdem liegt die 3D-Leistung hier auf vergleichbarem Niveau wie beim Apple A6X oder beim Nvidia Tegra 4. Unter dem Snapdragon 800 ist der 600, der mit einer etwas langsameren Adreno-320-GPU ausgestattet ist, die aber ebenfalls OpenGL ES 3.0 unterstützt.

Sony Xperia Z Ultra

© Hersteller

Das Sony Xperia Z Ultra mit 6,4-Zoll-Display: Das Luxus-Phablet ist eines der ersten Geräte mit dem Qualcomm-Flaggschiff Snapdragon 800.

Als CPU-Bestandteil dienen bei Snapdragon 600 und 800 die eigenen Krait-Cores auf ARM-Basis mit vier Prozessorkernen. Beim 800 arbeiten sie mit 2,3 GHz und beim 600 mit 1,9 GHz Taktfrequenz. Zudem unterstützt der Snapdragon 800 im Gegensatz zum 600 auch USB 3.0, ein Novum bei ARM-Prozessoren. Qualcomm kommt bei den Snapdragon-Prozessoren im Gegensatz zum Samsung Exynos 5 Octa oder zum Nvidia Tegra 4 ohne zusätzliche Low-Power-Kerne aus. Stattdessen nutzt Qualcomm eine Technik mit der Bezeichnung Asynchronous Symmetric Multiprocessing, bei der die Frequenz der individuellen Kerne gedrosselt werden kann, um so bei weniger anspruchsvollen Anwendungen eine längere Akkulaufzeit zu erreichen.

ARM im Vergleich zu Intel-Mobil-Prozessoren

Man darf bei der Beurteilung der Leistung von ARMProzessoren nicht vergessen, dass sie auf eine niedrige Leistungsaufnahme getrimmt sind und daher Mobil-CPUs wie Intels Haswell nicht das Wasser reichen können. So ist ein Sony VAIO Duo 13 mit Core i7-4500U mindestens dreimal so schnell wie ein Apple iPad der vierten Generation. Allerdings sind Leistungsaufnahme und vor allem der Preis eines Core-Prozessors natürlich höher. Dem aktuellen Intel Atom Z2760 als direktem Konkurrenten sind die ARM-Top-Modelle klar überlegen. Intel will aber Anfang 2014 mit einer neuen Atom-Generation kontern.

RISC vs. CISC

Mitte der 90er-Jahre schien es so, als ob RISC-Prozessoren auch die Desktop-PCs erobern könnten. Das hat nicht geklappt. Dafür dominieren sie heute die Mobilgeräte.

RISC-CPU DEC Alpha

© Hersteller

Die RISC-CPU DEC Alpha lieferte 1997 eine Taktrate von bis zu 533 MHz.

ARM-Prozessoren tragen das Kürzel RISC bereits im Namen: ARM steht für Advanced RISC Machines und bezeichnet damit auch die Architektur dieser Prozessoren. Denn das Akronym RISC (Reduced Instruction Set Computer) bezeichnet Prozessoren, die

mit einem einfachen und fest verdrahteten Befehlssatz arbeiten im Gegensatz zu klassischen CISC-Prozessoren (Complex Instruction Set Computer), bei denen die Befehle als Microcode geladen werden.

Der Vorteil von RISC-Prozessoren lag in ihrer höheren Taktfrequenz. So konnte ein DEC Alpha in 1997 mit 533 MHz arbeiten, während ein Intel Pentium nur mit 233 MHz laufen konnte. Selbst von Windows NT gab es seinerzeit eine Version für den Alpha. In der Praxis ist der Unterschied aber seit dem Intel Pentium Pro aufgehoben. Alle Intel- und AMD-Prozessoren arbeiten seitdem intern als RISC-CPUs. Die x86-Instruktionen werden über einen vorgeschalteten Decoder in RISC-Befehle übersetzt. Damit kamen auch x86-CPUs auf höhere Taktraten. Apple hat der RISCArchitektur mit dem PowerPC immerhin noch bis 2006 die Treue gehalten.

Schnellerer Atom am Horizont

Silvermont-Atom

© Hersteller

Die Silvermont-Atoms kommen in verschiedenen Ausführungen: Als Merrifield für Smartphones wahrscheinlich mit PowerVR-Grafik und als Bay Trail-T mit HD-4000-GPU für Tablets.

Intel macht Druck : Die neuen Silvermont-Atoms sind nicht nur für schnellere und günstigere Windows-8-Tablets gedacht, sondern sollen ARM Konkurrenz machen.

Atom in 22-Nanometer-Technik: Mit der kommenden Silvermont-Generation der Atom-Prozessoren will Intel verstärkt im Tablet- und Smartphone-Markt Fuß fassen. In den neuen Intel SoCs stecken statt zwei bis zu vier Kerne und als GPU für Tablets die aus Ivy Bridge bekannte HD 4000 mit deutlich besserer 3D-Leistung als die bisherigen Modelle mit älterer PowerVR-Grafik. Die neuen Atoms werden in 22-nm-Technik hergestellt und sollen so auch sparsamer sein, als die aktuellen 32-Nanometer-Atoms. Sie sollen Anfang 2014 auf den Markt kommen.

Mehr zum Thema

So drucken Unternehmen
IT Strategien

Auch in diesem Jahr hat Dokulife Consulting & Research mit Unterstützung von Brother International die Printerumfrage vorgestellt. Das Thema:…
Leistungslücke zwischen Prozessoren und Speichersystemen
Speichertechnologie

Mit der steigenden Datenflut und den Fortschritten auf Prozessorseite können klassische Datenspeicher nicht mehr mithalten. Abhilfe schaffen…
IPv6: Wir verraten Ihnen alles zum neuen Internetprotokoll.
Neues Internetprotokoll

PC Magazin Professional erklärt, was sich durch das neue Internetprotokoll IPv6 verändert, und was gleich bleibt. So sehen die Änderungen unter…