Die AMD x86 Open64 Compiler Suite ist ein leistungsstarker, Produktionsqualität Codegenerierung Werkzeug für High Performance Parallel-Computing-Workloads konzipiert. & Nbsp; Die x86 Open64 Umgebung bietet dem Entwickler die wesentlichen Entscheidungen bei der Erstellung und Optimierung von C, C ++ und Fortran-Anwendungen Targeting-32-Bit und 64-Bit-Linux-Plattformen.
Die x86 Open64 Compilersystem bietet ein hohes Niveau der fortgeschrittenen Optimierungen, Multi-Threading und Prozessor-Unterstützung, die globale Optimierung, Vektorisierung, interprozeduralen Analyse, Feedback gerichteten Optimierungen, Schleifentransformationen und Code-Generierung, die die optimale Leistung aus jedem x86-Prozessorkern-Extrakte enthält .
Die x86 Open64 Compiler Suite vereinfacht und beschleunigt die Entwicklung und Tuning für x86, AMD64 (AMD & reg; x86-64 Architektur), und Intel64 (Intel & reg; x86-64 Architektur) Anwendungen. Die x86 Open64 Compiler eine starke Grundlage für den Aufbau robuster, leistungsstarker Parallelprogramme über MPI, OpenMP und Ausrichtung ;, und Auto-Parallelisierung mit hoch optimierten Bibliotheken *
Eigenschaften .
- Sprache Standards:
- ANSI C99, ISO C ++ 98
- Entspricht den ISO / IEC 9899: 1999, Programmiersprachen - C Standard
- Entspricht der ISO / IEC 14882: 1998 (E), Programmiersprachen - C ++ Standard
- Fortran 77, 90, 95
- Entspricht den ISO / IEC 1539-1: 1997 Programmiersprachen - Fortran
- Inter-Aufruf-
- IEEE 754 Floating-Point-Unterstützung
- Pragmas steuern Optimierungen
- Platform Highlights:
- x86 32-Bit und x86 64-Bit-Code-Erzeugung
- Große Unterstützung auf 32-Bit-Systeme
- Byte-Swapping I / O
- Vector und skalare SSE / SSE2 / SSE3 Codegenerierung
- OpenMP 2.5 für Shared-Memory-Modelle
- MPICH2 für verteilte und Shared-Memory-Modelle
- Optimierte AMD-Core Math Library (ACML)
- Optimization Höhepunkte
- Globale Optimierungen, z.
- Teilredundanzbeseitigung
- Constant Propagation und Code-Bewegung
- Strength Reduktion und Vereinfachung Ausdruck
- Beseitigung von totem Code und gemeinsamen Unterausdruck Beseitigung
- Schleif Nest Optimierungen, zB (mit '-O3' aktiviert ist)
- Loopfusion und Verteilung
- Loop-Austausch und die Cache-Ort-Optimierung
- Vektorisierung für SSE * Code-Erzeugung
- Software Daten Prefetching
- Code-Erzeugung und Optimierungen, z.
- Erweitert Registerzuweisung
- Schleifenabwicklung
- Instruction Auswahl und Planung
- Peephole Optimierungen
- Feedback gerichtete Optimierungen (mit '-fb_create / -fb_opt "aktiviert), zB
- Layout-Code
- Feedback gerichteten Inlinefunktionen und de-Virtualisierung
- Feedback-geführte Register verschüttet
- Wert Spezialisierung
- Inter-Prozessanalyse und -optimierung (mit '-ipa "aktiviert), zB
- Function Inlining und Klonen
- Inter-Verfahrensanalyse alias
- Datenwieder Layout-Optimierungen für Strukturelemente
- Inter-Verfahrens konstanten Vermehrung und Beseitigung von totem Code
Was ist neu in dieser Pressemitteilung:
- Diese Version enthält neue Performance-Optimierungen, die Unterstützung von der Familie AMD 15h, bessere Gebäude von der Quelle, und viele Bugfixes.
Was ist neu in Version 4.2.4:
- Verbesserte Funktion inlining Heuristiken und verbesserte Inline-Erweiterung der Bibliothek Funktionen
- Verbesserte Rahmenbedingungen für Multi-Versionierung
- Verbesserte Induktions Ausdruck Vereinfachung und wenn-Zusammenführung Optimierung
- Verbesserte Code-Generierung für den Operator%
- Verbesserte interprozeduralen Analyse für indirekte Funktionsaufrufe, virtuelle Funktionen und Funktionen mit & quot; noreturn & quot; Attribut.
- Optimierte Ausnahmebehandlung
- Optimierung der Verarbeitung von Fortran 90 temporären Arrays
- Verbesserte Prozessoraffinität Zuordnung in der OpenMP und parallel-Laufzeitbibliothek
- Unterstützung für 1 GB großen Seiten
- Vereinfachte Gleitkomma-Optionen
- long double als 80-Bit-IEEE doppelter Genauigkeit umgesetzt
- Eigen hinzugefügt -ffastmath
- Fortran ISO_C_BINDING Modul
- Bug-Fixes in vielen Bereichen, einschließlich:
- GCC Kompatibilität
- Huge Seite Unterstützung
- Fortran Unterstützung
- OpenMP
- Gebäude von der Quelle
- Erweiterte Plattform-Unterstützung, einschließlich RHEL 5.5 und SLES11 SP1
Was ist neu in Version 4.2.4:
- Verbesserte Funktion inlining Heuristiken und verbesserte Inline-Erweiterung der Bibliothek Funktionen
- Verbesserte Rahmenbedingungen für Multi-Versionierung
- Verbesserte Induktions Ausdruck Vereinfachung und wenn-Zusammenführung Optimierung
- Verbesserte Code-Generierung für den Operator%
- Verbesserte interprozeduralen Analyse für indirekte Funktionsaufrufe, virtuelle Funktionen und Funktionen mit & quot; noreturn & quot; Attribut.
- Optimierte Ausnahmebehandlung
- Optimierung der Verarbeitung von Fortran 90 temporären Arrays
- Verbesserte Prozessoraffinität Zuordnung in der OpenMP und parallel-Laufzeitbibliothek
- Unterstützung für 1 GB großen Seiten
- Vereinfachte Gleitkomma-Optionen
- long double als 80-Bit-IEEE doppelter Genauigkeit umgesetzt
- Eigen hinzugefügt -ffastmath
- Fortran ISO_C_BINDING Modul
- Bug-Fixes in vielen Bereichen, einschließlich:
- GCC Kompatibilität
- Huge Seite Unterstützung
- Fortran Unterstützung
- OpenMP
- Gebäude von der Quelle
- Erweiterte Plattform-Unterstützung, einschließlich RHEL 5.5 und SLES11 SP1
Was ist neu in Version 4.2.3:
- Verbesserte interprozeduralen Analyse zu Strukturfeld Kopie Optimierung umfassen und Array Remapping-Optimierung.
- Verbesserte Schleifenoptimierungen. Schleifenabwicklung, Abrollen von Schleifen und Marmelade, dreieckige Schleifen, proaktive Schleife Austausch, Schleifenverteilung, Schleife Peeling
- Verbesserte Redundanzbeseitigung Optimierungen für Geschäfte und Speicher-Initialisierung; bessere Integration der Reassoziation und gemeinsamen Unterausdruck Beseitigung; verstärkte Expression Faktorisierung.
- Verbesserte Befehlsauswahl und Adressierung der Codegenerierung.
- Verbesserte Vektorisierung.
- Erweiterte Prefetching auf Arrays mit induktiver Basisadressen enthalten.
- Verbesserte Schleife Multiversionierung.
- Verbesserte OpenMP und Auto-Parallelisierung Codegenerierung.
- Verbesserte Abstimmung von OpenMP und parallel zur Laufzeit-Bibliotheksfunktionen.
- Eingeführt aggressive Optimierungen zur Verbesserung der Skalierbarkeit / Bandbreitennutzung von Multicore-Prozessoren. (Wird aufgerufen, indem Sie den neuen & quot; -mso & quot;. Flag)
- Verbesserte gcc-Kompatibilität, einschließlich der Unterstützung für mehrere Attribute, Befehlszeilenoptionen und integrierten Funktionen.
- erweiterte Plattformunterstützung, einschließlich SLES 11 und RHEL 5.4.
- Viele Bugfixes.
Kommentare nicht gefunden