Mehr zum Analyst Day 2022 von AMD – SemiAccurate

2022-11-10 11:48:01 By : Ms. YH Chen

Dies ist Teil 2 des Financial Analyst Day 2022 von AMD, Teil 1 finden Sie hier.Was für Datacenter kommen wirdDann war Dan McNamara an der Reihe, die Bühne zu betreten, und die gezeigte Straßenkarte war ein bisschen spärlicher als das, was wir bevorzugen, mit nichts, was an neue Informationen erinnert, abgesehen von einer Familie, Siena.Sicher, sie haben Turin auf die offiziellen Roadmaps gesetzt, aber wir haben Ihnen vor über zwei Jahren davon erzählt.Ja, die von uns geposteten Spezifikationen haben sich geändert, aber das war das Ergebnis des Upgrades und Forkens der Genoa-Plattform, wie wir zuvor behandelt haben.Siena ist ein auf Telekommunikation fokussierter Teil, das erkennt man an dem Begriff „Telco“ unter dem Namen auf der Roadmap.Ja, wir mussten, leugne nicht, dass du es auch getan hättest.Die für Siena angegebenen Spezifikationen sind 64 Kerne und Leistung pro Watt optimiert.Diese Hinweise, die AMD fallen gelassen hat, scheinen darauf hinzudeuten, dass Siena eher auf dem „kleinen“ Genoa IOD als auf dem größeren 96c Genoa/Bergamo-Die sein wird.Telekommunikationsunternehmen benötigen viele Threads und niedrige Latenzzeiten, daher ist unsere fundierte Vermutung das 4-DDR5-Kanal-IOD, das mit 4x 16c Zen4c-CCDs gekoppelt ist.Der relevantere Teil ist, was Siena zu einem Telekommunikationsteil macht und nicht nur zu einem Baby-Bergamo?Wenn unsere Intuition bezüglich des Layouts richtig ist, gibt es keine Möglichkeit, etwas auf CCD-Ebene hinzuzufügen, also ist CXL der wahrscheinlichste Weg, wenn überhaupt etwas vorhanden ist.Behalten Sie diesen im Auge, es könnten interessante Details unter der Haube stecken.Andere Leckerbissen in Dans Rede waren spärlich, aber relevant.Genoa hat 32 MB L3 pro CCD und es sind offensichtlich 12 CCDs auf dem Gerät.AMD beansprucht 1+ GB L3 pro Sockel mit Genoa-X, sodass man davon ausgehen kann, dass diese Generation auch 64 MB L3 pro CCD hinzufügen wird.12*96 ist 1152, also gilt die Mathematik.Sie behaupten auch einen massiven Sprung in der KI-Leistung, was sich in der zuvor erwähnten Hinzufügung von AVX-512 und VNNI niederschlägt.Da AMD nicht die Softwareimplementierung durchführt, sondern nur die ISA-Parität mit Intel erreicht, sollte diese Funktion von Software in den Zielmärkten weit verbreitet sein.Von dort nahm Forrest Norrod den Ball und lief damit los, um die Produktlinien zu beschreiben, die aus diesem Rechenzentrums-Silizium kommen werden, beginnend mit der CDNA3-basierten MI300-Reihe von „GPUs“.Wir verwenden erschreckende Anführungszeichen, weil es schwierig ist, diesen Namen für eine GPU mit x86-Kernen und FPGAs zu rechtfertigen, auch wenn einige davon wahrscheinlich optional sind.Der Beschleuniger fügt der Mischung Zen4-Kerne zusammen mit HBM für gemeinsam genutzten Speicher hinzu.Angesichts der Modularität der Architektur wurden auch andere Dinge wie FPGAs für zukünftige Produkte stark angedeutet.Der einheitliche Speicher ist nicht komplexer als die nächste Generation aktueller Kohärenzschemata, die auf dem Gerät implementiert sind.Xilinx und Pensando wurden ebenfalls erwähnt, weil sie direkt relevant für die Kontrolle des Weltraums Forrest sind.Xilinx hat eine zweite Generation seines Alveo-Beschleunigers im Jahr 2024 mit 200-Gbit/s-Unterstützung.Wenn Sie sich fragen, warum Xilinx so lange braucht, um Generationen hochzufahren, sind sie im Wesentlichen an die Netzwerkstandards gebunden.Wenn Gen1 die Arbeit mit Leitungsraten von 100 Gbit/s erledigen kann, besteht kaum Bedarf für mehr, bis sich die E/A-Geschwindigkeit erhöht, es ist das gleiche Problem, das die SSD-Controller-Leute in den frühen Tagen hatten.Pensando hat auch einen Code der zweiten Generation namens Elba in Arbeit.Es ist ein 7-nm-Produkt, das zwei 200-Gbit / s-Verbindungen herstellt, sodass sie in dieser Hinsicht Xilinx ein wenig voraus sind.Bis AMD mehr über Pensando spricht, gibt es wenig über diese Linie zu sagen, außer dass „heute in Produktion“ nicht bedeutet, dass es bald im Regal steht.Xilinx und AMD Embedded sind jetzt eingebettetDieser Vortrag führte gut zu Victor Pengs Präsentation über, keine Punkte, wenn Sie es erraten haben, Xilinx.Und eingebettete AMD-CPUs.Die oben gezeigte Roadmap ist nicht allzu bemerkenswert, außer darauf hinzuweisen, dass Xilinx die 5-nm-Siliziumgeneration überspringt, um von 7 nm auf 3 nm zu springen.Es ist auch eine gute Idee, AMD eingebettet in die Xilinx-Geschäftseinheit zu ziehen, die Software-Synergien werden viel bessere Renditen bringen, als sie unter der allgemeinen CPU-Seite zu halten.Dies war lange Zeit ein Schwachpunkt für AMD und das Unternehmen, das sich damit befasst, ist ein guter Schritt nach vorne.AIE ist jetzt überallDer Vortrag ging dann auf die AIE oder AI Engine, etwas, auf das viele der Vorredner verwiesen hatten.AMD hinkt an der KI-Hardware-Front kläglich hinterher und ist bei der Software weitaus schlechter aufgestellt.Sie sind der einzige große Hardwareanbieter, der keine KI-Einheit in seinen Hauptprodukten hat, eine eklatante Auslassung, auch wenn es keinen wirklichen Nutzen für die Benutzer gibt.In jedem Fall ist das Vorherrschen von AIE-Blöcken und Aufzählungszeichen in den meisten kommenden Produktlinien, insbesondere Verbraucher, ein Versuch, dieses Problem zu beheben.Diese Dinge sehen aus irgendeinem Grund gleich ausWenn Sie sich das obige Diagramm ansehen, scheint der Block ein kleiner Xilinx-FPGA zu sein, bei dem die KI-Programmierung zu einem ASIC verhärtet ist, anstatt in die Gates programmiert zu werden.Wenn diese Schlussfolgerung richtig ist (Ha! Sehen Sie, was wir dort gemacht haben?), dann können Sie erwarten, dass ähnliche Funktionen zu zukünftigen Produkten auf der Seite der benutzerdefinierten Silizium hinzugefügt werden.SemiAccurate ist der Ansicht, dass dies der erste Versuch von AMD ist, den Semi-Custom-Kunden ein „Produkt“ anzubieten, bei dem sie den Code auf ein FPGA schreiben, bevor AMD ihn härtet und auf ihrem Chip platziert.Wenn diese Spekulation falsch ist, sollte AMD dies wirklich als Produkt anbieten, es ist in vielerlei Hinsicht das Beste aus beiden Welten.KI-Software heute und morgenDie vielleicht wichtigste Folie des Analystentages ist die obige, die zweite der beiden, um genau zu sein.Die Software-Bemühungen von AMD sind seit Jahren ein Chaos.Während sie gelegentlich funktionierten, ist es ziemlich mühsam, jemanden zu finden, der sie in der Produktion verwendet, egal von welchem ​​​​Stack Sie sprechen.Wie Sie oben sehen können, nimmt AMD drei KI-APIs und konvergiert sie zu einer einzigen API im Stil von Intels OneAPI.KI-Software übermorgenBevor Sie denken, dass AMD aufholt oder sogar den richtigen Weg einschlägt, denken Sie daran, dass die Angebote von AMD zwar OneAPI ähneln, die Angebote von AMD jedoch nur für KI gelten, die von Intel für alles.SemiAccurate ist ein großer Fan der OneAPI-Strategie und hofft, dass AMD diesen Weg eines Tages vollständig gehen wird.Im Moment ist der AMD Unified AI Stack 1.0 nur ein winziges Puzzleteil.Wenn AMD für alles ein OneAPI-artiges übergreifendes Software- und Tool-Projekt durchführt, dann können Sie die beiden vergleichen.Wie Sie oben sehen können, wird es nach V2.0 sein, wenn es kommt.Auf Kundenseite hatte Saeid Moshkelani viel zu erzählen, manches wurde von früheren Rednern erwähnt, manches neu.Der bevorstehende Phoenix Point ist ein anständiger Schritt nach vorne, aber Strix Point ist aus einer Reihe von Gründen, die Saeid nicht erwähnt hat, derjenige, den man im Auge behalten sollte.Oder kurz bei uns.Es tut uns leid.Auf jeden Fall kennen Sie jetzt die Codenamen für die nächsten Generationen.Leider kann keines dieser Produkte aufgrund von nicht blockierbaren Hardware-Hintertüren sicher eingesetzt werden.Achtung, diese Produkte sind nicht nur unsicher, sie scheinen an der Sicherheitsfront absichtlich kompromittiert zu sein.Es gab drei Zahlen, die AMD für Ryzen 7000 veröffentlichte: eine IPC-Steigerung von 8 %, eine Spitzentaktgeschwindigkeit von etwa 10 % und eine Steigerung der Leistung pro Watt von >25 %.Wir haben die Leistungsseite der Dinge bereits früher behandelt, aber der PPW-Winkel ist interessant.Diese 8 % und 10 % zusammen mit nebulösen Größer-als-Zeichen ergeben eine Leistungssteigerung von fast 20 %.Angesichts der PPW-Angaben von >25 % bedeutet dies, dass wir eine Verringerung des Stromverbrauchs um etwa 5 % von Ryzen 6000 auf 7000 erwarten.Dies ist zwar ein willkommener Fortschritt, aber angesichts des vollständigen Schrumpfens und der architektonischen Vorteile von IPC ist es nicht annähernd so beeindruckend, wie SemiAccurate gehofft hatte.Wenn Sie den Zahlen von AMD glauben und wir zweifellos nicht, werden Sie verstehen, warum wir behaupteten, dass die Computex-Ergebnisse nicht so überzeugend waren.Unsichere und inkrementelle Gewinne, was will man mehr?Dann gibt es die Roadmap von viel Offensichtlichkeit.Wie Sie sehen können, wird die Verbraucher-Roadmap die des Rechenzentrums widerspiegeln, und jede Generation von Zen3-Teilen wird ein Zen4-basiertes Äquivalent haben.Das einzige neue Bit ist der Codename für Zen5-Geräte, Granite Point.Sie müssen sich fragen, woher sie diesen verrückten Granite-Codenamen haben?Es ist nicht so, als hätten wir ihnen vor Beginn des Projekts gesagt, dass das kleinlich wäre.Rick Bergman hatte die lustigsten Sachen, über die er reden konnte, weil er das sagte.Andererseits passen Verbraucher-GPUs gut zu dieser Rechnung, es ist schwieriger, auf die gleiche Weise über Rechenzentrums-RAS-Funktionen zu sprechen.Auf jeden Fall war die Grundlage seines Vortrags RDNA3, die 5-nm-Chiplet-basierte GPU-Architektur, die AMD noch in diesem Jahr vorstellen wird.Eine Sache, die in den Vorträgen, aber nicht auf den Folien gesagt wurde, war, dass die RDNA3-Architektur viel höher takten wird als RDNA2, sodass der Trend der Konvergenz von CPU- und GPU-Takten anhält.Wie Sie sehen können, ist der lang erwartete Nachfolger der RDNA2-basierten Navi2/Radeon 6000-GPUs der RDNA3 mit Navi3.In einer von allen erwarteten Wendung folgt die RNDA4-basierte Navi4-Linie.Wer wusste?Noch wichtiger ist, dass in diesem und vielen anderen Vorträgen viel über kundenspezifisches Silizium gesprochen wurde.Wie Rick und viele andere im Laufe des Analyst Day betonten, fertigt AMD seit Jahren kundenspezifisches Silizium von Konsolen bis hin zu Rechenzentren.Fragen Sie sie nur nicht, was mit diesem benutzerdefinierten HP Opteron passiert ist …Der letzte Redner, abgesehen von Lisa Sus Schlussworten, war CFO Devinder Kumar.Da SemiAccurate eine Tech-Site ist und unseren Finanzprognosen und Bilanzanalysen ein wenig an Tiefe fehlt, können wir diese beiden Gespräche einfach überspringen und uns wieder auf die technische Seite konzentrieren.Was hat AMD am Ende gezeigt?Viele Endbenutzergeräte basieren auf einem sehr kleinen Satz von Unterkomponenten.Das ist die Magie der Chiplet-Architektur, nicht gerade eine kombinatorische Explosion, aber wenn Sie die Chops zählen, sehen Sie in die richtige Richtung.Mit dem Aufkommen von GPUs in dieser Welt wächst das Mix-and-Match-Potenzial viel größer, wie die Computex-Ankündigung zeigt, dass die nächste große Ryzen-Reihe eine GPU auf dem IOD haben wird.Wenn Sie den offiziellen Zahlen vertrauen, sieht die Sache ziemlich solide aus.Auf der Siliziumseite ist der Weg, den AMD eingeschlagen hat, offensichtlich der richtige, jetzt stellt sich die Frage, ob sie bei der nächsten Welle nach Chiplets mit Intel mithalten können oder nicht.Auf der anderen Seite kommen wir auf eine Trommel zurück, die SemiAccurate für eine Weile geschlagen hat und die AMD heruntergespielt oder ignoriert hat, wenn sie gefragt wurden.Das Unternehmen hat ein ernsthaftes Sicherheitsproblem auf der Verbraucherseite, alle seine Geräte haben eine nicht entfernbare Hardware-Hintertür, die nach Ansicht von SemiAccurate die Sicherheit ausschließt.In den USA haben die Verbraucher Papierschutz, aber sind die Waren von AMD für ausländische Märkte verkaufsfähig?Diese Frage wurde aus gutem Grund von keinem der Redner angesprochen.Wir schließen damit, weil SemiAccurate der Meinung ist, dass es eine direkte Bedrohung für ihr Kerngeschäft darstellt, sobald die Öffentlichkeit das Problem versteht.Ansonsten sieht es anständig aus.S|ATags: AMD Financial Analyst Day 2022, AMD, CPU, EPYC, FPGA, GPU, Opteron, Pensando, Radeon, Ryzen, SemiAccurate, XilinxVielen Dank an unsere Abonnenten, Vergangenheit und Gegenwart.Sie sind das, was SemiAccurate am Laufen hält, was uns erlaubt, unseren Journalismus aufrechtzuerhalten, was uns werbefrei hält, was uns erlaubt, es so zu sagen, wie es ist, es sind immer noch nur Sie.Ihnen, dem Leser und Abonnenten, wir danken Ihnen.Wenn Sie mehr über kostenlose und kostenpflichtige Abonnements erfahren möchten, finden Sie die Informationen hier.Weitere Informationen zu unserer Erfolgsbilanz im Spitzenjournalismus finden Sie unter Fully Accurate.Charlie Demerjian ist der Gründer von Stone Arch Networking Services und S|A.SemiAccurate.com ist eine Website für Technologienachrichten;über Hardwaredesign, Softwareauswahl, Anpassung, Sicherheit und Wartung mit über einer Million Aufrufen pro Monat.Er ist Technologe und Analyst mit Spezialisierung auf Halbleiter, System- und Netzwerkarchitektur.Als Hauptautor von SemiAccurate.com berät er regelmäßig Autoren, Analysten und Führungskräfte der Branche zu technischen Fragen und langfristigen Branchentrends.Thomas Ryan ist GIS-Programmierer und freiberuflicher Technologieautor aus Seattle, WA.Sie finden seine Arbeit auf SemiAccurate und PCWorld.SemiAccurate ist ein Geschäftsbereich von Stone Arch Networking Services, Inc. Copyright © 2022 Stone Arch Networking Services, Inc, alle Rechte vorbehalten.