Nvidia, Rubin

Nvidia Rubin: Neuer KI-Chip startet in die Serienproduktion

25.01.2026 - 22:23:12

Nvidias neue Chip-Generation Vera Rubin geht in Produktion und verspricht eine zehnfache Senkung der KI-Betriebskosten. Die Architektur setzt auf HBM4-Speicher und Warmwasserkühlung.

Nvidias nächste Chip-Generation „Vera Rubin“ geht in Produktion und verspricht eine Revolution für KI-Rechenzentren. Die Architektur soll die Kosten für KI-Inferenz massiv senken und den Weg für autonome Agenten ebnen. Gleichzeitig bahnt sich eine Öffnung des chinesischen Marktes an.

Die Bestätigung kam am Wochenende: Der Chip-Riese hat seine „Vera Rubin“-Architektur, intern als R100 bezeichnet, in die Serienfertigung überführt. Der Nachfolger der aktuellen Blackwell-Serie soll noch im zweiten Halbjahr 2026 auf den Markt kommen. Die Spezifikationen versprechen einen Quantensprung: eine dreifach höhere Rechendichte und eine fünfmal größere Inferenz-Leistung.

Ein zentraler Treiber ist der neue HBM4-Speicher. Er soll eine Bandbreite von bis zu 22 Terabyte pro Sekunde pro Socket liefern – fast das Dreifache der Vorgängergeneration. Diese Leistung ist entscheidend für das Training komplexer KI-Modelle und den Betrieb autonomer KI-Agenten. Die Nachfrage der großen Cloud-Anbieter wie AWS, Microsoft Azure und Google Cloud ist bereits jetzt enorm. Ihr Fokus liegt nicht mehr auf roher Rechenkraft, sondern auf den „Kosten pro Token“. Nvidia verspricht hier eine Reduktion um den Faktor zehn im Vergleich zu Blackwell.

Anzeige

Passend zum Thema KI-Einsatz in Unternehmen: Die EU hat umfangreiche Pflichten für Anbieter und Nutzer von KI-Systemen eingeführt. Wer generative KI oder autonome Agenten produktiv einsetzen will, muss Kennzeichnungspflichten, Risikoklassen und umfangreiche Dokumentationsanforderungen beachten. Ein frei zugänglicher Umsetzungsleitfaden erklärt verständlich, welche Pflichten jetzt gelten, welche Fristen zu beachten sind und wie Sie Ihr System rechtssicher klassifizieren. EU-KI-Verordnung kompakt: Umsetzleitfaden jetzt herunterladen

Die Kühlungs-Herausforderung: Warmwasser bei 45°C

Die immense Leistungsdichte der neuen Chips stellt Rechenzentren vor massive Infrastruktur-Herausforderungen. Ein am Freitag bekannt gewordener Durchbruch könnte die Lösung bringen: Die Rubin-Systeme sind für eine Warmwasserkühlung bei bis zu 45°C Vorlauftemperatur ausgelegt.

Diese Technologie, für die der Anbieter DCX Liquid Cooling Systems spezielle Kühlverteiler angekündigt hat, macht energieintensive Kältemaschinen in vielen Klimazonen überflüssig. Stattdessen reichen einfache Trockenkühler. Angesichts einer thermischen Verlustleistung (TDP) von schätzungsweise 2,3 kW pro GPU ist Luftkühlung keine Option mehr. Der Wechsel zu Warmwasserkühlung senkt nicht nur die Betriebskosten, sondern ermöglicht erst die hochverdichteten Rechenhallen, die für KI-Fabriken der Zukunft nötig sind.

Geopolitisches Tauziehen: China gibt H200-Chips frei

Parallel zur technischen Entwicklung spitzt sich der Handelskonflikt um Hochleistungschips zu. Wie aus Branchenkreisen verlautete, haben chinesische Behörden grundsätzlich grünes Licht für Bestellungen der Nvidia-H200-Chips durch Konzerne wie Alibaba, Tencent und ByteDance gegeben.

Die H200 ist ein Vorgänger von Rubin, doch Analysten sehen in der Freigabe ein mögliches Einfallstor für künftige, noch leistungsfähigere Hardware – vorbehaltlich der US-Exportkontrollen. Der Aktienkurs von Nvidia reagierte am Freitag mit einem Plus von etwa 1,5 Prozent auf die Nachricht. Für die chinesischen Tech-Giganten ist die Leistung der „Rubin-Klasse“ überlebenswichtig, um im globalen Wettlauf um generative KI mithalten zu können.

Finanzbranche setzt auf autonome KI-Agenten

Die Nachfrage nach solcher Rechenpower wird durch eine parallel veröffentlichte Nvidia-Studie untermauert. Dem „State of AI in Financial Services“-Report zufolge rechnen nahezu 100 Prozent der Finanzdienstleister mit stabilen oder steigenden KI-Budgets für 2026.

Besonders bemerkenswert: 42 Prozent dieser Unternehmen evaluieren oder implementieren bereits „Agentic AI“. Diese autonome Systeme können eigenständig schlussfolgern und mehrstufige Aufgaben ausführen. Genau für diese Ära der KI-Agenten wirbt Nvidia mit der Vera-Rubin-Architektur. Ihr neuer Vera-CPU-Nachfolger soll die komplexen Logik-Abläufe steuern, die der massiven GPU-Rechenleistung folgen.

Wettbewerbsdruck treibt Leistung nach oben

Der harte Kampf um die Vorherrschaft im KI-Chip-Markt treibt die Spezifikationen in schwindelerregende Höhen. Berichten zufolge hat Nvidia die Leistungsaufnahme der Rubin-GPU zuletzt noch einmal nach oben korrigiert – von geschätzten 1,8 auf etwa 2,3 kW.

Dieser Schub zielt darauf ab, die Spitzenleistung auch bei langandauernden Trainingsläufen aufrechtzuerhalten. Es geht nicht mehr um theoretische Rechenoperationen pro Sekunde, sondern um reale Produktivitätskennzahlen wie „Tokens pro Sekunde pro Watt“. Nvidia will damit seine Führungsposition gegen Wettbewerber wie AMD und dessen Instinct MI455X absichern. Im Fokus steht dabei stets die Gesamtbetriebskosten (TCO) und die Effizienz im praktischen Einsatz.

Für Unternehmens-IT-Verantwortliche bedeutet die Rubin-Ära eine grundsätzliche Weichenstellung. Die Abhängigkeit von Hochleistungskühlung und extrem dichter Stromversorgung wird Upgrades bestehender Rechenzentren komplex und teuer machen. Viele werden in spezialisierte Colocation-Anbieter migrieren müssen. Das Versprechen, die KI-Betriebskosten um das Zehnfache zu senken, bietet dafür jedoch einen überzeugenden Return on Investment. Die Branche ist überzeugt: Mit Rubin setzt Nvidia einen neuen Maßstab für das, was heute als Hochleistungsrechnen gilt.

Anzeige

PS: Warum setzen die meisten High-Performance-Cluster auf Linux? Weil Stabilität, Performance und Anpassbarkeit in Rechenzentren entscheidend sind. Wer Rechenzentren modernisieren oder ältere Server kosteneffizient weiterbetreiben will, profitiert vom kostenlosen Linux-Startpaket: Ubuntu-Vollversion, Schritt-für-Schritt-Installationsratgeber und Praxis-Tipps für den Parallelbetrieb neben Windows. Ideal für IT-Verantwortliche, die Performance und Ausfallsicherheit steigern wollen. Jetzt kostenloses Linux-Startpaket sichern

@ boerse-global.de