Der große Silizium-Engpass: Warum die KI-Revolution an einer Fabrik in Taiwan hängt

Dennis Grote

23. März 20265 Min. Lesezeit

Die Welt will mehr KI-Chips als gebaut werden können. Das hat Konsequenzen — für Nvidia, für Google, für dein Smartphone und für jeden, der glaubt, die KI-Blase sei kurz vor dem Platzen.

Wer in den letzten Monaten versucht hat, GPU-Kapazität zu mieten, kennt das Gefühl: Es gibt keine. Nicht bei AWS, nicht bei Google Cloud, nicht bei den kleinen Neocloud-Anbietern. Selbst zwei Generationen alte Nvidia Hopper-GPUs werden zu steigenden Preisen gehandelt, als wären sie seltene Rohstoffe. Was sie, in gewisser Hinsicht, auch sind.

Denn hinter dem sichtbaren KI-Boom verbirgt sich ein physisches Problem, das sich nicht mit Software lösen lässt: Es gibt nicht genug Silizium.

Eine Fabrik, die alles entscheidet

Am Anfang jedes KI-Chips steht ein Wafer — eine runde Scheibe aus hochreinem Silizium, auf der in hunderten von Prozessschritten Milliarden von Transistoren geätzt werden. Und fast alle KI-Chips der Welt werden von einem einzigen Unternehmen gefertigt: TSMC in Taiwan.

TSMCs fortschrittlichster Fertigungsprozess heißt N3 — die 3-Nanometer-Technologie. Bis vor kurzem war N3 hauptsächlich für Smartphones reserviert. Apple nutzt es für seine neuesten iPhone- und Mac-Chips, Qualcomm für seine Snapdragon-Prozessoren, MediaTek für seine Mittelklasse-SoCs.

Dann kam 2026. Und plötzlich wollen alle gleichzeitig auf N3.

Nvidias neue Rubin-Architektur: N3. Googles TPU v7 und v8: N3. Amazons Trainium3: N3. AMDs MI350X: N3. Dazu kommen die Netzwerk-Chips, die CPU-Begleitprozessoren, die optischen Transceiver — alles konvergiert auf denselben Fertigungsprozess, zur selben Zeit.

Das Ergebnis ist ein Nachfrageschock, auf den TSMC nicht vorbereitet war.

Wie TSMC den Anschluss verlor

Das klingt paradox. Die größte Halbleiterfertigung der Welt, überrumpelt von der Nachfrage? Aber die Zahlen erzählen eine klare Geschichte.

Der größte Compute-Ausbau der Geschichte begann Ende 2022, als ChatGPT die Welt veränderte. TSMCs Investitionsausgaben übertrafen ihren bisherigen Höchststand aber erst 2025 — drei Jahre Verzögerung. Halbleiterfabriken brauchen 18 bis 24 Monate vom Baubeginn bis zur Produktion. Wer 2023 hätte bestellen müssen, hat erst 2025 reagiert.

In der zweiten Jahreshälfte 2026 wird die effektive Auslastung der N3-Kapazität voraussichtlich über 100 Prozent liegen. TSMC verlagert bereits einzelne Prozessschritte in andere Fabriken, um jede letzte Kapazitätsreserve herauszuquetschen.

Und es wird schlimmer, bevor es besser wird. Für 2027 rechnen Analysten damit, dass KI-bezogene Chips rund 86 Prozent der gesamten N3-Produktion beanspruchen werden. Smartphones und PCs, bisher die Hauptkunden, werden auf die Restkapazität verwiesen — oder auf den neueren N2-Prozess umgelenkt.

Das Geld ist da — das Silizium nicht

Die Hyperscaler werfen inzwischen Geld auf das Problem, als gäbe es kein Morgen. Googles Investitionsbudget für 2026 hat sich gegenüber früheren Schätzungen ungefähr verdoppelt. Branchenweit dürften die KI-Investitionsausgaben bis Ende 2026 an die 700 Milliarden Dollar heranreichen.

Aber Geld allein baut keine Fabriken. TSMCs neue Werke in Arizona, Kumamoto und Dresden sind noch nicht in der Lage, N3 in nennenswertem Volumen zu produzieren. Und selbst wenn sie es wären: EUV-Lithographie-Maschinen, qualifiziertes Personal und Energieinfrastruktur sind jeweils für sich genommen Engpassfaktoren.

Anthropic ist ein Beispiel dafür, was passiert wenn Nachfrage auf begrenzte Kapazität trifft. Das Unternehmen fügte allein im Februar 2026 rund 6 Milliarden Dollar an jährlich wiederkehrendem Umsatz hinzu, angetrieben vor allem durch die Verbreitung der Coding-Plattform Claude Code. Und hätte Anthropic mehr Rechenkapazität gehabt, wäre es noch mehr gewesen.

Nicht nur Logik — auch Speicher wird knapp

Der Silizium-Engpass beschränkt sich nicht auf Prozessoren. Die zweite Front im Kapazitätskrieg ist der Speicher.

Moderne KI-Chips nutzen HBM — High Bandwidth Memory. Das ist eine aufwändige 3D-Stapelung von bis zu zwölf einzelnen Speicherchips, die mit tausenden winziger Verbindungen direkt neben dem Prozessor montiert werden. HBM verbraucht pro gespeichertem Bit etwa dreimal so viel Wafer-Kapazität wie herkömmliches DRAM.

Mit jeder neuen Generation wird das Verhältnis ungünstiger. HBM4, das für Nvidias Rubin-Plattform vorgesehen ist, verschärft die Situation weiter. Die drei großen Speicherhersteller — SK Hynix, Samsung und Micron — bauen ihre Kapazitäten aus, aber der Großteil der neuen Produktion fließt direkt in HBM und verdrängt konventionellen Speicher. Das treibt nicht nur die Preise für KI-Hardware nach oben, sondern könnte mittelfristig auch Server, PCs und Smartphones verteuern.

TSMC als Königsmacher

In diesem Umfeld übernimmt TSMC eine Rolle, die über die eines normalen Auftragsfertigers hinausgeht. Das Unternehmen entscheidet de facto, welcher Kunde wie viele Chips bekommt.

KI-Chips haben größere Dies, komplexere Packaging-Anforderungen und höhere Durchschnittspreise pro Wafer als Smartphone-Chips. Für TSMC ist es wirtschaftlich rational, KI-Kunden zu bevorzugen — und genau das passiert.

Nvidia hat laut Branchenberichten zwischen 800.000 und 850.000 Wafer für fortschrittliches Packaging reserviert, um den Weg für Blackwell Ultra und Rubin freizumachen. Google hat mit seinen TPUs einen Vorsprung, weil die TPU v7-Produktion bereits 2025 angelaufen ist. Amazon drängt mit Trainium3 auf die Bühne.

Wer zu spät kommt oder zu wenig bestellt, steht hinten an. Einige Kunden zahlen Berichten zufolge 50 bis 100 Prozent Aufpreis für beschleunigte Fertigung — sogenannte "Hot Runs" — um in der Warteschlange nach vorne zu rücken.

Smartphones als Puffer

In einer normalen Welt wäre das ein Desaster für die Smartphone-Industrie. Und tatsächlich spüren Apple, Qualcomm und MediaTek den Druck. Aber ein paradoxer Effekt federt den Schlag ab: Die steigenden Speicherpreise, angetrieben durch die HBM-Nachfrage, drücken die Nachfrage nach Smartphones. Weniger Smartphone-Verkäufe bedeuten weniger Wafer-Bedarf, und die frei werdende Kapazität fließt — richtig — in KI-Chips.

Analysten rechnen vor: Würde man 25 Prozent der für Smartphones vorgesehenen N3-Wafer umwidmen, könnten rund 700.000 zusätzliche Rubin-GPUs oder 1,5 Millionen zusätzliche TPU v7 produziert werden. In der Praxis wird es weniger sein, aber die Richtung ist klar: Smartphones werden zum Puffer für die KI-Industrie.

Nvidia stoppt China — und verschiebt alles nach Rubin

Eine weitere tektonische Verschiebung: Nvidia hat Anfang März 2026 die gesamte H200-Produktion für China eingestellt. Der Hintergrund: Die USA hatten Exporte unter Auflagen erlaubt, aber Chinas Zollbehörden blockierten die Importe — Peking will die Abhängigkeit von US-Chips aktiv reduzieren.

Die Konsequenz: Sämtliche TSMC-Kapazität, die für H200-China vorgesehen war, wird auf die Rubin-Plattform umgeleitet. Für Nvidias westliche Kunden ist das kurzfristig eine gute Nachricht — mehr Rubin-Chips, schnellere Lieferung. Für den globalen GPU-Spotmarkt ändert sich wenig, weil die Hyperscaler die Mehrproduktion absorbieren, bevor sie bei kleineren Kunden ankommt.

Was das für die nächsten zwei Jahre bedeutet

Die Silizium-Knappheit ist kein kurzfristiges Problem. Die Engpässe verschieben sich, aber sie verschwinden nicht. 2023 war es CoWoS-Packaging. 2024-2025 waren es Datacenter und Energie. 2026 und darüber hinaus sind es die Wafer selbst.

Für Investoren: Die KI-Infrastruktur-These ist intakt — nicht weil die Bewertungen günstig wären, sondern weil die physischen Kapazitätsgrenzen die Nachfrage auf Jahre hinaus über dem Angebot halten. Wer Zugang zu Compute hat, hat einen strukturellen Vorteil.

Für Unternehmen: GPU-Kapazität wird nicht billiger werden, zumindest nicht in den nächsten 18 Monaten. Wer seine KI-Strategie auf günstig werdende Rechenleistung baut, plant auf Sand — oder besser gesagt, auf Silizium, das es nicht gibt.

Für die Branche: TSMC hat sich vom Zulieferer zum Flaschenhals der gesamten KI-Revolution entwickelt. Kein einzelnes Unternehmen hatte jemals so viel Einfluss darauf, welche Technologien gebaut werden und welche warten müssen. Das ist eine Machtkonzentration, über die erstaunlich wenig gesprochen wird.

Die größte technologische Revolution unserer Zeit hat ein ganz irdisches Limit: die Zahl der Wafer, die eine Handvoll Fabriken in Taiwan pro Monat aus der Produktion schieben kann.

Quellen: SemiAnalysis Foundry Model & Accelerator Model, IEEE Spectrum, Tom's Hardware, The Decoder, WCCFTech, Financial Times. Die in diesem Artikel genannten Zahlen und Schätzungen basieren auf öffentlich verfügbaren Analysen und Branchenberichten.

Der große Silizium-Engpass: Warum die KI-Revolution an einer Fabrik in Taiwan hängt

Eine Fabrik, die alles entscheidet

Wie TSMC den Anschluss verlor

Das Geld ist da — das Silizium nicht

Nicht nur Logik — auch Speicher wird knapp

TSMC als Königsmacher

Smartphones als Puffer

Nvidia stoppt China — und verschiebt alles nach Rubin

Was das für die nächsten zwei Jahre bedeutet

Mehr Deep Dives

Was ist Bittensor?

3 Bit, null Verlust: Wie Googles TurboQuant die Spielregeln der KI-Industrie umschreibt

Claude Code und das Ende der Software wie wir sie kennen