Open Source vs. Frontier: Was für den Mittelstand passt

AI Foundations · 10 Min Lesezeit

„Sollen wir auf Open Source setzen oder auf die kommerziellen Frontier-Modelle?“ Diese Frage höre ich von technisch versierten Mittelständlern fast so oft wie die nach dem richtigen LLM. Sie ist besser gestellt, enthält aber einen verbreiteten Denkfehler: Open Source und Frontier sind keine Gegensätze, zwischen denen man sich entscheiden muss. Es sind zwei Werkzeuge mit unterschiedlichen Stärken, und die richtige Antwort ist für die meisten Unternehmen ein bewusster Mix. Hier ist die Entscheidungsmatrix.

Es gibt eine Frage, die technisch versierte Mittelständler mir fast so oft stellen wie die nach dem richtigen LLM: „Open Source oder die kommerziellen Frontier-Modelle?“ Die Frage ist besser als die nach dem „besten Modell“, aber sie enthält einen Denkfehler: die Annahme, man müsse sich entscheiden.

Man muss nicht. Open Source und Frontier sind zwei Werkzeuge mit unterschiedlichen Stärken, keine Gegensätze. Die richtige Antwort ist für die meisten Unternehmen ein bewusster Mix. Die Kunst liegt darin zu wissen, welcher Use-Case auf welche Seite gehört.

Zuerst: „Open Source“ bei LLMs bedeutet meist „Open Weights“

Eine wichtige Klarstellung, die in den meisten Diskussionen fehlt: Was der Markt als „Open Source“-KI verkauft (Llama, Mistral, Qwen, DeepSeek), ist fast immer Open Weights und kein echtes Open Source im klassischen Sinn. Sie bekommen die fertig trainierten Modell-Gewichte zum Herunterladen und Selbstbetreiben. Sie bekommen meist nicht die vollständigen Trainingsdaten oder den kompletten Trainingsprozess.

Für die Praxis ist das selten ein Problem: entscheidend ist, dass Sie das Modell auf eigener Infrastruktur betreiben können. Aber die Lizenzen variieren erheblich. Manche erlauben uneingeschränkte kommerzielle Nutzung, andere haben Einschränkungen (etwa Llama bei sehr großen Nutzerzahlen). Vor jeder produktiven Nutzung gehört die Lizenz des konkreten Modells geprüft.

Die fünf echten Entscheidungs-Dimensionen

Die Wahl zwischen Open Weights und Frontier hängt von fünf Dimensionen ab, die je nach Use-Case unterschiedlich zählen. Mit „besser oder schlechter“ hat sie wenig zu tun:

Dimension	Frontier (Closed)	Open Weights (Self-Hosted)
Datensouveränität	Daten verlassen das Haus (auch wenn EU-gehostet + DPA)	Maximal — Daten bleiben in Ihrer Infrastruktur
Spitzen-Performance	Höchste verfügbare Reasoning-Qualität	Erreicht 60-80 % der Frontier-Qualität (steigend)
Kostenstruktur	Pro Token (variabel, skaliert mit Nutzung)	Fixe Hardware/Hosting-Kosten (planbar)
Betriebsaufwand	Minimal — API aufrufen, fertig	Hoch — eigene GPU-Infrastruktur + Wartung
Kontrolle / Lock-in	Abhängig vom Anbieter (Pricing, Deprecation)	Volle Kontrolle, kein Vendor-Lock-in

Wann Frontier (Closed) die richtige Wahl ist

Frontier-Modelle gewinnen, wenn:

Sie höchste Reasoning-Qualität brauchen: komplexe Analysen, anspruchsvolle Code-Generierung, mehrstufige Schlussfolgerungen.
Ihr Volumen moderat ist: Bei einigen tausend Anfragen pro Tag amortisiert sich eigene Hardware nicht.
Sie schnell starten wollen: kein Infrastruktur-Aufbau, sofort produktiv.
Die verarbeiteten Daten nicht hochsensibel sind, oder ein EU-Hosting mit DPA (AWS Bedrock, Azure, Vertex AI in Frankfurt) ausreicht.

Für die große Mehrheit der Mittelstands-Use-Cases ist das der pragmatische Startpunkt: ein Frontier-Modell über einen EU-gehosteten Endpunkt. Der Aufwand ist minimal, die Qualität maximal.

Wann Open Weights / Self-Hosting gewinnt

Die Self-Hosting-Variante lohnt sich in drei klar umrissenen Szenarien:

Erstens: hochsensible Daten. F&E-Daten, Personalakten, Patientendaten, Verträge mit Geheimhaltungsklauseln. Wenn Daten unter keinen Umständen das Haus verlassen dürfen, auch nicht zu einem EU-gehosteten US-Anbieter, ist Self-Hosting die einzig saubere Antwort. Das ist die stärkste Begründung, und sie ist qualitativ, nicht ökonomisch.

Zweitens: sehr hohes, konstantes Volumen. Ab einer bestimmten Schwelle (grob: hohe fünf- bis sechsstellige Token-Zahlen pro Tag, konstant) wird die fixe Hardware-Rechnung günstiger als die variable Token-Abrechnung. Hier ist die Begründung rein ökonomisch.

Drittens: strategische Unabhängigkeit. Wer aus geopolitischen oder strategischen Erwägungen nicht von US-Anbietern abhängig sein will, findet in europäischen Open-Weights-Modellen (Mistral) oder self-hosted Lösungen die Antwort. Das ist eine Vorstands-Entscheidung, keine rein technische.

Der Preis in allen drei Fällen: Sie brauchen GPU-Infrastruktur und Betriebskompetenz, entweder intern oder über einen spezialisierten Partner. Diesen realen Aufwand müssen Sie einkalkulieren.

Der hybride Mittelweg: was die meisten brauchen

In der Praxis lautet die sauberste Lösung für den gehobenen Mittelstand selten „alles Frontier“ oder „alles Open Source“. Sie ist ein bewusster Mix:

Frontier für anspruchsvolle, niedrig-volumige Aufgaben mit unkritischen Daten (Strategie-Analysen, Text-Generierung, Code).
Self-Hosted Open Weights für die Verarbeitung sensibler Daten (interne Wissensdatenbank über Personalakten, F&E-Dokumente).
Ein Gateway dazwischen, das je nach Use-Case und Datenklasse automatisch das richtige Modell wählt.

Genau dieser Mix war auch das Fazit meines Artikels zur LLM-Tool-Landschaft: Multi-Model statt Single-Vendor. Open vs Frontier ist nur eine weitere Achse desselben Prinzips.

Die Trend-Linie: Open Weights holt auf

Eine Entwicklung, die Ihre Entscheidung beeinflussen sollte: Der Qualitätsabstand zwischen Open Weights und Frontier schrumpft. Wo Open-Source-Modelle vor zwei Jahren noch deutlich abfielen, erreichen sie heute für die Mehrheit der Geschäfts-Use-Cases brauchbare bis sehr gute Ergebnisse. Parallel sinken die Hardware-Kosten und es entstehen immer bessere Hosting-Optionen (spezialisierte Inferenz-Anbieter mit EU-Rechenzentren).

Die strategische Konsequenz: Wer heute eine Architektur baut, sollte sie so gestalten, dass ein späterer Wechsel oder eine Ergänzung um Open-Weights-Modelle leicht möglich ist. Ein Gateway-Layer, der die Anwendung vom konkreten Modell entkoppelt, ist die günstigste Versicherung gegen die Volatilität dieses Marktes.

Die Entscheidungs-Quintessenz

Für die meisten Mittelständler lautet der pragmatische Pfad: Starten Sie mit einem Frontier-Modell über einen EU-gehosteten Endpunkt: schnell, einfach, maximale Qualität. Identifizieren Sie parallel die Use-Cases mit wirklich sensiblen Daten oder sehr hohem Volumen. Für genau diese, und nur diese, prüfen Sie Self-Hosting mit Open Weights.

Was Sie vermeiden sollten: die ideologische Entscheidung. Weder „Open Source aus Prinzip“ (führt zu unnötigem Betriebsaufwand bei unkritischen Use-Cases) noch „immer das teuerste Frontier-Modell“ (verbrennt Budget bei einfachen Aufgaben). Die Daten und das Volumen entscheiden, nicht die Weltanschauung.

Open Source vs. Frontier-Modelle: Wann sich welcher Weg für den Mittelstand lohnt