«Machen wir das einfach mit ChatGPT.» Für viele Unternehmen ist die US-Cloud der Reflex, sobald es um KI geht: schnell, stark, günstig im Einstieg. Doch nicht jede Aufgabe – und vor allem nicht jede Datenklasse – gehört in die Cloud eines US-Anbieters.
Es gibt nicht den einen richtigen Weg, KI zu betreiben, sondern vier gängige – vom eigenen Rechner bis zur direkten US-Subscription. Jeder ist ein Kompromiss aus drei Grössen: Kosten, Datensouveränität und Modell-Leistung. Dieser Überblick ordnet sie ein, damit die Wahl zur Anforderung passt – nicht zum Hype.
Leistung und Souveränität ziehen gegeneinander
Als Faustregel gilt: Je näher die Daten am eigenen Haus bleiben, desto höher die Kontrolle – und desto begrenzter oder teurer die verfügbare Spitzenleistung. Wer maximale Antwortqualität will, landet schnell bei den grossen US-Modellen; wer maximale Datenhoheit braucht, bei lokaler Hardware. Die interessanten Optionen liegen dort, wo sich beides austarieren lässt.
Der entscheidende Hebel ist selten das Modell. GPT, Claude und Gemini sind über mehrere Wege erreichbar. Was sich unterscheidet, ist wo die Daten verarbeitet werden, wer darauf zugreifen kann und was es kostet. Genau das macht die Infrastruktur zur eigentlichen Entscheidung.
Die vier Wege im Vergleich
Vier Setups decken die Bandbreite ab – von maximaler Souveränität bis maximaler Bequemlichkeit. Die Ampel zeigt die jeweilige Stärke pro Dimension (grün = gut, orange = mittel, rot = kritisch/hoch).
| Setup | Datensouveränität | Modell-Leistung | Laufende Kosten |
|---|---|---|---|
| LM StudioLokal | Maximal | Mittel | Sehr tief |
| Open WebUIServer / Cloud-Tenant | Hoch | Frontier | Tief / variabel |
| LangdockEU-SaaS | Hoch (EU) | Frontier | Mittel |
| Frontier LabsUS-Cloud | Tief | Frontier+ | Bis hoch |
«Frontier Labs» meint dabei die direkten Dienste von OpenAI, Anthropic und Google (ChatGPT, Claude, Gemini) über ein US-Abonnement.
Die vier Setups im Detail
01LM Studio – maximale Datenhoheit, lokal
Eine Desktop-Anwendung, die Open-Weights-Modelle (Llama, Qwen, Mistral, DeepSeek) direkt auf dem eigenen Rechner ausführt. Im rein lokalen Betrieb verlassen die Daten das Gerät nie – ein Air-Gap-Betrieb ist möglich. Über LM Link lassen sich zusätzlich eigene, selbst gehostete Cloud-Modelle (etwa im eigenen Azure-Tenant) anbinden; dann gehen die Daten zwar an diese Modelle, bleiben aber in der eigenen, kontrollierten Infrastruktur.
Die Software ist gratis. Auf einer vorhandenen Maschine entstehen praktisch keine laufenden Kosten – nur Strom. Erst für grössere Modelle braucht es eine einmalige Hardware-Investition (GPU oder Mac mit viel RAM). Der Preis für diese Souveränität: Die Spitzenleistung bleibt hinter echten Frontier-Modellen zurück. Ideal für sensible Daten, Offline-Betrieb, Einzelplatz und Prototyping.
02Open WebUI – Frontier aus dem eigenen Tenant
Open WebUI ist kein Modell, sondern ein self-hosted Frontend (Docker) – ein Gateway, das jedes OpenAI-kompatible Backend einbindet. Das macht es zur flexibelsten Option: lokale bzw. Open-Weights-Modelle (via vLLM oder Ollama) ebenso wie Frontier-Modelle, die im eigenen Azure-Tenant (Azure OpenAI) deployt werden – etwa in der Region Switzerland North.
So bekommt man Spitzenleistung bei eigener Daten-Governance und wählbarer Region. Das Frontend-Hosting ist günstig; die Modellkosten richten sich nach dem Backend (Token bei Azure, GPU-Miete bei Open-Weights). Der Preis: Frontend und Backends müssen selbst betrieben werden, und über einen Hyperscaler ist kein echtes Air-Gap möglich (Cloud-Act-Restrisiko). Ideal für Unternehmen mit eigenem Cloud-Tenant, die Frontier-Leistung mit eigener Governance verbinden wollen.
03Langdock – Frontier, EU-gehostet
Eine DSGVO-konforme SaaS-Plattform mit Rechenzentrum in der EU. Sie bündelt führende Modelle (GPT, Claude, Gemini, Mistral) hinter einem EU-Endpoint – mit Auftragsverarbeitungsvertrag und ohne Training auf den Kundendaten. Frontier-Leistung bei EU-Datenhaltung, sofort startklar, zentral verwaltbar.
Die Kosten sind als Lizenz pro Nutzer und Monat planbar (Grössenordnung CHF 20–40). Sie bleiben auch bei intensiver Nutzung mittel, weil kein token-hungriger Coding-Agent im Spiel ist. Der Preis: SaaS-Abhängigkeit, kein Air-Gap, Modell-Provider im Hintergrund (EU-gekapselt). Ideal für KMU, die Spitzenleistung und EU-Compliance wollen, ohne selbst zu hosten.
04Frontier Labs – direkte US-Subscription
Der direkte Zugang zu den nativen Diensten von OpenAI, Anthropic und Google. Sofort die neuesten und stärksten Modelle, null Betriebsaufwand, günstiger Einstieg. Der Haken: Die Datenverarbeitung findet in den USA statt, unter US-Jurisdiktion (Cloud Act); Consumer-Pläne trainieren teils auf den Eingaben. Für Personendaten oder Geschäftsgeheimnisse ist das heikel.
Bei den laufenden Kosten lohnt eine Differenzierung – sie hängen am Abrechnungsmodell, nicht am Tool:
Im Abo gedeckelt
Claude Code im Claude-Max-Abo, Codex in ChatGPT Pro/Plus, Gemini über Google AI/Workspace – Sitzplatz-Lizenz, planbar.
Rohe API
Unbegrenzte Automation oder Coding-Agents direkt über die API: nach Verbrauch abgerechnet – bei intensiver Nutzung schnell hoch.
Ideal für unkritische Daten, schnelle Resultate, neuste Features, Recherche und Entwürfe.
Die Empfehlung: KI nach Datenklasse staffeln
Es gibt kein «bestes» Setup – nur das passende. In der Praxis bewährt sich kein Entweder-oder, sondern ein abgestuftes Modell: eine Datenklassifizierung, die jeder Aufgabe das passende Setup zuweist. So entsteht ein gestaffeltes System – höchste Souveränität dort, wo es zählt, höchste Leistung dort, wo sie risikolos nutzbar ist.
| Datenklasse | Empfohlenes Setup |
|---|---|
| Geistiges Eigentum, Verträge, Finanzdaten, Strategie | LM Studio (lokal) o. Open WebUI mit Open-Weights |
| Kundendaten, HR-Daten, regulierte & interne Dokumente | Open WebUI + eigener Azure-Tenant |
| Personendaten (EU), Kundenkommunikation, Marketing-Daten | Langdock (EU-SaaS) |
| Öffentliche Daten, Recherche, Entwürfe, Marketing-Texte | US-Subscription |
Die Infrastruktur ist eine Strategieentscheidung, kein Tool-Kauf. Wer einmal sauber klassifiziert, was wie schützenswert ist, trifft alle weiteren KI-Entscheide schneller und sicherer.
Häufige Fragen
Welche Datenklasse gehört bei Ihnen wohin?
Wir klassifizieren Ihre KI-Anwendungsfälle und richten die passende, datenschutzkonforme Infrastruktur ein – von lokal bis EU-Cloud.