Zurück zum Blog
Blog 9. Juni 2026 8 Min. Lesezeit

Nicht jede KI gehört in die Cloud.

Lokal, self-hosted, EU-SaaS oder US-Cloud? Vier Wege, KI im Unternehmen zu betreiben – verglichen nach Kosten, Datensouveränität und Leistung. Mit einer klaren Empfehlung, welche Datenklasse wohin gehört.

Roberto Schlatter
Roberto Schlatter Gründer & KI-Berater, Moro Vision GmbH

«Machen wir das einfach mit ChatGPT.» Für viele Unternehmen ist die US-Cloud der Reflex, sobald es um KI geht: schnell, stark, günstig im Einstieg. Doch nicht jede Aufgabe – und vor allem nicht jede Datenklasse – gehört in die Cloud eines US-Anbieters.

Es gibt nicht den einen richtigen Weg, KI zu betreiben, sondern vier gängige – vom eigenen Rechner bis zur direkten US-Subscription. Jeder ist ein Kompromiss aus drei Grössen: Kosten, Datensouveränität und Modell-Leistung. Dieser Überblick ordnet sie ein, damit die Wahl zur Anforderung passt – nicht zum Hype.

Leistung und Souveränität ziehen gegeneinander

Als Faustregel gilt: Je näher die Daten am eigenen Haus bleiben, desto höher die Kontrolle – und desto begrenzter oder teurer die verfügbare Spitzenleistung. Wer maximale Antwortqualität will, landet schnell bei den grossen US-Modellen; wer maximale Datenhoheit braucht, bei lokaler Hardware. Die interessanten Optionen liegen dort, wo sich beides austarieren lässt.

Der entscheidende Hebel ist selten das Modell. GPT, Claude und Gemini sind über mehrere Wege erreichbar. Was sich unterscheidet, ist wo die Daten verarbeitet werden, wer darauf zugreifen kann und was es kostet. Genau das macht die Infrastruktur zur eigentlichen Entscheidung.

Die vier Wege im Vergleich

Vier Setups decken die Bandbreite ab – von maximaler Souveränität bis maximaler Bequemlichkeit. Die Ampel zeigt die jeweilige Stärke pro Dimension (grün = gut, orange = mittel, rot = kritisch/hoch).

Setup Daten­souveränität Modell-Leistung Laufende Kosten
LM StudioLokal Maximal Mittel Sehr tief
Open WebUIServer / Cloud-Tenant Hoch Frontier Tief / variabel
LangdockEU-SaaS Hoch (EU) Frontier Mittel
Frontier LabsUS-Cloud Tief Frontier+ Bis hoch

«Frontier Labs» meint dabei die direkten Dienste von OpenAI, Anthropic und Google (ChatGPT, Claude, Gemini) über ein US-Abonnement.

Die vier Setups im Detail

01LM Studio – maximale Datenhoheit, lokal

Eine Desktop-Anwendung, die Open-Weights-Modelle (Llama, Qwen, Mistral, DeepSeek) direkt auf dem eigenen Rechner ausführt. Im rein lokalen Betrieb verlassen die Daten das Gerät nie – ein Air-Gap-Betrieb ist möglich. Über LM Link lassen sich zusätzlich eigene, selbst gehostete Cloud-Modelle (etwa im eigenen Azure-Tenant) anbinden; dann gehen die Daten zwar an diese Modelle, bleiben aber in der eigenen, kontrollierten Infrastruktur.

Die Software ist gratis. Auf einer vorhandenen Maschine entstehen praktisch keine laufenden Kosten – nur Strom. Erst für grössere Modelle braucht es eine einmalige Hardware-Investition (GPU oder Mac mit viel RAM). Der Preis für diese Souveränität: Die Spitzenleistung bleibt hinter echten Frontier-Modellen zurück. Ideal für sensible Daten, Offline-Betrieb, Einzelplatz und Prototyping.

02Open WebUI – Frontier aus dem eigenen Tenant

Open WebUI ist kein Modell, sondern ein self-hosted Frontend (Docker) – ein Gateway, das jedes OpenAI-kompatible Backend einbindet. Das macht es zur flexibelsten Option: lokale bzw. Open-Weights-Modelle (via vLLM oder Ollama) ebenso wie Frontier-Modelle, die im eigenen Azure-Tenant (Azure OpenAI) deployt werden – etwa in der Region Switzerland North.

So bekommt man Spitzenleistung bei eigener Daten-Governance und wählbarer Region. Das Frontend-Hosting ist günstig; die Modellkosten richten sich nach dem Backend (Token bei Azure, GPU-Miete bei Open-Weights). Der Preis: Frontend und Backends müssen selbst betrieben werden, und über einen Hyperscaler ist kein echtes Air-Gap möglich (Cloud-Act-Restrisiko). Ideal für Unternehmen mit eigenem Cloud-Tenant, die Frontier-Leistung mit eigener Governance verbinden wollen.

03Langdock – Frontier, EU-gehostet

Eine DSGVO-konforme SaaS-Plattform mit Rechenzentrum in der EU. Sie bündelt führende Modelle (GPT, Claude, Gemini, Mistral) hinter einem EU-Endpoint – mit Auftragsverarbeitungsvertrag und ohne Training auf den Kundendaten. Frontier-Leistung bei EU-Datenhaltung, sofort startklar, zentral verwaltbar.

Die Kosten sind als Lizenz pro Nutzer und Monat planbar (Grössenordnung CHF 20–40). Sie bleiben auch bei intensiver Nutzung mittel, weil kein token-hungriger Coding-Agent im Spiel ist. Der Preis: SaaS-Abhängigkeit, kein Air-Gap, Modell-Provider im Hintergrund (EU-gekapselt). Ideal für KMU, die Spitzenleistung und EU-Compliance wollen, ohne selbst zu hosten.

04Frontier Labs – direkte US-Subscription

Der direkte Zugang zu den nativen Diensten von OpenAI, Anthropic und Google. Sofort die neuesten und stärksten Modelle, null Betriebsaufwand, günstiger Einstieg. Der Haken: Die Datenverarbeitung findet in den USA statt, unter US-Jurisdiktion (Cloud Act); Consumer-Pläne trainieren teils auf den Eingaben. Für Personendaten oder Geschäftsgeheimnisse ist das heikel.

Bei den laufenden Kosten lohnt eine Differenzierung – sie hängen am Abrechnungsmodell, nicht am Tool:

Mittel / planbar

Im Abo gedeckelt

Claude Code im Claude-Max-Abo, Codex in ChatGPT Pro/Plus, Gemini über Google AI/Workspace – Sitzplatz-Lizenz, planbar.

Bis hoch

Rohe API

Unbegrenzte Automation oder Coding-Agents direkt über die API: nach Verbrauch abgerechnet – bei intensiver Nutzung schnell hoch.

Ideal für unkritische Daten, schnelle Resultate, neuste Features, Recherche und Entwürfe.

Die Empfehlung: KI nach Datenklasse staffeln

Es gibt kein «bestes» Setup – nur das passende. In der Praxis bewährt sich kein Entweder-oder, sondern ein abgestuftes Modell: eine Datenklassifizierung, die jeder Aufgabe das passende Setup zuweist. So entsteht ein gestaffeltes System – höchste Souveränität dort, wo es zählt, höchste Leistung dort, wo sie risikolos nutzbar ist.

DatenklasseEmpfohlenes Setup
Geistiges Eigentum, Verträge, Finanzdaten, StrategieLM Studio (lokal) o. Open WebUI mit Open-Weights
Kundendaten, HR-Daten, regulierte & interne DokumenteOpen WebUI + eigener Azure-Tenant
Personendaten (EU), Kundenkommunikation, Marketing-DatenLangdock (EU-SaaS)
Öffentliche Daten, Recherche, Entwürfe, Marketing-TexteUS-Subscription

Die Infrastruktur ist eine Strategieentscheidung, kein Tool-Kauf. Wer einmal sauber klassifiziert, was wie schützenswert ist, trifft alle weiteren KI-Entscheide schneller und sicherer.

Häufige Fragen

Welche KI-Infrastruktur eignet sich für sensible oder vertrauliche Daten?
Für vertrauliche Daten wie geistiges Eigentum, Verträge oder Finanzdaten eignen sich lokale Modelle (z. B. mit LM Studio) oder eine self-hosted Lösung wie Open WebUI mit Open-Weights-Modellen auf eigenem Server. Die Daten verlassen das eigene Haus nie, ein Air-Gap-Betrieb ist möglich – das ist die höchste Stufe an Datensouveränität.
Sind ChatGPT, Claude und Gemini DSGVO- bzw. DSG-konform?
Bei direkten US-Abonnements werden die Daten in den USA verarbeitet und unterliegen US-Jurisdiktion (Cloud Act). Consumer-Pläne trainieren teils auf den eingegebenen Daten. Für Personendaten oder Geschäftsgeheimnisse ist das kritisch. Datenschutzkonform wird es über EU-gehostete Wege: Azure OpenAI im eigenen EU/CH-Tenant oder eine EU-SaaS-Plattform wie Langdock mit Auftragsverarbeitungsvertrag.
Kann ich Frontier-Modelle wie GPT-4o datenschutzkonform nutzen?
Ja. Zwei Wege halten die Daten in der EU bzw. der Schweiz: erstens Frontier-Modelle, die im eigenen Azure-Tenant (Azure OpenAI) in einer Region wie Switzerland North deployt und über Open WebUI angebunden werden; zweitens eine EU-gehostete SaaS-Plattform wie Langdock. Beide bieten Frontier-Leistung bei eigener bzw. EU-konformer Daten-Governance ohne Training auf den Kundendaten.
Was kostet der Betrieb von KI mit Open WebUI?
Das Frontend-Hosting (kleiner Container oder VPS) ist günstig. Die Modellkosten hängen vom Backend ab: Token-Verbrauch bei Azure OpenAI (über Provisioned Throughput planbar) oder GPU-Miete bei Open-Weights-Modellen. Eine zusätzliche SaaS-Lizenz fällt nicht an.
Treiben Coding-Agents wie Claude Code oder Codex die KI-Kosten in die Höhe?
Es kommt auf das Abrechnungsmodell an. In einem Abo – etwa Claude Code im Claude-Max-Plan oder Codex in ChatGPT Pro/Plus – sind die Agents gedeckelt und planbar (mittlere Kosten). Erst über die rohe, unlimitierte API steigen die Token-Kosten bei intensiver Nutzung schnell auf hoch.
Lohnt sich lokale KI mit LM Studio für KMU?
Ja, wenn Datenhoheit oder Offline-Betrieb zählen. Die Software ist gratis und läuft lokal; auf einer vorhandenen Maschine entstehen praktisch keine laufenden Kosten – nur Strom. Kleine bis mittlere Modelle laufen auf einem modernen Notebook; nur für grössere Modelle braucht es eine einmalige Hardware-Investition. Die Spitzenleistung bleibt aber hinter den Frontier-Modellen zurück.

Welche Datenklasse gehört bei Ihnen wohin?

Wir klassifizieren Ihre KI-Anwendungsfälle und richten die passende, datenschutzkonforme Infrastruktur ein – von lokal bis EU-Cloud.

Kostenloses Erstgespräch buchen → Mehr über Moro Vision →