Sie haben gerade drei separate LLM-Tabs geöffnet. Einer zum Schreiben, einer zur Code-Überprüfung, einer für Recherchen. Das Wechseln dazwischen kostet Zeit. Schlimmer noch – Sie kopieren und fügen manuell Kontexte zwischen Tools ein, die miteinander kommunizieren könnten.
Bei der Workflow-Automatisierung geht es nicht darum, „die KI alles machen zu lassen“. Es geht darum, Ihre LLM-Aufrufe in den Anwendungen zu belassen, in denen die Arbeit tatsächlich stattfindet – Ihre E-Mails, Ihre Tabellenkalkulationen, Ihr Projektmanagement-Tool, Ihr Slack-Kanal. Wenn das richtige Modell zum richtigen Zeitpunkt auf das richtige Tool trifft, verschwindet die Reibung.
Das funktionierende Setup
Hier gibt es zwei Wege. Wählen Sie den, der Ihrer Wartungsbereitschaft entspricht.
Weg 1: API-Integration (30 Minuten, kein Vendor-Lock-in) – Sie verbinden ChatGPT, Claude oder Gemini direkt über deren native Integrationen oder über ein Middleware-Tool wie Zapier, Make oder n8n mit Ihren Tools. Das ist schnell. Sie besitzen nichts. Wenn Zapier die Preise erhöht, wechseln Sie.
Weg 2: Selbst gehostete Orchestrierung (2–4 Stunden, mehr Kontrolle) – Sie richten einen kleinen Dienst (Node.js, Python) ein, der API-Aufrufe an mehrere Modelle verwaltet und das Routing übernimmt. Dies dauert länger in der Einrichtung, gibt Ihnen aber die volle Kontrolle darüber, welches Modell welche Aufgabe übernimmt.
Die meisten Teams sollten mit Weg 1 beginnen. Wechseln Sie zu Weg 2 nur, wenn Sie einen spezifischen Grund haben – Kostendruck, Compliance-Anforderungen oder ein sich wiederholendes Muster, das die Infrastruktur rechtfertigt.
Drei reale Workflows, die tatsächlich funktionieren
Workflow 1: Slack → Claude → Tabellenkalkulation
Ihr Team postet eine rohe Kundenfeedback-Nachricht in Slack. Ein Webhook löst Claude (über Make.com) aus, um Sentiment, Kernproblem und Priorität zu extrahieren. Claude schreibt das Ergebnis direkt in eine Google Sheets-Zeile. Kein manuelles Kopieren und Einfügen. Kein vergessener Kontext.
# Prompt, den Claude erhält (vom Make-Präprozessor)
Extrahieren Sie aus dieser Slack-Nachricht:
- Kundenstimmung (positiv/negativ/neutral)
- Hauptproblem (max. 1 Satz)
- Priorität (1-3, wobei 1 kritisch ist)
- Empfohlene nächste Aktion
Nachricht: [Slack-Text wird hier eingefügt]
Antworten Sie als JSON: {"sentiment": "", "issue": "", "priority": 0, "action": ""}
Das funktioniert, weil Claude Sonnet 4 kurze, begrenzte Eingaben für ca. 0,003 $ pro Aufruf verarbeitet. Sie können 330.000 davon monatlich für 1.000 $ ausführen. Das JSON-Ausgabeformat bindet Claude an eine Struktur – es wird nicht in Prosa abdriften.
Workflow 2: Gmail → GPT-4o → Task-Management-Tool
E-Mails kommen an. Ein Zapier-Flow löst GPT-4o aus, um sie zu klassifizieren (dringend/routinemäßig/Referenz), Aktionspunkte zu extrahieren und automatisch Tickets in Asana oder Linear zu erstellen. Sie lesen E-Mails, aber die Weiterleitung und Extraktion erfolgen ohne Sie.
GPT-4o ist hier die richtige Wahl, da es Bilder (Anhänge) und längere E-Mail-Threads schneller verarbeitet als günstigere Modelle. Seine multimodale Fähigkeit verhindert, dass Sie den Kontext verlieren, wenn jemand einen Screenshot mit dem E-Mail-Text sendet.
# Schlechter Prompt (vage, keine Struktur)
Lies diese E-Mail und sag mir, was ich damit machen soll.
# Verbesserter Prompt (begrenzt, JSON-Ausgabe)
Klassifizieren Sie diese E-Mail und extrahieren Sie Aktionspunkte.
Kategorieoptionen: dringend, routinemäßig, nur zur Referenz.
Antworten Sie als JSON:
{
"category": "",
"subject_summary": "",
"action_items": [{"task": "", "deadline": ""}],
"assignee": "" // Verwenden Sie den Namen eines Teammitglieds oder lassen Sie es leer
}
Workflow 3: Tabellenkalkulation → Gemini → Content-Ausgabe
Sie pflegen eine Content-Briefing-Tabellenkalkulation (Thema, Ton, Wortanzahl, Kernpunkte). Apps Script (Googles Automatisierungsschicht) löst die Gemini-API aus, um Entwürfe aus jeder Zeile zu generieren. Ausgaben landen in einem Google Doc. Überprüfen, verfeinern, veröffentlichen.
Geminis Stärke liegt hier nicht in der Geschwindigkeit, sondern in den Kosten pro Token. Bei der Generierung von Inhalten im Batch ist die Gemini-API bei gleicher Qualität für längere Texte etwa 40 % günstiger als GPT-4o. Wenn Sie 500+ Stücke pro Monat generieren, summiert sich dieser Unterschied.
Die Integrationsschicht, die zählt
Sie brauchen kein schickes Orchestrierungstool. Beginnen Sie mit dem, was Ihr SaaS bereits unterstützt.
Native Integrationen (am einfachsten): Slack hat eine native ChatGPT-Integration. Google Workspace hat ein Gemini-Plugin. Diese sind Zero-Code.
Zapier / Make (am flexibelsten): Beide Plattformen verfügen über Module für ChatGPT, Claude und Gemini. Sie erstellen Workflows, indem Sie Trigger (E-Mail kommt an, Tabellenzeile hinzugefügt, Formular übermittelt) mit Aktionen (API aufrufen, Ausgabe formatieren, an Tool senden) verbinden. Kein Code erforderlich. Kosten: 50–200 $/Monat, abhängig vom Aufgabevolumen.
Selbst gehostet (Python/Node): Wenn Ihr Workflow maßgeschneidert oder kostensensibel ist, dauert die Erstellung eines leichten Orchestrators 3–4 Stunden:
// Node.js + Axios Beispiel
const axios = require('axios');
async function routeToModel(task, input) {
let response;
if (task === 'sentiment') {
// Claude für Klassifizierung verwenden (schneller, günstiger)
response = await axios.post('https://api.anthropic.com/v1/messages', {
model: 'claude-3-5-sonnet-20241022',
max_tokens: 256,
messages: [{role: 'user', content: input}]
}, {
headers: {'x-api-key': process.env.ANTHROPIC_API_KEY}
});
} else if (task === 'image_analysis') {
// GPT-4o für multimodale Nutzung
response = await axios.post('https://api.openai.com/v1/chat/completions', {
model: 'gpt-4o',
max_tokens: 512,
messages: [{role: 'user', content: input}]
}, {
headers: {'Authorization': `Bearer ${process.env.OPENAI_API_KEY}`}
});
}
return response.data;
}
module.exports = { routeToModel };
Dieses Muster ermöglicht es Ihnen, Aufgaben nach Typ zu routen. Sentiment-Extraktion → Claude (günstig, schnell). Bildanalyse → GPT-4o (multimodal). Lange Dokumente → welches Modell Sie auch immer lokal verglichen haben.
Kostenkontrolle ist Ihr echtes Problem
Ein automatisierter Workflow, der 100 Mal pro Tag eine API für 0,01 $ pro Aufruf aufruft, kostet 30 $/Monat. Bei 1.000 Aufrufen pro Tag sind es 300 $. Sie brauchen Schutzmaßnahmen.
Legen Sie harte Limits in Ihrer Orchestrierungsschicht fest. Verwenden Sie Claude Sonnet 4 und GPT-4o für wichtige Arbeiten. Verwenden Sie Gemini oder Llama 3.1 (über Together AI) für repetitive Aufgaben mit geringer Fehlertoleranz. Bündeln Sie API-Aufrufe an dasselbe Modell in derselben Minute – die meisten Anbieter zählen Minuten, nicht einzelne Aufrufe.
Überwachen Sie Ihre tatsächlichen Ausgaben wöchentlich. Zapier und Make zeigen die Kosten pro Workflow an. Wenn ein Workflow mehr als 10 % der eingesparten Zeit kostet, pausieren Sie ihn. Automatisieren Sie nur, was sich lohnt.
Tun Sie das heute
Wählen Sie einen Workflow, den Sie mehr als 3 Mal pro Woche wiederholen. E-Mail-Klassifizierung, Slack-Analyse, Content-Extraktion – was auch immer. Verbringen Sie 30 Minuten damit, ihn über Zapier mit Claude zu verbinden (günstigerer Startpunkt als GPT-4o). Optimieren Sie nicht. Verbinden Sie einfach. Sobald er läuft, messen Sie die tatsächliche Zeitersparnis über zwei Wochen. Wenn sie die Einrichtungskosten in Stunden übersteigt, erweitern Sie. Wenn nicht, beenden Sie ihn und wechseln Sie zum nächsten Workflow.