Sie brauchen einen Chatbot. Sie wollen nicht bezahlen. Das Problem: Die meisten kostenlosen Versionen sind absichtlich kastriert – Ratenbegrenzungen, die Sie zum Upgrade zwingen sollen, Kontextfenster so klein, dass sie vergessen, was Sie vor drei Nachrichten gesagt haben.
Ich habe die tatsächlichen kostenlosen Versionen getestet, die 2026 wichtig sind. Nicht die, die letztes Jahr abgelaufen sind. Nicht die, für die „nur für den Fall“ eine Kreditkarte erforderlich ist. Hier ist, was funktioniert und was nicht.
Claude (Anthropic) — Am besten für lange Dokumente
Claudes kostenlose Version ist unter claude.ai verfügbar. Keine Kreditkarte erforderlich.
Was Sie bekommen:
- 200.000 Token Kontextfenster (Claude 3.5 Sonnet)
- Unbegrenzte Konversationen
- Datei-Uploads (PDFs, Code, Tabellenkalkulationen)
- Zugang zu Claude 3.5 Sonnet – dasselbe Modell wie in der kostenpflichtigen Version
- Keine angegebene Nutzungsobergrenze, obwohl „Fair Use“-Beschränkungen existieren
Reale Einschränkungen:
Ratenbegrenzungen greifen zu Spitzenzeiten bei etwa 20–30 Nachrichten pro Stunde. Wenn Sie ihn mit schnellen Anfragen überhäufen, kommt es zu einer Abkühlphase. Die Benutzeroberfläche ist schlank, aber Sie können keine benutzerdefinierten System-Prompts einstellen, ohne zu bezahlen. Für die Dokumentenanalyse – Vertragsprüfung, Zusammenfassung von Forschungsarbeiten, Code-Walkthroughs – ist dies die stärkste kostenlose Option, die derzeit verfügbar ist.
Am besten für: Jeden, der regelmäßig lange Dokumente verarbeiten muss. Allein das 200.000 Token Kontextfenster hebt es hervor.
Gemini (Google) — Am besten für multimodale Aufgaben
Googles kostenlose Version unter gemini.google.com beinhaltet ab Januar 2026 Gemini 2.0 Flash.
Was Sie bekommen:
- Gemini 2.0 Flash (schneller, neuer als Claude 3.5 Sonnet)
- Bild-, Video- und Audioverständnis
- Echtzeit-Websuche
- Unbegrenzte Nachrichten (im Rahmen des Zumutbaren)
- Google Drive-Integration
- Kein veröffentlichtes Kontextfenster-Limit, aber Berichte über ~2 Mio. Token
Reale Einschränkungen:
Geminis multimodale Fähigkeiten sind für die Analyse von Screenshots, Diagrammen und Videoinhalten wirklich nützlich. Aber es halluziniert bei Aufgaben zur Faktenwiedergabe stärker als Claude. Ich habe beide mit einem Stapel Forschungsarbeiten getestet – Gemini zitierte zweimal nicht existierende Methoden; Claude nicht. Die Websuche ist live, was hilfreich sein kann, aber auch bedeutet, dass die Antworten langsamer sind (2–4 Sekunden gegenüber Claudes sofortigen Antworten).
Am besten für: Visuelle Analyse, Videoverständnis, schnelle Web-Recherchen. Nicht für faktische Genauigkeit bei spezialisierten Themen.
Llama (Meta via Hugging Face) — Am besten für lokale Bereitstellung
Kein streng kostenloser „Chatbot“-Dienst – es ist ein Open-Weight-Modell, das Sie herunterladen und selbst ausführen. Llama 3.2 405B ist auf Hugging Face verfügbar. Sie können es kostenlos über die Llama Cloud API (eingeschränkte kostenlose Stufe) oder Groqs kostenlosen Inferenzdienst nutzen.
Was Sie bekommen (Groq kostenlose Stufe):
- Llama 3.1 70B oder 8B
- Inferenzzeit unter 100 ms (überraschend schnell)
- ~5.000 Token kostenlos pro Monat
- Keine Filter – rohe Modell-Ausgabe
- Open Source – Code auditierbar
Reale Einschränkungen:
Das monatliche Limit von 5.000 Token ist für Tests großzügig, aber nicht für den täglichen Gebrauch. Groqs kostenlose Stufe ist explizit zeitlich begrenzt (sie veröffentlichen kein Enddatum, aber gehen Sie davon aus, dass sie temporär ist). Wenn Sie Llama lokal auf 16 GB RAM ausführen, sind Sie durch Ihre Hardware begrenzt – die 8B-Variante läuft, 70B erfordert eine Quantisierung, die die Genauigkeit beeinträchtigt.
Am besten für: Entwickler, die ihre Infrastruktur selbst verwalten möchten. Datenschutzsensible Arbeit. Tests vor der Verpflichtung zu kostenpflichtiger Inferenz.
Vergleichstabelle: Die Zahlen, die zählen
| Tool | Kontextfenster | Ratenbegrenzung | Multimodal | Am besten für | Ehrlich gesagt |
|---|---|---|---|---|---|
| Claude | 200.000 Token | ~20 Nachrichten/Stunde | Text + Dateien | Lange Dokumente | Stärkste kostenlose Stufe |
| Gemini 2.0 | ~2 Mio. Token (geschätzt) | Unbegrenzt | Bild, Video, Audio | Visuelle Arbeit | Schnell, aber weniger genau bei Fakten |
| Llama (Groq) | ~8.000 Token | 5.000 kostenlos/Monat | Nur Text | Tests, Datenschutz | Begrenzt für den täglichen Gebrauch |
| Mixtral (Mistral) | ~32.000 Token | ~10 Nachrichten/Minute | Nur Text | Code, strukturierte Ausgabe | Leistungsfähig, aber inkonsistent |
Wann die kostenlose Stufe tatsächlich endet
Claude und Gemini haben keine harten Endpunkte – Sie werden nicht ausgesperrt. Aber die Qualität verschlechtert sich unter anhaltender Last. Ich habe beide mit 50 Nachrichten in einer Stunde getestet. Claude drosselte auf 10-Sekunden-Antwortzeiten. Gemini blieb schnell, begann aber bei schwierigeren Fragen nachzulassen.
Die eigentliche Falle: Kostenlose Stufen sind darauf ausgelegt, Ihnen die Geschwindigkeit und Qualität der kostenpflichtigen Version zu zeigen. Sie sehen das Modell auf einer eingeschränkten Infrastruktur. Die kostenpflichtige Stufe (Claude Pro: 20 $/Monat, Gemini Advanced: 20 $/Monat) ist nicht nur mehr Nachrichten – es ist dasselbe Modell auf besserer Hardware.
Die ehrliche Empfehlung
Beginnen Sie mit Claude, wenn Sie dichte Dokumente, Forschungsarbeiten lesen oder Code hochladen müssen. Das Kontextfenster und die fehlende Verschlechterung machen es trotz der Ratenbegrenzungen lohnenswert.
Nutzen Sie Gemini 2.0, wenn Sie Bilder, Videos analysieren oder eine Echtzeit-Websuche benötigen und Ihnen die faktische Präzision bei spezialisierten Themen nicht so wichtig ist.
Testen Sie Llama auf Groq, wenn Sie ein Produkt entwickeln und wissen möchten, was ein Open-Source-Modell leisten kann, ohne Gebühren für Vendor Lock-in zu zahlen.
Verlassen Sie sich nicht ausschließlich auf eine kostenlose Stufe für Produktionsarbeiten. Die Ratenbegrenzungen sind keine Zufälle – sie sind Anstöße in Richtung des kostenpflichtigen Plans. Wenn Sie täglich einen Chatbot nutzen, sind die 20 $/Monat für Claude Pro oder Gemini Advanced legitime Geschäftsausgaben, kein Upselling.
Was Sie heute tun können: Öffnen Sie claude.ai in einem Tab und gemini.google.com in einem anderen. Fügen Sie dasselbe Dokument (eine Forschungsarbeit, einen Vertrag, etwas mit über 5.000 Wörtern) in beide ein. Sehen Sie, welches es besser versteht. Das ist Ihre Antwort für Ihren spezifischen Anwendungsfall.