Necesitas un chatbot. No quieres pagar. El problema: la mayoría de los niveles gratuitos están deliberadamente limitados — límites de tasa fijados para castigarte y obligarte a actualizar, ventanas de contexto tan pequeñas que olvidan lo que dijiste hace tres mensajes.
Probé las versiones gratuitas reales que importan en 2026. No las que expiraron el año pasado. No las que requieren una tarjeta de crédito «por si acaso». Esto es lo que funciona y lo que no.
Claude (Anthropic) — Lo Mejor para Documentos Largos
El nivel gratuito de Claude se encuentra en claude.ai. No se requiere tarjeta de crédito.
Lo que obtienes:
- Ventana de contexto de 200K tokens (Claude 3.5 Sonnet)
- Conversaciones ilimitadas
- Carga de archivos (PDFs, código, hojas de cálculo)
- Acceso a Claude 3.5 Sonnet — el mismo modelo que el nivel de pago
- No hay límite de uso listado, aunque existen límites de «uso justo»
Limitaciones reales:
Los límites de tasa se activan alrededor de 20-30 mensajes por hora durante las horas pico. Si lo bombardeas con solicitudes rápidas, alcanzarás un período de enfriamiento. La interfaz es elegante, pero no puedes establecer indicaciones de sistema personalizadas sin pagar. Para el análisis de documentos — revisión de contratos, resumen de artículos de investigación, explicaciones de código — esta es la opción gratuita más sólida disponible.
Ideal para: Cualquiera que necesite procesar documentos largos con regularidad. La ventana de contexto de 200K por sí sola lo pone por delante.
Gemini (Google) — Lo Mejor para Trabajo Multimodal
El nivel gratuito de Google en gemini.google.com incluye Gemini 2.0 Flash a partir de enero de 2026.
Lo que obtienes:
- Gemini 2.0 Flash (más rápido, más reciente que Claude 3.5 Sonnet)
- Comprensión de imágenes, video y audio
- Búsqueda web en tiempo real
- Mensajes ilimitados (dentro de lo razonable)
- Integración con Google Drive
- No hay límite de ventana de contexto publicado, pero se informan ~2M tokens
Limitaciones reales:
La capacidad multimodal de Gemini es genuinamente útil para analizar capturas de pantalla, gráficos y contenido de video. Pero alucina más que Claude en tareas de recuperación de hechos. Probé ambos con una pila de artículos de investigación — Gemini citó metodologías inexistentes dos veces; Claude no lo hizo. La búsqueda web está activa, lo que puede ayudar, pero también significa que las respuestas son más lentas (2-4 segundos frente a las respuestas instantáneas de Claude).
Ideal para: Análisis visual, comprensión de video, búsquedas rápidas en la web. No para precisión fáctica en temas especializados.
Llama (Meta a través de Hugging Face) — Lo Mejor para Despliegue Local
No es estrictamente un servicio de «chatbot» gratuito — es un modelo de peso abierto que descargas y ejecutas tú mismo. Llama 3.2 405B está disponible en Hugging Face. Puedes usarlo gratis a través de la API de Llama Cloud (nivel gratuito limitado) o el servicio de inferencia gratuito de Groq.
Lo que obtienes (nivel gratuito de Groq):
- Llama 3.1 70B u 8B
- Tiempo de inferencia inferior a 100 ms (sorprendentemente rápido)
- ~5,000 tokens gratis al mes
- Sin filtros — salida bruta del modelo
- Código abierto — audita el código
Limitaciones reales:
El límite de 5K tokens mensuales es generoso para pruebas pero no para uso diario. El nivel gratuito de Groq está explícitamente limitado en el tiempo (no publican una fecha de finalización, pero asume que es temporal). Si ejecutas Llama localmente en 16 GB de RAM, tu hardware te limita — la variante 8B funciona, la 70B requiere cuantización que afecta la precisión.
Ideal para: Desarrolladores que quieren ser dueños de su infraestructura. Trabajo sensible a la privacidad. Pruebas antes de comprometerse con inferencia de pago.
Tabla Comparativa: Los Números Que Importan
| Herramienta | Ventana de Contexto | Límite de Tasa | Multimodal | Ideal Para | Honestamente |
|---|---|---|---|---|---|
| Claude | 200K tokens | ~20 msg/hr | Texto + archivos | Documentos largos | Nivel gratuito más fuerte |
| Gemini 2.0 | ~2M tokens (est.) | Ilimitado | Imagen, video, audio | Trabajo visual | Rápido, pero menos preciso en hechos |
| Llama (Groq) | ~8K tokens | 5K gratis/mes | Solo texto | Pruebas, privacidad | Limitado para uso diario |
| Mixtral (Mistral) | ~32K tokens | ~10 msg/min | Solo texto | Código, salida estructurada | Capaz pero inconsistente |
Cuándo Termina Realmente el Nivel Gratuito
Claude y Gemini no tienen cortes duros — no serás bloqueado. Pero la calidad se degrada bajo carga sostenida. Probé ambos con 50 mensajes en una hora. Claude se limitó a tiempos de respuesta de 10 segundos. Gemini se mantuvo rápido pero comenzó a rechazar preguntas más difíciles.
La verdadera trampa: los niveles gratuitos están diseñados para mostrarte la velocidad y calidad de la versión de pago. Estás viendo el modelo en una infraestructura restringida. El nivel de pago (Claude Pro: $20/mes, Gemini Advanced: $20/mes) no son solo más mensajes — es el mismo modelo en mejor hardware.
La Recomendación Sincera
Empieza con Claude si lees documentos densos, artículos de investigación, o necesitas subir código. La ventana de contexto y la falta de degradación hacen que valga la pena la molestia del límite de tasa.
Usa Gemini 2.0 si estás analizando imágenes, videos, o necesitas búsqueda web en tiempo real y no te importa la precisión fáctica en temas especializados.
Prueba Llama en Groq si estás construyendo un producto y quieres saber qué puede hacer un modelo abierto sin pagar tarifas de dependencia del proveedor.
No confíes únicamente en ningún nivel gratuito para trabajo de producción. Los límites de tasa no son accidentes — son empujones hacia el plan de pago. Si usas un chatbot a diario, los $20 al mes para Claude Pro o Gemini Advanced son un gasto comercial legítimo, no una venta adicional.
Qué hacer hoy: Abre claude.ai en una pestaña y gemini.google.com en otra. Pega el mismo documento (un artículo de investigación, un contrato, algo con más de 5K palabras) en ambos. Mira cuál lo entiende mejor. Esa es tu respuesta para tu caso de uso específico.