Guía Completa de SillyTavern 2026: Configuración, Modelos Locales y Mejores Personajes
SillyTavern es el frontend de roleplay IA más potente disponible hoy en día. No tiene la comodidad de Character.ai ni la curva de entrada suave de Janitor AI, pero te da algo que ninguna plataforma cloud puede ofrecerte: control absoluto sobre cada aspecto de la experiencia — el modelo, los parámetros, el system prompt, la memoria, el lore. Si eres un power user que quiere exprimir al máximo el roleplay con IA, esta es tu herramienta.
Esta guía cubre todo lo que necesitas para empezar en 2026: desde los requisitos de hardware hasta cómo crear personajes complejos, pasando por la instalación paso a paso y los mejores modelos para cada caso de uso.
TL;DR — Lo Más Importante
- SillyTavern es gratis y open-source — el coste viene del hardware o las APIs cloud que uses
- Necesitas mínimo 8GB de VRAM para una experiencia de roleplay local decente
- LM Studio es la forma más fácil de correr modelos locales con SillyTavern
- Los mejores modelos para RP local en 2026: Rocinante-X-12B (16GB VRAM) o L3-8B-Stheno-v3.2 (8GB)
- También puedes conectar APIs cloud (Claude, GPT, Gemini) para tener la mejor calidad sin hardware
- La comunidad de SillyTavern en Discord y Reddit tiene recursos extensos — no estás solo
- El sistema de tarjetas de personaje (CharacterCard v2) es compatible con otras plataformas
Qué es SillyTavern y Por Qué es la Mejor Opción para Power Users
SillyTavern es un frontend de chat con modelos de lenguaje diseñado específicamente para roleplay, narrativa creativa y simulación de personajes. Empezó como un fork de TavernAI (de ahí el nombre) y ha evolucionado hasta convertirse en el estándar de facto de la comunidad de roleplay IA.
Lo que lo hace diferente de cualquier plataforma cloud:
Control total del modelo: Puedes conectar cualquier modelo local (via Ollama, LM Studio, KoboldCPP) o cualquier API cloud (Claude, GPT-5, Gemini, modelos de OpenRouter). Tú decides qué motor usa el personaje.
Control total de los parámetros: Temperatura, top-p, repetition penalty, context length — todo ajustable. Un modelo a temperatura 0.8 se comporta de forma completamente diferente al mismo modelo a temperatura 1.2. En plataformas cloud no tienes acceso a esto.
Sistema de personajes avanzado: El formato CharacterCard v2 permite definir al personaje en detalle (descripción, personalidad, ejemplos de diálogo, escenario inicial), e importar/exportar personajes entre plataformas.
Extensiones y plugins: La comunidad ha desarrollado extensiones para memoria de largo plazo, generación de imágenes integrada, gestión de lore, y mucho más.
Privacidad real: Con modelos locales, tus conversaciones no salen de tu máquina. Punto.
"SillyTavern es la diferencia entre conducir un coche automático de alquiler y tunear tu propio coche. La curva de aprendizaje existe, pero el control que ganas cambia completamente la experiencia." — Javier Santos Criado, consultor de IA en Javadex
SillyTavern vs Character.ai vs Otras Plataformas
| Característica | SillyTavern | Character.ai | Janitor AI | Jenova.ai |
|---|---|---|---|---|
| Precio | Gratis | Gratis / $9.99/mes | Gratis / ~$12/mes | ~$15/mes |
| Modelo | Tú eliges | Propio (cerrado) | Propio + API externa | Claude/GPT/Gemini |
| Control parámetros | Total | Ninguno | Parcial | Ninguno |
| Privacidad | Total (local) | Baja | Media | Media |
| Memoria larga | Extensiones | ~30 mensajes | Parcial | Ilimitada |
| Curva aprendizaje | Alta | Baja | Media | Baja |
| NSFW | Sí (local) | No | Sí | No |
| App móvil | No oficial | Sí | Sí | Parcial |
| Comunidad | Muy activa | Masiva | Activa | Media |
Requisitos de Hardware para SillyTavern
El propio SillyTavern es muy ligero (es básicamente una app web local). El hardware que necesitas es para los modelos locales, no para SillyTavern en sí.
| Configuración | GPU | VRAM | RAM | Modelos posibles | Calidad RP |
|---|---|---|---|---|---|
| Mínimo viable | RTX 3060 / RX 6600 | 8 GB | 16 GB | L3-8B-Stheno, Llama 4 Scout 9B | Buena |
| Recomendado | RTX 4070 / RX 7800 XT | 12-16 GB | 32 GB | Rocinante-X-12B, Snowpiercer-15B | Muy buena |
| Enthusiast | RTX 4080/4090 | 16-24 GB | 64 GB | Modelos 30-70B en cuantización | Excelente |
| Sin GPU dedicada | CPU + RAM | N/A | 32-64 GB | Modelos GGUF pequeños (lento) | Básica |
| Solo API cloud | Cualquiera | N/A | 8 GB | Claude, GPT, Gemini | La mejor |
Paso a Paso: Instalación de SillyTavern 2026
Paso 1: Instalar Node.js
SillyTavern requiere Node.js 18 o superior.
- Descarga Node.js LTS desde: nodejs.org
- Verifica la instalación:
node --versiondebe mostrar v18 o superior
Paso 2: Descargar SillyTavern
1# Clona el repositorio (opción recomendada)2git clone https://github.com/SillyTavern/SillyTavern.git3 4# O descarga el ZIP desde GitHub releases
Paso 3: Instalar dependencias y arrancar
1cd SillyTavern2 3# En Windows: ejecuta start.bat4# En macOS/Linux:5npm install6node server.js
SillyTavern se abrirá automáticamente en tu navegador en http://localhost:8000.
Paso 4: Configurar el backend de IA
Aquí tienes tres opciones según tu hardware:
Opción A — LM Studio (más fácil para modelos locales):
- Descarga LM Studio desde lmstudio.ai
- Descarga un modelo (te recomendamos L3-8B-Stheno-v3.2 para empezar)
- En LM Studio, ve a "Local Server" y actívalo
- En SillyTavern → API → selecciona "Text Completion" → URL:
http://localhost:1234/v1
Opción B — Ollama (más simple, más limitado):
- Instala Ollama desde ollama.ai
- Descarga un modelo:
ollama pull llama3 - En SillyTavern → API → selecciona "Ollama" → URL:
http://localhost:11434
Opción C — API cloud (Claude, OpenAI, etc.):
- Obtén tu API key de Anthropic (claude.ai) o OpenAI
- En SillyTavern → API → selecciona "Claude" o "OpenAI"
- Introduce tu API key
Paso 5: Tu primera conversación
Una vez configurado el backend, crea o importa un personaje y empieza. La interfaz puede parecer abrumadora al principio — normal. Los controles más importantes están en el panel lateral izquierdo (configuración del personaje) y el menú de la parte superior (parámetros del modelo).
Los Mejores Modelos Locales para SillyTavern en 2026
| Modelo | VRAM mínima | Calidad RP | NSFW | Cuantización | Descarga |
|---|---|---|---|---|---|
| Rocinante-X-12B | 10-12 GB | 8.2/10 | Sí | Q4_K_M | HuggingFace |
| Snowpiercer-15B | 12-16 GB | 8.3/10 | Sí | Q4_K_M | HuggingFace |
| L3-8B-Stheno-v3.2 | 6-8 GB | 8.0/10 | Sí | Q5_K_M | HuggingFace |
| MythoMax-L2-13B | 10-12 GB | 7.9/10 | Sí | Q4 | HuggingFace |
| Llama 4 Scout 9B | 5-6 GB | 7.6/10 | Sí | Q4_K_M | Meta/HuggingFace |
| Nous Hermes 2 Solar 10.7B | 8-10 GB | 7.5/10 | Parcial | Q4 | HuggingFace |
Recomendaciones por Hardware
Si tienes 6-8GB VRAM (RTX 3060, RTX 4060):
Tu mejor opción es L3-8B-Stheno-v3.2 en Q5_K_M. Es el modelo más pequeño de la lista con buen rendimiento de roleplay real. Para narrativa más casual, Llama 4 Scout 9B en Q4 también funciona bien y es más fácil de encontrar.
Si tienes 12-16GB VRAM (RTX 4070, RTX 3080):
Rocinante-X-12B en Q4_K_M es la elección obvia. Si prefieres algo orientado más al contenido adulto con más parámetros, Snowpiercer-15B es el favorito de la comunidad actualmente. Ambos están en HuggingFace.Si tienes 20-24GB VRAM (RTX 4090, RTX 3090):
Puedes correr modelos de 20-30B en Q4. Busca los últimas finetunes comunitarios en HuggingFace — la oferta cambia rápido y la comunidad señaliza los mejores en los foros de r/SillyTavernAI.
Cómo Descargar Modelos
La forma más cómoda es usar LM Studio, que tiene una interfaz de búsqueda integrada. También puedes descargar directamente desde HuggingFace:
1# Con huggingface-cli2pip install huggingface_hub3huggingface-cli download TheBloke/MythoMax-L2-13B-GGUF --include "*.Q4_K_M.gguf"
Para los modelos GGUF (el formato más común para uso local), busca siempre las variantes Q4_K_M como mínimo para roleplay. Q3 y Q2 degradan notablemente la calidad narrativa.
Cómo Conectar APIs Cloud con SillyTavern
Si quieres la máxima calidad sin invertir en hardware, conectar SillyTavern a una API cloud es la mejor opción. Obtienes la interfaz y el sistema de personajes de SillyTavern con la calidad de Claude Opus 4.6 o GPT-5.2.
Conectar Claude (Anthropic)
- Ve a console.anthropic.com y crea una cuenta
- Genera una API key en "API Keys"
- En SillyTavern: API Settings → API Type: "Claude" → Introduce tu API key
- Selecciona el modelo (claude-opus-4-6 para máxima calidad)
- Ajusta los parámetros recomendados para roleplay (temperatura: 0.9-1.1)
Coste estimado: Claude Opus cuesta ~$15 por millón de tokens de entrada. Una sesión de roleplay de 2 horas consume aproximadamente 50.000-80.000 tokens. Eso son ~$0.75-1.20 por sesión de 2 horas de calidad máxima.
Conectar OpenAI (GPT-5.2)
- Ve a platform.openai.com
- Genera una API key
- En SillyTavern: API Settings → API Type: "OpenAI" → API key
- Modelo:
gpt-5.2o el más reciente disponible
Conectar via OpenRouter (múltiples modelos)
OpenRouter es un proxy que da acceso a múltiples modelos (Claude, GPT, Mistral, modelos open-source) con una sola API key. Muy útil para comparar modelos sin cambiar configuración:
- Regístrate en openrouter.ai
- Obtén tu API key y añade créditos
- En SillyTavern: API Settings → "OpenAI" → URL:
https://openrouter.ai/api/v1→ API key de OpenRouter
Cómo Crear y Personalizar Personajes en SillyTavern
El sistema de personajes de SillyTavern usa el formato CharacterCard v2, un estándar que también es compatible con Janitor AI y otras plataformas. Aquí están los campos clave:
Los Campos de la Tarjeta de Personaje
Name (Nombre): Simple, el nombre del personaje.
Description (Descripción): La definición principal del personaje. Incluye aquí apariencia física, personalidad, historia, patrones de habla, manías. Cuanto más detallado, mejor. Un personaje bien definido en este campo mantiene su consistencia durante sesiones mucho más largas.
Ejemplo de descripción efectiva:
1Elara es una maga de 28 años con experiencia en magia de ilusión. Habla de forma directa y 2algo sarcástica, con un humor seco. Tiene la manía de jugar con una moneda de cobre entre 3los dedos cuando piensa. Desconfía de los paladines tras una mala experiencia en su pasado. 4Cuando está nerviosa, tiende a hablar más rápido y usar más palabras técnicas de su oficio.
Personality (Personalidad): Un resumen más compacto de los rasgos de personalidad, para uso interno del modelo.
Scenario (Escenario): El contexto inicial de la historia — dónde están los personajes, qué está pasando, qué lleva a este momento.
First Message (Primer mensaje): El mensaje inicial del personaje cuando empieza la conversación. Este primer mensaje marca el tono de todo lo que sigue — invierte tiempo en hacerlo bueno.
Example Dialogs (Ejemplos de diálogo): Ejemplos de cómo habla y reacciona el personaje. Este campo tiene un impacto enorme en la consistencia del personaje, especialmente en modelos más pequeños. Incluye 3-5 intercambios de ejemplo.
System Prompt para Roleplay
El system prompt es tan importante como la tarjeta de personaje. Un prompt básico para roleplay:
1Eres {{char}}, un personaje en una historia interactiva. 2Mantén siempre la perspectiva de {{char}} y responde desde su punto de vista.3Escribe en tercera persona cuando describes acciones y primera persona en los diálogos.4Mantén la coherencia con los eventos anteriores de la historia.5No rompas el personaje ni hagas referencia a que eres una IA.6Desarrolla la narrativa con detalle, emoción y consecuencias realistas.
Para sesiones con contenido adulto (usando modelos locales sin restricciones), el system prompt debe ser más explícito sobre los permisos de contenido.
Importar Personajes
Puedes importar personajes en formato .json o .png (las tarjetas de personaje se almacenan como metadatos en imágenes PNG). Las principales fuentes de personajes:
- chub.ai: La biblioteca más grande de personajes compatibles con SillyTavern
- characterhub.org: Alternativa popular con curación
- janitorai.com: Muchos personajes son compatibles
- r/SillyTavernAI: La comunidad comparte personajes regularmente
Tips para Mejores Prompts de Roleplay
Estos son los ajustes que más impacto tienen en la calidad del roleplay según mi experiencia:
1. Define el punto de vista narrativo desde el principio: Decide si la historia se cuenta en primera o tercera persona y sé consistente. Los modelos mantienen mejor la coherencia cuando el punto de vista es explícito.
2. Usa "ejemplos de estilo" en la tarjeta del personaje: Incluir 2-3 párrafos de prosa con el estilo que quieres es más efectivo que describir el estilo con palabras. El modelo imitará el tono.
3. Temperatura entre 0.9 y 1.1 para roleplay narrativo: Por debajo de 0.8 el texto se vuelve demasiado predecible. Por encima de 1.2 empieza a desvariar. El rango 0.9-1.1 suele dar el mejor balance entre creatividad y coherencia.
4. Usa el campo "Author's Note" para instrucciones de sesión: SillyTavern tiene un campo "Author's Note" que se inyecta en el contexto en una posición configurable. Úsalo para instrucciones que quieres que el modelo "recuerde" activamente (el tono de la escena actual, un giro de trama que viene, el estado emocional del personaje).
5. Gestiona el contexto activamente: Cuando una sesión lleva muchos mensajes, revisa el historial y resume los eventos anteriores en el campo de memoria/lorebook. Esto es especialmente importante con modelos pequeños (8-13B).
Errores Comunes en la Configuración de SillyTavern
Error 1: Arrancar con un modelo demasiado grande para tu hardware
- Problema: El modelo tarda 5+ minutos en generar una respuesta o directamente no carga.
- Solución: Empieza con el modelo más pequeño de la lista (L3-8B-Stheno o Llama 4 Scout 9B) y prueba. Si va bien, sube de tamaño.
Error 2: Usar cuantización Q2 o Q3 para ahorrar VRAM
- Problema: La calidad narrativa cae drásticamente en cuantizaciones bajas. El modelo empieza a repetirse, pierde coherencia y "olvida" el personaje.
- Solución: Q4_K_M es el mínimo para roleplay decente. Q5_K_M o Q8 si tu hardware lo permite.
Error 3: Ignorar el "Tokenizer" de SillyTavern
- Problema: Diferentes modelos usan tokenizadores distintos. Si SillyTavern usa el tokenizador equivocado, el contexto no se calcula bien y el modelo "olvida" antes de lo esperado.
- Solución: En la configuración de contexto, asegúrate de que el tokenizador coincide con la familia del modelo (Llama3, Mistral, etc.).
Error 4: No usar el sistema de lorebook/world info para worldbuilding complejo
- Problema: Para worldbuilding con muchos lugares, personajes y eventos, la tarjeta del personaje se llena y el modelo no puede "recordar" todo.
- Solución: SillyTavern tiene un sistema de "World Info" / Lorebook donde puedes definir entradas que se inyectan automáticamente en el contexto cuando se mencionan ciertas palabras clave.
Error 5: No hacer backup de las tarjetas de personaje
- Problema: Pierdes horas de trabajo en un personaje si actualizas SillyTavern incorrectamente o tienes un problema de disco.
- Solución: Haz backup periódico de la carpeta
/data/characters/— ahí están todas tus tarjetas de personaje.
FAQ — Preguntas Frecuentes sobre SillyTavern
¿SillyTavern es gratis?
Sí, SillyTavern es completamente gratuito y open-source bajo licencia AGPL-3.0. El código está disponible en GitHub. Lo único que cuesta es el hardware para correr modelos locales o el gasto en APIs cloud si decides conectar Claude, GPT u otros. No hay suscripción, no hay tier de pago.
¿Qué modelo usar con SillyTavern si tengo una RTX 4060?
Con una RTX 4060 (8GB VRAM) te recomiendo L3-8B-Stheno-v3.2 en cuantización Q5_K_M como primera elección para roleplay de calidad. Si prefieres algo más fácil de encontrar y configurar, Llama 4 Scout 9B en Q4_K_M también funciona bien en ese hardware. Ambos modelos los encuentras en HuggingFace buscando el nombre exacto.
¿SillyTavern es seguro?
Sí, SillyTavern es seguro en el sentido de que es software open-source auditado por la comunidad, sin malware ni código malicioso conocido. Descárgalo siempre desde el repositorio oficial en GitHub (SillyTavern/SillyTavern). No instales versiones de fuentes no oficiales. Con modelos locales, tus conversaciones no salen de tu ordenador — es la opción más privada que existe en roleplay IA.
¿Funciona SillyTavern en macOS?
Sí, SillyTavern funciona en macOS. Los Mac con chips M-series (M1, M2, M3, M4) tienen la ventaja de que la memoria unificada actúa como VRAM, lo que permite correr modelos más grandes de lo que sugeriría el benchmark de GPU tradicional. Un Mac con 24GB de RAM unificada puede correr modelos de 13B con buena calidad.
¿Puedo usar SillyTavern en el móvil?
No hay app oficial de SillyTavern para móvil, pero hay soluciones: puedes acceder a tu instancia de SillyTavern desde el móvil si tu PC está en la misma red local (accediendo a la IP local de tu PC en el puerto 8000). También hay proyectos de la comunidad para Android como "SillyTavern Launcher" que facilitan esto.
¿Qué diferencia hay entre SillyTavern y KoboldCPP?
Son herramientas complementarias, no competidoras: KoboldCPP es un backend que corre modelos locales con optimizaciones específicas. SillyTavern es el frontend de chat/roleplay. Puedes (y muchos usuarios lo hacen) usar KoboldCPP como backend y SillyTavern como frontend, conectándolos por API local. LM Studio y Ollama son alternativas a KoboldCPP como backends locales.
¿Cómo se actualiza SillyTavern?
1# En la carpeta de SillyTavern:2git pull3 4# O si usaste start.bat en Windows:5# Abre la carpeta, botón derecho → Git Bash → git pull
Haz backup de tu carpeta /data/ antes de actualizar para no perder tus personajes y configuración.
CTA — IA Personalizada para tu Empresa
SillyTavern es la herramienta perfecta para power users individuales, pero para empresas que quieren implementar sistemas de IA conversacional personalizados — simulaciones de ventas, formación de equipos, onboarding interactivo — el enfoque es diferente. Si quieres explorar cómo la IA puede mejorar tu formación o procesos, cuéntame tu caso en javadex.es/contact.
En Resumen
- SillyTavern es gratis y open-source — solo pagas por el hardware o las APIs que uses
- LM Studio es la forma más fácil de conectar modelos locales a SillyTavern, sin línea de comandos
- Para 8GB VRAM: L3-8B-Stheno-v3.2 (Q5_K_M) es el mejor modelo disponible con ese hardware
- Para 16GB VRAM: Rocinante-X-12B o Snowpiercer-15B son la referencia de la comunidad en 2026
- Conectar APIs cloud (Claude, GPT via OpenRouter) da la máxima calidad sin necesidad de hardware potente
- El system prompt y la tarjeta de personaje determinan el 60% de la calidad — invierte tiempo en hacerlos bien
- El Lorebook/World Info es imprescindible para worldbuilding complejo — úsalo desde el principio
- Haz backup periódico de
/data/characters/— perder una tarjeta de personaje trabajada es doloroso
