Ir al contenido principal

Guía Completa de SillyTavern 2026: Configuración, Modelos Locales y Mejores Personajes

3 de mayo de 2026
17 min

Todo lo que necesitas saber sobre SillyTavern en 2026: instalación, los mejores modelos locales para roleplay, configuración con LM Studio y cómo crear personajes propios.

Javier Santos

Especialista en IA & Machine Learning

📧¿Te gusta este contenido?

Únete a 547+ profesionales que reciben tips de IA cada semana. Sin spam, cancela cuando quieras.

Guía Completa de SillyTavern 2026: Configuración, Modelos Locales y Mejores Personajes

SillyTavern es el frontend de roleplay IA más potente disponible hoy en día. No tiene la comodidad de Character.ai ni la curva de entrada suave de Janitor AI, pero te da algo que ninguna plataforma cloud puede ofrecerte: control absoluto sobre cada aspecto de la experiencia — el modelo, los parámetros, el system prompt, la memoria, el lore. Si eres un power user que quiere exprimir al máximo el roleplay con IA, esta es tu herramienta.

Esta guía cubre todo lo que necesitas para empezar en 2026: desde los requisitos de hardware hasta cómo crear personajes complejos, pasando por la instalación paso a paso y los mejores modelos para cada caso de uso.


TL;DR — Lo Más Importante

  • SillyTavern es gratis y open-source — el coste viene del hardware o las APIs cloud que uses
  • Necesitas mínimo 8GB de VRAM para una experiencia de roleplay local decente
  • LM Studio es la forma más fácil de correr modelos locales con SillyTavern
  • Los mejores modelos para RP local en 2026: Rocinante-X-12B (16GB VRAM) o L3-8B-Stheno-v3.2 (8GB)
  • También puedes conectar APIs cloud (Claude, GPT, Gemini) para tener la mejor calidad sin hardware
  • La comunidad de SillyTavern en Discord y Reddit tiene recursos extensos — no estás solo
  • El sistema de tarjetas de personaje (CharacterCard v2) es compatible con otras plataformas


Qué es SillyTavern y Por Qué es la Mejor Opción para Power Users

SillyTavern es un frontend de chat con modelos de lenguaje diseñado específicamente para roleplay, narrativa creativa y simulación de personajes. Empezó como un fork de TavernAI (de ahí el nombre) y ha evolucionado hasta convertirse en el estándar de facto de la comunidad de roleplay IA.

Lo que lo hace diferente de cualquier plataforma cloud:

Control total del modelo: Puedes conectar cualquier modelo local (via Ollama, LM Studio, KoboldCPP) o cualquier API cloud (Claude, GPT-5, Gemini, modelos de OpenRouter). Tú decides qué motor usa el personaje.

Control total de los parámetros: Temperatura, top-p, repetition penalty, context length — todo ajustable. Un modelo a temperatura 0.8 se comporta de forma completamente diferente al mismo modelo a temperatura 1.2. En plataformas cloud no tienes acceso a esto.

Sistema de personajes avanzado: El formato CharacterCard v2 permite definir al personaje en detalle (descripción, personalidad, ejemplos de diálogo, escenario inicial), e importar/exportar personajes entre plataformas.

Extensiones y plugins: La comunidad ha desarrollado extensiones para memoria de largo plazo, generación de imágenes integrada, gestión de lore, y mucho más.

Privacidad real: Con modelos locales, tus conversaciones no salen de tu máquina. Punto.

"SillyTavern es la diferencia entre conducir un coche automático de alquiler y tunear tu propio coche. La curva de aprendizaje existe, pero el control que ganas cambia completamente la experiencia." — Javier Santos Criado, consultor de IA en Javadex


SillyTavern vs Character.ai vs Otras Plataformas

CaracterísticaSillyTavernCharacter.aiJanitor AIJenova.ai
PrecioGratisGratis / $9.99/mesGratis / ~$12/mes~$15/mes
ModeloTú eligesPropio (cerrado)Propio + API externaClaude/GPT/Gemini
Control parámetrosTotalNingunoParcialNinguno
PrivacidadTotal (local)BajaMediaMedia
Memoria largaExtensiones~30 mensajesParcialIlimitada
Curva aprendizajeAltaBajaMediaBaja
NSFWSí (local)NoNo
App móvilNo oficialParcial
ComunidadMuy activaMasivaActivaMedia
Conclusión: SillyTavern es superior técnicamente en casi todo, pero requiere más inversión de tiempo inicial. Para usuarios que priorizan la comodidad sobre el control, las plataformas cloud siguen siendo válidas.


Requisitos de Hardware para SillyTavern

El propio SillyTavern es muy ligero (es básicamente una app web local). El hardware que necesitas es para los modelos locales, no para SillyTavern en sí.

ConfiguraciónGPUVRAMRAMModelos posiblesCalidad RP
Mínimo viableRTX 3060 / RX 66008 GB16 GBL3-8B-Stheno, Llama 4 Scout 9BBuena
RecomendadoRTX 4070 / RX 7800 XT12-16 GB32 GBRocinante-X-12B, Snowpiercer-15BMuy buena
EnthusiastRTX 4080/409016-24 GB64 GBModelos 30-70B en cuantizaciónExcelente
Sin GPU dedicadaCPU + RAMN/A32-64 GBModelos GGUF pequeños (lento)Básica
Solo API cloudCualquieraN/A8 GBClaude, GPT, GeminiLa mejor
Nota importante: Si no tienes una GPU dedicada con suficiente VRAM pero quieres probar SillyTavern, puedes conectarlo a APIs cloud (Claude API, OpenAI API). La calidad será excelente pero pagarás por token.


Paso a Paso: Instalación de SillyTavern 2026

Paso 1: Instalar Node.js

SillyTavern requiere Node.js 18 o superior.

  • Descarga Node.js LTS desde: nodejs.org
  • Verifica la instalación: node --version debe mostrar v18 o superior

Paso 2: Descargar SillyTavern

bash
1# Clona el repositorio (opción recomendada)
2git clone https://github.com/SillyTavern/SillyTavern.git
3 
4# O descarga el ZIP desde GitHub releases

Paso 3: Instalar dependencias y arrancar

bash
1cd SillyTavern
2 
3# En Windows: ejecuta start.bat
4# En macOS/Linux:
5npm install
6node server.js

SillyTavern se abrirá automáticamente en tu navegador en http://localhost:8000.

Paso 4: Configurar el backend de IA

Aquí tienes tres opciones según tu hardware:

Opción A — LM Studio (más fácil para modelos locales):

  1. Descarga LM Studio desde lmstudio.ai
  2. Descarga un modelo (te recomendamos L3-8B-Stheno-v3.2 para empezar)
  3. En LM Studio, ve a "Local Server" y actívalo
  4. En SillyTavern → API → selecciona "Text Completion" → URL: http://localhost:1234/v1

Opción B — Ollama (más simple, más limitado):

  1. Instala Ollama desde ollama.ai
  2. Descarga un modelo: ollama pull llama3
  3. En SillyTavern → API → selecciona "Ollama" → URL: http://localhost:11434

Opción C — API cloud (Claude, OpenAI, etc.):

  1. Obtén tu API key de Anthropic (claude.ai) o OpenAI
  2. En SillyTavern → API → selecciona "Claude" o "OpenAI"
  3. Introduce tu API key

Paso 5: Tu primera conversación

Una vez configurado el backend, crea o importa un personaje y empieza. La interfaz puede parecer abrumadora al principio — normal. Los controles más importantes están en el panel lateral izquierdo (configuración del personaje) y el menú de la parte superior (parámetros del modelo).


Los Mejores Modelos Locales para SillyTavern en 2026

ModeloVRAM mínimaCalidad RPNSFWCuantizaciónDescarga
Rocinante-X-12B10-12 GB8.2/10Q4_K_MHuggingFace
Snowpiercer-15B12-16 GB8.3/10Q4_K_MHuggingFace
L3-8B-Stheno-v3.26-8 GB8.0/10Q5_K_MHuggingFace
MythoMax-L2-13B10-12 GB7.9/10Q4HuggingFace
Llama 4 Scout 9B5-6 GB7.6/10Q4_K_MMeta/HuggingFace
Nous Hermes 2 Solar 10.7B8-10 GB7.5/10ParcialQ4HuggingFace
Calidades evaluadas para roleplay específicamente. VRAM estimada para cuantización Q4. Fuente: análisis propio, javadex.es, mayo 2026.

Recomendaciones por Hardware

Si tienes 6-8GB VRAM (RTX 3060, RTX 4060):

Tu mejor opción es L3-8B-Stheno-v3.2 en Q5_K_M. Es el modelo más pequeño de la lista con buen rendimiento de roleplay real. Para narrativa más casual, Llama 4 Scout 9B en Q4 también funciona bien y es más fácil de encontrar.

Si tienes 12-16GB VRAM (RTX 4070, RTX 3080):

Rocinante-X-12B en Q4_K_M es la elección obvia. Si prefieres algo orientado más al contenido adulto con más parámetros, Snowpiercer-15B es el favorito de la comunidad actualmente. Ambos están en HuggingFace.

Si tienes 20-24GB VRAM (RTX 4090, RTX 3090):

Puedes correr modelos de 20-30B en Q4. Busca los últimas finetunes comunitarios en HuggingFace — la oferta cambia rápido y la comunidad señaliza los mejores en los foros de r/SillyTavernAI.

Cómo Descargar Modelos

La forma más cómoda es usar LM Studio, que tiene una interfaz de búsqueda integrada. También puedes descargar directamente desde HuggingFace:

bash
1# Con huggingface-cli
2pip install huggingface_hub
3huggingface-cli download TheBloke/MythoMax-L2-13B-GGUF --include "*.Q4_K_M.gguf"

Para los modelos GGUF (el formato más común para uso local), busca siempre las variantes Q4_K_M como mínimo para roleplay. Q3 y Q2 degradan notablemente la calidad narrativa.


Cómo Conectar APIs Cloud con SillyTavern

Si quieres la máxima calidad sin invertir en hardware, conectar SillyTavern a una API cloud es la mejor opción. Obtienes la interfaz y el sistema de personajes de SillyTavern con la calidad de Claude Opus 4.6 o GPT-5.2.

Conectar Claude (Anthropic)

  1. Ve a console.anthropic.com y crea una cuenta
  2. Genera una API key en "API Keys"
  3. En SillyTavern: API Settings → API Type: "Claude" → Introduce tu API key
  4. Selecciona el modelo (claude-opus-4-6 para máxima calidad)
  5. Ajusta los parámetros recomendados para roleplay (temperatura: 0.9-1.1)

Coste estimado: Claude Opus cuesta ~$15 por millón de tokens de entrada. Una sesión de roleplay de 2 horas consume aproximadamente 50.000-80.000 tokens. Eso son ~$0.75-1.20 por sesión de 2 horas de calidad máxima.

Conectar OpenAI (GPT-5.2)

  1. Ve a platform.openai.com
  2. Genera una API key
  3. En SillyTavern: API Settings → API Type: "OpenAI" → API key
  4. Modelo: gpt-5.2 o el más reciente disponible

Conectar via OpenRouter (múltiples modelos)

OpenRouter es un proxy que da acceso a múltiples modelos (Claude, GPT, Mistral, modelos open-source) con una sola API key. Muy útil para comparar modelos sin cambiar configuración:

  1. Regístrate en openrouter.ai
  2. Obtén tu API key y añade créditos
  3. En SillyTavern: API Settings → "OpenAI" → URL: https://openrouter.ai/api/v1 → API key de OpenRouter


Cómo Crear y Personalizar Personajes en SillyTavern

El sistema de personajes de SillyTavern usa el formato CharacterCard v2, un estándar que también es compatible con Janitor AI y otras plataformas. Aquí están los campos clave:

Los Campos de la Tarjeta de Personaje

Name (Nombre): Simple, el nombre del personaje.

Description (Descripción): La definición principal del personaje. Incluye aquí apariencia física, personalidad, historia, patrones de habla, manías. Cuanto más detallado, mejor. Un personaje bien definido en este campo mantiene su consistencia durante sesiones mucho más largas.

Ejemplo de descripción efectiva:

code
1Elara es una maga de 28 años con experiencia en magia de ilusión. Habla de forma directa y
2algo sarcástica, con un humor seco. Tiene la manía de jugar con una moneda de cobre entre
3los dedos cuando piensa. Desconfía de los paladines tras una mala experiencia en su pasado.
4Cuando está nerviosa, tiende a hablar más rápido y usar más palabras técnicas de su oficio.

Personality (Personalidad): Un resumen más compacto de los rasgos de personalidad, para uso interno del modelo.

Scenario (Escenario): El contexto inicial de la historia — dónde están los personajes, qué está pasando, qué lleva a este momento.

First Message (Primer mensaje): El mensaje inicial del personaje cuando empieza la conversación. Este primer mensaje marca el tono de todo lo que sigue — invierte tiempo en hacerlo bueno.

Example Dialogs (Ejemplos de diálogo): Ejemplos de cómo habla y reacciona el personaje. Este campo tiene un impacto enorme en la consistencia del personaje, especialmente en modelos más pequeños. Incluye 3-5 intercambios de ejemplo.

System Prompt para Roleplay

El system prompt es tan importante como la tarjeta de personaje. Un prompt básico para roleplay:

code
1Eres {{char}}, un personaje en una historia interactiva.
2Mantén siempre la perspectiva de {{char}} y responde desde su punto de vista.
3Escribe en tercera persona cuando describes acciones y primera persona en los diálogos.
4Mantén la coherencia con los eventos anteriores de la historia.
5No rompas el personaje ni hagas referencia a que eres una IA.
6Desarrolla la narrativa con detalle, emoción y consecuencias realistas.

Para sesiones con contenido adulto (usando modelos locales sin restricciones), el system prompt debe ser más explícito sobre los permisos de contenido.

Importar Personajes

Puedes importar personajes en formato .json o .png (las tarjetas de personaje se almacenan como metadatos en imágenes PNG). Las principales fuentes de personajes:

  • chub.ai: La biblioteca más grande de personajes compatibles con SillyTavern
  • characterhub.org: Alternativa popular con curación
  • janitorai.com: Muchos personajes son compatibles
  • r/SillyTavernAI: La comunidad comparte personajes regularmente


Tips para Mejores Prompts de Roleplay

Estos son los ajustes que más impacto tienen en la calidad del roleplay según mi experiencia:

1. Define el punto de vista narrativo desde el principio: Decide si la historia se cuenta en primera o tercera persona y sé consistente. Los modelos mantienen mejor la coherencia cuando el punto de vista es explícito.

2. Usa "ejemplos de estilo" en la tarjeta del personaje: Incluir 2-3 párrafos de prosa con el estilo que quieres es más efectivo que describir el estilo con palabras. El modelo imitará el tono.

3. Temperatura entre 0.9 y 1.1 para roleplay narrativo: Por debajo de 0.8 el texto se vuelve demasiado predecible. Por encima de 1.2 empieza a desvariar. El rango 0.9-1.1 suele dar el mejor balance entre creatividad y coherencia.

4. Usa el campo "Author's Note" para instrucciones de sesión: SillyTavern tiene un campo "Author's Note" que se inyecta en el contexto en una posición configurable. Úsalo para instrucciones que quieres que el modelo "recuerde" activamente (el tono de la escena actual, un giro de trama que viene, el estado emocional del personaje).

5. Gestiona el contexto activamente: Cuando una sesión lleva muchos mensajes, revisa el historial y resume los eventos anteriores en el campo de memoria/lorebook. Esto es especialmente importante con modelos pequeños (8-13B).


Errores Comunes en la Configuración de SillyTavern

Error 1: Arrancar con un modelo demasiado grande para tu hardware

  • Problema: El modelo tarda 5+ minutos en generar una respuesta o directamente no carga.
  • Solución: Empieza con el modelo más pequeño de la lista (L3-8B-Stheno o Llama 4 Scout 9B) y prueba. Si va bien, sube de tamaño.

Error 2: Usar cuantización Q2 o Q3 para ahorrar VRAM

  • Problema: La calidad narrativa cae drásticamente en cuantizaciones bajas. El modelo empieza a repetirse, pierde coherencia y "olvida" el personaje.
  • Solución: Q4_K_M es el mínimo para roleplay decente. Q5_K_M o Q8 si tu hardware lo permite.

Error 3: Ignorar el "Tokenizer" de SillyTavern

  • Problema: Diferentes modelos usan tokenizadores distintos. Si SillyTavern usa el tokenizador equivocado, el contexto no se calcula bien y el modelo "olvida" antes de lo esperado.
  • Solución: En la configuración de contexto, asegúrate de que el tokenizador coincide con la familia del modelo (Llama3, Mistral, etc.).

Error 4: No usar el sistema de lorebook/world info para worldbuilding complejo

  • Problema: Para worldbuilding con muchos lugares, personajes y eventos, la tarjeta del personaje se llena y el modelo no puede "recordar" todo.
  • Solución: SillyTavern tiene un sistema de "World Info" / Lorebook donde puedes definir entradas que se inyectan automáticamente en el contexto cuando se mencionan ciertas palabras clave.

Error 5: No hacer backup de las tarjetas de personaje

  • Problema: Pierdes horas de trabajo en un personaje si actualizas SillyTavern incorrectamente o tienes un problema de disco.
  • Solución: Haz backup periódico de la carpeta /data/characters/ — ahí están todas tus tarjetas de personaje.


FAQ — Preguntas Frecuentes sobre SillyTavern

¿SillyTavern es gratis?

Sí, SillyTavern es completamente gratuito y open-source bajo licencia AGPL-3.0. El código está disponible en GitHub. Lo único que cuesta es el hardware para correr modelos locales o el gasto en APIs cloud si decides conectar Claude, GPT u otros. No hay suscripción, no hay tier de pago.

¿Qué modelo usar con SillyTavern si tengo una RTX 4060?

Con una RTX 4060 (8GB VRAM) te recomiendo L3-8B-Stheno-v3.2 en cuantización Q5_K_M como primera elección para roleplay de calidad. Si prefieres algo más fácil de encontrar y configurar, Llama 4 Scout 9B en Q4_K_M también funciona bien en ese hardware. Ambos modelos los encuentras en HuggingFace buscando el nombre exacto.

¿SillyTavern es seguro?

Sí, SillyTavern es seguro en el sentido de que es software open-source auditado por la comunidad, sin malware ni código malicioso conocido. Descárgalo siempre desde el repositorio oficial en GitHub (SillyTavern/SillyTavern). No instales versiones de fuentes no oficiales. Con modelos locales, tus conversaciones no salen de tu ordenador — es la opción más privada que existe en roleplay IA.

¿Funciona SillyTavern en macOS?

, SillyTavern funciona en macOS. Los Mac con chips M-series (M1, M2, M3, M4) tienen la ventaja de que la memoria unificada actúa como VRAM, lo que permite correr modelos más grandes de lo que sugeriría el benchmark de GPU tradicional. Un Mac con 24GB de RAM unificada puede correr modelos de 13B con buena calidad.

¿Puedo usar SillyTavern en el móvil?

No hay app oficial de SillyTavern para móvil, pero hay soluciones: puedes acceder a tu instancia de SillyTavern desde el móvil si tu PC está en la misma red local (accediendo a la IP local de tu PC en el puerto 8000). También hay proyectos de la comunidad para Android como "SillyTavern Launcher" que facilitan esto.

¿Qué diferencia hay entre SillyTavern y KoboldCPP?

Son herramientas complementarias, no competidoras: KoboldCPP es un backend que corre modelos locales con optimizaciones específicas. SillyTavern es el frontend de chat/roleplay. Puedes (y muchos usuarios lo hacen) usar KoboldCPP como backend y SillyTavern como frontend, conectándolos por API local. LM Studio y Ollama son alternativas a KoboldCPP como backends locales.

¿Cómo se actualiza SillyTavern?

bash
1# En la carpeta de SillyTavern:
2git pull
3 
4# O si usaste start.bat en Windows:
5# Abre la carpeta, botón derecho → Git Bash → git pull

Haz backup de tu carpeta /data/ antes de actualizar para no perder tus personajes y configuración.


CTA — IA Personalizada para tu Empresa

SillyTavern es la herramienta perfecta para power users individuales, pero para empresas que quieren implementar sistemas de IA conversacional personalizados — simulaciones de ventas, formación de equipos, onboarding interactivo — el enfoque es diferente. Si quieres explorar cómo la IA puede mejorar tu formación o procesos, cuéntame tu caso en javadex.es/contact.


En Resumen

  • SillyTavern es gratis y open-source — solo pagas por el hardware o las APIs que uses
  • LM Studio es la forma más fácil de conectar modelos locales a SillyTavern, sin línea de comandos
  • Para 8GB VRAM: L3-8B-Stheno-v3.2 (Q5_K_M) es el mejor modelo disponible con ese hardware
  • Para 16GB VRAM: Rocinante-X-12B o Snowpiercer-15B son la referencia de la comunidad en 2026
  • Conectar APIs cloud (Claude, GPT via OpenRouter) da la máxima calidad sin necesidad de hardware potente
  • El system prompt y la tarjeta de personaje determinan el 60% de la calidad — invierte tiempo en hacerlos bien
  • El Lorebook/World Info es imprescindible para worldbuilding complejo — úsalo desde el principio
  • Haz backup periódico de /data/characters/ — perder una tarjeta de personaje trabajada es doloroso

¿Crees que estás sacando partido a la IA en tu empresa?

Si la respuesta no es un sí rotundo, te estás dejando horas, dinero y ventaja competitiva cada día que pasa. Mientras tú lo valoras, tu competencia ya lo está usando para moverse el doble de rápido.

Te construyo el cerebro de IA de tu empresa: 100% adaptado a tu stack, tus datos y tus procesos. Resultados medibles desde la primera semana, no dentro de seis meses.

📬

¿Te ha gustado? Hay más cada semana

Únete a "IA Sin Humo" — la newsletter donde comparto lo que realmente funciona en inteligencia artificial. Sin teoría innecesaria, sin postureo.

📚

1 Tutorial

Paso a paso, práctico

🛠️

3 Herramientas

Probadas y útiles

💡

0 Bullshit

Solo lo que importa

+547 suscriptores • Cada martes • Cancela cuando quieras

Javier Santos - Especialista en IA & Machine Learning

Javier Santos

Consultor de IA para empresas. Comparto contenido sobre inteligencia artificial, automatización y desarrollo cada semana.