La Batalla de los Recursos
Todo lo que necesitas saber para entrar en batalla con el Coronel Blotto
El Coronel Blotto es un juego de estrategia pura nacido en 1921, inventado por el matemático francés Émile Borel. Dos generales rivales deben decidir cómo repartir sus tropas en varios frentes de batalla sin saber qué hará el enemigo.
No hay suerte. No hay dados. Solo ingenio táctico y psicología. Es uno de los ejemplos más puros de teoría de juegos: un duelo mental donde la información oculta y la anticipación del rival son las únicas armas.
La paradoja fascinante: no existe una estrategia perfecta. Para cada asignación de tropas, siempre hay otra que la derrota. Eso convierte el juego en un eterno baile de anticipación.
Antes de cada partida puedes elegir el número de tropas totales (10–500), el número de frentes (2–6) y el tipo de IA enemiga. La IA tiene 5 modos: aleatoria, uniforme, concentrada, adaptativa y Nash.
En cada tarjeta de frente verás cuatro botones: −10, −1, +1, +10. Úsalos para asignar tus tropas. El contador superior en dorado siempre muestra cuántas tropas te quedan por asignar.
Mientras decides, el panel central te muestra tu probabilidad estimada de victoria contra la IA actual, cuántos frentes esperas ganar, y si tu estrategia es concentrada, dispersa o equilibrada.
Cuando hayas asignado todas las tropas, el botón "⚔ Batallar" se activará. Al pulsarlo, la IA revela su asignación y se resuelven todos los frentes simultáneamente con animación.
Supón que ambos tenéis 100 tropas y hay 3 frentes. Tú decides repartir: [50, 30, 20]. La máquina usa: [10, 40, 50].
La moraleja: poner 50 tropas en el Norte para ganarlo por goleada (50 vs 10) fue un desperdicio. La IA aprovechó ese sacrificio para dominar con superioridad en los otros dos frentes. Esto ilustra el dilema central del Coronel Blotto: concentrarte te hace vulnerable, dispersarte te hace predecible.
Se gana la partida conquistando más de la mitad de los frentes. Con 3 frentes necesitas ganar al menos 2. Con 5 frentes, al menos 3.
Se gana la sesión acumulando más victorias que derrotas en el historial. Cada ronda cuenta por separado: no hay carryover de tropas.
La clave estratégica está en esta asimetría: no importa cuánto ganas cada frente, solo si lo ganas. Ganar con 51 vs 50 es idéntico a ganar con 100 vs 0. Esto cambia radicalmente cómo debes pensar la distribución.
Aperturas, tácticas y jugadas para dominar el campo de batalla
Antes de aprender estrategias concretas, hay que entender la verdad incómoda del Coronel Blotto: no existe estrategia ganadora universal. Para cualquier distribución fija que adoptes, hay exactamente una distribución que la derrota.
Por eso el juego se juega en dos niveles: el táctico (qué asignas esta ronda) y el psicológico (anticipar qué crees que hará el rival). Las estrategias que verás a continuación son herramientas, no fórmulas mágicas.
Divide las tropas en partes iguales entre todos los frentes. Con 100 tropas y 3 frentes: [33·33·34].
Fortaleza: Imposible de explotar si el rival también es uniforme. Consistente y predecible. Debilidad: Es la estrategia más fácil de derrotar: basta con concentrar en 2 de 3 frentes para ganar 2 contra 1.
Aplasta solo los frentes necesarios para la victoria, ignorando los demás. Con 3 frentes, concentra en 2: [50·50·0].
Fortaleza: Devastadora contra estrategias dispersas. Garantiza 2 frentes si el rival no lo anticipa. Debilidad: Completamente previsible. El rival que sepa que vas a concentrar solo tiene que contra-concentrar en los mismos frentes.
Como la uniforme, pero con una ligera ventaja en el frente más importante. [40·35·25] en lugar de [33·33·34].
Fortaleza: Cubre todos los frentes mientras prioriza uno clave. Más difícil de predecir que la uniforme pura. Debilidad: Sigue siendo parcialmente predecible en el frente reforzado.
No fijes una asignación: alterna aleatoriamente entre varias estrategias ronda a ronda. Mezcla uniforme + concentrada + perturbada.
Fortaleza: Imposible de predecir a largo plazo. Es el equilibrio teórico del juego. Debilidad: No explota errores del rival. A veces "desperdicias" rondas con malas asignaciones aleatorias.
Gana los frentes clave con apenas 1 tropa de margen y redirige el resto. Si el rival usa uniforme (33), asigna [34·34·32] — ganas 2 frentes por 1 tropa de diferencia.
Fortaleza: Máxima eficiencia táctica contra rivales previsibles. Debilidad: Requiere saber la estrategia rival. Contra Nash Mix es una apuesta arriesgada.
Toma la distribución uniforme y pertúrbala con ruido controlado. [33·33·34] → [28·38·34]. Diferente cada ronda pero siempre cubriendo todos los frentes.
Fortaleza: Difícil de predecir sin renunciar a la cobertura total. Buen compromiso entre aleatoriedad y control. Debilidad: No tan agresiva como la concentrada ni tan segura como la uniforme.
Cada celda muestra qué ocurre cuando la estrategia de la fila se enfrenta a la estrategia de la columna.
| Tú \ Rival | Uniforme | Concentrada | Eq. Ajustado | Nash Mix |
|---|---|---|---|---|
| Uniforme [33·33·34] | Empate | Pierdes (1–2) | Pierdes (1–2) | ~50% |
| Concentrada [50·50·0] | Ganas (2–1) | Varía | Ganas (2–1) | ~50% |
| Sobre-refuerzo [34·34·32] | Ganas (2–1) | Pierdes (1–2) | Ganas (2–1) | ~50% |
| Nash Mix (aleatorio) | ~50% | ~50% | ~50% | ~50% |
La IA distribuye tropas de forma perfectamente igualitaria. Úsala para practicar el sobre-refuerzo mínimo: gana exactamente los frentes que necesitas por 1–2 tropas de diferencia y redirige el resto.
La IA apuesta todo en la mitad de los frentes (los elige al azar). Tu estrategia óptima: distribuye de forma uniforme-perturbada. Ganarás los frentes que ella abandona y perderás los que ella ataca, pero como elige al azar, a largo plazo las probabilidades se equilibran a tu favor si juegas bien los frentes descuidados.
Mezcla 55% concentrada + 45% uniforme perturbada. La mejor respuesta: juega también de forma mixta. En series largas, alterna concentrada y uniforme sin patrón fijo.
Técnicamente no hay ventaja posible. Lo mejor es también jugar Nash Mix (aleatorio). A largo plazo ninguno tiene ventaja estadística; el azar decide.
Coloca 1 tropa en un frente "sacrificado" para atraer tropas del rival y dominar los demás. Con 3 frentes: [1·60·39]. El rival que pierde el Norte por 1 tropa suele haberle puesto demasiadas tropas ahí.
Si en una ronda perdiste el Norte y ganaste Sur, en la siguiente invierte: ataca fuerte el Norte (donde el rival cree que estás débil) y pon menos en el Sur. Explota los patrones de inercia del rival.
Calcula las tropas mínimas para ganar exactamente ⌈N/2⌉ frentes y redistribuye el excedente aleatoriamente en esos mismos frentes. Maximiza la eficiencia minimizando "tropas muertas".
Para confundir al rival: crea distribuciones muy irregulares e impredecibles como [80·15·5] o [5·90·5]. Aunque son fáciles de contrarrestar si se conocen, su aspecto irracional desincentiva al rival de anticiparlas.
La estructura matemática detrás del juego: teoría de juegos, álgebra y optimización combinatoria
El juego del Coronel Blotto es un juego de suma cero de dos jugadores con información simultánea. Formalmente:
El jugador 1 gana si \( U(\mathbf{x}, \mathbf{y}) > N/2 \), pierde si \( U < N/2 \), y empata si \( U = N/2 \) (solo posible con N par).
Una estrategia pura es una asignación entera de T tropas en N frentes. El número total de estrategias puras es una combinación con repetición:
Con T = 100 tropas y N = 3 frentes, esto da:
Con N = 5 frentes el espacio explota:
Con 5 frentes, la IA tendría que evaluar millones de posibles jugadas tuyas. Esto hace que el juego sea computacionalmente difícil de resolver de forma exacta, justificando el uso de estrategias mixtas como aproximación al equilibrio de Nash.
El teorema de Nash (1950) garantiza que todo juego finito de suma cero tiene al menos un equilibrio de Nash en estrategias mixtas. Una estrategia mixta es una distribución de probabilidad sobre todas las estrategias puras:
En el equilibrio de Nash del Coronel Blotto, ambos jugadores usan estrategias mixtas tales que ninguno puede mejorar su resultado cambiando unilateralmente de estrategia.
El valor del juego con tropas iguales es exactamente N/2: en promedio, cada jugador gana la mitad de los frentes. Ninguna estrategia fija puede superar consistentemente este valor contra un rival que juega Nash óptimo.
Si tu rival juega Nash óptimo, no puedes ganar más del 50% a largo plazo con ninguna estrategia fija. La única forma de tener ventaja es explotar que el rival no juega Nash óptimo, como cuando la IA usa siempre la misma estrategia (uniforme, concentrada, etc.).
A diferencia del ajedrez o el ajedrez, el Coronel Blotto no tiene una estrategia dominante en sentido estricto. La relación de "derrota" entre estrategias forma un torneo cíclico: A derrota a B, B derrota a C, C derrota a A.
Ejemplo concreto con 3 frentes y 6 tropas:
| Jugador 1 \ Jugador 2 | [2·2·2] | [3·3·0] | [4·1·1] |
|---|---|---|---|
| [2·2·2] Uniforme | Empate | Pierde (1–2) | Gana (2–1)* |
| [3·3·0] Concentrada | Gana (2–1) | Empate | Pierde (1–2) |
| [4·1·1] Asimétrica | Pierde* (1–2) | Gana (2–1) | Empate |
*depende del orden de los frentes; ilustrativo para T=6
Esta no-transitividad es exactamente lo que ocurre en Piedra-Papel-Tijera. El Coronel Blotto es una versión exponencialmente más compleja del mismo principio fundamental. Y por la misma razón, la única estrategia óptima a largo plazo es la aleatoria.
¿Qué pasa si un jugador tiene más tropas que el otro? Sea el jugador 1 con \(T_1\) tropas y el jugador 2 con \(T_2 < T_1\) tropas.
Se puede demostrar que si \(T_1 > T_2\), el jugador 1 tiene una estrategia dominante que garantiza ganar más de la mitad de los frentes en promedio:
Para N = 3 frentes, la estrategia óptima del jugador rico es:
Un jugador con solo un 10% más de tropas ya obtiene una ventaja estadística significativa. Esto tiene implicaciones reales: en política, publicidad y finanzas, quien tiene más recursos puede ganar con estrategia casi aleatoria mientras el rival tiene que ser perfecto.
En la versión continua del juego (donde las tropas son reales, no enteras), el equilibrio de Nash tiene una estructura elegante para N = 3 frentes.
Para T = 1 (normalizado), la estrategia mixta óptima es muestrear uniformemente sobre el simplex estándar \(\Delta^{N-1}\):
Esta distribución uniforme sobre el simplex es equivalente a generar tres exponenciales independientes y normalizarlas:
La IA en modo "Nash Mix" usa exactamente esta construcción: genera N valores exponenciales y los normaliza para obtener una distribución uniforme sobre el simplex. Es la única forma de garantizar que ningún rival puede explotarte sistemáticamente.
Si el rival usa siempre estrategia uniforme \(\mathbf{y}^* = (T/N, \ldots, T/N)\), tu respuesta óptima es el sobre-refuerzo mínimo: asigna \(\lfloor T/N \rfloor + 1\) a exactamente ⌈N/2⌉ frentes y el resto al mínimo. La ganancia esperada de frentes sube de N/2 a exactamente ⌈N/2⌉:
Si ganas un frente con 51 tropas vs 50, consumes exactamente 1 tropa más que el mínimo necesario. Generalizado:
Las tropas sobrantes \(T - C_{\min}(k)\) pueden distribuirse en los frentes restantes para confundir al rival en futuras rondas.
Si conocieses la asignación del rival antes de jugar, podrías ganar siempre. El valor de esta información perfecta es:
Con información perfecta pasarías de ganar N/2 frentes en promedio a ganar N frentes siempre. La diferencia es toda la incertidumbre del juego, comprimida en un solo número.
1. No existe estrategia pura dominante — el ciclo de dominancia es inevitable.
2. La única estrategia óptima universal es la Nash mix (uniforme sobre el simplex).
3. Contra rivales no-Nash, el sobre-refuerzo mínimo y la explotación de patrones son matemáticamente superiores.