Por: Hanwen Zhang

Hoy me siento triste y decepcionada, pero también sorprendida. Mi amada ciencia estadística ha sido torturada en el lecho de Procusto. Les cuento:
El 26 de abril de 2026, Invamer publicó su encuesta "Colombia Opina #21", donde el tema de mayor interés público es, sin duda, los resultados de intención de voto, en los que Iván Cepeda aparece a 5 puntos de ganar en primera vuelta. No tardaron los periodistas, influencers, tuiteros y opinadores en salir a analizar cada detalle de esa encuesta. Argumentos van y argumentos vienen, pero déjenme decirles que la opinión pública de Colombia persigue a esta encuesta como el burro persigue, engañado, a la zanahoria que nunca va a morder.
Que si la encuesta está sesgada hacia los estratos más bajos, que si los municipios seleccionados favorecen a fulano o a zutano, que si la tasa de no respuesta es muy alta... Pero de lo que nadie está hablando es de la forma en que Invamer calcula los resultados, que es errónea y viola la base científica de una encuesta (la teoría de muestreo estadístico).
El punto clave para entender ese error es el objetivo de un estudio por encuestas: representar a la población con una muestra de tamaño muy reducido. ¿Te has preguntado cómo una muestra de mil, dos mil o cuatro mil personas puede representar a 40 millones del electorado colombiano? ¿La información del 0,01 % del electorado se puede extrapolar a la población entera? Pues sí, pero con la ayuda de los denominados factores de expansión.
En términos simples, los factores de expansión miden a cuántas personas debe representar un individuo seleccionado en la muestra. Si Juan fue seleccionado y su factor de expansión es igual a 20, significa que Juan no solo se representa a sí mismo, sino también a 19 personas más en la población que no fueron seleccionadas. Este concepto es fundamental en el cálculo de los indicadores en una encuesta, ya que los individuos con mayor factor de expansión tienen un mayor peso en el resultado. Estos factores de expansión son una parte inherente del muestreo probabilístico (el estándar de oro para lograr que una muestra represente a la población), y su cálculo depende del mecanismo de selección en el proceso de muestreo.
En este punto es importante destacar la siguiente definición de encuesta en el artículo 3º de la Ley 2494 de 2025 (la nueva Ley de Encuestas):
Encuesta o encuesta por muestreo probabilístico: producto técnico de base científica que consiste en aplicar un conjunto de técnicas y procedimientos mediante los cuales, sobre la base de un cuestionario específico, se obtienen datos e información respecto de las opiniones, deseos, actitudes o comportamientos de un grupo representativo de consultados, y cuyos resultados pueden ser generalizados a universos definidos y conocidos de la población.
Ahora, los dos componentes fundamentales para que la muestra sea representativa y los resultados puedan ser extrapolados a la población son:
- La selección de los individuos debe obedecer al diseño muestral.
- Posterior a la recolección de información, el cálculo de los resultados debe incorporar los factores de expansión.
En cuanto a la encuesta Colombia Opina de Invamer, la descripción del punto uno —la selección de los individuos— aparece en la ficha técnica, bajo el apartado "PROCEDIMIENTO UTILIZADO PARA SELECCIONAR LAS UNIDADES MUESTRALES". Allí se presentan los detalles de la selección en diferentes etapas y no parece haber mayores problemas técnicos. Sin embargo, donde radica la falta gravísima de Invamer es en los factores de expansión: estos deben estar calculados con base en la probabilidad de inclusión de los individuos muestreados. ¿Pero qué es lo que calcula Invamer? Miremos lo que la encuestadora presentó al Consejo Nacional Electoral (tomaré la encuesta Colombia Opina #20, ya que los documentos técnicos correspondientes a la última encuesta aún no están publicados):
En este enlace del CNE se encuentra el archivo Excel llamado "6. Factor de ponderación", que contiene la descripción del procedimiento de cálculo (he comprobado, a partir de los microdatos de dicha encuesta, que estos factores de ponderación son efectivamente los que utilizó Invamer para el cálculo de indicadores).

Dicho procedimiento deja en evidencia que el cálculo de estos factores no se basó en la probabilidad de inclusión de los individuos, sino que corresponde a una mera ponderación usando las proyecciones poblacionales para 2026. En otras palabras, en el cálculo realizado por Invamer, cuánto pesa cada individuo seleccionado en los indicadores depende del número de personas en la población de su mismo grupo de edad, región, etc., ¡pero no depende de la probabilidad de inclusión! Un error imperdonable para cualquier encuesta probabilística, ya que va en contravía de la base misma de la teoría científica. Un error de esta naturaleza solo muestra un profundo desconocimiento —o manipulación— por parte de la firma encuestadora en materia de muestreo.
Al parecer, la Comisión Técnica de Vigilancia de Encuestas sobre Opinión Pública y Electoral también está al tanto de esta situación, pues en su comunicado de prensa del 14 de abril de 2026 afirma:
“El CNE también advierte que técnicas estadísticas como la ponderación o el raking no sustituyen el diseño muestral ni corrigen fallas estructurales de cobertura. Su uso únicamente es válido cuando parte de muestreos probabilísticos adecuados y se limita a ajustar desviaciones observables.”
Aquí tengo que resaltar una de las bondades de la nueva Ley de Encuestas: antes de la nueva legislación, las firmas encuestadoras solo tenían que entregar la ficha técnica; el público no tenía cómo acceder a los microdatos ni a los factores de expansión y, por ende, errores graves de este estilo habrían pasado inadvertidos ante la opinión pública durante décadas.
Terminaré usando las frases que dijo Morpheus cuando le revelaba la verdad a Neo: durante mucho tiempo me negué a creerlo, hasta que vi los factores de expansión con mis propios ojos... Y sentada ahí, frente a los archivos de Invamer, encarando esa precisión horripilante, me di cuenta de lo obvia que era la verdad: han convertido a las encuestas en meros sondeos y hemos sido engañados. Y tú, mi amigo, ¿seguirás creyendo los resultados de este tipo de encuestas o tomarás la píldora roja y despertarás?
