gantt
title Particiones posibles de la muestra 2005Q1-2025Q4
dateFormat YYYY-MM-DD
axisFormat %Y
section Partición i = 1
E^(1) (2005Q1-2012Q4) :done, p1e, 2005-01-01, 8y
G^(1) (2013Q1-2013Q4) :crit, p1g, 2013-01-01, 1y
V^(1) (2014Q1-2021Q4) :active, p1v, 2014-01-01, 8y
Resto de T (2022Q1-2025Q4) :p1r, 2022-01-01, 4y
section Partición i = 2
Resto de T (2005Q1-2005Q4) :p2r0, 2005-01-01, 1y
E^(2) (2006Q1-2013Q4) :done, p2e, 2006-01-01, 8y
G^(2) (2014Q1-2014Q4) :crit, p2g, 2014-01-01, 1y
V^(2) (2015Q1-2022Q4) :active, p2v, 2015-01-01, 8y
Resto de T (2023Q1-2025Q4) :p2r1, 2023-01-01, 3y
section Partición i = 3
Resto de T (2005Q1-2006Q4) :p3r0, 2005-01-01, 2y
E^(3) (2007Q1-2014Q4) :done, p3e, 2007-01-01, 8y
G^(3) (2015Q1-2015Q4) :crit, p3g, 2015-01-01, 1y
V^(3) (2016Q1-2023Q4) :active, p3v, 2016-01-01, 8y
Resto de T (2024Q1-2025Q4) :p3r1, 2024-01-01, 2y
Estabilidad en la Recuperación de Choques Estructurales
1 Introducción
Esta nota desarrolla el criterio de estabilidad en la recuperación de choques estructurales como continuidad del documento “Criteria for SVAR Model Selection: A Proposal”. La idea central es la siguiente: si un modelo SVAR es una guía empírica razonable, entonces un mismo bloque de datos debería inducir choques estructurales similares cuando estos se recuperan bajo distintas parametrizaciones del modelo.
Para estudiar esta propiedad, se particiona una muestra de datos en submuestras ordenadas y complementarias. Primero, se estima el modelo en una de ellas y se recuperan choques estructurales sobre otra. Luego, se compara esa recuperación con la que se obtiene al reestimar el modelo sobre el propio bloque evaluado. La validación consiste en medir si los choques recuperados para un mismo subconjunto de datos son consistentes cuando cambia la muestra usada para parametrizar el SVAR.
La hipótesis metodológica es que un buen modelo estructural debería mostrar, al menos, consistencia en la recuperación de choques a través de submuestras. En este marco, el error condicional no se interpreta como un fin en sí mismo, sino como un objeto intermedio que expresa, en unidades observables, la discrepancia entre recuperaciones de choques sobre un mismo bloque de datos.
El documento organiza esta idea en tres partes. Primero se describe la construcción de las particiones de muestra y la notación para los errores incondicionales y condicionales. Luego se desarrolla el cómputo operativo: estimación en la muestra de validación, recuperación de choques, construcción de pronósticos condicionales y cálculo final de errores. Finalmente se explica por qué el MSE conjunto requiere simetrizar la distribución de errores condicionales.
2 Particiones de la Muestra
Sea \(t\) el índice temporal, con valores en la muestra completa
\[ \mathcal{T} = \{0, 1, \dots, V\}. \tag{1}\]
Para cada partición \(i\) de la muestra se selecciona una ventana \(\mathcal{W}^{(i)} \subseteq \mathcal{T}\). Dentro de esa ventana se definen tres bloques ordenados:
\[ \mathcal{W}^{(i)} = \mathcal{E}^{(i)} \cup \mathcal{G}^{(i)} \cup \mathcal{V}^{(i)}. \tag{2}\]
Los bloques son disjuntos:
\[ \mathcal{E}^{(i)} \cap \mathcal{G}^{(i)} = \mathcal{E}^{(i)} \cap \mathcal{V}^{(i)} = \mathcal{G}^{(i)} \cap \mathcal{V}^{(i)} = \varnothing. \tag{3}\]
En esta notación, \(\mathcal{E}^{(i)}\) es la submuestra usada para parametrizar el modelo, \(\mathcal{V}^{(i)}\) es la submuestra sobre la que se evalúa la validación y \(\mathcal{G}^{(i)}\) es una brecha temporal entre ambas. La brecha reduce la dependencia mecánica entre los datos usados para estimar y los datos usados para evaluar.
El ejercicio impone que \(\mathcal{E}^{(i)}\) y \(\mathcal{V}^{(i)}\) tengan el mismo tamaño y que \(\mathcal{G}^{(i)}\) tenga un tamaño fijo a través de particiones. Es decir, existen enteros \(m \ge 1\) y \(g \ge 0\) tales que
\[ \begin{aligned} |\mathcal{E}^{(i)}| &= |\mathcal{V}^{(i)}| = m, \\ |\mathcal{G}^{(i)}| &= g, \\ &\forall i. \end{aligned} \tag{4}\]
Esta restricción implica que cada ventana \(\mathcal{W}^{(i)}\) tiene tamaño fijo \(2m+g\). Por lo tanto, \(\mathcal{W}^{(i)}\) no agota necesariamente la muestra completa \(\mathcal{T}\); las distintas particiones se construyen desplazando esa ventana a lo largo del tiempo.
Además, las particiones respetan el orden temporal de la muestra. Para cada partición \(i\) existe un índice inicial \(s_i\) tal que \(0 \le s_i\) y \(s_i + 2m + g - 1 \le V\), y
\[ \begin{aligned} \mathcal{E}^{(i)} &= \{s_i, s_i + 1, \dots, s_i + m - 1\}, \\ \mathcal{G}^{(i)} &= \{s_i + m, \dots, s_i + m + g - 1\}, \\ \mathcal{V}^{(i)} &= \{s_i + m + g, \dots, s_i + 2m + g - 1\}. \end{aligned} \tag{5}\]
El siguiente diagrama ilustra algunas particiones posibles para una muestra que abarca de 2005Q1 a 2025Q4, bajo una elección fija de tamaños \(|\mathcal{E}^{(i)}| = |\mathcal{V}^{(i)}| = 8\) años y \(|\mathcal{G}^{(i)}| = 1\) año.
La expresión Ecuación 5 muestra que \(\mathcal{E}^{(i)}\) siempre precede a \(\mathcal{G}^{(i)}\) y que \(\mathcal{G}^{(i)}\) siempre precede a \(\mathcal{V}^{(i)}\). A su vez, Ecuación 4 garantiza que las particiones comparables usan un mismo tamaño para los tres bloques, variando únicamente su posición dentro de la muestra completa.
3 Cómputo de la Desviación en la Recuperación de Choques Estructurales
3.1 Planteamiento General
Para describir el cómputo de la desviación, fijemos una partición de la muestra \(\mathcal{T}\) y escribamos \(\mathcal{A}\) y \(\mathcal{B}\) para dos submuestras genéricas. Esta notación evita asignar de entrada un rol fijo de estimación o validación a cada submuestra.
El cálculo requiere dos parametrizaciones del mismo SVAR:
- Una parametrización estimada en la submuestra \(\mathcal{A}\): \(\hat{A}_{0,\mathcal{A}}\), \(\hat{A}_{1,\mathcal{A}}\) y \(\hat{B}_{0,\mathcal{A}}\).
- Una parametrización estimada en la submuestra \(\mathcal{B}\): \(\hat{A}_{0,\mathcal{B}}\), \(\hat{A}_{1,\mathcal{B}}\) y \(\hat{B}_{0,\mathcal{B}}\).
Para que la comparación sea simétrica, ambas parametrizaciones deben evaluarse sobre el mismo conjunto de observaciones. Por ello definimos el conjunto común de evaluación como
\[ \mathcal{U} = \mathcal{A} \cup \mathcal{B}. \tag{6}\]
La razón para trabajar sobre \(\mathcal{U}\) es que el intercambio de los roles de \(\mathcal{A}\) y \(\mathcal{B}\) solo produce una relación simétrica si las dos direcciones se evalúan sobre las mismas fechas. Esta propiedad se desarrolla en Sección 6 y se usa para justificar la simetrización de los errores condicionales.
3.2 Horizonte de Pronóstico 1
El horizonte 1 es el caso base del procedimiento anterior. Se expone por separado porque es el horizonte sobre el cual se construye directamente la tupla empírica de desviaciones.
3.2.1 Pronósticos Incondicionales
El pronóstico incondicional a horizonte 1, usando la parametrización de \(\mathcal{A}\) y evaluando observaciones en \(\mathcal{U}\), parte del origen \(t\) y pronostica la observación en \(t+1\):
\[ \hat{y}_{t+1|t,u,\mathcal{A},\mathcal{U}} = \hat{A}_{0,\mathcal{A}} + \hat{A}_{1,\mathcal{A}} y_t, \qquad t+1 \in \mathcal{U}. \tag{7}\]
De forma paralela, el pronóstico incondicional usando la parametrización de \(\mathcal{B}\) y evaluando observaciones en \(\mathcal{U}\) es
\[ \hat{y}_{t+1|t,u,\mathcal{B},\mathcal{U}} = \hat{A}_{0,\mathcal{B}} + \hat{A}_{1,\mathcal{B}} y_t, \qquad t+1 \in \mathcal{U}. \tag{8}\]
3.2.2 Errores Incondicionales
Los errores incondicionales asociados a cada parametrización se calculan como la diferencia entre la observación realizada y el pronóstico incondicional correspondiente. Para la parametrización estimada en \(\mathcal{A}\):
\[ \hat{e}_{t+1|t,u,\mathcal{A},\mathcal{U}} = y_{t+1} - \hat{y}_{t+1|t,u,\mathcal{A},\mathcal{U}}, \qquad t+1 \in \mathcal{U}. \tag{9}\]
Para la parametrización estimada en \(\mathcal{B}\):
\[ \hat{e}_{t+1|t,u,\mathcal{B},\mathcal{U}} = y_{t+1} - \hat{y}_{t+1|t,u,\mathcal{B},\mathcal{U}}, \qquad t+1 \in \mathcal{U}. \tag{10}\]
3.2.3 Desviaciones en la Recuperación de Choques Estructurales
La desviación en la dirección \(\mathcal{A} \to \mathcal{B}\) compara el error incondicional obtenido con la parametrización de \(\mathcal{A}\) contra el error incondicional obtenido con la parametrización de \(\mathcal{B}\), ambos evaluados sobre \(\mathcal{U}\):
\[ \begin{align} \hat{e}_{t+1|t,c,\mathcal{A},\mathcal{B},\mathcal{U}} &= \hat{e}_{t+1|t,u,\mathcal{A},\mathcal{U}} - \hat{e}_{t+1|t,u,\mathcal{B},\mathcal{U}}, \qquad t+1 \in \mathcal{U}. \end{align} \tag{11}\]
En la dirección opuesta, la desviación es
\[ \begin{align} \hat{e}_{t+1|t,c,\mathcal{B},\mathcal{A},\mathcal{U}} = \hat{e}_{t+1|t,u,\mathcal{B},\mathcal{U}} - \hat{e}_{t+1|t,u,\mathcal{A},\mathcal{U}}, \qquad t+1 \in \mathcal{U}. \end{align} \tag{12}\]
Por construcción, ambas desviaciones tienen el mismo tamaño y signo contrario:
\[ \hat{e}_{t+1|t,c,\mathcal{B},\mathcal{A},\mathcal{U}} = - \hat{e}_{t+1|t,c,\mathcal{A},\mathcal{B},\mathcal{U}}. \tag{13}\]
Estas desviaciones cuantifican cuánto cambia la recuperación implícita de los choques estructurales al parametrizar el mismo bloque de observaciones con una u otra submuestra.
3.3 Horizonte de Pronóstico Mayor a 1
Para horizontes \(h > 1\), el desarrollo parte de una última observación disponible en \(t\) y evalúa el resultado en \(t+h\). Por lo tanto, el horizonte debe ser factible dentro del conjunto común de evaluación:
\[ t+h \in \mathcal{U}. \tag{14}\]
El cómputo sigue la misma lógica del horizonte 1, pero reemplaza los pronósticos de un paso por pronósticos acumulados a \(h\) pasos. Para cada origen temporal \(t\), se generan dos pronósticos sobre la misma observación \(y_{t+h}\): uno con la parametrización de \(\mathcal{A}\) y otro con la parametrización de \(\mathcal{B}\). Al restar ambos pronósticos de la misma observación realizada se obtienen dos errores incondicionales comparables.
El pronóstico incondicional con parametrización en \(\mathcal{A}\), para un VAR(1), se calcula como
\[ \hat{y}_{t+h|t,u,\mathcal{A},\mathcal{U}} = \hat{A}_{1,\mathcal{A}}^h y_t + \sum_{j=1}^{h} \hat{A}_{1,\mathcal{A}}^{j-1} \hat{A}_{0,\mathcal{A}}. \tag{15}\]
De manera análoga, el pronóstico incondicional con parametrización en \(\mathcal{B}\) es
\[ \hat{y}_{t+h|t,u,\mathcal{B},\mathcal{U}} = \hat{A}_{1,\mathcal{B}}^h y_t + \sum_{j=1}^{h} \hat{A}_{1,\mathcal{B}}^{j-1} \hat{A}_{0,\mathcal{B}}. \tag{16}\]
Los errores incondicionales asociados se calculan restando cada pronóstico de la misma observación realizada \(y_{t+h}\):
\[ \hat{e}_{t+h|t,u,\mathcal{A},\mathcal{U}} = y_{t+h} - \hat{y}_{t+h|t,u,\mathcal{A},\mathcal{U}}, \tag{17}\]
\[ \hat{e}_{t+h|t,u,\mathcal{B},\mathcal{U}} = y_{t+h} - \hat{y}_{t+h|t,u,\mathcal{B},\mathcal{U}}. \tag{18}\]
La desviación se obtiene comparando esos errores incondicionales. En la dirección \(\mathcal{A} \to \mathcal{B}\) se define como
\[ \begin{align} \hat{e}_{t+h|t,c,\mathcal{A},\mathcal{B},\mathcal{U}} &= \hat{e}_{t+h|t,u,\mathcal{A},\mathcal{U}} - \hat{e}_{t+h|t,u,\mathcal{B},\mathcal{U}}, \qquad t+h \in \mathcal{U}. \end{align} \tag{19}\]
En la dirección opuesta,
\[ \begin{align} \hat{e}_{t+h|t,c,\mathcal{B},\mathcal{A},\mathcal{U}} &= \hat{e}_{t+h|t,u,\mathcal{B},\mathcal{U}} - \hat{e}_{t+h|t,u,\mathcal{A},\mathcal{U}}, \qquad t+h \in \mathcal{U}. \end{align} \tag{20}\]
Por construcción, invertir el orden de las parametrizaciones solo cambia el signo de la desviación:
\[ \hat{e}_{t+h|t,c,\mathcal{B},\mathcal{A},\mathcal{U}} = - \hat{e}_{t+h|t,c,\mathcal{A},\mathcal{B},\mathcal{U}}. \tag{21}\]
Así, para horizontes mayores a uno, no se introduce una noción distinta de desviación. Lo único que cambia es que los errores incondicionales provienen de pronósticos acumulados a \(h\) pasos, por lo que la comparación incorpora la dinámica del modelo durante varios periodos.
4 Procedimiento Operativo
En la aplicación concreta, se toma \(\mathcal{A}=\mathcal{E}^{(i)}\) y \(\mathcal{B}=\mathcal{V}^{(i)}\) para cada partición \(i\). El conjunto común de evaluación es entonces
\[ \mathcal{U}^{(i)} = \mathcal{E}^{(i)} \cup \mathcal{V}^{(i)}. \tag{22}\]
El procedimiento operativo puede resumirse en cuatro objetos matemáticos:
- La parametrización estimada en \(\mathcal{E}^{(i)}\): \(\hat{A}_{0,\mathcal{E}^{(i)}}\), \(\hat{A}_{1,\mathcal{E}^{(i)}}\) y \(\hat{B}_{0,\mathcal{E}^{(i)}}\).
- La parametrización estimada en \(\mathcal{V}^{(i)}\): \(\hat{A}_{0,\mathcal{V}^{(i)}}\), \(\hat{A}_{1,\mathcal{V}^{(i)}}\) y \(\hat{B}_{0,\mathcal{V}^{(i)}}\).
- Los errores incondicionales sobre \(\mathcal{U}^{(i)}\) usando la parametrización de \(\mathcal{E}^{(i)}\).
- Los errores incondicionales sobre \(\mathcal{U}^{(i)}\) usando la parametrización de \(\mathcal{V}^{(i)}\).
El resultado final es el error condicional, definido como la diferencia entre ambos errores incondicionales sobre \(\mathcal{U}^{(i)}\):
\[ \hat{e}_{t+h|t,c,\mathcal{E}^{(i)},\mathcal{V}^{(i)},\mathcal{U}^{(i)}} = \hat{e}_{t+h|t,u,\mathcal{E}^{(i)},\mathcal{U}^{(i)}} - \hat{e}_{t+h|t,u,\mathcal{V}^{(i)},\mathcal{U}^{(i)}}. \tag{23}\]
Este error condicional es la desviación observable asociada a recuperar choques estructurales con dos parametrizaciones distintas sobre el mismo conjunto de fechas.
5 Tuplas de Desviaciones en la Recuperación de Choques
Una vez calculadas las desviaciones para cada partición, el siguiente paso es organizarlas como tuplas empíricas. La tupla no introduce una nueva definición de error: únicamente recopila las desviaciones obtenidas al comparar dos parametrizaciones sobre el conjunto común de evaluación \(\mathcal{U}^{(i)}\).
Sea \(\mathcal{I}\) el conjunto de particiones consideradas. Para una partición \(i\) y un horizonte \(h\), definimos el conjunto de orígenes admisibles como
\[ \mathcal{S}_{h}^{(i)} = \left\{ t : t+h \in \mathcal{U}^{(i)} \ \text{y}\ y_t\ \text{está disponible} \right\}. \tag{24}\]
Para cada \(t \in \mathcal{S}_{h}^{(i)}\) se calcula una desviación
\[ \hat{e}_{t+h|t,c,\mathcal{E}^{(i)},\mathcal{V}^{(i)},\mathcal{U}^{(i)}} = \hat{e}_{t+h|t,u,\mathcal{E}^{(i)},\mathcal{U}^{(i)}} - \hat{e}_{t+h|t,u,\mathcal{V}^{(i)},\mathcal{U}^{(i)}}. \tag{25}\]
La tupla de desviaciones a horizonte \(h\) se conforma agrupando esos objetos a través de todas las particiones:
\[ \mathcal{D}_{c,h} = \left( \hat{e}_{t+h|t,c,\mathcal{E}^{(i)},\mathcal{V}^{(i)},\mathcal{U}^{(i)}} : i \in \mathcal{I},\ t \in \mathcal{S}_{h}^{(i)} \right). \tag{26}\]
Si el SVAR contiene \(K\) variables, cada elemento de \(\mathcal{D}_{c,h}\) es un vector en \(\mathbb{R}^{K}\). Cuando se requiere trabajar variable por variable, la tupla correspondiente al componente \(k\) es
\[ \mathcal{D}_{c,h,k} = \left( \hat{e}_{t+h|t,c,k,\mathcal{E}^{(i)},\mathcal{V}^{(i)},\mathcal{U}^{(i)}} : i \in \mathcal{I},\ t \in \mathcal{S}_{h}^{(i)} \right), \qquad k = 1,\dots,K. \tag{27}\]
Debido a la simetría entre los errores expuesta en Sección 6, la tupla total de desviaciones condicionales a horizonte \(h\), \(\tilde{\mathcal{D}}_{c,h}\), se define a partir de la tupla original \(\mathcal{D}_{c,h}\) como
\[ \tilde{\mathcal{D}}_{c,h} = \mathcal{D}_{c,h} \Vert -\mathcal{D}_{c,h}. \tag{28}\]
El operador \(\Vert\) denota concatenación. Es decir, la tupla original se extiende agregando una copia de sus elementos multiplicados por \(-1\). Esta transformación fuerza simetría alrededor de cero y conserva la magnitud de los errores condicionales.
6 Justificación por Simetría entre Submuestras
Una forma de motivar la simetrización es estudiar qué ocurre al intercambiar los roles de las submuestras \(\mathcal{E}(i)\) y \(\mathcal{V}(i)\). Para evitar cargar la notación, en esta sección escribimos simplemente \(\mathcal{E}\) y \(\mathcal{V}\).
La definición del error condicional puede expresarse como
\[ \begin{align} \hat{e}_{t+h|t, c,\mathcal{E}, \mathcal{V}, \mathcal{V}} &= y_{t+h} - y_{t+h|t, c, \mathcal{E}, \mathcal{V}, \mathcal{V}} \\ &= y_{t+h} - \left( y_{t+h|t, u, \mathcal{E}, \mathcal{V}} + \hat{e}_{t+h|t, u, \mathcal{V}, \mathcal{V}} \right) \\ &= \left( y_{t+h|t, u, \mathcal{E}, \mathcal{V}} + \hat{e}_{t+h|t, u, \mathcal{E}, \mathcal{V}} \right) - \left( y_{t+h|t, u, \mathcal{E}, \mathcal{V}} + \hat{e}_{t+h|t, u, \mathcal{V}, \mathcal{V}} \right) \\ &= \hat{e}_{t+h|t, u, \mathcal{E}, \mathcal{V}} - \hat{e}_{t+h|t, u, \mathcal{V}, \mathcal{V}}. \end{align} \tag{29}\]
Como el error condicional puede expresarse como una diferencia de errores incondicionales, una primera conjetura sería esperar que
\[ \hat{e}_{t+h|t, c,\mathcal{E}, \mathcal{V}, \mathcal{V}} \stackrel{?}{=} -\hat{e}_{t+h|t, c,\mathcal{V}, \mathcal{E}, \mathcal{E}}. \tag{30}\]
Esa conjetura no es válida tal como está escrita, porque en el lado izquierdo \(t+h \in \mathcal{V}\), mientras que en el lado derecho \(t+h \in \mathcal{E}\). Dado que \(\mathcal{E} \cap \mathcal{V} = \varnothing\), ambas expresiones no se evalúan sobre las mismas observaciones.
La simetría sí aparece cuando los errores condicionales se calculan sobre la unión \(\mathcal{E} \cup \mathcal{V}\) en lugar de restringirse únicamente a \(\mathcal{V}\):
\[ \hat{e}_{t+h|t, c,\mathcal{E}, \mathcal{V}, \mathcal{E} \cup \mathcal{V}} = - \hat{e}_{t+h|t, c,\mathcal{V}, \mathcal{E}, \mathcal{V} \cup \mathcal{E}}. \tag{31}\]
En efecto,
\[ \hat{e}_{t+h|t, c,\mathcal{E}, \mathcal{V}, \mathcal{E} \cup \mathcal{V}} = \hat{e}_{t+h|t, u, \mathcal{E},\mathcal{E} \cup \mathcal{V}} - \hat{e}_{t+h|t, u, \mathcal{V}, \mathcal{E} \cup \mathcal{V}}, \tag{32}\]
mientras que
\[ \hat{e}_{t+h|t, c,\mathcal{V}, \mathcal{E}, \mathcal{E} \cup \mathcal{V}} = \hat{e}_{t+h|t, u, \mathcal{V},\mathcal{E} \cup \mathcal{V}} - \hat{e}_{t+h|t, u, \mathcal{E}, \mathcal{E} \cup \mathcal{V}}. \tag{33}\]
Por lo tanto, si la validación condicional se computa sobre \(\mathcal{E}(i) \cup \mathcal{V}(i)\), la tupla relevante es la tupla de desviaciones construida en la sección anterior.
La versión simetrizada queda entonces dada por
\[ \tilde{\mathcal{D}}_{c,h} = \mathcal{D}_{c,h} \Vert -\mathcal{D}_{c,h}. \tag{34}\]
Esta construcción provee una justificación operacional para la simetrización: al evaluar ambas direcciones sobre el mismo conjunto de observaciones, intercambiar las submuestras cambia el signo del error condicional.