Escala σ priormultiplica (hi−lo)/2 por parámetro libre
Iteraciones máx.Tol. ‖Δμ‖ (cp)
Una iteración: paso-E O(n · D²) + paso-M Cholesky 26×26. Típicamente 20–50 iteraciones hasta convergencia.
Convergencia Ejecutando
Iteración
—
of —
‖Δμ‖⊂2 (cp)
—
tol —
Transcurrido
—
—
Log-verosimilitud
—
por posición
Resumen posterior —
Intervalos de credibilidad posterior
— cada parámetro normalizado a su propio [lo, hi]
Prior ±2σ⊂0;
Posterior ±2σ
Media posterior
Valor por defecto
Correlaciones posteriores
— pares principales por |ρ| de la Σ completa
Las correlaciones surgen de la geometría de los datos, no del prior (que es diagonal).
ρ positivo fuerte: piezas cuyos valores son conjuntamente inciertos. ρ negativo fuerte: explicaciones alternativas para las mismas posiciones.
Salida de código — reemplazo directo de defaultWeights()
Modelo.
p(y⊂i; = 1 | w) = σ(x⊂i;′ ⊃T;w) donde x⊂i;′ = posFeatures(tablero⊂i;)/K e y⊂i; ∈ {0, ½, 1}.
Prior: w ~ N(μ⊂0;, Σ⊂0;) diagonal, μ⊂0; = valores por defecto actuales, σ⊂0;⊂j; = escala × (hi−lo)/2.
Los parámetros congelados usan σ⊂0; = 1 cp.
MFVB aumentado con Pólya-Gamma: todas las actualizaciones de coordenadas son exactas y en forma cerrada.
Ventajas.
Devuelve una distribución posterior completa — no sólo una estimación puntual.
Cada parámetro recibe un intervalo de credibilidad al 95% y la covarianza posterior
completa de 26×26 está disponible para cuantificación de incertidumbre.
Opera sobre todos los parámetros simultáneamente; sin maldición de la dimensionalidad.