Nivel de confianza
Cada predicción incluye un nivel de confianza que refleja la calidad y cantidad de datos disponibles para ese vehículo específico. Aquí explicamos cómo se calcula.
Niveles de confianza
Alta
El modelo tiene abundantes datos de referencia y alta especificidad del perfil del vehículo. El precio estimado tiene un margen de variación de ±5%.
≥ 30 vehículos similares (CLT) Y ≥ 4 de 7 campos opcionales completados
Media
Hay datos suficientes pero alguna señal es débil (pocos comparables, datos algo desactualizados o perfil incompleto). El margen de variación es de ±8%.
≥ 15 vehículos similares, pero no cumple condición de alta
Limitada
Pocos vehículos de referencia. La predicción es válida, pero la incertidumbre es mayor. El margen de variación es de ±18%.
< 15 vehículos similares en el dataset
Puntuación de confianza (0–100)
Además del nivel, calculamos un índice numérico que combina cuatro señales ponderadas.
Puntuación
Score = 0.40 × s_density + 0.20 × s_freshness + 0.25 × s_dispersion + 0.15 × s_specificity
Cada señal toma un valor entre 0 y 1 (1 = óptimo, 0.6 = aceptable, 0.2 = débil). El resultado final se multiplica por 100 y se redondea al entero más cercano.
Vehículos similares — peso 40%
Cantidad de anuncios del mismo modelo y versión en el dataset de entrenamiento.
Cuando se especifica una versión, se cuenta sólo esa versión; si no hay datos suficientes, se usa el total marca+modelo como respaldo.
Fuente: columna training_samples devuelta por /api/predict/.
Sólido · 1.0
≥ 30 vehículos
OK · 0.6
15 – 29 vehículos
Débil · 0.2
< 15 vehículos
Actualización del mercado — peso 20%
Días transcurridos desde el anuncio más reciente del mismo modelo en la base de datos.
Fuente: /api/catalog/freshness → campo days_ago,
que calcula MAX(scraped_at) sobre los anuncios activos.
Sólido · 1.0
≤ 7 días
OK · 0.6
8 – 30 días
Débil · 0.2
> 30 días
Dispersión de precios — peso 25%
Coeficiente de variación (CV = desviación estándar / media × 100) de los precios del modelo
y año consultados. Un CV bajo indica que los precios del mercado son homogéneos y la predicción
es más precisa. Fuente: /api/catalog/price-stats → campo cv_pct.
Sólido · 1.0
CV < 8%
OK · 0.6
8% – 15%
Débil · 0.2
CV ≥ 15%
Datos del vehículo — peso 15%
Proporción de campos opcionales completados por el usuario: versión, cilindraje, potencia, combustible, transmisión y tracción (5 campos evaluados). A más datos, el modelo puede afinar mejor la predicción.
Sólido · 1.0
5 / 5 campos
Proporcional
campos_completados / 5
Débil · 0.0
0 / 5 campos
Señales no disponibles
Cuando un dato no está disponible (p. ej., el modelo no tiene anuncios en la BD o la base local se usa sin conexión), la señal correspondiente toma el valor mínimo 0.2 en lugar de bloquear el cálculo. Esto garantiza que el score siempre se muestra, pero penaliza adecuadamente la incertidumbre.
Rango de precio estimado
El rango que se muestra debajo del precio central varía según el nivel de confianza:
Alta
± 5%
Media
± 8%
Limitada
± 18%
Actualización de datos
Los datos del mercado se actualizan automáticamente a diario mediante el pipeline
cars_daily_refresh,
que extrae nuevos anuncios, limpia y normaliza los datos, y recarga el catálogo en producción.
La señal "Actualización del mercado" refleja cuántos días han pasado desde la última ingesta
para el modelo consultado.