Nivel de confianza

Cada predicción incluye un nivel de confianza que refleja la calidad y cantidad de datos disponibles para ese vehículo específico. Aquí explicamos cómo se calcula.

Niveles de confianza

Alta

El modelo tiene abundantes datos de referencia y alta especificidad del perfil del vehículo. El precio estimado tiene un margen de variación de ±5%.

≥ 30 vehículos similares (CLT) Y ≥ 4 de 7 campos opcionales completados

Media

Hay datos suficientes pero alguna señal es débil (pocos comparables, datos algo desactualizados o perfil incompleto). El margen de variación es de ±8%.

≥ 15 vehículos similares, pero no cumple condición de alta

Limitada

Pocos vehículos de referencia. La predicción es válida, pero la incertidumbre es mayor. El margen de variación es de ±18%.

< 15 vehículos similares en el dataset

Puntuación de confianza (0–100)

Además del nivel, calculamos un índice numérico que combina cuatro señales ponderadas.

Puntuación

Score = 0.40 × s_density + 0.20 × s_freshness + 0.25 × s_dispersion + 0.15 × s_specificity

Cada señal toma un valor entre 0 y 1 (1 = óptimo, 0.6 = aceptable, 0.2 = débil). El resultado final se multiplica por 100 y se redondea al entero más cercano.

Vehículos similares — peso 40%

Cantidad de anuncios del mismo modelo y versión en el dataset de entrenamiento. Cuando se especifica una versión, se cuenta sólo esa versión; si no hay datos suficientes, se usa el total marca+modelo como respaldo. Fuente: columna training_samples devuelta por /api/predict/.

Sólido · 1.0

≥ 30 vehículos

OK · 0.6

15 – 29 vehículos

Débil · 0.2

< 15 vehículos

Actualización del mercado — peso 20%

Días transcurridos desde el anuncio más reciente del mismo modelo en la base de datos. Fuente: /api/catalog/freshness → campo days_ago, que calcula MAX(scraped_at) sobre los anuncios activos.

Sólido · 1.0

≤ 7 días

OK · 0.6

8 – 30 días

Débil · 0.2

> 30 días

Dispersión de precios — peso 25%

Coeficiente de variación (CV = desviación estándar / media × 100) de los precios del modelo y año consultados. Un CV bajo indica que los precios del mercado son homogéneos y la predicción es más precisa. Fuente: /api/catalog/price-stats → campo cv_pct.

Sólido · 1.0

CV < 8%

OK · 0.6

8% – 15%

Débil · 0.2

CV ≥ 15%

Datos del vehículo — peso 15%

Proporción de campos opcionales completados por el usuario: versión, cilindraje, potencia, combustible, transmisión y tracción (5 campos evaluados). A más datos, el modelo puede afinar mejor la predicción.

Sólido · 1.0

5 / 5 campos

Proporcional

campos_completados / 5

Débil · 0.0

0 / 5 campos

Señales no disponibles

Cuando un dato no está disponible (p. ej., el modelo no tiene anuncios en la BD o la base local se usa sin conexión), la señal correspondiente toma el valor mínimo 0.2 en lugar de bloquear el cálculo. Esto garantiza que el score siempre se muestra, pero penaliza adecuadamente la incertidumbre.

Rango de precio estimado

El rango que se muestra debajo del precio central varía según el nivel de confianza:

Alta

± 5%

Media

± 8%

Limitada

± 18%

Actualización de datos

Los datos del mercado se actualizan automáticamente a diario mediante el pipeline cars_daily_refresh, que extrae nuevos anuncios, limpia y normaliza los datos, y recarga el catálogo en producción. La señal "Actualización del mercado" refleja cuántos días han pasado desde la última ingesta para el modelo consultado.