"Calidad de datos" es una de esas frases con las que todos en RevOps están de acuerdo en que es importante, pero que casi nadie ha operacionalizado. Surge en las revisiones trimestrales cuando las campañas no rinden, en las revisiones de pipeline cuando la atribución parece incorrecta, y en las reuniones de directiva cuando los números del CRM no cuadran con la intuición de ventas. Luego la crisis pasa, el proyecto de higiene de datos se reincorpora al roadmap, y la misma conversación se repite el siguiente trimestre.
La razón por la que la calidad de datos permanece perpetuamente sin resolver no es falta de voluntad. Es falta de definición operativa. "Mejorar la calidad de datos" no es una tarea que alguien pueda ejecutar. Pero "asegurar que el 90% de los contactos en nuestros segmentos de campaña activos tengan un correo electrónico válido, un cargo profesional completado y el tamaño de la empresa registrado antes de cualquier envío" — esa sí es una tarea con un criterio de aceptación claro, un responsable y un mecanismo de aplicación.
Esta guía te proporciona el marco para hacer operativa la calidad de datos en HubSpot: las siete dimensiones, cómo evaluar tu estado actual, cómo establecer umbrales con significado real, cómo incorporar controles de calidad en los workflows y cómo convertir todo esto en un hábito de equipo en lugar de un simulacro de incendio trimestral.
Las siete dimensiones de la calidad de datos en CRM
La mayoría de las discusiones sobre calidad de datos mezclan varios problemas distintos en un mismo cajón. Separarlos es importante porque cada dimensión tiene una causa diferente, un enfoque de remediación diferente y un conjunto diferente de métricas.
1. Completitud
La completitud mide si los campos que deberían estar completados realmente lo están. Un registro de contacto con nombre y correo electrónico pero sin cargo, empresa o industria está incompleto. La completitud es la dimensión más visible y la más fácil de medir — es simplemente el porcentaje de campos requeridos con un valor no nulo.
Ejemplo en HubSpot: Crea un informe personalizado que muestre el porcentaje de contactos en tu segmento objetivo con cada campo crítico completado. Esta es tu puntuación de completitud. La mayoría de los equipos descubren que están operando con un 50-70% de completitud en sus campos críticos — lo que significa que el 30-50% de su base de datos carece de al menos un campo requerido para un enrutamiento, puntuación o personalización efectivos.
2. Precisión
La precisión mide si los valores que están completados son realmente correctos. Un contacto con un cargo de "Director de Marketing" que ahora es VP de Ventas tiene 100% de completitud en el campo de cargo y 0% de precisión. La precisión es más difícil de medir que la completitud porque requiere verificación externa o inferencia de vigencia — no se puede determinar desde dentro del CRM si el valor de un campo es correcto sin compararlo con la realidad.
Ejemplo en HubSpot: La precisión se evalúa mejor mediante enriquecimiento — pasando un contacto por un proveedor de datos y comparando el valor devuelto con el almacenado. Una alta tasa de discrepancia de enriquecimiento en un campo sugiere baja precisión. Alternativamente, las tasas de rebote y las tasas de respuesta a secuencias sirven como indicadores rezagados de la precisión del correo electrónico específicamente.
3. Vigencia
La vigencia mide cuán recientemente se verificaron o actualizaron los datos de un registro. Un registro completamente completo y preciso de hace 18 meses tiene un problema de vigencia — la precisión puede haberse deteriorado desde la última vez que se confirmaron los datos. La vigencia es función del tiempo y de las tasas de deterioro específicas por campo.
Ejemplo en HubSpot: Registra la "Fecha de último enriquecimiento" como una propiedad personalizada en cada registro de contacto. Crea segmentos para contactos no enriquecidos en los últimos 90, 180 y 365 días. Los contactos en el grupo de 365+ días deben tratarse como de alto riesgo de deterioro y priorizarse para re-enriquecimiento antes de cualquier acción outbound.
4. Validez
La validez mide si los valores de los campos se ajustan al formato y tipo de dato esperado — independientemente de si son precisos. Una dirección de correo de "john@" no es válida. Un número de teléfono de "555" no es válido. Un campo de país completado con "US" cuando el formato esperado es "United States" es técnicamente inválido, aunque todos sepan qué significa. Los problemas de validez se introducen frecuentemente en el punto de entrada de datos o mediante formatos de importación inconsistentes.
Ejemplo en HubSpot: Las reglas de validación de propiedades de HubSpot capturan algunos problemas de formato en el envío de formularios (sintaxis de correo, formato de URL), pero son limitadas para propiedades personalizadas. Las auditorías regulares de datos mediante exportaciones y coincidencia básica de patrones revelarán problemas de validez que se escapan.
5. Consistencia
La consistencia mide si los mismos datos se representan de la misma manera entre registros y entre objetos relacionados. Un registro de contacto que muestra "Tecnología" como industria y cuyo registro de empresa asociado muestra "Software" tiene un problema de consistencia. Un registro de negocio que muestra una asociación de empresa diferente a la empresa principal del contacto tiene un problema de consistencia.
Ejemplo en HubSpot: Los problemas de consistencia entre objetos son comunes después de integraciones con sistemas externos (sincronizaciones con Salesforce, importaciones de datos) que usan taxonomías diferentes para el mismo campo. Ejecuta verificaciones de consistencia en los campos de industria, tamaño de empresa y territorio entre los objetos de contacto y empresa periódicamente.
6. Unicidad
La unicidad mide la ausencia de registros duplicados. Una base de datos con 10,000 contactos que en realidad representa 8,500 personas únicas tiene un problema de unicidad — y la tasa de duplicados del 15% significa que cada segmento, modelo de atribución y secuencia está trabajando con un dataset corrupto.
Ejemplo en HubSpot: La unicidad es la dimensión más directamente abordada por herramientas de deduplicación. También es una de las más medibles — puedes cuantificar tu tasa estimada de duplicados mediante un escaneo con una herramienta de dedup y rastrearla a lo largo del tiempo como un KPI.
7. Cobertura de enriquecimiento
La cobertura de enriquecimiento mide el porcentaje de registros que han sido complementados con datos de terceros — firmográficos, tecnográficos, señales demográficas. Un registro de contacto completado solo con lo que el contacto reportó en un formulario tiene una cobertura de enriquecimiento diferente a uno que ha pasado por una cascada multi-proveedor y tiene 20 campos completados.
Ejemplo en HubSpot: Mide la cobertura de enriquecimiento como una puntuación compuesta: el porcentaje de un conjunto definido de campos de enriquecimiento (industria, número de empleados, ingresos, stack tecnológico, teléfono directo, nivel de antigüedad) que están completados en cada registro. Un registro con 4 de 8 campos de enriquecimiento completados tiene un 50% de cobertura de enriquecimiento.
Cómo evaluar tu base de datos actual: Un enfoque de auditoría manual
Con las siete dimensiones definidas, puedes construir una puntuación base. A continuación se presenta un enfoque práctico que no requiere herramientas especializadas.
Paso 1: Define tu conjunto de campos críticos
Comienza listando los campos requeridos para tus casos de uso principales. Para la mayoría de los equipos de RevOps, esto incluye:
- Dirección de correo electrónico (requerida para toda acción outbound)
- Cargo profesional (requerido para puntuación y personalización)
- Nombre de empresa (requerido para enrutamiento firmográfico)
- Industria (requerida para segmentación)
- Número de empleados de la empresa (requerido para enrutamiento basado en niveles)
- País/región (requerido para asignación de territorio)
- Número de teléfono (requerido para secuencias outbound con llamadas)
Este es tu "conjunto de campos críticos". Puedes tener entre 7 y 12 campos, dependiendo de tu stack tecnológico y estrategia.
Paso 2: Ejecuta la completitud por dimensión
Para cada campo en tu conjunto crítico, consulta HubSpot para obtener el porcentaje de tu población activa de contactos (etapa del ciclo de vida = Lead Cualificado de Marketing, SQL, Cliente, o cualesquiera que sean tus estados activos) que tiene un valor no nulo. Exporta estos números. Esta es tu puntuación de completitud.
Paso 3: Estima la exposición a vigencia
Filtra tu población activa de contactos por "Fecha de último enriquecimiento" (si la registras) o por "Fecha de última actividad" como aproximación. ¿Qué porcentaje no ha tenido ninguna actualización de datos en más de 12 meses? Aplica tus tasas de deterioro conocidas para estimar la exposición a precisión. Si el 40% de tus contactos activos no han sido enriquecidos en 18 meses, y el cargo profesional se deteriora al 65.8% por año, puedes estimar que aproximadamente el 50%+ de esa cohorte tiene un cargo inexacto.
Paso 4: Verifica la precisión por muestreo
Extrae una muestra aleatoria de 50 contactos de tu base de datos activa. Verifica manualmente cada registro contra LinkedIn y el sitio web de la empresa. ¿Cuántos cargos son precisos? ¿Cuántas empresas siguen existiendo como se describe? ¿Cuántos correos son entregables (puedes probar una muestra con la verificación de email de Hunter.io)? Esta verificación por muestreo te da un intervalo de confianza para las estimaciones de vigencia del Paso 3.
Paso 5: Calcula una puntuación compuesta
Pondera tus dimensiones según su importancia para tus estrategias de ingresos específicas. Un marco de partida aproximado:
- Completitud (campos críticos): 30%
- Vigencia: 25%
- Precisión (estimada del muestreo): 20%
- Validez: 10%
- Unicidad: 10%
- Cobertura de enriquecimiento: 5%
Puntúa cada dimensión en una escala de 0-100 basándote en tus mediciones. Multiplica por las ponderaciones. Esta es tu puntuación compuesta de calidad de datos en HubSpot.
La mayoría de los equipos que realizan este ejercicio por primera vez descubren que su puntuación compuesta está entre 45 y 65. Una puntuación por debajo de 60 indica que la calidad de datos es una limitación material en el rendimiento de ingresos. Una puntuación por encima de 80 indica una operación de datos de alto rendimiento.
Establecer umbrales de calidad con significado real
Los umbrales solo importan si están vinculados a acciones de negocio. "Queremos un 80% de completitud de campos" es un objetivo, no un umbral. Un umbral especifica el estándar mínimo requerido antes de que pueda ocurrir una acción de negocio.
Estándar de preparación para campañas: Antes de que un contacto sea elegible para un envío de campaña, ¿qué campos deben estar completados? Un estándar razonable para la mayoría de las campañas de email B2B:
- Dirección de correo electrónico: presente y válida (sin rebote duro)
- Nombre de empresa: presente
- Al menos uno de: cargo profesional, industria o nivel de antigüedad
Este umbral previene el peor escenario — campañas personalizadas enviadas a registros sin campos fiables para personalizar.
Estándar de preparación para secuencias: Antes de que un contacto sea elegible para una secuencia de ventas, ¿qué campos deben estar completados? Un estándar razonable para secuencias outbound con personalización:
- Dirección de correo electrónico: presente y válida
- Cargo profesional: presente y con menos de 12 meses desde la última verificación
- Nombre de empresa: presente
- Industria: presente (para variantes de mensajería específicas por industria)
Estándar de preparación para enrutamiento: Antes de que un contacto sea asignado a un representante de ventas o territorio específico, ¿qué campos firmográficos deben estar completados?
- Número de empleados de la empresa: presente (para enrutamiento basado en niveles)
- País/región: presente (para enrutamiento territorial)
- Industria: presente (para enrutamiento basado en segmentos)
Estándar de elegibilidad para puntuación: Antes de que la puntuación de un lead se use para activar acciones de pipeline, ¿qué criterios de completitud y vigencia deben cumplirse? Este es el umbral más importante para organizaciones con activadores automáticos de MQL, porque un contacto que puntúa por encima del umbral MQL basándose en datos obsoletos puede crear un falso MQL que desperdicia capacidad de ventas.
El principio clave: los umbrales deben prevenir falsos positivos (registros deficientes que pasan los controles de calidad y crean trabajo para equipos posteriores) en lugar de simplemente establecer objetivos aspiracionales.
Incorporar controles de calidad en los workflows de HubSpot
Una vez que has definido tus umbrales, puedes codificarlos como condiciones de workflow que actúan como controles de calidad.
El patrón básico de control
Crea un Workflow de HubSpot activado por el cambio de etapa del ciclo de vida que precede a la acción que deseas controlar (por ejemplo, activado cuando "Etapa del ciclo de vida se establece como Lead Cualificado de Marketing"):
- Verificar condición de inscripción: ¿Se conoce [campo crítico]? ¿No ha rebotado [correo]? ¿La [fecha de enriquecimiento] es de menos de 365 días?
- Si SÍ: Proceder con la acción posterior (inscripción en campaña, enrutamiento a ventas, inscripción en secuencia)
- Si NO: Derivar a una ruta de remediación — activar enriquecimiento, establecer una marca de "Retención por Calidad de Datos", agregar a una lista de revisión para limpieza manual, o suprimir de la acción posterior
Remediación activada por enriquecimiento
Construye un workflow que se active automáticamente cuando un registro no pasa un control de calidad:
- El registro no pasa la verificación de preparación para campañas (falta cargo o correo rebotado)
- El workflow activa enriquecimiento mediante webhook a tu proveedor de enriquecimiento
- Se vuelve a verificar el control de calidad después del intento de enriquecimiento
- Si el enriquecimiento resuelve la brecha, se inscribe en la campaña original
- Si el enriquecimiento no lo resuelve, se marca para revisión manual
Este patrón convierte las verificaciones de calidad de datos de pasivas a activas — en lugar de simplemente suprimir registros deficientes, el workflow intenta activamente repararlos antes de la supresión.
Propiedad de puntuación de calidad
Crea una propiedad personalizada en HubSpot llamada "Puntuación de Calidad de Datos" (numérica, 0-100) y complétala mediante una propiedad calculada o un workflow periódico. Usa esta puntuación como criterio de inscripción para campañas de alto valor. Los contactos deben tener una puntuación de calidad por encima de tu umbral para ser elegibles.
Re-enriquecimiento basado en deterioro
Crea un workflow activado cuando "Fecha de último enriquecimiento es mayor a 365 días" para contactos activos. Esto dispara un re-enriquecimiento automático, asegurando que los contactos utilizados activamente en tu operación de ingresos no envejezcan hacia la inexactitud sin intervención.
Convertir la calidad de datos en un hábito de equipo (no un simulacro de incendio trimestral)
El problema estructural de la calidad de datos es que beneficia a todo el equipo pero el costo de mantenerla recae en unas pocas personas (el administrador de HubSpot, el analista de RevOps). Si la calidad de datos es una preocupación exclusiva de RevOps, siempre estará sub-financiada en relación con la demanda.
Convertir la calidad de datos en un hábito de equipo requiere hacer visibles sus costos y beneficios tanto para las personas que crean los datos como para las que los limpian.
Haz visible la calidad de datos en dashboards compartidos. Agrega un widget de "Salud de la Base de Datos" al dashboard de RevOps que muestre los porcentajes actuales de completitud de campos en campos críticos, la tendencia de la tasa de duplicados y los contactos actualmente en retención por calidad. Cuando ventas y marketing pueden ver los números de calidad de datos como parte de su cadencia operativa regular, desarrollan un interés en el resultado.
Atribuye ingresos a la calidad de datos. Cuando un negocio se cierra y el registro del contacto fue enriquecido, marca eso en el registro del negocio. Cuando una campaña rinde por encima de lo esperado, verifica si el segmento tenía puntuaciones de calidad de datos superiores al promedio. Construir una correlación entre calidad de datos y resultados de ingresos hace que el caso de negocio sea concreto y repetible.
Da a los representantes de ventas la propiedad sobre la precisión de los registros. Crea una tarea de ventas o un paso de secuencia en HubSpot que se active después de la primera llamada: "Actualizar cargo del contacto, confirmar número de teléfono directo, verificar tamaño de la empresa." Haz que la actualización precisa de registros sea una parte estándar del flujo de trabajo posterior a la llamada, no una tarea administrativa opcional.
Establece un rol formal de administrador de datos. En organizaciones con más de 50 usuarios, un administrador formal de datos — alguien que sea propietario de la calidad de datos como una responsabilidad definida, no un proyecto secundario — marca una diferencia medible. No necesita ser un rol a tiempo completo; el 20% del tiempo de un administrador senior de HubSpot, con un mandato definido y métricas, es suficiente para la mayoría de las bases de datos de menos de 100,000 contactos.
Revisa la calidad de datos mensualmente, no trimestralmente. Las revisiones mensuales detectan la acumulación tempranamente. Las revisiones trimestrales a menudo detectan problemas después de que ya han afectado un ciclo importante de campañas. Coloca la salud de la base de datos en la agenda de la revisión mensual de RevOps junto con la cobertura de pipeline y el rendimiento de campañas.
De calidad de datos reactiva a proactiva
La diferencia entre operaciones de calidad de datos reactivas y proactivas es simple: los equipos reactivos limpian datos después de que las campañas fracasan; los equipos proactivos aplican controles de calidad que previenen que los datos deficientes lleguen a las campañas en primer lugar.
El marco de este artículo te proporciona los componentes fundamentales para un sistema proactivo de calidad de datos:
- Siete dimensiones para medir, cada una con ejemplos específicos de HubSpot
- Un enfoque de auditoría manual que produce una puntuación compuesta en un día de trabajo
- Umbrales de calidad vinculados a acciones de negocio específicas, no a objetivos aspiracionales
- Patrones de workflow que aplican esos umbrales automáticamente
- Hábitos de equipo que distribuyen el costo del mantenimiento de datos
El estado completamente proactivo — donde las verificaciones de calidad se ejecutan automáticamente, los workflows de remediación operan sin intervención humana, y ventas y marketing siempre trabajan con registros preparados para campañas — requiere herramientas más allá de lo que los workflows nativos de HubSpot pueden soportar fácilmente. Pero la base estructural: definir dimensiones, establecer umbrales e incorporar controles en tu lógica de workflows — es alcanzable hoy con lo que ya tienes.
Lo que estamos construyendo
En MarketingSoda, estamos construyendo MarketingSoda Refine™ — una plataforma de calidad de datos nativa de HubSpot que automatiza este marco. Las siete dimensiones descritas en este artículo están codificadas como nuestro motor de puntuación de calidad por registro — cada registro de contacto y empresa recibe una calificación de A a F en las siete dimensiones, calculada continuamente y expuesta como propiedades de HubSpot que puedes usar en workflows, segmentos e informes.
Los controles de calidad, activadores de enriquecimiento y workflows de remediación descritos anteriormente son la capa operativa que estamos construyendo sobre esa puntuación: cuando la puntuación de calidad de un registro cae por debajo de un umbral, el enriquecimiento se activa automáticamente. Cuando un segmento de campaña tiene contactos por debajo del grado requerido, se retienen hasta que se complete la remediación.
Estamos en fase de pre-lanzamiento y construyendo nuestra lista de espera. Si este marco corresponde a los problemas de calidad de datos que estás intentando resolver, nos gustaría contar contigo en el acceso anticipado. Únete a la lista de espera de MarketingSoda Refine
Ve la puntuación de salud de tu base de datos.
Conecta HubSpot. Obtén una calificación A–F en cinco dimensiones en minutos. Gratis.
Iniciar Auditoría Gratis



