• Esther Riveroll

Dirty Data, Un Desafío Invisible


A estas alturas ya no es sorprendente que se hable de los datos como uno de los activos más valiosos para las empresas. También sabemos que la información por sí sola no es de utilidad si no se analiza dentro de un contexto y con un fin específico. Sin embargo, existe un riesgo invisible que podría afectar la analítica de datos de cada compañía: el Dirty Data.

Imagina que en un banco existan tres bases de datos, cada una con más de dos mil filas y más de 300 columnas con información detallada de sus clientes. Ahora imagina que en cada base hay un dato incorrecto por cada cliente, ya sea porque hubo un error al introducir la información, porque esta no se ha actualizado (por ejemplo, el correo electrónico, número celular o un cambio de domicilio), o porque han proporcionado datos incorrectos de forma intencionada.


Estos errores en la información son mejor conocidos como “datos sucios” o Dirty Data y existen en las bases de datos de cualquier empresa, y por cada dato erróneo que se integra, más se modifican de manera incorrecta las estrategias de atracción de clientes, las ideas para la generación de nuevos productos o servicios provocan la previsión de ventas inexactas; en fin, todo tipo de planificación cambia, llevando a las compañías a reducir su capacidad de captación de ingresos.


Por lo tanto, uno de los mayores retos de los negocios en la actualidad es conseguir que la información de sus bases no contenga “datos sucios” y tratar de resarcir estos efectos “limpiando” dichas bases.


De acuerdo con la empresa Hocelot, entre los datos más falsificados por los clientes se encuentran los aspectos personales (edad, nivel educativo, etc.), información económica (gastos, ahorros), el domicilio (si el lugar es rentado o propio, precio estimado del inmueble), y el salario percibido, mientras que entre los sectores más perjudicados se encuentran la banca, seguros, telecomunicaciones, finanzas y retail.


Por si fuera poco, es difícil saber cuándo un negocio tiene algún error en sus datos, ya que un reporte de eMarketer afirma que sólo 57% de los negocios en Latinoamérica se entera de este problema hasta que lo reporta algún cliente, proveedor o prospecto.

Lo que sí es posible es conocer algunas estrategias para mejorar la calidad de los datos de las empresas, entre los que destacan los siguientes:

Evita pedir datos innecesarios: Recuerda que hay información que los usuarios tratan de ocultar, la mayoría lo hace por privacidad, así que evita obstáculos adicionales para mantener “limpia” tu base de datos y analiza cual es la información que necesitas y que es importante solicitar. De esta manera, sabrás que información considerar en una estrategia de limpieza de datos y cuales no son indispensables, pero sería bueno tenerlos.

Crea una estrategia de limpieza proactiva: Establece actividades de limpieza de datos e implementa reglas en los campos de captura para que no se pueda ingresar información incorrecta, además de que los campos contengan autoayuda para las personas que vacíen la información y la mayoría de los datos capturados cumplan con lo requerido.

Descarta datos duplicados: En ocasiones, cuando se juntan datos que provienen de distintas fuentes, se da por hecho que la información es diferente, sin embargo, es necesario comprobar que no esté repetida. Debes crear una estrategia de consolidación de información.

Revisa los datos ocasionalmente: Crea una cultura de monitoreo de la información. Existen plataformas de software que permiten enviar notificaciones cuando la calidad de los datos y los datos sucios bajan del nivel requerido. Esto apoya a prever acciones para mantener tus bases de datos con información limpia que den valor y contexto para tu negocio.

Existen plataformas de Calidad de Datos que apoyan en la estrategia para evitar los “dirty data”, además de tecnologías de Deep Learning, Machine Learning, Inteligencia Artificial (IA) o Smart Data, entre otras, para el análisis y uso de datos. De esta forma, las empresas tendrán bases más “limpias” que les permitirán tener verdaderas ventajas ante sus competidores y tomar decisiones correctas.

Y tú, ¿cómo “limpias” los datos de tu negocio?


Esther Riveroll, Fundadora y Directora General de Alldatum Business

6 vistas0 comentarios