
Leo en dmreview un interesente artículo denominado "Data quality, structured and unstructured data". A pesar de la importancia creciente de la gestión de datos dentro de las organizaciones lo cierto es que no se está realizando convenientemente por la empresas.
Y es fundamental tener en cuenta la importancia de los datos no estructurados en una organización. Según estudios realizados por la industria BI se indica que hasta el 85 por cierto de los datos de una compañía residen en áreas clasificadas como no estructuradas (emails, videos, fotos, blogs, mesajería instantánea, wikis...). Y mientras todas estas herramientas y recursos incrementan la comunicación también representan información perdida ya que no se organiza convenientemente de forma que ayude a la toma de decisiones. Por otro lado nos encontramos con la CALIDAD DE DATOS, reconocida como uno de los procesos más importantes en el área de gestión de datos. Sin un marco de trabajo de gestión global de la calidad de datos es casi imposible alcanzar el objetivo de la INTELIGENCIA DE DATOS. Constituye por tanto un reto para las organizaciones gestionar conmenientemente la CALIDAD DE DATOS por un lado y los DATOS NO ESTRUCTURADOS por otro, gestión de datos global en definitiva. Y es aquí donde se cuestiona la capacidad del software comercial para llevar a cabo esta labor frente la OPEN SOURCE. La carencia de la flexibilidad de las soluciones comerciales hacen que el análisis de datos no estructurados en el proceso de análisis de datos estructurados sea una tarea casi imposible lo que lleva a las organizaciones a obviar esta tipología de datos en aras de los datos estructurados para la toma de decisiones. Por no mencionar el elevado coste de las licencias que las hace únicamente asequibles a las grandes corporaciones. Las soluciones de datos basadas en open source pueden hacer del análisis de datos no estructurados y datos estructurados parte de una jerarquía global de la gestión de datos creando una solución que es global, precisa y focalizada en el proceso de gestión de datos a largo plazo.
Y es fundamental tener en cuenta la importancia de los datos no estructurados en una organización. Según estudios realizados por la industria BI se indica que hasta el 85 por cierto de los datos de una compañía residen en áreas clasificadas como no estructuradas (emails, videos, fotos, blogs, mesajería instantánea, wikis...). Y mientras todas estas herramientas y recursos incrementan la comunicación también representan información perdida ya que no se organiza convenientemente de forma que ayude a la toma de decisiones. Por otro lado nos encontramos con la CALIDAD DE DATOS, reconocida como uno de los procesos más importantes en el área de gestión de datos. Sin un marco de trabajo de gestión global de la calidad de datos es casi imposible alcanzar el objetivo de la INTELIGENCIA DE DATOS. Constituye por tanto un reto para las organizaciones gestionar conmenientemente la CALIDAD DE DATOS por un lado y los DATOS NO ESTRUCTURADOS por otro, gestión de datos global en definitiva. Y es aquí donde se cuestiona la capacidad del software comercial para llevar a cabo esta labor frente la OPEN SOURCE. La carencia de la flexibilidad de las soluciones comerciales hacen que el análisis de datos no estructurados en el proceso de análisis de datos estructurados sea una tarea casi imposible lo que lleva a las organizaciones a obviar esta tipología de datos en aras de los datos estructurados para la toma de decisiones. Por no mencionar el elevado coste de las licencias que las hace únicamente asequibles a las grandes corporaciones. Las soluciones de datos basadas en open source pueden hacer del análisis de datos no estructurados y datos estructurados parte de una jerarquía global de la gestión de datos creando una solución que es global, precisa y focalizada en el proceso de gestión de datos a largo plazo.