Rol del bibliotecario de datos
Hay nuevo rol en el negocio del dato. Antes o después le pondremos un nombre, quizás permanezca el de bibliotecario de datos o se acuñe uno nuevo, el tiempo lo dirá.
Del metadato al bibliotecario de datos
Algunas de las consultas más frecuentes que recibimos los que nos dedicamos a las fábricas de datos están referidas a cómo encontrar datos espaciales. ¿Dónde hay datos sobre éste o aquel tema? ¿Cómo son? ¿En que formato están? ¿Cómo se han elaborado? ¿Qué error tienen? ¿Están actualizados? ¿Son adecuados para ésto que quiero hacer? ¿Qué tipo de licencia tienen?
La insistencia de tales cuestiones hace meditar que algo está pasando con los metadatos. He de confesar que pensé que estábamos ante un fenómeno transitorio. Los metadatos deberían de ser capaces de solventar estas cuestiones. La consulta a los catálogos debería solucionar estas dudas y despejar cualquier incertidumbre sobre el uso de los datos espaciales. El marco de los metadatos y su tecnología son sólidos..
Invisibilidad de los datos
A pesar de los catálogos, Internet y el algoritmo de Google las preguntas que nos formulan los usuarios nos muestran que en la prática cotidiana el descubrimiento localización exploración y explotación de la información siguen siendo en la actualidad siendo un trabajo arduo que consume tiempo y provoca cierta frustración en el usuario.
Las causas son variadas, lancemos algunas hipótesis, como siempre sin ánimo de ser exhaustivos:
Desconocimiento de los usuarios de los catálogo de datos y cómo utilizarlos.
Falta de información al usuario sobre cuáles son los organismos ,entidades universidades, asociaciones etc.. productoras de datos, y qué conjunto de datos producen.
Datos grises y oscuros invisibles al usuario, algunos no digitalizados todavía o se encuntran en formatos poco o nada interoperables. Todavia hay mucho ETL pendiente de ejecutar.
Rellenamos los metadatos pensando en la máquina, en el catálogo , en pasar el validador del xml, y no en el usuario.
Hay información que no incluimos en los catálogos. Especialmente la que procede de la experiencia de creación y uso de los datos. Antes era habitual encontrar libros detallados, si, libros, que describían los datos cómo se habían obtenidos, las pruebas de validación, sus errores, y ejemplos prácticos de uso e interpretación. La estructura de metadatos permite enlazar archivo con esta información pero es una práctica muy poco habitual.
Falta de de dialogo de los productores de datos con los usuarios. En las páginas de compra más usadas en Internet existe un diálogo y opinión de los usuarios , su valoración y respuestas que dan otros usuarios o los propios creadores y distribuidores del producto. No es frecuente encontrarse reproducido este marco con los datos.
En muchos foros existen hilos, histórico de preguntas y respuestas que facilitan las búsquedas a la comunidad de cuestiones y soluciones ya formuladas.
La automatización de decisiones y procesos es una tarea incipiente que dificulta que la búsqueda y sistematización y actualización y en definitiva la interoperabilidad se beneficie de economías de escala.
Tipos de usuarios o públicos muy heterogéneo. Tanto en sus necesidades de datos como en el conocmiento previos sobre ellos.
No tienen el mismo fin los datos internos de las organizaciones, los datos externos, o los datos públicos por poner algunos ejemplos. Pero todos ellos sí que pueden beneficiarse de un tratamiento común a los retos que acabamos de enumerar. El motivo es que siempre hay nuevos usuarios o nuevas necesidades en los usuarios ya existentes. Muchas de las plataformas de gobernanza de datos comienzan a incluir algunas de las funciones e ideas que he enumerado.
Recursos para el bibliotecario de datos
Para salir del atolladero las organizaciones o los usuarios, impulsados por datos, disponen de varias vías. Las cuales podemos inferir gracias las pistas que nos proporcionan la geografía informal, la geocomunicación y la ciencia de los datos, entre otros ámbitos.
- La geografía informal, la web 2.0. y la industria de venta al detalle nos estan proporcionado claves sobre cómo dialogar alrededor de los datos y cómo conocer las necesidades de los usuarios.
- La geocomunicación nos muestra que es necesario realizar tareas de divulgación y difusión de los datos. Un marketing del dato si queremos que éste sea visible y usado. Este esfuerzo debe ir parejo al posicionamiento de marca de datos. Marca que debe ser extendida más allá del concepto de organización y descender cuando sea necesario al nivel de conjunto de datos.
- La ciencia de los datos está apostando, al igual que las administraciones y la industria, por la reutilización de la información bajo los programas de datos, ciencia y gobierno abiertos. Para lograr la reutilización la comunicación sobre los datos está avanzando utilizando múltiples canales on line y offline (multimodal) en su meta de difusión. Algunos ejemplos podemos encontrarlos en las conferencias de usuarios, las publicaciones destinadas a presentar conjunto de datos, o los planes de gestión de datos de H2020.
Nuevas funciones de los bibliotecarios de geodatos
Las funciones del bibliotecario de datos van mucho más allá de la simple catalogación y evaluación de conjuntos de datos. Su trabajo se hace visible al usuario y al público y nos muestra todo su valor, cuando está orientado a la curación… Share on X@orbemapa
En cualquier caso, parece claro que el efecto horizonte que provoca el mar de datos en el que estamos inmersos no se puede solucionar sólo con los metadatos, hay un nuevo rol en la gobernanza de datos: el bibliotecario de datos. Sin embargo los recursos destinados la gestión de datos son limitados y la tarea no está suficientemente reconocida aún en las fábricas y factorías de datos.
Las nuevas funciones que demandamos al rol de bibliotecarios de información geográfica redefinen la imagen que tenemos de esta tarea y le añaden funciones muy cercanas a áreas de la industria clásica y aparentemente tan dispares como las de jefe de compra, o el product manager. Algunas ideas obtenedidas de mi experiencia cotidiana.
- Su papel no es saber lo que hay, y asesorar la elección consultando catálogos, va más allá al estimar lo que puede haber y el valor que puede generar en el negocio.
- El rol de bibliotecario de datos no debe ceñirse sólo a los datos científicos. Su papel es clave en la reutiilización de la información y en la puesta en valor de los esfuerzos de producción.
- No puede ceñirse exclusivamente a datos digitales, debe inlcuir los analógicos y los que puede sobtener sobre el terreno
- Incluir en su acervo no sólo el concocimiento de datos primarios sino tambien de datos secundarios obtenidos de geoprocesos.
- Dominar el campo de aplicaición, capacidad y limitaciones de los geoprocesos y modelos para obtener variables que serán usadas en otros modelos, CRM, DSS, BI
- Debe enriquecer muchas de las características que incluimos de forma sucinta en los metadatos. Un ejemplo en este sentido es el linaje. Conocer el orden cronológico y las causas y efectos históricos de cómo se han cartografiado determinadas ámbito y variables. Existe una rica tradciión geográfcai que es necesario maejar, pongamos como ejemplo la cartografía de la vegtación o la cartografía urbana.
- La estadistica es una herramienta imprescindible en las tareas de recomendación no solo en términos de evaluación de la caldidad de los datos sino tamabién sobre su incertidumbre, y riesgo para asesorar sobre la cantidad de datos necesarios y su holgura.
- Otro conjunto de herramientas necesaria es la economía, el valor del datos y la información. No se trata sólo de estimar sus costes de adquisición y ETL sino también sobre sus beneficios.
- Su trabajo no es solitario ni aislado de la organización,al revés, esta totalmente involucrado en un dialogo permanente , activo con los administradores de datos (Data stewardship), los controller, o los usuarios, ente otros.
- Debe conocoer en profundidad la comunidad de usuarios, la organziicón y el ámbito temático.
Muchas de estas competencias se pueden aprender y otras se adquieren con la práctica y la experiencia, pero este rápido repaso nos muestran algunas pistas y claves que nos muestran algunas de las funciones que estamos demandando de ellos hoy en día.
Todas esta habilidades se resumen en un objetivo: La curación, selección y recomendación de datos espaciales.
Curación de datos
En el marco actual de la geo-comunicación la tarea de curación de contenidos no es un objetivo sencillo. Si queremos lograrlo con éxito hay que conocer en profundidad los datos. La mejor forma de entenderlos y recomendarlos es usarlos y entablar un dialogo con usuarios y productores en su medio: Internet.