Datos estructurados e interoperables de beneficiarios finales

Resumen

La utilidad y el valor de los datos de beneficiarios finales (BO) aumentan cuando los datos están disponibles en unformato estructurado. Los datos estructurados se refieren a la información que está altamente organizada según un modelo predefinido. Desde que las primeras jurisdicciones empezaron a recopilar y, en algunos casos, a publicar información de BO, algunas lo han hecho en forma de datos estructurados, mientras que otras lo han hecho en forma de datos no estructurados. Los datos no estructurados no siguen un modelo de datos predefinido: por ejemplo, si una persona informante es libre de describir la relación entre un beneficiario final y una persona jurídica con sus propias palabras. Si bien los datos estructurados pueden producirse en entornos no digitales, cuando los datos estructurados están disponibles de forma digital es más fácil que las máquinas los lean y procesen.

En la primera parte de este resumen de políticas se describen los beneficios principales de la recopilación, el almacenamiento y la publicación de datos estructurados de BO. Las jurisdicciones que han publicado datos estructurados y abiertos de beneficiarios finales han hecho posible una gama más amplia de análisis de datos por parte de usuarios adicionales. Esto ha facilitado el impacto temprano de las reformas de transparencia de beneficiarios finales (BOT). [1] Para maximizar el impacto de las reformas de BOT, un régimen de divulgación debe recopilar, almacenar y compartir la información de BO comodatos estructurados. Esto permitirá:

La estructuración de los datos crea información que es predecible. Como la estructura está predefinida, los usuarios saben qué esperar de los datos, lo que facilita el trabajo. Estos beneficios no solo se aplican a los usuarios técnicos. Los usuarios no técnicos pueden beneficiarse de los datos estructurados sin tener que utilizarlos directamente. Dado que se puede hacer que los datos estructurados estén disponibles en formatos que permiten su fácil procesamiento por parte de máquinas, computadoras, sitios web, aplicaciones y otras herramientas, por ejemplo, a través de una interfaz web, una interfaz de programación de aplicaciones (API) o en formato en bloque, pueden desarrollar separa que las personas puedan acceder, visualizar e interactuar con la información relevante de diversas manerasno técnicas. Los datos estructurados pueden integrarse en procesos dirigidos tanto por personas como por máquinas que son difíciles o imposibles de realizar con datos no estructurados. Por ejemplo, hacer que los datos estructurados de BO estén disponibles en formato en bloque permite a usuarios, como unidades de inteligencia financiera, organismos de contratación, bancos y periodistas, aplicar técnicas de ciencia de datos y aprendizaje automático para identificar patrones sospechosos de titularidad o beneficiarios finales que aparecen en otros conjuntos de datos de interés.

Al eliminar las fricciones asociadas a los datos no estructurados, los datos estructurados disminuyen el costo de la recopilación de datos por parte de los gobiernos y del cumplimiento de los requisitos de divulgación por parte de las personas jurídicas. También reduce los costos asociados al mantenimiento y a la publicación de los datos. Los datos estructurados reducen el costo y aumentan el impacto de la ejecución de los objetivos de las reformas de BOT al reducir los costos asociados con el uso y el análisis. Se espera que los costos iniciales más altos asociados a la creación de los sistemas necesarios se vean neutralizados por los costos más bajos asociados a la recopilación, el almacenamiento, la publicación, el uso y el mantenimiento a largo plazo.

El núcleo de los datos estructurados es la interoperabilidad, es decir, la posibilidad de utilizar los datos de manera sencilla con otras fuentes e integrarlos en diferentes sistemas y procesos. La naturaleza transnacional delas relaciones complejas de BO hace que la combinación de conjuntos de datos de BO de diferentes jurisdicciones sea esencial para obtener una visibilidad completa de las estructuras de titularidad. El cumplimiento de otros objetivos por los que los países buscan la BOT, como la mejora de los procesos de contratación y la aplicación de sanciones y normas de financiación de campañas, también requiere que la información se combine con otros conjuntos de datos. Cuando los datos de BOT están estructurados y son interoperables, también son más fáciles de verificar, ya quese puede utilizar una mayor gama de mecanismos de verificación, mejorando así la calidad de los datos.

Estos beneficios serían mayores tras la adopción generalizada de un estándar de datos como el Estándar de Datos sobre Beneficiarios Finales (BODS) de Open Ownership (OO). [A] El BODS es un marco para la publicación de datos estructurados sobre beneficiarios finales en un formato que los sistemas informáticos de todo el mundo pueden leer y comprender. Tanto gobiernos como el sector privado han adoptado el BODS, y se han desarrollado una serie de herramientas y aplicaciones en torno a él. [2]

La segunda parte de este resumen de políticas destaca loque los implementadores necesitan para aplicar los datos estructurados de BO. Para aplicar los datos estructurados de BO, los implementadores deben:

  • Crear un entorno propicio adoptando un enfoque centrado en el usuario e interactivo, y estableciendo y mejorando progresivamente el marco jurídico, normativo y político para alcanzar los objetivos técnicos relacionados con la BOT. Esto incluye garantizar una base legal y reglamentaria sólida en línea con los Principios de Open Ownership (Principios de OO) y proporcionar recursos suficientes. [B]

  • Establecer principios para la recopilación y el almacenamiento de información de BO garantizando que, como mínimo, los datos estructurados de BO:
    1. identifiquen a las personas, empresas y otras partes relevantes incluidas en una declaración de BO mediante el uso de identificadores únicos y campos descriptivos suficientes;
    2. describan toda la gama de relaciones que pueden existir entre las partes incluidas en una declaración de BO; y
  • garanticen que las divulgaciones de BO se puedan auditar.

    Los implementadores deben asegurarse de que el diseño de los sistemas y los procesos respalden los objetivos de las reformas a nivel técnico. En las primeras etapas de la implementación, se debe prestar atención a que el diseño de los sistemas técnicos y las bases de datos cumpla en su totalidad con la funcionalidad y la accesibilidad que se esperan en las fases de publicación e intercambio de datos. [C]
  • Lograr el potencial y resolver la incertidumbre en la etapa de publicación. Para lograr todo el potencial de los datos que se publican es necesario garantizar que los usuarios puedan auditarlos. Esto puede lograrse haciendo que los datos publicados estén disponibles de diversas maneras, tanto para los usuarios no técnicos como para los usuarios técnicos y los sistemas a escala, como por ejemplo:
    • búsqueda por registro a través de una interfaz web;
    • navegación por los registros a través de una interfaz web;
    • formato en bloque;
    • acceso vía API.

Los implementadores también deben elegir una licencia adecuada para los datos y proporcionar suficiente documentación que los acompañe enforma de política de publicación, que debe tener como objetivo resolver cualquier incertidumbre sobre los datos publicados.

Los datos estructurados son un principio básico de los Principios de OO, ya que garantizan que los datos se puedan combinar fácilmente con otros, y que resulten predecibles y confiables. [3] Los Principios de OO marcan el estándar para la divulgación eficaz de la información de BO y establecen enfoques para la publicación de datos útiles y de alta calidad. Los Principios de OO ayudan a garantizar que los datos publicados resulten utilizables, precisos e interoperables.

Figura 1. Ejemplo de un sistema de divulgación de beneficiarios finales que utiliza datos estructurados
Ejemplo de un sistema de divulgación de beneficiarios finales que utiliza datos estructurados

Los datos estructurados de BO mejoran su funcionalidad (página 7), reducen el costo en todas las etapas (página 9), y conducen a un mayor impacto (página 13). Para lograrlo, los implementadores deben crear un entorno propicio (página 17),y los datos deben estar estructurados de manera que identifiquen y describan los elementos clave sobre los beneficiarios finales (página 18). Los sistemas digitales y los procesos administrativos deben encajar sin problemas para permitir la recopilación, el almacenamiento, el mantenimiento, el intercambio y la publicación de la información de BO (página 22). Hay que eliminar las incertidumbres en la etapa de intercambio y publicación adhiriéndose a los estándares abiertos (página 22) y publicando una política de publicación clara, que incluya documentación e información sobre licencias (página 24). Puede hacerse que los datos sean auditables proporcionando múltiples maneras de acceder a ellos (página 24). Los estándares de datos como el BODS ofrecen un formato de datos estructurado, junto con una guía para la recopilación, intercambio y uso de los datos de BO (página 23).

Cuadro 1: Conceptos y definiciones clave

Para entender cómo los datos estructurados e interoperables de BO pueden contribuir a alcanzar los objetivos buscados y las políticas necesarias para facilitar la recopilación, el almacenamiento y el intercambio de datos estructurados de BO, es necesario explicar una serie de conceptos clave. Aunque algunos de estos conceptos se aplican de forma más general, el enfoque principal se encuentra en el contexto de la información de BO.

Los datos se utilizan para almacenar y comunicar información mediante máquinas y personas. Son una unidad de información. Los datos, por sí solos, no tienen un significado inherente, sino que lo adquieren cuando se utilizan o se ven en un contexto determinado.

Los datos estructurados son datos altamente organizados según un modelo predefinido. [D] Tienen suficiente contenido, organización y contexto para que puedan ser interpretados por máquinas y para que transmitan información significativa sobre beneficiarios finales (consulte la Tabla 1). Los datos estructurados pueden crearse en entornos no digitales, pero este resumen se refiere a los datos digitales.

Los datos legibles por medios informáticos son datos en un formato que puede procesarse fácilmente por una máquina o una computadora. Los datos legibles por medios informáticos deben ser datos digitales estructurados.

Los datos son interoperables cuando pueden utilizarse fácilmente con otras fuentes de datos e integrarse en diferentes sistemas y procesos. Los datos interoperables de BO, por ejemplo, pueden utilizar un método ampliamente acordado para describir los números de registro de las empresas, lo que permite unir conjuntos de datos de múltiples jurisdicciones. [4] Los datos interoperables de BO también pueden unirse a conjuntos de datos que no sean de BO, como los datos de contratación.

Un estándar de datos proporciona un conjunto documentado de reglas y acuerdos sobre cómo se estructuran, publican y contextualizan los datos. También pueden abarcar el formato, la definición, la transmisión, la manipulación, el uso y la gestión de los datos. Los estándares proporcionan un lenguaje común para producir y entender los datos, independientemente de su origen, e incorporan un alto grado de interoperabilidad en su diseño. Los datos estructurados que no se adhieren al mismo estándar de datos pueden ser, aunque no necesariamente, interoperables, pero requerirían un paso adicional de traducción para unir los datos. El BODS, del que hablaremos más adelante, es un estándar de datos que establece reglas para los datos de BO de alta calidad. [5]

Tabla 1. Datos de beneficiarios finales no estructurados (izquierda) frente a datos estructurados (derecha)

Unstructured Structured
Nature of ownership or control Nature of ownership or control
This beneficial owner indirectly herself, or through her children, owns 27% of the declaring legal entity’s shares through the following shareholders of the legal entity (1) “Angerujjheit B.V.”, registration number in the Netherlands 64739564, registered office: Byterslaan 105, NL-4722GF Amsterdam, Netherlands; (2) “RigaTech Systems Ltd.”, registration number in the United Kingdom: 396654, registered office: P.O. Box 124, Company Services Ltd. Main Road, London, United Kingdom. % Aggregate share ownership 27
% Aggregate control via voting shares 27
Direct share ownership in declaring entity 0
Direct voting control over declaring entity 0
1.1 Intermediate legal owner(s)
Legal owner 1
Name Angerujjheit B.V.
Registration authority Commercial register of the Netherlands
Registration number 64739564
Legal owner 2
Name RigaTech Systems Ltd.
Registration authority Companies House, UK
Registration number 396654

En el lado izquierdo de este ejemplo hipotético, los datos no están estructurados, ya que toda la información relativa a beneficiarios finales y su relación con una empresa se encuentra en un único campo de texto. En el lado derecho, los datos están estructurados, ya que la información está separada en diferentes campos de forma estandarizada.

Notas al pie

[A] Para obtener más información, consulte: “Beneficial Ownership Data Standard (v0.3)”, Open Ownership, n.d., https://standard.openownership.org.

[B] Para obtener más información, consulte: “Open Ownership Principles”, Open Ownership, actualizado en julio de 2021, https://www.openownership.org/en/principles.

[C] Para obtener más información sobre el diseño de bases de datos, consulte: “Relational database design considerations for beneficial ownership information”, Extractive Industries Transparency Initiative y Open Ownership, 16 de diciembre de 2021, https://www.openownership.org/en/publications/relational-database-design-considerations-for-beneficial-ownership-information

[D] Formalmente, los datos "estructurados" y "semiestructurados" son categorías diferentes. Sin embargo, a efectos de la BOT, basta con señalar que la misma información se almacenará a menudo en forma estructurada (en una base de datos relacional) y se publicará en forma semiestructurada (como JavaScript Object Notation [JSON] o XML). Tanto los datos estructurados como los semiestructurados se incluyen en la definición utilizada en este resumen, siempre que se transmita suficiente información a través de la estructura y el contexto.

Notas finales

[1] Para ver ejemplos, consulte: “Case studies”, Open Ownership, n.d., https://www.openownership.org/en/publication-categories/case-studies.

[2] Consulte: “Beneficial Ownership Data Standard”, OpenOwnership, n.d., https://www.openownership.org/en/topics/beneficial-ownership-data-standard.

[3] “Open Ownership Principles – Structured data”, Open Ownership, actualizado en julio de 2021, https://www.openownership.org/en/principles/structured-data.

[4] Los Principios FAIR ofrecen un marco para la gestión y administración de los datos que pueden ser procesados por máquinas. Consulte: “FAIRPrinciples”, GO FAIR, n.d., https://www.go-fair.org/fair-principles.

[5] “Beneficial Ownership Data Standard (v0.3)”, Open Ownership.

Next page: Beneficios de los datos estructurados e interoperables