Professional Documents
Culture Documents
Son datos con acceso libre e irrestricto, sin procesar, estructurados en formato
estándar y reutilizables para crear servicios derivados, que están sólo en custodia de
las AAPP. ¿Cómo entendemos ‘lo abierto’? Desde tres caracteristicas:
1. ¿Quiénes pueden usar los datos abiertos? Participación [universal]: toda persona
debe poder usarlos, reusarlos y redistribuir para sí, desde sí o a través de una
entidad sin disciminar el campo de actividad
2. ¿Cómo llego a los datos abiertos? Disponibilidad y el acceso: disponibles en la
Red con detalle y descarga libre y directa (en diferentes formatos estándar: xls,
csv, json, etc.) y sin costo de acceso
3. ¿Qué hago con los datos abiertos? Uso, reutilización y redistribución: libertad de
ejercerlas y reintegrar con otros datasets
Nos interesamos por los gubernamentales (Open Government Data) pero debemos
abrir datos de empresas, sociedad civil organizada, sindicatos, universidades e
investigación.
Si cualquier dato producido por las AAPP es público, podrá ponerse a disposición
(volveremos más adelante sobre esto al ver ventajas, costos y riesgos)
O aquí O aquí
Restricciones legítimas aparecen al cuidar de otro derecho enfrente al derecho humano del acceso a la
información: la privacidad.
Reutilización de la Información
del Sector Público (RISP)
Así podemos:
Datos tabulares: CSV (TSV): Archivo de texto plano (no estandarizado ni estructurado,
por eso puede precisar de metadatos que expliquen contenido) para representar
información tabulada, separada con comas (=tabulación).
Texto: TXT. Sin estructura, es usado para metadatos | HTML. Lenguaje de marcado
para crear páginas web (para datos estables, porque es dificultoso de compartir).
También: ODF, para texto, hojas de cálculo y presentaciones.
Los datos públicos implican origen -el gobierno-, y refieren a datos pasibles de ser
compartidos por no poseer restricción legal (datos personales o razones de
defensa pública).
● Licencias libres: Los datos no deben estar condicionados por derecho, patente,
marca o regulación de secrecía. Sólo se permiten las restricciones del ítem
‘público’.
● Dirige la W3C (World Wide Web Consortium), una comunidad internacional para
desarrollar estándares (protocolos y directrices) para que la Red crezca a largo
plazo. Uno de ellos son las Buenas Prácticas de Datos Online
● Asegura licencia abierta (PDDL, ODC-by y CC0) pero los datos están encerrados
en un documento (como un PDF que presenta información imposible de extraer).
Cuando no es posible publicar datos estructurados, se apela a OpenDocument,
enlaces a otros sitios web, mapas interactivos, o incluso RSS.
RE (Readable) | OL
↑ Reutilización (formato estructurado)
↓ Disponibilidad (licencia propietaria)
MÁXIMA Disponibilidad
MÁXIMA Reutilización
● Open Data Monitor (UE): investiga y desarrolla metodologías para metadatos (la
manera de analizar y entender datos). Sopesa la preponderancia de licencias
abiertas, estructuración, disponibilidad y completitud de los DA.
● Global Open Data Index -GODI- es la referencia anual sobre datos abiertos
gubernamentales (según la Open Knowledge Network). Da especial peso a
presupuesto, estadísticas nacionales y leyes nacionales.
La Web Semántica está construida en RDF (estándar W3C que describe recursos web,
especifica metadatos y representa información). Pero Linked Data no implica libre
disponibilidad: una empresa puede publicar datos interoperados en RDF en una red
privada).
Por eso, hablemos de datos abiertos enlazados. Son datos abiertos en RDF, el usuario
puede enlazarlos desde diversas fuentes, instituciones u organizaciones, explorar y
combinarlos sin restricciones para nuevos desarrollos web: será información con
descripción de contenido, significado y relación de los datos.
OGD: grandes datasets del gobierno (clima, censos, salud pública) +información pública
del Estado (por ejemplo, presupuestos) +información proveniente de la participación
ciudadana (fuera de los datos abiertos, como una e-petición)
Open data: enormes datasets de investigación científica, redes sociales y OSC +los del
gobierno (clima, censos, salud pública) +información pública del Estado (por ejemplo,
presupuestos)
Por eso se debe promover la existencia de portales de datos y la visualización del acervo
informativo, junto con la activa vinculación con organizaciones que potencialmente se
interesan por ellos. Y, en la medida que avancemos a una sociedad abierta, esos mismos
consumidores deben ser también futuros infomediarios (esto se logra a partir de un
mecanismo conocido como transparencia focalizada (BID, 2012; Mariñez Navarro, 2015)
(Y un largo etcétera… los datos no hacen magia solos: se debe sostenerlos para que la hagan)
Esta especie puede ser desvirtuada con opacidades por vía de la calidad:
datos no pertinentes, formatos no estructurados, o software privativo.
A. Seleccionar datos
•Catalogación: Los catálogos son la herramienta para ofrecer los datos. Consisten en uno o
varios portales que facilitan el ordenamiento y acceso. Están formados por búsqueda,
metadatos, información sobre licencias y acceso a los conjuntos de datos. Los más conocidos
son CKAN, Jnar, DKAN, Sócrata...
Rojo, 192.234.235.245.678,
Datos Huevos, harina, leche…
v2.0