Trabajo:Open Data para startups

De FdIwiki ELP
Saltar a: navegación, buscar

Planteamiento del trabajo

La Administración Pública pone a disposición de la sociedad información relacionada con la actividad pública. A través de Open data permite el acceso individual a esta información para satisfacer las necesidades particulares de los ciudadanos y también permite la descarga de colecciones de datos (datasets) para que puedan ser sometidos a un tratamiento informático.

Esto permite desarrollar nuevas oportunidades de negocio para empresas que pueden aprovechar esta información para ofrecer mejores productos o crear nuevas empresas (start-ups) que identifiquen una necesidad de mercado que pueda atenderse con esta información. El objetivo de este trabajo es difundir estas posibilidades.

Open data: Conceptos previos

Según Wikipedia, open data es una filosofía y práctica que persigue que determinados datos estén disponibles de forma libre para todo el mundo.

Consiste en que quién gestione información para realizar una actividad la ofrezca de forma libre a terceros interesados. El productor de esta información puede ser un particular, un empresario, una Universidad o una Administración Pública. El productor puede establecer restricciones al uso de la información estableciendo cláusulas como por ejemplo la obligación de citar el origen de la misma.

La información cedida puede tener como objetivo satisfacer una necesidad particular como sería el caso de la realización de un trabajo fin de grado de la Universidad, un uso comercial o conseguir una mayor transparencia del funcionamiento de la entidad productora de los datos para mejorar su nivel de confianza (un ejemplo podría ser dar a conocer los índices de defectos de los productos vendidos por la empresa que cedería estos datos).

Fue precisamente en el mundo académico dónde surgió esta filosofía. Los investigadores consideraron que la divulgación de sus trabajos podía producir un efecto inducido beneficioso ya podría abrir nuevas vías de investigación.

Otro ejemplo muy ilustrativo de los resultados positivos de Open Data fue la cesión de la compañía GeoEye de sus fotos cartográficas obtenidas vía satélite para coordinar los trabajos de ayuda que se llevaron a cabo en Haití tras el terremoto de Haití en 2010 (300.000 fallecidos).

caption

Las Administraciones Públicas hacen un uso intensivo de la información. La necesita para tomar decisiones, tiene que motivar sus decisiones….

Hay tres motivos que las obligan a aplicar Open Data:

  1. Se mejora la calidad de vida de los ciudadanos
  2. Aumenta la transparencia: El ciudadano se identifica mejor con la Administración y se previene la corrupción.
  3. Se genera riqueza en la medida en que esta información sirve para realizar alguna actividad económica

Este sería el caso de upmystreet en Reino Unido, es una compañía privada que utiliza:

  • GoogleMaps como base cartográfica
  • Lista de colegios incluyendo las notas medias por asignatura (open data Ministerio de Educación)
  • Índices de criminalidad (open data Ministerio de Interior)
  • Índices de polución (open data Ministerio de Medio Ambiente)

El destinatario de la información de la Administración puede ser una empresa o un ciudadano individual. También podría serlo una Asociación sin ánimo de lucro.

Aparece un nuevo tipo de actividad económica que tiene por objetivo reutilizar la información proporcionada por otros agentes económicos. Se le denomina sector infomediario (“intermediario de información). Esta actividad consiste en obtener información por ejemplo del Sector Público, para realizar una elaboración de la misma y aplicarla a la obtención de un producto o un nuevo servicio.

La información se puede ofrecer en modo servicio Web (Web service, o Rest), en cuyo caso el productor de la información atiende las peticiones de información de forma individual. Este tipo de funcionamiento es muy útil en el ámbito de aplicaciones constituidas por micro-servicios especialmente en las apps de dispositivos móviles.

También se puede ofrecer en modalidad fichero. Estos conjuntos de datos reciben el nombre de data-sets. En este caso hay dos sub-modalidades. Datos en bruto (Raw Data) sin haber realizado ningún proceso de elaboración y Datos refinados (Cooked Data).

Para que la información suministrada sea útil debe cumplir los siguientes requisitos de calidad:

  • Veracidad: Los datos han de ser correctos
  • Actualidad
  • Completitud
  • Adecuación al contexto: Los datos son representaciones de hechos dentro de un contexto determinado. La valoración de un inmueble puede ser distinta si está destinada a la liquidación de un tributo (valor catastral) o si ha de servir de base para una hipoteca.

Además la información deber ser proporcionada en el formato más adecuado a cada caso. El formato seleccionado debería ser abierto y estándar para que cualquier usuario pueda acceder a su contenido sin necesidad de adquirir software o licencias.

El formato debería ser, además, estructurado o semiestructurado (XML) para posibilitar su tratamiento y elaboración por un programa.

La Directiva Inspire tiene como objetivo la creación de una infraestructura de datos espaciales a nivel europeo. La ley del Suelo (Real Decreto Legislativo 2/2008, de 20 de junio, por el que se aprueba el texto refundido de la Ley de suelo) se hizo eco de este mandato pero no estableció condiciones de formato, por lo que muchos Ayuntamientos se limitaron a publicar los planos en formato pdf.

Un buen ejemplo es Aragon Open Data que ofrece información para satisfacer las necesidades del ciudadano. También ofrece información para los infomediarios ofreciendo APIS o consultas via SPARQL. Los contenidos del portal están sujetos a licencia Creative Commons Reconocimiento 4.0 (BY). Dispone de 2.661 datasets y el servicio más demandado es el de descarga cartográfica por municipios. Otro ejemplo que será descrito más adelante es datos gob Se trata de cátalogos que:

  • Muestran un catálogo de la información disponible
  • Dan acceso a las colecciones de datos (datasets)
  • Ofrecen los metadatos asociados a cada dataset (por ejemplo esquemas XML)

Open data del Sector Público: Marco Legal

La Directiva 2003/98/CE estableció un marco legal de referencia para toda la Unión Europea en materia de reutilización de la información del Sector Público. Para que la directiva sea aplicable en un Estado miembro es necesario que cada Estado apruebe una Ley. Esto sucedió con la Ley 37/2007 de 16 de noviembre de reutilización de información del sector público. Esta Ley fue objeto a su vez de desarrollo por el Real Decreto 1495/2011.

Los mandatos más importantes que establecen estas normas son:

  • Toda la información del sector público pasa a ser reutilizable salvo que una ley disponga lo contrario (datos de carácter personal por ejemplo)
  • Se establece un catálogo oficial de información pública reutilizable en el portal datos.gob.es
  • Se regulan diversas modalidades de reutilización de la información proporcionada
    • Sin condiciones específicas. Se ceden todos los derechos necesarios para desarrollar cualquier actividad de forma gratuita y no exclusiva. Sólo se puede requerir tener que citar la fuente de la información. Se trata de licencias-tipo “libres” La información elaborada a partir de la información cedida está sometida a las mismas restricciones que la información original.
      • Citar la fuente de los datos
      • No desnaturalizar el sentido de la información
      • Mantener la fecha de la última actualización
      • Conservar sin alteración los metadatos
      • No involucrar a la Administración productora de los datos en la actividad derivada de la reutilización de los datos
    • Licencias con condiciones específicas establecidas por el productor de la información. La licencia deberá incorporar entre otra, información de si se autoriza su uso comercial.
    • Licencias concedidas a petición. Se aplica a aquella información no disponible a priori ya sea porque no se encuentre en formato digital o porque los datos estén incluidos en una base de datos junto con otra información y sea necesario desarrollar un programa específico para su extracción. En estos casos se autoriza el cobro de un precio que no puede superar el coste de los trabajos necesarios para su obtención.


caption

Datos gob(España)

Datos Gob es el catálogo de open data de referencia a nivel estatal.

Es el punto de entrada para conocer el inventario sobre los conjuntos de datos disponibles. Federa contenidos: Enlaza con otros portales de la Administración Pública que reflejan inventarios de data-sets a nivel autonómico o municipal. Para cada data-set se muestra la siguiente información:

  • Nombre del data-set
  • Descripción del mismo
  • Condiciones de reutilización
  • Fecha de última actualización
  • Frecuencia de actualización
  • Cobertura territorial
  • Formatos y servicios a través de los cuales es accesible la información

Entre los formatos posibles se halla RDF (Resource Description Framework). Se basa en tripletas que permiten representar sujeto-objeto-predicado(propiedad) Este formato permite hacer consultas directas mediante el lenguaje SPARQL lo que permite obtener directamente la información necesaria.

Empresas infomediarias: Oportunidad de negocio

Las empresas infomediarias son empresas que basan su modelo de negocio en la reutilización de la información del Sector Público. Algunos ejemplos reales de aplicaciones desarrolladas por empresas privadas basadas en open data en España son:

  • Betterplace: Es una plataforma on-line que proporciona información geolocalizada para ayudar a las empresas a tomar mejores decisiones. Entre sus prestaciones se encuentra la posibilidad de analizar información cercana a los puntos de venta. Permite encontrar la mejor localización de los puntos de venta, identificar zonas similares a los mejores puntos de venta de un negocio, establecer patrones de consumo. Utiliza la información geoespacial propocionada por la Dirección General de Catastro.
  • Osiris: Es una aplicación móvil que tiene por objetivo ayudar en la gestión del agua empleada para el riego de explotaciones agrarias. En función de la localización, el tipo de cultivo, el sistema de riego y la época de siembra, la herramienta ayuda a calcular la cantidad y la frecuencia de riego. La información que utiliza es la proporcionada por la Junta de Castilla y León que recopila cada hora información de las estaciones meteorológicas de la región para tener datos actualizados de precipitaciones y condiciones agroclimáticas.

Hay tres formas de encontrar una oportunidad de negocio basada en Open Data:

  • Partir de la necesidad y averiguar si existen data-sets disponibles
  • Explorar los data-sets disponibles y descubrir necesidades
  • Importar experiencias de otros países

Beagle Score es un ejemplo localizado al teclear en Google “Open Data success stories” El servicio que ofrece es el siguiente: Si alguien quiere abrir un nuevo negocio en una dirección determinada en Colorado (EEUU) obtiene la siguiente información a través de una app:

  • Infraestructuras disponibles
  • Vecindario: población, pirámide de edad, estadísticas del nivel de ingresos…
  • Tributación local
  • Ordenanzas locales
  • Competencia: Otros establecimientos próximos que realizan la misma actividad económica

Conclusiones

Actualmente existe mucha información disponible a través de Open data y se está utilizando muy poca. (Información de Tráfico, listados de colegios, localización de establecimientos públicos de cualquier tipo, localización de establecimientos privados sometidos a autorización administrativa (farmacias, gasolineras), sentencias judiciales, niveles de contaminación, información metereólogica, legislación de todo tipo… Además, si se detectara algún vacío informativo la normativa vigente obliga a la Administración Pública a proporcionarla. Existen por tanto grandes posibilidades para desarrollar oportunidades de negocio basadas en esta información soportadas en desarrollos informáticos.

Referencias