Diferencia entre revisiones de «Trabajo:Third-Party Cookies»

De FdIwiki ELP
Saltar a: navegación, buscar
Línea 70: Línea 70:
  
 
Después de darle forma con Gephi hemos exportado los datos creando un [https://cookieselp.000webhostapp.com mapa interactivo] y guardándolo en un servidor. Puedes entrar a él y ver las third-parties que acceden a los nodos de nuestra investigación.
 
Después de darle forma con Gephi hemos exportado los datos creando un [https://cookieselp.000webhostapp.com mapa interactivo] y guardándolo en un servidor. Puedes entrar a él y ver las third-parties que acceden a los nodos de nuestra investigación.
 +
 +
[[Archivo:Mapa interactivo.png|650px|Ejemplo de Lightbeam.]]
  
 
== Puntos del vídeo ==
 
== Puntos del vídeo ==

Revisión de 11:01 22 ene 2018

Cookies.jpg

Introducción

Estudio sobre el fenómeno de monitorización de páginas web y third-party cookies. Es un proyecto que compartimos para la asignatura de Análisis de Redes Sociales, donde vamos a profundizar en el análisis de los grafos que se pueden crear con las páginas web de origen y de terceros, y las cookies que éstos crean. Para este análisis nos basamos en los datos obtenidos con una extensión de firefox llamada Lightbeam, que registra las páginas visitadas, creando después un grafo interactivo. Estos datos se pueden exportar, y es lo que utilizaremos como base para el proyecto.

La idea principal es visitar páginas webs que puedan interesar a distintos perfiles de usuario, analizar cuantas third-parties tienen acceso a ellas sin que el usuario lo sepa y que hacen esas third-parties, para así lograr unos resultados que nos permitan mostrar al público cómo funciona ese sistema y concienciar al respecto.

El resultado final será un análisis sobre estas páginas, un grafo interactivo disponible online para que los usuarios lo usen de ejemplo y un vídeo explicativo para concienciar al respecto, puesto que nos parece la mejor forma de llegar a más gente.

Páginas para el análisis

  1. Estudiantes
    1. Wikipedia
    2. Google Drive
    3. Github
  1. Universidades
    1. UCM
    2. URJC
    3. Comillas (por poner una privada)
  1. Redes Sociales
    1. Facebook
    2. Instagram
    3. Twitter
  1. Entretenimiento
    1. Youtube
    2. Minijuegos
    3. Seriesblanco
  1. Páginas polémicas
    1. thePirateBay
    2. Pornhub
    3. Forocoches

Teoría

Para entender bien el análisis que vamos a hacer hay que entender algunos conceptos:

  1. Cookies: Son un documento de un tamaño máximo de 4KB que se guarda en el navegador, en este documento se almacenan datos sobre el usuarios, generalmente preferencias de uso de la página que se este visitando, pero también pueden guardar datos personales si los desarrolladores así lo quieren, puesto que estos datos pueden venderse a otras empresas siempre y cuando el usuario haya aceptado los términos de uso. Estos datos personales pueden contener tu ubicación, idioma de la página preferido, gustos (Categorías que utilizas), tiempo y hora de navegación, productos en el carrito de la compra, clicks que has hecho, links que has visitado y muchos más.
  2. Third Party: El término third-party puede aplicarse a muchos contextos, nosotros nos referimos a páginas web que tienen acceso a las webs que vamos a utilizar en nuestro análisis. Este acceso a los datos de las webs principales (Nodos desde ahora) puede deberse a tres razones:
    1. Son apis propias que utilizan los desarrolladores de un nodo para enviar y recibir información de su servidor.
    2. Son servicios de terceros que usan los desarrolladores de los nodos.
    3. Son webs de terceros que ponen anuncios en los nodos y almacenan sus propias cookies.

El último de estos casos es el que más nos importa. ya que podemos aceptar que una página use cookies confiando en esa página únicamente, sin saber que otras webs tienen acceso a esas cookies.

Práctica

La extensión de Firefox "Lightbeam" muestra un grafo interactivo compuesto por círculos representando los nodos visitados, y con triángulos las third-parties que obtienen información a través de ellos. Además podemos saber si una third-almacena cookies o no.

Ejemplo de Lightbeam.


El programa acabará generando una red muy grande, con su correspondiente archivo .json del cual sacaremos los datos que nos interesan.

Red monitorizada de uno de nuestros integrantes.


Una vez tengamos los datos, tendremos que formatearlos para que Gephi, una herramienta libre para visualizar datos, pueda entenderlos. El archivo json y el código que utilizamos en este proyecto puede encontrarse aquí.

La forma que hemos utilizado para representar los datos es la siguiente:

  1. Los nodos son de un color diferente dependiendo de la cantidad de aristas que tengan.
  2. Las aristas pueden ser verdes sí la página de destino no guarda cookies y rojas si sí las guarda.

Después de darle forma con Gephi hemos exportado los datos creando un mapa interactivo y guardándolo en un servidor. Puedes entrar a él y ver las third-parties que acceden a los nodos de nuestra investigación.

Ejemplo de Lightbeam.

Puntos del vídeo

  1. Introducción
  2. Qué son las third-parties
    1. Qué son las cookies
    2. Qué hacer al respecto


Artículos relacionados

  1. https://www.opentracker.net/article/third-party-cookies-vs-first-party-cookies
  2. https://www.ida.cl/blog/ida/diferencias-first-third-party-cookies/
  3. http://whatis.techtarget.com/definition/third-party-cookie
  4. http://www.ravelrumba.com/blog/third-party-cookies/
  5. http://www.bobulous.org.uk/misc/third-party-cookies.html
  6. http://jesusredondo.es/%C2%BFque-son-las-cookies-de-terceros
  7. https://noctuido.wordpress.com/2010/08/03/no-permitir-las-cookies-de-terceros-en-los-navegadores/
  8. https://www.neurodigital.es/definicion-y-funcion-de-las-cookies/

Vídeo final

Vídeo: Third-Party Cookies

Creado con: Powtoon

Concienciar a los usuarios

El objetivo del vídeo es hacer a la gente saber hasta que punto tienen acceso a su información las empresas y que valor y uso puede tener para ellas. Mucha gente parece estar de acuerdo con que las aplicaciones que utiliza o páginas web que visita tengan acceso a sus datos y esto se debe principalmente a que en general no saben que tipo de información están permitiendo a las empresas obtener ni que cantidad de estas tienen acceso a esos datos.

Participantes

  • Pablo Verdugo Garrido
  • Raúl Gil Fernández
  • Blanca de la Torre Fuertes
  • Guillermo Monserrate Sánchez