Trabajo:Fairness en Machine Learning

De FdIwiki ELP
Saltar a: navegación, buscar

Este trabajo sobre equidad en aprendizaje automático ha sido desarrollado por alumnos de la asignatura de "Ética, Legislación y Profesión" de 4ºA del curso 2019/2020, asignatura impartida en la Universidad Complutense de Madrid (UCM).

Nuestro trabajo consistirá en comunicar sobre equidad (o fairness) en aprendizaje automático, no sólo centrándonos en el sesgo que se produce sino especialmente en los medios que existen para solucionarlo.

Introducción

La traducción más directa de fairness al español sería la de equidad; es decir, la cualidad de tratar a las personas de manera parecida o de forma que parezca justa o razonable. Ahora bien, tanto la justicia como la razonabilidad son conceptos subjetivos, por lo que el fairness también lo será (de hecho se podrá definir formalmente de varias maneras). Sin embargo, aunque el concepto sea subjetivo, en la práctica la sociedad actual tiende a violar constantemente este principio de equidad de formas que no parecen razonables. Por ejemplo, no parece justificable que la brecha salarial entre hombres y mujeres en España sea superior al 10%, o que una de cada cuatro personas que ocupa una celda en España sea inmigrante (cuando estos tan solo representan alrededor de un 10% de la población de nuestro país). Se puede deducir de estos datos (y de muchos otros casos que se dan) que la sociedad tiene sesgo. Por ejemplo, en la forma de dictaminar sentencias, otorgar puestos de trabajo, conceder una hipoteca o seguro, etc.

Hasta hace no muchos años los responsables de estas injusticias eran humanos. Sin embargo, con los algoritmos de aprendizaje automático se están empezando a automatizar estos procesos. Estos algoritmos, en esencia, reciben una gran cantidad de casos reales ya procesados e intentan obtener un patrón a partir de estos (se entrena al algoritmo). A continuación, el algoritmo procesa con el patrón obtenido otros casos reales de los que se conoce el resultado, pues han sido procesados ya sea por otro programa o por un humano. De esta forma un acierto representará un caso en el que el resultado real coincida con el que ha dado el algoritmo.

Como se puede observar, los algoritmos no dan un resultado correcto o incorrecto, sino un resultado que trata de emular los casos reales. De esta forma, si los datos de entrenamientos están sesgados, los algoritmos también lo serán.

Por este motivo, es de vital importancia que los datos que se le pasen a la máquina sean lo más representativos posible. Para lograr este objetivo serán tratados mediante los llamados algoritmos de fairness.

Motivación

Tras buscar en Internet hemos visto que hay un gran desconocimiento en este tema en esta facultad y, en general, en la población. Además consideramos que este tema es de especial interés para todos aquellos colectivos que son discriminados en la actualidad, pues sin estos algoritmos de fairness la desigualdad social incrementaría irremediablemente cuando el uso de los mismos se generalice aún más. Por ello vamos a hacer una campaña de información para comunicar las ideas de este campo desde un punto de vista divulgativo y uno más técnico.

Desarrollo del trabajo

Documento divulgativo

En paralelo, otra parte del grupo escribirá un documento más divulgativo para personas menos especializadas intentando llamar la atención al problema y concienciando sobre la importancia de este campo en crecimiento.

Video divulgativo

Tabmbién a modo divulgativo se creará un video en el que se explica brevemente como se producen los sesgos algorítmicos y las formas que hay de evitarlos.

Taller sobre IBM-AIF360 en la FDI

Por último se hará una presentación del tema en uno de los laboratorios de la facultad en la que explicaremos en qué consiste el problema a los asistentes y les enseñaremos la ejecución de algunos de los algoritmos de fairness existentes.

Aportación Wiki ELP

En primer lugar, tras buscar una página web que unificara los conceptos hemos visto que hay muchos libros y artículos sobre distintos campos pero ninguno que los recopilara al completo. Por ello, haremos una wiki donde vengan incluidos los contenidos más importantes y actuales (a modo de estado del arte) de Equidad (las diferentes definiciones, las métricas y las soluciones algorítmicas), de manera organizada y accesible para que se pueda usar como un sitio de consulta o para aprender del tema en general.

Aportaciones a Wikipedia

Adicionalmente se realizarán ediciones en algunas páginas relacionadas con el tema de wikipedia, ya sea porque están desactualizadas o porque les falta información. En algunas ocasiones lo único que haremos será traducir contenido de wikipedia de inglés al español o viceversa. De esta manera realizaremos una pequeña contribución al procomún.

Biblioteca de Zotero

Impacto social

Ambos archivos serán difundidos por distintos medios y esperamos que haya personas que se vean atraídos por el documento divulgativo y usen nuestra wiki como consulta. Para ello, haremos ambos tanto en inglés como en español.

Si el tiempo lo permite se planea hacer otras cosas como un vídeo divulgativo, una presentación en la facultad o cierta aportación en forma de código.

Documento divulgativo

Vídeo divulgativo

Aportaciones al procomún

Enlaces usados

Integrantes del grupo

Este trabajo ha sido realizado por el grupo 8, compuesto por:

  • Rafael Herrera Troca
  • Alejandro Jiménez Sánchez
  • José María López Morales
  • Pablo Martín Huertas
  • Guillermo Martín Sánchez
  • Rubén Ruperto Díaz