el grande (Datos) Sesgo de género

.
Al corriente mayo 4, 2021 .
6 lectura mínima.


D
desarrolloimplementadores sona nosotrosing grandes datos" desde teléfonos celularesy remesas para seguir el flujo de refugiados y migrantes.A través de estodatos, ellos Puede modelar el alcance y la escala de un “problema” y proporcionar información en tiempo real que permite a los equipos de diseño de programas adaptar las intervenciones.. Incluso puede proporcionar ladetalles esoson necesario para la toma de decisiones de desarrollo basada en evidencia. 

 todo esto es bueno; sin embargo, debemos recuerda quetales datos suele sergeneradode un subconjunto de la población. Por ejemplo, wLos presagios no están igualmente representados en estas muestras de datos. porque es mucho menos probable que lleven teléfonos móviles, serconectado aLa Interneto activoen redes sociales.Por lo tanto, tEl uso de estos datos excluye automáticamente a proporciones significativas de la población. no solo mujeres, pero los ancianos, los pobres, ciertos grupos étnicos – la lista continúa. En esta etapa de la transformación digital global, big data sufre de representaciónnorte o sesgo de muestra y debe usarse con extrema precaución para informar la toma de decisiones de desarrollo. 

 Grandes datos- particularmentedatos pasivos como metadatos de redes sociales y teléfonos móviles o registros de detalles de llamadas–es oninguna de las entradas principales del modelo o datos de entrenamiento paraInteligencia artificial(AI) y aprendizaje automático (ml).  

Afortunadamente, USAID ha iniciado una muy necesariadiscusión sobre prejuicios de género en IA y su efecto en las iniciativas de desarrollo. Identificar las formas insidiosas en que el sesgo de género se infiltra en el ciclo de vida de la IA y corregir este sesgo es crucial para garantizar que la programación futura promueva el desarrollo inclusivo.. Este blog se centra en conseguirIA derecho de datos subyacente. 

GéneroBestá enDesarrollo Data 

 Los actores del desarrollo también son productores de conjuntos de datos a través de los esfuerzos de recopilación de datos de los proyectos.USAID ahora exige que todos los datos del proyecto se ingresen en su Biblioteca de datos de desarrollo en formatos “legibles por máquina”. Unopuede asumir lógicamente que esto los datos pueden ser utilizados en IA/ml aplicaciones. Esto sería bueno si los datos que se incluyen en las aplicaciones de IA estuvieran libres de sesgos.. Sin embargo, Los datos sobre desarrollo han estado plagados durante demasiado tiempo de sesgos de género. 

 tl uso de muestras donde los hombres están representados de manera desproporcionada es tan frecuente en nuestro proyectoconjuntos de datos de nivel que muchos de nosotros ni siquiera notamos. Hay razones prácticas por las que esto sucede. 

 Primero, es más fácil llegar a los hombres. En muchosdesarrollopaíses, Las mujeres están menos presentes en los espacios públicos, ya sea como resultado de supobreza de tiempo" (es mucho más probable que estén en casa, realizar tareas domésticas, cuidando a los niños, los enfermos y los ancianos) o debido a las normas de género. Segundo, las mujeres tienden a estar más protegidas. Las normas sociales a menudo restringen a los hombresinteracción femenina y hacer que las familias duden en dar la bienvenida a los entrevistadores al hogar. Estas normas también hacen que sea más probable que un hombre esté presente si se lleva a cabo una entrevista., yEs mucho más probable que las mujeres sean menos comunicativas en las discusiones en las que hay hombres presentes.En entornos de grupos más grandes, mujerson más propensos aser deferente a los hombres. 

 Si los datos se recopilan a través de medios tradicionales o basándose en fuentes de big data, El sesgo a favor de los hombres en los datos de muestreo suele ser leve.pie indiscutible. Justificamos el uso de estos datos diciéndonos a nosotros mismosesoesto es lo mejor que podemos conseguir. De este modo, Brindamos espacio para que el sesgo de género afecte la forma en que interpretamos los datos.BLos datos combinados conducen a una programación que satisface las necesidades de unos pocos. (generalmente hombres)=y refuerzay se propagadesigualdades de género existentes, todomientrasdaring la ilusión de avanzar desarrollo objetivos. 

Abordar el sesgo de género en el uso de Big Data 

 Cierre La brecha digital puede algún día hacer que los big data sean menos vulnerables al sesgo interpretativo.. Mientras tanto, esNuestra responsabilidad es reconocer primero las limitaciones del uso de big data para capturar la realidad sobre el terreno., así como que refleja el comportamiento de las mujeres y otras personas que tienen menos probabilidades de llevar teléfonos móviles oa nosotrosing La Internet. 

 Entonces debemos evitar tomar decisiones de programación basadas únicamente en datos que sabemos que están sesgados a favor de un subgrupo de la población.. Estas no son grandes soluciones tecnológicas, pero si se implementa exitosamente, Minimizarían la posibilidad de que el sesgo de género se introduzca en la forma en que utilizamos los macrodatos y conducirían a decisiones de programación más inclusivas.. 

 Corrección dela sobrerrepresentación de los hombres enLos conjuntos de datos deben realizarse como una cuestión de datos.calidad y mejores practicas, justo como sería si hubiera otro tipo de distorsiones en los datos.tlos datoscolocar necesita ser revisado para garantizar quees representativo -en queéltienenumero iguals de machos y hembrasIsi está sesgado a favor de los hombres, entonces el proyecto debe recopilar más datos de las mujeres paracorrecto por la subrepresentación de las mujeres.  

Tomar medidas positivas 

thoy, nosotrostener cada vez más granularcomprensión del alcance de la brecha digital y del acceso digital. Podríamos aplicar esta información para desarrollarIndicadores estadísticos que permitan a los recopiladores o editores de datos ajustarse al sesgo de muestreo. en países específicos. 

 Si nada más, deberíamosrequerirque todos los conjuntos de datos carry etiquetas de advertenciaesoIndique claramente qué proporción de hombres y mujeres están representados en la muestra.. La advertencia advertiría a quienes utilizan los datos sobreeslimitacionesy hacer más difícil para los profesionales del desarrollo"inconscientemente"tomar datos de un subconjunto de la población y extrapolar los hallazgos a toda la comunidad. 

En escenarios donde los publicadores de datos y los usuarios se conocen entre sí, Hay otra forma sencilla de exponer el sesgo.: Garantizar que todas las partes (quienes recopilan datos y quienes los utilizan) desarrollen una comprensión compartida de los datos., sus limitaciones y qué conclusiones se pueden sacar de ello. 

 En mi experiencia como Asesora de Género e Inclusión, este ejercicio tiene varios beneficios, el el más importante de los cuales es interrumpirnegocio como siempre" y la tendencia a confiar en datos sesgados. Esto crea un espacio para que los equipos de proyecto reconozcan la necesidad de desarrollar una programación que responda a las necesidades e intereses de aquellas comunidades que se vuelven invisibles cuando se utilizan dichos datos.. Sin tal proceso, Los equipos de proyecto a menudo no reconocen la necesidad de considerar a las mujeres o el género en absoluto, especialmente sino considérelo un proyecto de “género”. 

También recomendamoselproducción colaborativa de un compendio sobre el sesgo de género en la IA para el desarrollo aexponer dónde y cómo el prejuicio de género manifiesta y discos el potencial negativoresultadosen programación de desarrollosectores. Este doun ser útil para incitar discusión yaumentarconciencia deSesgo de género en los datos para la toma de decisiones en materia de desarrollo.  

nosotros notenertodas las respuestas, pero sí sabemos que cuanto másnosotrosdeshacery analyzedfuentes de datos aDakota del Norte entradas en el modelo AI/MLsincorporar procesos que nos obliguen aExplorar colectivamente cómo los interpretamos y utilizamos. con cuidado para informar nuestra toma de decisionescuanto másequitativonuestrolos resultados serán.

Rebeca Sewall es el asesor principal, Género e inclusiónMiembros de la Laboratorio de desarrollo creativo, promueve y canaliza nuevas estrategias para abordar los desafíos del desarrollo a través de la ciencia, tecnología y medioscontribuido a este blog.