Cómo prevenir el sesgo de IA: 5 consejos para científicos de datos

0
4
artificial_intelligence_facial_profile.jpg

La inteligencia artificial está cada vez más involucrada en procesos comerciales importantes, como la evaluación de la solvencia y la selección de currículos para determinar los candidatos ideales. Como resultado, es comprensible que la IA y sus resultados estén bajo el microscopio. La pregunta clave que preocupa a los implementadores: ¿Está sesgado el algoritmo de IA?

El sesgo puede infiltrarse de múltiples maneras, incluidas las prácticas de muestreo que ignoran grandes franjas de la población y el sesgo de confirmación, donde un científico de datos solo incluye los conjuntos de datos que se ajustan a su visión del mundo.

Aquí hay varias formas en que los científicos de datos están abordando el problema.

1. Comprenda el potencial del sesgo de la IA

El aprendizaje supervisado, uno de los subconjuntos de la IA, opera en la ingestión de datos de memoria. Al aprender bajo “supervisión”, un algoritmo entrenado toma decisiones sobre conjuntos de datos que nunca antes había visto. Siguiendo el principio de “basura que entra, basura que sale”, la calidad de la decisión de la IA solo puede ser tan buena como los datos que ingiere.

Los científicos de datos deben evaluar sus datos para garantizar que sean una representación imparcial del equivalente de la vida real. Para abordar el sesgo de confirmación, la diversidad de equipos de datos también es importante.

2. Aumentar la transparencia

AI sigue siendo desafiada por la inescrutabilidad de sus procesos. Los algoritmos de aprendizaje profundo, por ejemplo, utilizan redes neuronales modeladas a partir del cerebro humano para llegar a decisiones. Pero exactamente cómo llegan allí sigue sin estar claro.

“Parte del movimiento hacia la ‘IA explicable’ es arrojar luz sobre cómo se entrenan los datos y cómo se usan qué algoritmos”, dijo Jonathon Wright, evangelista jefe de tecnología en Keysight Technologies, una empresa de pruebas proveedor de tecnología.

Si bien hacer que la IA sea explicable no evitará por completo los sesgos, comprender la causa de un sesgo es un paso fundamental. La transparencia es especialmente importante cuando las empresas utilizan programas de inteligencia artificial de proveedores externos.

3. Normas del Instituto

Al implementar IA, las organizaciones deben seguir un marco que estandarice la producción y garantice modelos éticos, dijo Wright.

Wright señaló la Ley de Inteligencia Artificial de la Unión Europea como un cambio de juego en el esfuerzo por limpiar la tecnología sin prejuicios.

4. Modelos de prueba antes y después de la implementación

Probar modelos de inteligencia artificial y aprendizaje automático es una forma de evitar sesgos antes de lanzar los algoritmos a la naturaleza.

Las empresas de software, creadas específicamente para este propósito, se están volviendo más comunes. “Es hacia donde se dirige la industria en este momento”, dijo Wright.

5.Usar datos sintéticos

Desea conjuntos de datos que sean representativos de la población más grande, pero “el hecho de que tenga datos reales del mundo real no significa que sea imparcial”, señaló Wright.

De hecho, los sesgos de aprendizaje de la IA del mundo real son un riesgo. Para abordar este problema, los datos sintéticos podrían verse como una posible solución, dijo Harry Keen, director ejecutivo y cofundador de Hazy, una empresa emergente que crea datos sintéticos para instituciones financieras.

Los conjuntos de datos sintéticos son versiones estadísticamente representativas de conjuntos de datos reales y, a menudo, se implementan cuando los datos originales están sujetos a problemas de privacidad.

Keen enfatizó que el uso de datos sintéticos para abordar el sesgo es “un tema de investigación abierto” y que redondear los conjuntos de datos, por ejemplo, introducir más mujeres en los modelos que examinan los currículums, podría introducir un tipo diferente de sesgo.

Los datos sintéticos están experimentando la mayor tracción en la noche de los “datos estructurados de menor dimensión” como las imágenes, dijo Keen. Para datos más complejos, “puede ser un poco como un juego de Whack-a-Mole, donde puede resolver un sesgo pero introducir o amplificar algunos otros. … El sesgo en los datos es un problema un poco espinoso”.

Sin embargo, es un problema que debe resolverse, dado que la tecnología está creciendo a una tasa anual impresionante del 39,4 %, según un estudio de Zion Market Research.

Sobre el Autor

Poornima Apte es una ingeniera capacitada convertida en escritora que se especializa en los campos de robótica, IA, IoT, 5G, ciberseguridad y más. Ganador de un premio de reportaje de la Asociación de Periodistas del Sur de Asia, a Poornima le encanta aprender y escribir sobre nuevas tecnologías, y las personas detrás de ellas. Su lista de clientes incluye numerosos puntos de venta B2B y B2C, que encargan reportajes, perfiles, libros blancos, estudios de casos, infografías, guiones de video e informes de la industria. Poornima también es miembro titular de la tarjeta Cloud Appreciation Society.

LEAVE A REPLY

Please enter your comment!
Please enter your name here