Categories
54cuatro

Resolver sesgos cognitivos con Data Science

Fotos sesgo libres de regalías | Pxfuel

Que es un sesgo?

Un #sesgo es cualquier cosa que pueda distorsionar nuestra capacidad de sacar conclusiones de manera imparcial y objetiva. Muchos de estos sesgos pueden ser intencionales o accidentales, pero de la forma que sea, son enemigos de las buenas decisiones.

¿Como tomamos decisiones?

Tampoco quiere decir que debemos delegar el 100% de la toma de decisiones en algoritmos, sino que debemos complementar experiencia con datos estadísticos para crear decisiones mas precisas.

En términos generales “sesgo” se deriva de la antigua palabra griega que describe una línea oblicua (es decir, una desviación de la horizontal). Investigadores han descubierto más de 200 sesgos diferentes en las últimas siete décadas y han estudiado cómo estos sesgos impactan áreas como las finanzas, la gestión y el juicio clínico, pero vamos a hacer foco en estos 20 sesgos publicados por Samantha Lee y Drake Baer en Business Insider que afectan nuestras decisiones y comparando como ello puede afectar un análisis de negocios:

Sesgo PublicadoNuestra apreciación
1. Sesgo de anclaje. Las personas confían demasiado en la primera información que escuchan.Esto puede generar un resultado interesante en la exploración temprana e ignorar otros resultados posibles o, lo que es peor, ignorar información contradictoria.
2. Heurística de disponibilidad. La gente sobreestima la importancia de la información que está disponible para ellos.Se confía con demasiada frecuencia solo en datos recopilados previamente y no se realizan experimentos controlados aleatorios propios. Incluso sin experimentos se puede confiar en los datos disponibles y no buscar fuentes adicionales..
3. Efecto Bandwagon. La probabilidad de que una persona adopte una creencia aumenta en función del número de personas que tienen esa creencia.Esto suele afectar por ejemplo si alguien ha oído hablar de un fenómeno particular (por ejemplo, el tono incorrecto de azul que hace que las personas abandonen un sitio web) y tratar de reproducirlo para el cliente de inmediato.
4. Sesgo del punto ciego. No reconocer sus propios sesgos cognitivos es un prejuicio en sí mismo.Es necesario trabajar para desarrollar un número suficiente de hipótesis de calidad.
5. Sesgo de apoyo a la elección. Cuando eliges algo, tiendes a sentirte positivo al respecto, incluso si esa elección tiene defectos.Esto lleva a “casarse” con un resultado inicial, una visualización o una técnica de aprendizaje automático.
6. Agrupación de ilusión. Esta es la tendencia a ver patrones en eventos aleatorios.El mundo de la ciencia de datos está repleto de correlaciones espurias.
7. Sesgo de confirmación. Tendemos a escuchar solo la información que confirma nuestras ideas preconcebidas.No hay espacio para nociones preconcebidas en el mundo de la ciencia de datos.
8. Sesgo de conservadurismo. Cuando las personas favorecen la evidencia previa sobre la nueva evidencia o información que ha surgido.Los datos a veces pueden revelar tendencias emergentes, sobre los clientes y sus hábitos, que son tan inesperados y contrarios al comportamiento pasado que son difíciles de aceptar.
9. Sesgo de información. La tendencia a buscar información cuando no afecta la acción.Se debe gastar tiempo solo cuando existe la posibilidad de generar un resultado procesable, donde procesable no incluye barreras culturales o financieras insuperables para la implementación.
10. Efecto de avestruz. La decisión de ignorar información peligrosa o negativa al “enterrar” la cabeza en la arena, como un avestruz.Poner todos los datos a disposición en los análisis evita esta tendencia a esconder informacion.
11. Sesgo de resultado. Juzgar una decisión basada en el resultado, en lugar de cómo exactamente se tomó la decisión en el momento.Los equipos de análisis no trabajan como justificación de las decisiones, solamente buscan nuevos complementos.
12. Sobreconfianza. Algunos de nosotros confiamos demasiado en nuestras habilidades, y esto nos lleva a asumir mayores riesgos en nuestra vida cotidiana.Solemos asumir que entendemos todo acerca de un área de experiencia, o herramientas que manejamos, haciendo que cometamos errores y no aprovechemos el potencial.
13. Efecto Placebo. Cuando simplemente crees que algo tendrá cierto efecto en ti, hace que tenga ese efecto.Por ejemplo, en una comparación A/B, debemos asegurarnos de que los usuarios no sepan cuál es la versión “antigua” y cuál es la “nueva”, o incluso, si los usuarios de la prueba son internos, qué opción es la preferida por su jefe.
14. Prejuicio a favor de la innovación. Cuando un proponente de una innovación tiende a sobrevalorar su utilidad y menospreciar sus limitaciones.Se debe garantizar que se pueda establecer un beneficio cuantitativo para tomar esa acción.
15. Frescura. La tendencia a ponderar la información más reciente con mayor intensidad que los datos anteriores.Cuando ocurre una anomalía, es necesario evaluar la relevancia y las causas.
16. Rasgo sobresaliente. Nuestra tendencia a enfocarnos en las características más fácilmente reconocibles de una persona o concepto.Es necesario centrarse en los resultados que tienen el mayor impacto cuantificable, no en los que tienen una narrativa cautivadora.
17. Percepción selectiva. Permitir que nuestras expectativas influyan en cómo percibimos el mundo.Si se descubren fallas en algún lugar de un sistema u organización, se debe aplicar ese rigor de manera uniforme en todo el sistema u organización.
18. Estereotipos. Esperar que un grupo o persona tenga ciertas cualidades sin tener información real sobre la persona.Si se realiza la segmentación de clientes, los estereotipos pueden ayudar a formular hipótesis (por ejemplo, los hogares con niños pueden ser más propensos a comprar juguetes), pero estas hipótesis deben probarse (por ejemplo, los datos pueden mostrar que los abuelos también compran muchos juguetes).
19. Sesgo de supervivencia. Un error que proviene de centrarse solo en los ejemplos que sobreviven, lo que nos hace juzgar mal una situación.Un análisis de abandono de los datos actuales puede perder las razones por las cuales los clientes se quedaron fuera hace un año cuando se realizó un cambio importante en el sitio web.
20. Sesgo de riesgo cero. Los sociólogos han descubierto que amamos la certeza, incluso si es contraproducente.Gravitar hacia un resultado procesable de alto impacto y bajo impacto sobre un resultado procesable de alto impacto y medio nivel de confianza. En cambio, el científico de datos debe trabajar para aumentar la confianza de este último o para refinar sus límites.

¿Como corregir sesgos por medio de la ciencia de datos?

En #DataScience, el sesgo es una desviación de la expectativa en los datos. Más fundamentalmente, el sesgo se refiere a un error en los datos.

head, brain, thoughts, human body, face, psychology, concentration ...

Los #modelos #predictivos solo “ven” el mundo a través de los datos utilizados para el entrenamiento. De hecho, ellos no conocen ninguna otra realidad. Cuando esos datos están sesgados, la precisión y fidelidad del modelo se ven comprometidas. Los modelos sesgados pueden limitar su credibilidad con las partes interesadas. Conocer estos riesgos le permite a un Científico de Datos eliminar mejor el sesgo. 

Los modelos resultantes de mayor calidad mejoran la adopción de análisis y aumenta el valor de la inversión en análisis.


Contactate

    Por favor, demuestra que eres humano mediante la selección el avión.