¿Qué hace a un buen científico de datos?

¿Qué hace a un buen científico de datos?

Wikimedia

'¿Qué hace a un buen científico de datos? ¿Cómo vencen los mejores científicos de datos a otros generalistas (como los son lo actuarios de propiedad y casualidad, analistas de negocios) en análisis predictivo?' apareció originalmente en Quora, un lugar para adquirir y compartir conocimiento y entender mejor el mundo.

Respuesta de Carlos Martín, Data Scientist:

Hay que aclarar en primer lugar que el límite es difuso.

En la práctica, un científico de datos conjunta:

  • Conocimiento estadístico y analítico (como un investigador de mercado o alguien de ciencias puras: matemáticas, física...)
  • Conocimiento de negocio (como un analista de negocio)
  • Conocimiento técnico (como un informático)
  • Adaptabilidad (lo que llaman hacking skills)

En la práctica. Supongamos un test A/B tan comúnmente hecho en análisis digital.

Un test A/B se basa en que teniendo dos hipótesis (A y B), las ponemos en la práctica en un subconjunto de gente, y la hipótesis ganadora se generalizará a todo el conjunto. Es un caso muy clásico el mail centralizado enviado, con un botón tipo "call to action".

La idea sería enviar el mismo correo a todo el mundo excepto con un pequeño cambio:

  • Al grupo A le enviamos un mail que diga en el botón "RESERVA AHORA"
  • Al grupo B le enviamos un mail que diga en el botón "RESERVA AQUÍ".

El botón que reciba un mayor número de clicks será el que se generalice para todo el conjunto de clientes que tengamos en la lista de correo.

Tendríamos los siguientes resultados:

  • En el grupo A, de 1000 envíos, han pulsado 100 personas
  • En el grupo B, de 1050 envíos, han pulsado 86 personas

Típicamente un analista digital, te calculará el CTR (click-through-rate, porcentaje de mails clicados):

  • CTR_A = 10.0%
  • CTR_B = 8.1%

Y te dirá: El caso A es mejor que el caso B. Así que enviaremos los mails que digan RESERVA AHORA.

¿Qué haría un Data Scientist? Calcular con matemática bayesiana la probabilidad de falsear la hipótesis nula. Yo para facilitarme las cosas, utilizo una herramienta online (para que veáis que tampoco hace falta programar en R para hacer las cosas bien)

Esta preguntaapareció originalmente en Quora, un lugar para adquirir y compartir conocimiento, capacitando a la gente a aprender unos de otros y comprender mejor el mundo. Puedes seguir a Quora en Twitter y Facebook. Más preguntas: