Sobre mi vocación (ciencia de datos)

Cuando era niño todos los Viernes salían en el periódico las principales estadísticas de los jugadores de béisbol de la Liga Mexicana del Pacífico (LMP), me apasionaba sacar conclusiones y hacer rankings de jugadores en base a estos datos. También recuerdo como en la preparatoria hice una regresión lineal (o algo parecido) para escoger entre estudiar economía o ingeniería industrial (que terminé escogiendo erróneamente ingeniería industrial siendo que mi modelo me había dicho que estudiara economía, al final terminé estudiando ingeniería financiera), siempre me ha gustado modelar mi entorno, para bien o para mal es algo presente en todos los aspectos de mi personalidad.

Recuerdo mi primera clase de machine learning, en esta vimos la teoría detrás cómo crear árboles de decisión y al final de la clase implementamos este algoritmo en lenguaje R, el ejemplo que usamos fue modelar el salario de un beisbolista en base a sus estadísticas (home runs, hits, errores, etc.) y visualizamos el árbol resultante en el proyector. En ese de momento algo hizo click en mi memoria y descubrí mi verdadera vocación.

Imagen de la clase:

Notas:

  • Claro está que no todo el mundo tiene porque tener una vocación profesional.
  • Fuente de la imagen: James, G. (2014). An Introduction to Statistical Learning: With Applications in R (1a ed, pp. 310). Nueva York, EUA: Springer.
  • Hoy en día trabajo en el equipo de analytics con el profesor de esa materia
  • Para poder reproducir el árbol el lenguaje R:
    library(ISLR) # Instalar estos paquetes
    library(tree)
    datos <- Hitters
    tree.datos <- tree(Salary~.,datos)
    plot(tree.datos)
    text(tree.datos ,pretty =0)