Cómo puedes aprender ciencia de datos por tu cuenta
Cómo puedes aprender ciencia de datos por tu cuenta
La ciencia de datos y el Machine Learning (Aprendizaje automático) es algo que se puede aprender, si bien existe como materia en determinadas carreras universitarias y encontramos multitud de cursos a nuestro alcance, también podemos aprenderlo de manera autodidacta. A su vez podemos complementar la educación “formal” con estas técnicas para aprender ciencia de datos por nuestra cuenta más rápido:
¿Cómo puedo aprender ciencia de datos por mi cuenta?
Conocer la figura del científico de datos es el primer paso para saber cómo aprender esta materia por nuestra cuenta.
Un científico de datos es el profesional que se sirve de grandes volúmenes de información para resolver problemas de negocio, mediante respuestas objetivas basadas en datos reales.
Para ejercer su trabajo el científico de datos debe tener una cierta formación en informática, comandos y programación, a su vez debe poseer conocimientos mínimos en matemáticas y estadística, además de conocer lo básico sobre negocios, pues es su área de actuación.
Aprender ciencia de datos por tu cuenta paso a paso
Una vez que conocemos las competencias de un científico de datos no podemos pasar por alto que el primer paso para convertirnos en uno es dominar estos puntos:
1. El primer paso es aprender a programar, Python es uno de los idiomas de programación más utilizados en ciencia de datos, aunque por supuesto, hay más. También es muy útil aprender a utilizar la terminal de comandos.
2. Seguidamente aprender lo básico de estadística y SQL (Structured Query Language)
3. Por último es buena idea conocer algoritmos de aprendizaje automático y comenzar a programarlos mediante datos de uso público.
¿Qué hago si no sé programar?
Lo ideal es empezar aprendiendo lo básico sobre “Python” y “R”, ambos son idiomas de programación muy utilizados en Big Data, encontrarás multitud de recursos para aprender a dominarlos de forma online y totalmente gratuita. La mayoría de estos recursos se encuentran en inglés.
Python es muy utilizado por perfiles propios de las ingenierías, mientras que “R” es un lenguaje más propio de matemáticos y estadísticos.
Y ¿Si ya sé programar?
Si ya sabes programar ¡Enhorabuena! Tienes medio camino hecho, pero aún no has acabado:
Algoritmos
Cuando ya has adquirido conocimientos básicos de programación y SQL puedes comenzar a programar tus primeros algoritmos de Machine Learning o Aprendizaje Automático. Antes de empezar conviene saber también los conceptos básicos que rodean al Aprendizaje automático y de nuevo encontramos muchos libros que nos sirven de guía, si bien debemos tener en cuenta que gran parte de estos libros también se encuentran en inglés.
¿Cómo sigo aprendiendo?
Con todos estos elementos ya deberías ser capaz de programar tus primeros algoritmos básicos. A partir de aquí todo es cuestión de que tú te animes con libros y cursos más avanzados.
Si quieres una recomendación para empezar, te aconsejo visitar la web de competiciones de ciencia de datos Kaggle.com, donde podrás aprender directamente de otros científicos de datos. Incluye una sección aprendizaje, competiciones y “kernels” (Códigos subidos directamente por otros usuarios.).