Sugeriría la Especialización en Ciencia de Datos por la Universidad Johns Hopkins de Coursera . Es una serie de cursos que incluyen conceptos básicos de R, obtención y preparación de datos para análisis, construcción de modelos, aprendizaje automático y cómo realizar análisis de forma reproducible. Podría ser un muy buen punto de partida, y cada curso te tomará 4 semanas para completar, con mucha práctica práctica. Aprendí muchas cosas útiles y las apliqué al trabajo para mejorar la eficiencia.
Python a menudo se usa también para el análisis de datos, aunque, en mi opinión, no es tan conveniente como R. Entonces, si ha decidido emprender el viaje para convertirse en un científico de datos, dominar las habilidades de R debería ser una prioridad. No solo es prestigioso dentro de las estadísticas, sino que también es bueno, ya que es de código abierto, y la gente sigue escribiendo paquetes útiles como ggplot2 y plyr . Sin embargo, cuando tenga tiempo, también se recomienda aprender Python, ya que es más un lenguaje de propósito general y puede hacer cosas que R no puede hacer, como el controlador web del paquete de selenio .
SQL es probablemente muy útil. Si desea lidiar con grandes datos, Excel no sería la forma ideal de almacenamiento de datos. La mayoría de las bases de datos (MySQL, Microsoft SQL Sever, Oracle Database, etc.) usan el mismo lenguaje, que es SQL.
- ¿Cuál es la mejor aplicación de escritura de guiones disponible?
- ¿Qué debo hacer para convertirme en ingeniero de software de Android?
- ¿Cuál es el mejor software virtual de DJ?
- ¿Cuáles son algunos proyectos de programación que has hecho para que te diviertas mientras practicas tus habilidades de codificación?
- ¿Cuál es la mejor plataforma para crear un software de examen en línea?
A menudo, como analista de datos, uno debe lidiar con los datos almacenados en formato XML o JSON. También es beneficioso aprender a analizar estos datos con un lenguaje de programación (a menudo hay algún paquete listo para usar).
Espero que esto ayude