¿Qué libro / video conferencia debería seguir si quiero aprender el análisis de datos de basic? ¿Cuáles son los otros softwares necesarios aparte de R y matlab?

Sugeriría la Especialización en Ciencia de Datos por la Universidad Johns Hopkins de Coursera . Es una serie de cursos que incluyen conceptos básicos de R, obtención y preparación de datos para análisis, construcción de modelos, aprendizaje automático y cómo realizar análisis de forma reproducible. Podría ser un muy buen punto de partida, y cada curso te tomará 4 semanas para completar, con mucha práctica práctica. Aprendí muchas cosas útiles y las apliqué al trabajo para mejorar la eficiencia.

Python a menudo se usa también para el análisis de datos, aunque, en mi opinión, no es tan conveniente como R. Entonces, si ha decidido emprender el viaje para convertirse en un científico de datos, dominar las habilidades de R debería ser una prioridad. No solo es prestigioso dentro de las estadísticas, sino que también es bueno, ya que es de código abierto, y la gente sigue escribiendo paquetes útiles como ggplot2 y plyr . Sin embargo, cuando tenga tiempo, también se recomienda aprender Python, ya que es más un lenguaje de propósito general y puede hacer cosas que R no puede hacer, como el controlador web del paquete de selenio .

SQL es probablemente muy útil. Si desea lidiar con grandes datos, Excel no sería la forma ideal de almacenamiento de datos. La mayoría de las bases de datos (MySQL, Microsoft SQL Sever, Oracle Database, etc.) usan el mismo lenguaje, que es SQL.

A menudo, como analista de datos, uno debe lidiar con los datos almacenados en formato XML o JSON. También es beneficioso aprender a analizar estos datos con un lenguaje de programación (a menudo hay algún paquete listo para usar).

Espero que esto ayude

codecademy
udemia
Coursera
y mucho más