Para mí, tu pregunta comienza de manera demasiado amplia. Si tuviera que predecir el mercado de valores, me gustaría tener una idea muy definida de por qué querría hacerlo y cómo me gustaría hacerlo antes de comenzar a elegir tecnologías como node.js.
Por ejemplo:
- ¿Desea aprender a analizar diversos datos (es decir, transmisiones de noticias, cotizaciones bursátiles, publicaciones de Twitter, etc.)?
- ¿Desea aprender a almacenar y administrar grandes cantidades de datos?
- ¿Te importa evaluar múltiples algoritmos y elegir el correcto?
- ¿Desea procesar el lenguaje natural (es decir, desea procesar texto, como artículos de noticias)?
- ¿Te interesan los aspectos internos de, por ejemplo, un algoritmo de bosque aleatorio, o simplemente quieres usarlo sin preocuparte por los detalles?
- ¿Quieres mostrar visualizaciones agradables a las personas?
- ¿O simplemente quieres obtener una buena calificación en tu proyecto de clase?
- O tal vez tengas alguna ambición de ganar dinero con esto …
Todas estas preguntas, y las otras que estoy seguro de que puede formular, guiarán el enfoque que elija. Evitaría ser específico con respecto a la pila de tecnología que desea usar, y simplemente trazaré sus objetivos. Tenga en cuenta que cuanto más ambicioso sea, más tiempo le llevará y más probabilidades tendrá de obtener un mal resultado.
- ¿Qué es un excelente componente de hoja de cálculo basado en web de código abierto que se puede incrustar en aplicaciones basadas en web?
- ¿Cuáles son sus procesos de pensamiento al diseñar la interfaz de usuario de una aplicación web de consumo?
- Sé algo de Python, y planeo desarrollar una aplicación web. ¿Cuáles son mis opciones tecnológicas?
- Cómo hacer una aplicación en la web para uso personal
- ¿Qué es una aplicación de Windows que puede organizar mi biblioteca de música y hacer lo siguiente?
Intentar lidiar con múltiples flujos de datos y almacenar y procesar adecuadamente todos los datos puede ser simplemente referido como una semi-pesadilla. Este es un problema extremadamente no trivial. En comparación con la dificultad de adquirir y procesar datos, la creación del algoritmo predictivo a menudo requiere menos tiempo.
Le sugiero encarecidamente que encuentre un conjunto de datos que ya se haya limpiado y procesado.
Aquí hay una competencia de Kaggle que tiene un gran conjunto de datos de inicio: Algorithmic Trading Challenge. Otra ventaja aquí es que puede ver cómo se desempeña frente a otros que intentaron trabajar con estos datos.
También puede descargar cotizaciones de fin de día de Yahoo y procesarlas de manera bastante trivial. Incluso hay un paquete R que lo hace por usted: Página en R-project.
Entonces, en conclusión, puntos clave:
- Limite su alcance y ambiciones tanto como sea posible.
- Planifique por qué quiere hacer esto y cómo (en teoría) lo hará de antemano.
- ¡No bloquee las tecnologías antes de hacer lo anterior!
- Le recomiendo encarecidamente que no use node.js para ningún trabajo de datos / algoritmo. Node.js ciertamente podría usarse para ayudar con una capa de visualización / presentación.
¡Buena suerte con esto, y espero que te vaya bien!