Hay algunas piezas de software asombroso en las que he trabajado ya sea con:
- En Microsoft, creamos un sistema de mapeo de datos extraordinario, que ahora actúa como el núcleo de Entity Framework en el marco .NET. Es capaz de tomar dos modelos de datos diferentes y demostrar que los datos se pueden transformar de una manera bidireccional entre ellos sin pérdida de datos. Además de esto, creamos un sistema ORM muy poderoso que es el núcleo de LINQ to Entities.
- Apache Cassandra : una de las tecnologías centrales de la web moderna a gran escala. Un almacén de datos distribuidos linealmente escalable capaz de almacenar y consultar petabytes de datos a una velocidad cegadora. Si bien a primera vista parece tener pocas funciones como base de datos, un poco de inteligencia le permite usarlo para todo, desde sistemas de chat hasta análisis en tiempo real.
- ElasticSearch : Mientras que Cassandra limita agresivamente su capacidad de consultar datos, ElasticSearch es una base de datos distribuida que vive y respira índices de alta velocidad. También se puede usar para análisis en tiempo real, pero puede ejecutar agregados dentro del motor. También, por supuesto, puede usarse para construir motores de búsqueda de texto masivos.
- Apache Kafka : Sorprendentemente simple en diseño, aunque complejo en sus detalles, le permite almacenar flujos de eventos de escala casi ilimitados, procesarlos en paralelo, reproducir fallas, avanzar y retroceder en el tiempo, dividir flujos de datos en múltiples destinos, etc. Un registro distribuido muy, muy poderoso.
- Apache Spark : Por supuesto, ninguna lista de software “potente” estaría completa sin este motor, que le permite escribir código que, en su mayor parte, parece ejecutarse como una transformación funcional local estándar, pero que Spark distribuirá a través de un racimo. Capaz de aplicar el mismo modelo de procesamiento a lotes y micro lotes para transmisión, y lo suficientemente rápido como para entrenar y ejecutar modelos de aprendizaje automático. Spark patea a **.
- Apache Drill : un motor SQL distribuido rápido y conectable. Usamos esto para habilitar consultas analíticas complejas sobre Cassandra. Pero, en realidad, se puede utilizar para realizar consultas relacionales en almacenes de datos heterogéneos. Tener su propio motor SQL distribuido casi gratis … ¿qué es más poderoso que eso?
- No puedo dejar pasar esto sin hablar del bus de servicios empresariales de código abierto de mi propia empresa: Mule . Presentamos Mule 4 y Anypoint Studio 7 Beta. Cientos de personas han trabajado durante años en este último lanzamiento, que presenta un motor de núcleo reactivo sin bloqueo de última generación. Este es un contenedor de aplicaciones que puede integrar cualquier sistema en cualquier red. Hemos utilizado la plataforma Anypoint para modernizar una parte importante de las empresas del mundo. Lo más probable es que hayas sido parte de varias transacciones de Mule hoy.
- Ok, una cosa súper genial más: MELD .
Meld es una tecnología de base de datos MuleSoft que le permite empujar cargas JSON arbitrarias a una API REST y luego consultarlas con ANSI SQL. La tecnología subyacente utiliza algunos trabajos patentados de almacenamiento en columna junto con Drill y Cassandra. Es realmente mágico Puede ver a nuestro arquitecto principal de esta plataforma explicar todos los detalles aquí: