Reducción de dimensionalidad:
Uno de los usos más comunes para la covarianza es para la integración de datos / reducción de dimensionalidad / extracción de características, un ejemplo clave de esto es el análisis de componentes principales http://en.m.wikipedia.org/wiki/P…
La covarianza entre variables en un conjunto de datos puede ayudar a revelar un espacio de dimensión inferior que aún puede capturar la mayoría de la varianza en los datos, es decir, puede ser posible combinar variables que están altamente correlacionadas (tienen alta covarianza) sin perder demasiado información.
- ¿Quiénes son los proveedores de prevención de pérdida de datos?
- ¿Existe una solución de hardware / software de código abierto para el rastreo GPS de flotas basado en Raspberry PI 2?
- ¿Qué gigante de software sobrevivirá al final después de la locura de adquisición de la compañía de tecnología?
- ¿Cómo se hace una copia de seguridad de la configuración del software en Windows?
- ¿Necesito instalar algún software para enviar SMS?
Análisis de correlación canónica (CCA):
Otro uso interesante: análisis de correlación canónica http://en.m.wikipedia.org/wiki/C…
Una aplicación interesante de las cuales es el aprendizaje de múltiples vistas:
http://dl.acm.org/citation.cfm?i…
http: //www-stat.wharton.upenn.ed…
El aprendizaje de múltiples vistas generalmente aprovecha los datos adicionales en forma de múltiples conjuntos de características independientes y completas para datos junto con datos sin etiquetar para mejorar el modelado.
Uno de los primeros documentos que demuestran la efectividad del aprendizaje de múltiples vistas que ilustra la idea subyacente: http://dl.acm.org/citation.cfm?i…
Clasificación y selección de características para clasificación
La correlación / covarianza de características con la etiqueta (o basada en la etiqueta) también se usa para muchos métodos de aprendizaje automático. Por ejemplo, muchos métodos de selección de funciones utilizan este http://en.m.wikipedia.org/wiki/F…
Uno de los enfoques más rápidos y simples para la selección de características es filtrar cierto número de características que están menos correlacionadas con la variable etiqueta / respuesta. Esto también se puede hacer para reducir rápidamente la cantidad de funciones a una cantidad más manejable antes de usar un método de selección más costoso.
Otro ejemplo desde una perspectiva generativa hasta la clasificación: análisis discriminante lineal:
http://en.m.wikipedia.org/wiki/L…