(Construyo una plataforma de publicidad contextual por diversión. Funciona bastante bien, pero obviamente no es así como lo hace Google)
- Araña de página
Suponiendo que se trata de publicidad web, debe obtener el contenido de la página
- Analizador de página
Necesita extraer el texto útil y / o los detalles de la página. Esto podría ser tan simple como usar un analizador HTML para eliminar etiquetas HTML, a uno que intente eliminar menús.
- ¿Qué es un buen software para proteger contra copia un DVD?
- ¿Cuál es el mejor software para hacer EDM, para principiantes?
- ¿Cuánto cuesta el software ERP?
- ¿Cuál es un buen producto para almacenar datos de preguntas y respuestas de servicio al cliente?
- ¿Cuál es el mejor software para la gestión de proyectos del cliente?
- Extractor de contexto
Una vez que tenga el texto, necesita extraer el contexto. Esto es generalmente donde está la “salsa secreta” de la implementación. Una versión puede usar microdatos HTML / marcado semántico para tratar de encontrar datos de ubicación, otra puede escanear el texto en busca de ISBN, y hay muchas otras posibilidades
- Ad Matcher
Una vez que tenga el contexto, necesita encontrar candidatos a anuncios basados en ese contexto.
- Servidor de anuncios
El anuncio se sirve al cliente. Esto generalmente se hace a través de Javascript, como un IFrame y / o usando Flash.