¿Cuáles son los componentes de software de una plataforma de publicidad contextual?

(Construyo una plataforma de publicidad contextual por diversión. Funciona bastante bien, pero obviamente no es así como lo hace Google)

  • Araña de página

Suponiendo que se trata de publicidad web, debe obtener el contenido de la página

  • Analizador de página

Necesita extraer el texto útil y / o los detalles de la página. Esto podría ser tan simple como usar un analizador HTML para eliminar etiquetas HTML, a uno que intente eliminar menús.

  • Extractor de contexto

Una vez que tenga el texto, necesita extraer el contexto. Esto es generalmente donde está la “salsa secreta” de la implementación. Una versión puede usar microdatos HTML / marcado semántico para tratar de encontrar datos de ubicación, otra puede escanear el texto en busca de ISBN, y hay muchas otras posibilidades

  • Ad Matcher

Una vez que tenga el contexto, necesita encontrar candidatos a anuncios basados ​​en ese contexto.

  • Servidor de anuncios

El anuncio se sirve al cliente. Esto generalmente se hace a través de Javascript, como un IFrame y / o usando Flash.

Para ampliar aún más el punto de ‘extractor de contexto’, necesita una forma de entender la semántica / contexto del texto, que es aceptable tanto por el editor como por el anunciante.

Una forma es etiquetar el contenido de la página web en la taxonomía contextual de IAB (QAG Taxonomy) para el editor. Los visitantes de esta página web se consideran interesados ​​en estas etiquetas / rótulos. Los anuncios con las mismas etiquetas / etiquetas se pueden publicar en la misma página. Es posible que desee consultar Semantar (Orientación semántica para publicidad en línea), que proporciona API gratuitas para la orientación semántica, la seguridad de la marca y el análisis de sentimientos.