Usamos curl para hacer una solicitud HTTP GET para un enlace dado. Si el tipo de contenido es texto / html, analizamos el marcado resultante y extraemos título, resumen, imágenes y contenido multimedia (generalmente videos y contenido flash).
Tomaremos extraer estos metadatos de los siguientes lugares (en orden de precedencia):
- Abrir metadatos de gráficos (http://developers.facebook.com/d…)
- Contenido de la metaetiqueta cuando el nombre de la etiqueta es título, descripción, medio u otros. (http://www.niallkennedy.com/blog…)
- Mejor suposición basada en incrustaciones / objetos, , y el primer
en el marcado.
Siempre puede saber qué contenido generará un enlace consultando http://developers.facebook.com/t…. Tenga en cuenta que este punto final forzará un raspado del contenido del sitio al que ingresa y repoblará el caché. Esto asegura que las acciones futuras reflejarán cualquier cambio.
- ¿Cómo es el proceso de entrevista para un desarrollador web front-end?
- ¿Dónde está el mejor lugar para encontrar un desarrollador web japonés para unirse a una startup en Tokio?
- ¿Cuál fue la pila de software menos irritante con la que has trabajado en tu vida de programación?
- ¿Cómo sería Golang una buena opción para un servidor WebSocket para una aplicación PHP?
- ¿Cuántos de ustedes todavía usan PrototypeJS a partir de la segunda mitad de 2014? ¿Por qué o por qué no?
Consulte también ¿Cómo determina Facebook qué imágenes mostrar como miniaturas al publicar un enlace?