¿Hay alguna diferencia entre no tener un archivo robots.txt y tener un archivo robots.txt que permita a todos los agentes de usuario y archivos / directorios?

Primero, debe saber qué es realmente un archivo Robots.txt .

Generador Robosts.txt le dice a los motores de búsqueda qué páginas acceder e indexar en su sitio web y qué páginas no. Por ejemplo, si especifica en su archivo Robots.txt que no desea que los motores de búsqueda puedan acceder a su página de contacto, esa página no podrá aparecer en los resultados de búsqueda y los usuarios de la web no podrán ser capaz de encontrarlo Evitar que los motores de búsqueda accedan a ciertas páginas de su sitio es esencial tanto para la privacidad de su sitio como para su SEO .

Entonces, si tiene algunos contenidos que no cree que debería permitir que los motores de búsqueda rastreen, entonces debería usar Robots.txt . generalmente en un sitio web hay algunos contenidos que se usan dos o tres veces. En ese caso, si el rastreador de los motores de búsqueda escanea esos contenidos, penalizará su sitio web por duplicación y perderá rango.

Y también el archivo Robots.txt especifica la ubicación del mapa del sitio que facilita el rastreo de los robots de los motores de búsqueda. Por lo tanto, sería realmente tonto no usar robtos.txt por completo. Aunque puede usarlo específicamente para algunos contenidos y si no tiene ningún contenido que ocultar, no hay ningún daño en usar el archivo robots.txt .

La razón por la que hace esta pregunta es porque no está familiarizado con este archivo txt. Pero no es tan difícil generar un archivo robots.txt. Puede generar este archivo fácilmente utilizando este generador Online Robots.txt .

Los pasos para usar una herramienta de generador Free Robots.txt se da a continuación:

  1. Primero configure la opción para todos los robots en “Permitido”.
  2. Dé el retraso de rastreo según su deseo de 5 segundos a 120 segundos.
  3. Coloque un mapa del sitio si lo tiene o déjelo en blanco.
  4. Para cargar un archivo existente y ocupar previamente la herramienta generadora, escriba o copie y pegue el texto en la URL del dominio raíz y seleccione ‘Cargar’.
  5. Puede utilizar las funciones “Permitido” y “Rechazado” para modificar el archivo Robots.txt generado. Tenga en cuenta que la herramienta por defecto es ‘Permitida’.
  6. Luego, para aplicar una nueva directiva a su lista, puede hacer clic en ‘Agregar directiva’ y para excluir o editar una directiva actual, seleccione ‘Eliminar directiva’, luego cree una nueva utilizando la función ‘Agregar directiva’.

Gracias.

No debería haber diferencia. Pero tenga en cuenta que el archivo robots.txt tiene otros usos, como especificar ubicaciones del mapa del sitio, que pueden facilitar el rastreo de su sitio (consulte http://www.sitemaps.org/protocol …).

Además, los robots pueden ignorar por completo cualquier restricción especificada en robots.txt, por lo que podría ser mejor no enumerar nada a lo que no desee que acceda nadie ni nada, ya que robots.txt es completamente accesible al público (mejor aún, proteja con contraseña todos materiales sensibles!).

robots.txt siempre ha actuado como el ‘mapa del sitio’ para los chicos que juegan con facilidad (los motores de búsqueda legítimos). Cuánto se observa, incluso por ellos, en estos días, es discutible, pero para eso es.

Los desagradables siempre patrullarán lo que sea que esté en exhibición, independientemente de por qué DirectoryIndexing siempre debe estar configurado como ‘apagado’ (no puedo creer que herramientas como Acunetix marquen DirectoryIndexing como azul: factor de advertencia, cuando se estudia un sitio).