¿Proyecto nuevo con muchas URLs sin indexar? Os dejo por aquí un pequeño script indexador para forzar la indexación de hasta 200 URLs diarias. Es básicamente lo que hace Rank Math Instant Indexing pero que podemos emplear en otros CMS.
Abajo os dejo el enlace a Google Colab para que podáis usarlo. Básicamente tendremos que darnos de alta en Google Cloud para poder usar Web Search Indexing API y vincularlo a nuestra cuenta de Google Search Console.
Necesitaremos las credenciales de Google Cloud y un listado de las URLs que queremos mandar a indexar.
Pasos para conseguir tus credenciales
Podéis seguir también la guía de Rank Math para obtener y configurar tus credenciales.
Tiempo total 15 minutos
Web Search Indexing API
Lo primero que debemos hacer es configurar en Google Cloud el “Web Search Indexing API”, puedes hacerlo desde aquí. En nuestro caso, hemos creado también un proyecto nuevo:
Selección del proyecto
A continuación, debemos crear una cuenta de servicio en el proyecto que hemos creado, puedes hacerlo desde aquí. Clicamos en el proyecto.
Cuenta de servicio
Se nos abrirá una nueva pestaña donde debemos ir a «Crear cuenta de servicio».
Credenciales cuenta de Servicio
Lo siguiente que debemos hacer es darle un nombre. Esa dirección de correo electrónico que vemos en la ID la vamos a necesitar, pero podemos copiarla luego.
Copiar correo y descargar claves
En la nueva pantalla que se nos abre copiaremos y guardaremos el correo e iremos a «administrar claves». Una vez ahí, agregaremos una clave nueva y la descargaremos en JSON.
Pegar correo en Search Console
Con nuestra clave API descargada solo tendremos que pegar ese correo largo que nos aparecía antes en nuestro Google Search Console.
Nombrar archivos
Ahora solo tendremos que renombrar el archivo de credenciales a «credenciales.json» e incluir en un documento con nombre «urls_para_indexar.txt» las que queramos indexar, 1 por línea y con un tope de 200, que es el máximo diario que tenemos.
Estos documentos son los que tenemos que subir a Colab como verás a continuación.
Script en funcionamiento
- Sube los archivos credenciales.json y urls_para_indexar.txt al espacio de trabajo.
- Ejecuta el Colab para indexar tus URLs.
Librerías Utilizadas
- google.oauth2.service_account: Gestiona las credenciales de la cuenta de servicio para autenticar con la API de Google.
- googleapiclient.discovery: Permite interactuar con la API de Indexación.
Explicación del Código
- Cargar Credenciales: Se utiliza la función service_account.Credentials. from_service_account_file() para cargar las credenciales desde el archivo credenciales.json.
- Construcción del Servicio: build(‘indexing’, ‘v3’, credentials=credentials) configura el cliente de la API.
- Lectura y Envío de URLs: El script lee las URLs desde urls_para_indexar.txt y las envía a Google para su indexación utilizando service.urlNotifications().publish().