Accueil > Référencement > Scraper les résultats de Google (astuce SEO)

Scraper les résultats de Google (astuce SEO)

récupérer les liens dans les résultats de google

Après cet article sur la manière d’aspirer les résultats de Google avec un bookmarklet j’ai décidé d’apporter ma contribution en proposant une solution avec Google Spreadsheet.

Comment ça marche

Dans “Search terms”vous indiquez l’expression à rechercher.

Dans “Page” la page de résultats google que vous voulez scraper.

Dans “url” se trouve l’url Google qui est utilisé pour récupérer les liens.

L’import est réalisé sur une page de 100 résultats de Google.

Différences par rapport au bookmarklet

Avec le bookmarklet il est recommandé d’installer autopager qui permet de charger plusieurs pages de résultats, avec la spreadsheet il faudra faire cela à la main en modifiant la valeur dans page.

Par contre on récupère une liste que l’on peut sauvegarder dans divers format.

Tous les liens de la page sont récupérés même ceux se trouvant dans le lien “Plus de résultats” qu’ajoute parfois Google.

Le fichier

Voici le lien pour récupérer la spreadsheet : bit.ly/scraping-google-results

Il faudra aller dans “Fichier/Créer une copie” pour sauvegarder votre version. Si cette option est  grisée, retournez à l’accueil de Google Docs le fichier devrait apparaitre dans votre arborescence, ensuite en retournant dessus la fonction copie devrait apparaitre.

  1. eacute
    7 janvier 2011 à 00:59 | #1

    Très très pratique. Merci !

    Par contre, impossible de ressortir les résultats sur les url à variables complexes du type : uniquement les recherches sur les blogs fr.

    Je creuse…

  2. ross-well
    7 janvier 2011 à 21:57 | #2

    En rajoutant le paramètre &tbs=blg:1 il est possible d’activer le filtre blog de google.
    La formule en D1 devient =”http://www.google.fr/search?q=”&SUBSTITUTE(B1,” “,”+”)&”&num=100&filter=0&start=”&(B2-1)*100&”&tbs=blg:1″

    A priori ca doit marcher.

  3. DI
    4 mai 2011 à 11:09 | #3

    Bonjour, très utile cette fonction. En revanche, l’ordre dans lequel sont récupéré les résultats semble altéré lorsque dans la liste des résultats en question il y a des liens de type “Autres résultats sur xxx.com”. Est-ce un problème connu ? Est-ce qu’on peut récupérer les résultats dans l’ordre ? (merci d’avance)

  4. ross-well
    4 mai 2011 à 14:44 | #4

    Je n’avais pas fait attention mais sinon j’ai fait aussi une spreadsheet pour suivre le positionnement de sont site et dans celui là l’ordre est respecté
    http://notjustbi.wordpress.com/2010/12/15/suivre-le-positionnement-de-son-site-sur-google-outil-referencement-gratuit/

    Pour celle-ci je n’avais pas regardé car l’objectif était de récupérer les urls seulement.

    Stéphane

  1. Pas encore de rétroliens.

Répondre

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Twitter picture

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Connexion à %s

Suivre

Get every new post delivered to your Inbox.