Référencement et SEO
Tout le monde rêve d'être à la première place sur Google. Certains webmaster en font une obsession et sont même prêts à payer pour avoir un résultat.
Comprendre le référencement
Un moteur de recherche référence automatiquement un site web dès qu'il a le lien de la page d'accueil ou d'une page quelconque permettant de remonter sur la page d'accueil. Le fait de citer le lien d'un site web ailleurs sur le web, suffit à provoquer cette indexation du contenu.
Voici une liste de quelques moteurs de recherche:
- Google - le moteur de recherche de Google
- Bing - le moteur de recherche de Google
- Qwant - moteur de recherche européen
- Yandex - le moteur de recherche pour les russophones
- Baïdu - le moteur de recherche pour la Chine
- DuckDuckGo - un moteur de recherche qui affirme ne pas vous tracer
Nous n'avons cité ici que les plus gros moteurs de recherche. Pour ceux que ça intéresse, voici une liste des principaux moteurs de recherche selon Wikipedia.
Qui doit référencer votre site
Dans cette liste des principaux moteurs de recherche, les moteurs incontournables seront ceux qui sont utilisés par vos visiteurs:
- les français de France pour un site à portée régionale. La pub pour les prestations d'un artisan, un restaurant, etc...
- les francophones de la planête si votre site est rédigé en français...
En clair, vous devez être référencé par Google, Bing et Qwant...
Un chinois de Chine qui ne parle que le mandarin n'a aucun intérêt à venir sur votre site web. Les rares visiteurs venant de ce pays ont de forte chance d'être venus par hasard ou ce seront des hackers qui cherchent les failles de votre site web.
Donc, à moins d'avoir une partie de site en chinois ou en russe, on évitera l'indexation par Yandex ou Baïdu. Laisser ces moteurs indexer votre site web n'a aucun intérêt et provoquera plutôt un accroissement du volume en sortie de serveur.
De très nombreux serveurs comptabilisent le volume des données émises par les sites web qu'ils hébergent. En cas de dépassement du quota autorisé, beaucoup de serveurs interrompent la diffusion ou demandent aux clients de migrer vers des solutions plus appropriées à la diffusion de forts volumes.
On a donc tout intérêt à contrôler qui vient sur le serveur et pourquoi les visiteurs viennent...
Qui ne doit pas référencer votre site
Il existe des crawlers associés à des ressources SEO, genre semalt ou sistrix pour ne citer que les plus agressifs. Ces référenceurs n'ont aucun intérêt pour vous et vont générer un trafic en sortie de serveur tout à fait conséquent.
Ces crawlers n'intéressent que des sites qui cherchent à analyser leur "notoriété" sur le net et qui paient fort cher pour ça. Et pour arriver à leur fins, ils exploitent vos ressources informatiques au point de faire parfois écrouler certains serveurs.
La solution la plus radicale est de leur refuser l'entrée de votre serveur. Nous verrons plus loin comment y arriver.
Etre le premier sur Google
C'est le rêve de tout webmaster: avoir son site en premier dans les recherches de Google.
Si votre site parle des lézards axolotl de couleur gludure, il est vrai que si vous cherchez "axolotl gludure", vous aurez la certitude d'être toujours en première page des recherches Google ou Bing ou Yahoo ou DuckDuck ou Yandex ou Baidu....
Maintenant, la question est de savoir si les axolotls de couleur gludure passionnent les foules...
Si vous avez un site qui parle de cuisine et que vous avez un blog avec 10 recettes, il y a très peu de chances d'être en tête de Google. Même avec 10.000 recettes, ce sera pas évident.
Augmenter ses chances
Et en informatique - comme en cuisine - il n'y a pas de recette miracle. Pour être correctement référencé, il faut au préalable avoir un en-tête de page web bien structuré. Voici le minimum syndical:
<title>Référencement et SEO</title>
<meta name="description" content="Avoir un site web, c'est bien. Le faire
référencer, c'est mieux. mais éviter les parasites et les nuisibles,
c'est très difficile..." >Ici, ce sont les balises title et meta placées
en tête du contenu HTML de la page web qui aideront les moteurs de recherche
à indexer votre site web.
Si le contenu de ces balises reste le même pour toutes les pages web, vous diminuez l'impact du référencement.
Ensuite, les recettes qui marchent bien:
- du contenu textuel bien structuré et abondant.
- un contenu qui évolue en permanence
Voici quelques techniques à éviter:
- les frames qui cassent la structure logique d'un site en morcelant le contenu;
- avoir du texte sous forme d'images;
- avoir du contenu chargé dynamiquement par des scripts ajax. Un moteur de recherche ne "clique" pas sur toutes les combinaisons...
- les animations flash interactives pénalisent catastrophiquement un bon référencement;
- des documents annexes dans des formats cryptés ou propriétaires;
- des documents annexes en PDF exclusivement graphiques. Par exemple, des planches de bande dessinnées ou un catalogue interactif. Pour les moteurs de recherche, leur contenu ne pourra pas être indexé.
- Un contenu répétitif et morcelé, par exemple des tableaux de statistiques contenant jsute des mots et chiffres...
Donc, avant de se focaliser sur le référencement, cherchons à comprendre qui vient sur votre site web. C'est ce que nous allons voir dans la partie suivante intitulée traçage des visites sur un site web