Blog Informatique

Comment débuter avec Elasticsearch

Internet   2 réactions »
A ce point ?PassableIntéressantYeahExcellent! (3 vote(s), 3,67/ 5)
Loading...

L'époque de MySQL et de ses données structurées est presque révolue. Avec la multiplication des données et métadonnées il est nécessaire de se tourner vers d'autres solutions, vous avez peut-être entendu parler du terme NoSQL. On ne parle plus de table ou de structure relationnelle car ces mécanismes ne permettent pas à des sites à forte affluence de délivrer le service escompté (twitter, facebook, google, etc).

elasticsearch

La bonne nouvelle c'est que la plupart sont des moteurs NoSQL libres open source. L'approche d'un SGBD tel qu'Elasticsearch est radicalement différente de MySQL ou MariaDB (son fork). Il faut utiliser une API REST pour interagir avec la base de données. Du coup la question se pose, comment migrer un site développé pour SQL vers Elasticsearch ? » Lire la suite

Limitez le duplicate content de votre blog sur Google

Développement   13 réactions »
A ce point ?PassableIntéressantYeahExcellent! (3 vote(s), 5,00/ 5)
Loading...

Le duplicate content est très mauvais pour votre site/blog, c'est un paramètre à ne pas négliger pour un bon référencement naturel.

Quelques rappels

Définition : le duplicate-content c'est la présence sur le web d'une même page sur plusieurs URL, lorsque l'on vous plagie par un vilain copier-coller par exemple (sans demander votre avis biensûr); mais également d'une même page accessible par plusieurs adresses différentes sur un même site : http://monsite.fr/mapage.php&p=1 avec http://monsite.fr/mapage.php?p=1&coucou.

Les moteurs de recherche n'aiment pas la redondance d'information et n'indexent qu'une seule fois l'information. Ils doivent donc faire le tri et trouver la page originale...

C'est comme ça que vous vous retrouvez avec certains Digg (paperblog, technoblog pour ne pas les citer) qui reprennent un des vos billets qui ressortent avant votre propre blog dans les résultats Google ! Il est d'ailleurs souvent impossible de retomber sur votre page originale dans les résultats, sauf en tappant certains mots clés précis ou bien en précisant le domaine (site:http://mosite.fr mes mots clés).

Lorsque plusieurs sites proposent une page identique, Google va tout simplement définir le site qui a le plus haut pagerank comme site original, voilà pourquoi les Digg vous passe souvent devant !

Cette page originale est appelée : URL canonique.

Il existe trois cas de duplicate-content » Lire la suite

Le sitemap influence-t-il votre position dans les moteurs ?

Internet   5 réactions »
A ce point ?PassableIntéressantYeahExcellent! (Votez !)
Loading...

Le sitemap est un élément important dans le processus d'indexation d'un site/blog. Il permet d'indiquer aux moteurs de recherche quel est grossièrement la structure de votre site et à quel rythme il serait préférable que le contenu soit indexé.

Sans ce sitemap, les moteurs indexent votre site/blog en suivant les différents liens de votre site. De ce fait certaines pages ne sont tout simplement pas indéxées (ou mal positionnées)  car le nombre de liens menants à cette page est trop faible. En quelque sorte il force l'indexation de pages orphelines.

Un membre de SEOMoz a effectué des tests pour vérifier si l'utilisation d’un Sitemap avait un impact sur la rapidité d'indexation dans les moteurs de recherche Google et Yahoo.

Le temps d'indéxation est considérablement réduit si votre site comporte un sitemap : 10 fois plus rapide chez Yahoo et 100 fois plus rapide chez Google !

Sans sitemap :

» Lire la suite

Augmentez la rapidité d’indexation de votre blog

Internet   6 réactions »
A ce point ?PassableIntéressantYeahExcellent! (3 vote(s), 3,33/ 5)
Loading...

WordPress utilise le protocole XML-RPC (Remote Procedure Call) pour notifier un site web lorsque vous faîtes un lien hypertexte vers celui-ci. Ce système permet à chaque blogueur d'être informé des sites ou blogs qui parlent de lui, c'est donc un protocole que l'on pourrait presque appelé "communautaire".

XML-RPC est également utilisé pour annoncer vos billets aux moteurs de recherche et "digg like",  pour inciter les robots à venir indéxer vos articles le plus rapidement possible. Les moteurs attendent donc que vous les sollicitiez pour indexer. Dans le cas contraire, ils ne passeront que bien moins fréquemment.

Par défaut, WordPress inclut pingomatic (via rpc.pingomatic.com) dans la liste des  serveurs XML-RPC, c'est un service qui permet de pinguer plusieurs plateformes connues : yahoo, bloglines, feedburner, etc.

Pour annoncer au plus de sites/plateformes possibles, je vous propose aujourd'hui de compléter/remplacer cette liste de serveurs avec la mienne que j'ai pu compléter au fil des mois. » Lire la suite

Augmentez la popularité de votre blog

Internet   83 réactions »
A ce point ?PassableIntéressantYeahExcellent! (4 vote(s), 4,75/ 5)
Loading...

But : supprimer l'attribut noflollow de votre blog

La problématique

Lorsque vous postez un commentaire sur un blog WordPress, on vous propose de renseigner l’adresse de votre blog. N'espérez pas gagner en popularité en plaçant votre url car les bots Google ne le verront pas. La faute à l'attribut NoFollow (Yahoo lui semble ne pas en tenir compte). » Lire la suite