Showing posts with label xml. Show all posts
Showing posts with label xml. Show all posts

Cum se adaugi un sitemap XML Google blogului de pe Blogger

  Daca aveti un blog gazduit de Blogger aveti si un sitemap, creat automat de catre Google. Acesta se gaseste si in fisierul robots.txt, pentru a notifica motoarele de cautare de existenta acestui sitemap.
  Problema sitemap-ului creat de Blogger este ca afiseaza doar ultimele 26 de articole/postari. Cu alte cuvinte, articolele mai vechi au sansa de a nu fi indexate vreodata de catre motoarele de cautare. Din fericire, exista o solutie destul de simple pentru a "convinge" motoarele de cautare sa va indexeze toate paginile blogului Blogger.
Google Sitemap XML + Blogger
Google Sitemap XML + Blogger
  Mergeti in setarile blogului, folosind noua interfata (Settings > Search preferences) si editati Custom robots.txt. Veti observa ca nu se incarca nimic in casuta de editare, nsa exista deja un fisier robots.txt care arata asa:
User-agent: Mediapartners-Google
Disallow: 

User-agent: *
Disallow: /search
Allow: /

Sitemap: http://www.atat.ro/feeds/posts/default?orderby=UPDATED
 Acesta restrictioneaza accesul robotilor la rezultatele cautarii, pentru a nu crea duplicate, insa daca veti cauta orice pe blogurile Blogger veti vedea ca acestea sunt, totusi, indexate. Iar pentru ca cel mai bine, pentru corecta indexare a oricarui sit, este sa nu folositi deloc fisierul robots.txt ci sa lasati motoarele de cautare sa indexeze ce vor, am renuntat la aceasta restrictie si am introdus, in casuta Custom robots.txt, urmatoarele:
User-agent: Mediapartners-Google
Disallow: 

User-agent: *
Disallow: 
Allow: /

Sitemap: http://www.atat.ro/feeds/posts/default?orderby=UPDATED
Sitemap: http://www.atat.ro/atom.xml?redirect=false&start-index=1&max-results=500
Sitemap: http://www.atat.ro/atom.xml?redirect=false&start-index=501&max-results=500
Sitemap: http://www.atat.ro/atom.xml?redirect=false&start-index=1001&max-results=500
Astfel, prin intermediul fisierului robots.txt, specificam motoarelor de cautare unde sunt sitemap-urile. Primul sitemap este feed-ul atom al sitului, cel care exista oricum si care afiseaza ultimele 26 de articole. Urmatoarele sunt tot feed-uri atom ce vor tine loc de sitemap - adica nu este neaparata nevoie ca sitemap-ul sa aiba extensia XML sau orice alta extensie.
 Dupa cum vedeti am impartit sitemap-urile in asa fel incat sa contina 500 de intrati (articole, postari, cum vreti sa le ziceti). Desi Google spune, daca-mi amintesc bine, ca 50000 este limita de articole ce vor fi citite dintr-un oarecare sitemap, am observat ca in cazul celor Blogger nu indexeaza decat 500; asadar vom folosi mai multe sitemap-uri, cate este nevoie,  fiecare indexand 500 de articole (de la 1 la 500, urmatoarea de la 501 la 1000 si tot asa pana la indexarea tuturor articolelor/paginilor).
 Deasemenea, desi motoarele de cautare ar trebui, teoretic, sa citeasca fisierul robots.txt si sa gaseasca singure sitemap-urile, puteti sa le adaugati dvs. in Google Webmaster Tools, Bing Webmaster, Yandex Webmaster s.a.m.d. pentru toate motoarele de cautare ce ofera servicii de analiza si optimizare de situri.
 Puteti folosi serviciul gratuit de creare sitemap Blogger oferit de ctrlq.org/blogger
© all rights reserved
made with by templateszoo