luni, 27 mai 2013

Gestionarea indexării site-ului de către motoarele de căutare (continuare)

În articolul precedent am discutat despre cum poate fi influențată indexarea paginilor unui site prin metoda interzicerii indexării cu ajutorul tag-urilor meta sau a fișierului robots.txt. În continuare va fi descrisă metoda a doua: Gestionarea indexării cu ajutorul datei modificării documentului.

Data modificării documentului


În standardul protocolului HTTP există o cerere cu titlul If – modified – Since. Dacă robotul motorului de căutare face o astfel de interogare la server-ul pe care se află site-ul, înseamnă că, el se va adresa la server cu „rugămintea” de a-i oferi pagina doar în cazul în care pagina a fost modificară după data indicată.

Dacă pe pagină nu au avut loc nici un fel de schimbări în perioada indicată, atunci serverul trimite răspunsul 304 Not Modified (documentul nu a fost modificat) și nu oferă pagina robotului. În așa caz, robotul poate să lase în index copia veche a documentului și va putea oferi mai multă atenție documentelor noi și celor cu modificări. 

Prelucrarea corectă a cererilor cu data modificării documentelor este actuală pentru site-uri cu un număr mare de pagini și permite îndrumarea roboților către documente noi sau actualizate. Oricum aceste metode trebuie utilizate cu mare atenție, deoarece algoritmii roboților diferitor motoare de căutare pot să difere foarte mult, și parafrazând un vechi proverb se poate de spus: „Ce este bine pentru Google, poate fi rău pentru Yandex”.

Niciun comentariu:

Trimiteți un comentariu