Přemýšleli jste někdy o tom, jak často anebo zda vůbec na vaše stránky přichází vyhledávací robot (pavouk), aby zaindexoval vaše stránky? U nových stránek je to vcelku potřebná a důležitá událost – nenavštíví-li stránky robot, vaši potenciální návštěvníci vás ve vyhledávačích nenajdou. A naopak u starších stránek se podle frekvence návštěv roboty dozvíte, jak je stránka pro vyhledávače atraktivní. Obecně platí, že čím je stránka častěji aktualizovaná, dá se očekávat i kraší interval mezi návštěvami vyhledávacích pavouků. Fakt, jak oblíbené jsou z hlediska vyhledávačů právě vaše stránky, si můžete zjistit z různých zdrojů. Poslední návštěvy GoogleBota (vyhledávací robot Google), zjistíte například pomocí nástroje Google Webmasters, pomocí statistik na serveru, analýzou logů anebo jednoduchým PHP scriptem.
Půvab tohoto scriptu je v tom, že pokud jej vložíte na stránku, tak kdykoli, když robot tuto stránku otevře, dá vám script mailem echo, že se tak stalo. Autorem původního scriptu je Steve Dawson, následující modifikace ignoruje ale narozdíl od původního scriptu většinu zahraničních robotů a naopak zaznamenává pouze návštěvy dvou nejdůležitějších vyhledávačů u nás – Seznam a Google. Pro šikovné ale určitě nebude problém přidat případně detekci dalších robotů – stačí vám k tomu znát jen jejich jména.
Nejprve si nastavíme e-mail, kam bude chodit upozornění, že vaše stránky navštívil robot.
$Email = “vas@email.cz”; ## notifikační mail
$Email = preg_replace(“/[\n\r]+/”, “”, “$Email”);
Pak si připravíme hlavičku mailu a formát datumu
$datum = date(“d. M. Y v G:i”);
$hlavicka = “—————————————————————————–
Prave tvoje stranky navstivil vyhledavaci robot
—————————————————————————–“;
A nakonec si připravíme část, která detekuje příchozího robota a odešle nám mail:
Nejprve pro Google
if(eregi(“Googlebot”,$HTTP_USER_AGENT)) {
global $hlavicka;
global $datum;
if ($QUERY_STRING != “”) {$GoogleLink = “http://”.$SERVER_NAME.$PHP_SELF.’?’.$QUERY_STRING;}
else {$GoogleLink = “http://”.$SERVER_NAME.$PHP_SELF;}¨
$GoogleEmail = ”
“.$hlavicka.”
Prave tvou stranku http://$SERVER_NAME navstivil robot vyhledavace Google.
Konkretne prochazel strankou “.$GoogleLink.”
Cas navstevy – “.$datum.”
“;
@mail(“$Email”, “Navsteva Googlebota”, $GoogleEmail, “Od: <Google Robot>$Email”);
}
A následně pro SeznamBota
## Seznam
if(eregi(“SeznamBot”,$HTTP_USER_AGENT)) {
global $hlavicka;
global $datum;
if ($QUERY_STRING != “”) {$SeznamLink = “http://”.$SERVER_NAME.$PHP_SELF.’?’.$QUERY_STRING;}
else {$SeznamLink = “http://”.$SERVER_NAME.$PHP_SELF;}$SeznamEmail = ”
“.$hlavicka.”
Prave tvou stranku http://$SERVER_NAME navstivil robot vyhledavace Seznam.
Konkretne prochazel strankou “.$SeznamLink.”
Cas navstevy – “.$datum.”
“;
@mail(“$Email”, “Navsteva Seznambota”, $SeznamEmail, “Od: <Seznam Robot>$Email”);
}
Toť vše… Teď už jen čekejte na návštěvu:-)
Celý script najedte ke stažení zde
Zajímává věc, taky vyzkouším
Pingback: Chcete vědět, jestli vás, respektive vaše stránky navštívil vyhledávací robot? | Zajímavosti
Zdravim. Aplikováno na http://freebit.cz tak uvidíme xD
Souhlasim s tim, ze mailovani muze byt u vetsich webu problem, kod se hodi spis pro nove a mensi weby. Pokud provozuji starsi a hojne aktualizovany web, uz me az tak navstevy botu asi nezajimaji…
Pěkná myšlenka. Ještě to zaobalit do nějaké třídy a přidat k tomu konfig v iniku třeba, aby se to dalo implementovat jako black-box :)
require_once ‘Boti.php’;
Boti::loadConfig(‘config.ini’);
Boti::check();
Kod je to pro spoustu lidi zajimavy, jen to emailovani je dobra silenost v dnesni dobe, kdy googlebot behem hodiny klidne 1000x proleze trosku vetsi web ;)
Diky, uz to zkousim :)
A nebo nainstalujeme Firestats (PHP, MySQL) a hezky online a přehledně sledujeme podrobnou činnost všech robotů, uživatelů, atd.
Pingback: 1. zprávy » Michal Kubíček // Zjistěte si, jak často na vaše stránky přichází Google a Seznam