V návaznosti na svůj článek o tom, jak jsem vyřešil penalizaci ze Seznamu, jsem se jal řešit vytížení multihostingu. Přece jen jsem řešil důsledek, ne příčinu.

Přesun webů na jiný hosting

Sice jsem hostingu uvolnil systémové prostředky přesunem některých svých webů, ale stále mi na něm zůstaly některé docela klíčové weby a ty se také v posledních 7 měsících potýkají s mizernou návštěvností ze Seznamu.

Začal jsem tedy jít po příčině vytížení hostingu. K této myšlence mě přivedl můj bratránek, který má multihosting u stejné firmy, jako já, a také se potýkal s mizernou návštěvností. Začal procházet logy svých webů a zjistil, že jsou jeho stránky (také postavené na WordPressu) opakovaně napadány ze stále stejných IP adres, které se neustále snaží (naštěstí neúspěšně) přihlásit. Opakovanými pokusy o přihlášení ale bohužel docházelo k pádu webu, který byl následně delší dobu nedostupný.

Dané IP adresy zablokoval a během krátké doby mu vzrostla návštěvnost ze Seznamu o 20% a zisky o 30%.

Prostě, když je web nedostupný pro uživatele, a co je možná horší, i pro vyhledávače, postupně se web přestane vyhledávačům líbit a pomalu jej začnou ve fulltextu penalizovat.

Vyzbrojen touto informací, začal jsem procházet statistiky přenosu na svých webech. Narazil jsem hned na 5 problematických, které se potýkají se stejným problémem, jako můj bratránek.

Opakované neúspěšné přihlášení robotů

Opakované neúspěšné přihlášení robotů

Zjistil jsem, že se stejná situace objevuje nahodile na více mých webech. V grafu vždy vyskočí „židlička“, spadne hosting, robot odejde. Web se postupně zmátoří a tak stále dokola :-).

Na základě tohoto grafu jsem začal zkoumat logy, které mapují různé přístupy botů, ale i návštěvníků.

Opakovaný login k WordPressu

Opakovaný login k WordPressu

Tenhle robot včera (19.5.2015) dokázal za 50 minut vyzkoušet 16 500 přihlášení, pak hosting spadl a robot odešel :-D.

Jak robotům zamezit přístup?

Nejjednodušší variantou je zablokování IP adresy pomocí souboru .htaccess, kam stačí vložit řádek deny from IP adresa. Více info na webujakpsatweb.

Toto řešení však je pouze dočasné, protože zablokuje po