Seznam.cz má nový fulltext. Jaký bude?

Seznam.cz oznámil nové testování nového vyhledávacího fulltext enginu. Jaké změny přinesl? Co bude znamenat pro optimalizátory webu? Budou všechny dosavadní poznatky o tomto vyhledávači zastaralé? Jde skutečně o revoluci, jak to některé internetové servery podávají? Zkusme se podívat na nové vyhledávání trochu blíž. Pod každým poznatkem a postřehem se zamýšlím nad tím, co bude každý jednotlivý fakt znamenat v praxi pro ty z nás, kteří se snaží přizpůsobovat weby tak, aby byly vyhledávačům milejší.

Změna je zvláště u některých dotazů vidět na první pohled. Ve staré verzi (v době psaní článku stále ještě nasazené do ostrého provozu – nový engine by měl být podle Seznamáků spuštěn „zanedlouho“) když jste chtěli například najít „ubytování na horách“, vyhledávač vám předložil nabídku stránek nabízející ubytování v Černé . Nová verze pochopila rozdíl mezi hory a Černá hora a ukáže vám skutečně stránky nabízející ubytování na horách. Jak se zdá, Seznam dává větší důraz na často užívaná klíčová spojení a fráze. Otázkou je, zda je se učil ze stránek nebo z dotazů v hledání. Zkusíme si to tedy na dalším případě:

Tentokrát se ptám na Jiřího Topolánka. Ne nemyslím tím expremiéra a ani jsem se nespletl ve jméně. Prostě hledám pána, který se jmenuje Jiří Topolánek. Má smůlu, že má často zmiňovaného jmenovce, což znamená, že pokud se skutečně Seznam učí i z dotazů, ať už z jejich tvaru nebo z jejich četnosti, pak se to musí projevit ve výsledcích. A skutečně. Stará verze mi nabídne odkaz na firmu pana Jiřího Topolánka až na druhém a třetím místě. Naopak první odkaz pojednává o expremiérovi, stejně tak jako zbývajících osm. Nová verze naopak ukázal stránky s Jiřím Topolánkem na prvních 4. místech, pak nějaké stránky, kde se objevuje jak jméno Jiří, tak příjmení Topolánek, včetně nějakého toho nezbytného článečku o Mirkovi. Pro zajímavost Google na první stránku Mirka nepustil a nabídl Jiřího hned 10x. Takže sice se asi Seznam z frází učí, ale ještě je stále na půli cesty, i tak zaplaťpánbu za to…

V diskuzích kolem nového vyhledávače se objevují názory, že Seznam upozaďuje stránky, kde není klíčové slovo v URL, domény s tuzemskou TLD (.cz), případně upozaďuje MFAčka. Nemyslím si. Keyword v URL není a nemůže být až tak silný parametr řadicího algoritmu, kvalitní stránky se najdou i na jiných než českých doménách a s potlačením MFA stránek to nebude až tak silné. Snad jen to vypadá, ale to je podle mne dlouhodobější trend, že Seznam dává přednost rozsáhlejším webům s velkým textovým obsahem a silnou vnitřní strukturou odkazů, což většina rychlokvašených MFA a mikrostránek nikdy nesplňovala.  Takže podle všeho bude hlavní změna vyhledávače někde jinde…

Samostatnou kapitolou je propojení jednotlivých komponent, která dávají dohromady to, co známe jako stránku výsledků vyhledávání (SERP – search engine results page). Svého času Seznam zápolil se snímačem screenshotů, to je nyní zdá se pod kontrolou, navíc větší výřezy ze screenshotů pomohly a myslím, že se to líbí i uživatelům, kteří tak mohou být lépe ovlivňování při proklikuí i designem stránek.

Teď se zdá, že je trochu nekoordinovaná práce vyhledávacího stroje a systému, který zvýrazňuje hledané fráze. Zeptám-li se třeba na obligátní „ubytování na horách“, ve výpise se mi zvýrazní i slova jako „české“, „slovenské“ nebo „Krušné“ (časté sousloví s „hory“). Snaží se snad vyhledávač náš dotaz doplňovat, a tedy automaticky do dotazu zapracovává „nevyřčená“ slova?

Věřím, že se v jejich TODO listu objeví i odstranění problému, že když hledáte-li tři slova, vyhledávač zvýrazní jen první dvě. Pokud se ptáte na klíčové slovo nebo frázi, nešvar starého systému, že najde-li ho v URL bez pomlčky nebo jiného dělícího znaku, zvýrazní ho celé (hledáte MP3 a nabídne www.mp3stahuj.cz  místo www.mp3stahuj.cz) také zůstal. 

Na co by se nakonec mohli hoši z Fulltextu také ještě podívat, jsou popisky (snippet) Jsou totiž o poznání kratší. Často se spokojí místo s popiskem, z něhož bude patrnější kontext vyhledaného textu na stránce, jen se zveřejněním první H1 na stránkách, ve které je hledané slovo. V řadě případů je samotný titulek odkazu delší než popisek a to vypadá docela divně. CO si pak myslet jako uživatel o takové stránce? Že tam nic víc nenajdu? proč bych pak na ni klikal? Navíc se bojím, že pokud to tak zůstane, budou se tvůrci stránek snažit cpát co nejvíce textů hod H1, H2 a H3 a to si myslím, že je nešvar, o který nikdo nestojí…

Snad jde chyby, které do ostré verze administrátoři nepustí. Jak se však zdá, nová verze je skutečně relevantnější. A to je jen dobrá zpráva.

4 thoughts on “Seznam.cz má nový fulltext. Jaký bude?

  • avatar
    18. 4. 2010 at 16:49
    Permalink

    No pěkný článek,ale jak píšete, ještě bude hodně dlouho trvat než seznam dohoní google v relevanci…Stejně tak ohledně odkazů, při linkbuildingu by to chtělo větší relevanci u odkazů…

    Reply
  • avatar
    16. 10. 2009 at 09:40
    Permalink

    K nadpisům H1, H2 atp. Myslím, že je dobře, když tam je hledané slovo, aby to zvýraznili a brali na to určitou váhu. S tím, že k tomu ale vypíšou i další část ze stránky, tedy ne jen nadpis samotný. A to, že by někteří tvůrci dávali vše do nadpisů, toho bych se nebál. Zaprvé jsem se s tím setkal několikrát již nyní a zadruhé by to měl robot poznat resp. jestli bude nadpis tvořen jednou či více větami, tak tomu snížit váhu…

    Reply
  • avatar
    7. 10. 2009 at 19:59
    Permalink

    Ad zvýrazňování: „Že je xxx ztučněné, bude práce starého sekundárního zvýrazňovače.“ říká Yuhů v jiné duskuzi.

    Reply

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *