SEO novinky podzimu 2016

SEO nikdy nespí. Koncem letošního roku to platí dvojnásob. Hlavní vyhledávače Seznam.cz i Google reagují na trend „rozšiřování internetu“ a nárůst mobilního vyhledávání. Co všechno se mění?

novinky v SEO podzim 2016

Seznam.cz: Jede na „steroidech“ a posílil význam kvality stránek

Koncem září 2016 uvedl Seznam.cz do provozu přes 1 000 nových serverů, díky nimž navýšil počet webových stránek v databázi svého robota o 2/3 (z původních 1,5 miliardy na 2,5 miliardy). Následně v akci „Steroidy“ naboostoval o 70 % (oproti roku 2012) i index, tedy databázi hledání. Při každém dotazu nyní hledání na Seznamu projde 1,2 miliardy stránek. Slibuje tak přesnější odpovědi na dotazy uživatelů. Zaměřuje se stále především na stránky v češtině.

  • TIP: Počet konkrétních stránek prohledávaných robotem na vaší doméně zjistíte prostřednictvím operátoru site.

Zvýšila se také rychlost robotů. Když na svých stránkách něco změníte, Seznam.cz na to přijde v průměru do 2 dnů. Tedy o 50 % rychleji než dřív. Výsledky vyhledávání by tak měly být i aktuálnější.

17. 10.: Posílení významu kvality stránek ve výsledcích vyhledávání

Po aktualizaci vyhledávacího algoritmu zvané „Page Quality“ by se weby s kvalitnějším obsahem ve výsledcích vyhledávání měly posunout výš. Podle informací Seznamu narostla kvalita výsledků v SERPu zhruba o 9 %. U 50 % dotazů díky tomu došlo ke změně na prvních 3 pozicích. Skóre kvality ovlivňuje dosažitelnost, přehlednost, organizovanost, originalita a odbornost obsahu, ale i pověst webu jako takového.

23. 11.: Nové signály v relevanci

Relevance tvoří spolu s kvalitou 2 nejvýznamnější kritéria pro řazení výsledků v SERPu. Zatímco kvalita obsahu se posuzuje bez ohledu na vyhledávací dotaz, relevance naopak vychází ze schopnosti stránky daný dotaz zodpovědět.

Nově Seznam.cz přidal 15 nových signálů, podle nichž relevanci posuzuje. V blogpostu vyhledavani.sblog.cz však Dušan Janovský prozrazuje pouze 1 hodnotící pomůcku – tzv. entropii textu (nahodilost rozložení slov). Podle 404m.com tak nové signály relevance pouze přidělují stránku různým metodám dalšího hodnocení. Zatím je těžké posoudit praktické dopady této změny. Důležité zůstává zachovat kvalitu obsahu i odkazů (externích i interních), které na něj směřují.

Graf pozic Collabimu k 15. 12.

Zdroj: Graf Collabimu k 15. 12.

Kam Seznam.cz směřuje?

100milionová investice do serverů a dalších novinek předznamenává velké změny. O tom, kam Seznam.cz směřuje, si na setkání SEOloger povídal se specialisty přímo Dušan Janovský, „duchovní otec“ českého fulltextu. Naznačil následující priority Seznamu pro příští rok:

  • Mobilní vyhledávání – byť Seznam.cz zatím nechystá vlastní mobilní algoritmus jako Google.
  • Přímé výsledky – otevírací doby a další podobné informace brzy najdeme přímo ve fulltextu. V SERPu sice zůstane prostor pro 10 výsledků, ale o pozornost uživatele budou bojovat i další prvky.
  • Seznam Webmaster Tools – spustí se minimalistické rozhraní pro komunikaci webmasterů přímo se Seznamem.

Více informací o směřování Seznamu najdete například v článku Jardy Vidíma z eVisions.

Google: Penguin pevnou součástí algoritmu a připravovaný mobilní index

23. září 2016 Garry Illyes na oficiálním blogu Google oznámil, že se anti-spamový signál Penguin celosvětově stává pevnou součástí hlavního algoritmu (stejně jako aktualizace Panda). Žádný Penguin 5.0 tedy už nebude, změny se budou dít průběžně a v reálném čase.

23. 9. – 13. 10. Roll-out Penguin 4.0

I poslední Penguin se zaměřuje na odkazové portfolio a (ne)dodržování návodu pro správce webů, zejména doporučení pro tvorbu odkazů. Penguin nově za nekvalitní odkazy nepenalizuje celý web, ale pouze jednotlivé stránky (tzv. granular penalty). Při posuzování odkazu nehledí jen na zdrojovou URL, ale celkovou kvalitu dané domény.

Aktualizace Penguina v reálném čase znamená riziko rychlejší penalizace, pokud uděláte při linkbuildingu chybu. Na druhou stranu, po vyřešení problému by mělo stačit nové projití robotem (tzv. re-crawling) nebo re-indexace (uložení změny na stránce do databáze).

13. 10. Plánované rozdělení indexu na mobilní a desktopový

Zhruba od půlky října se objevují informace, že Google spustí v průběhu několika měsíců vlastní mobilní index. Ten se dokonce má stát primárním před desktopovým. Jak přesně to bude vypadat, zatím těžko odhadovat. Spekuluje se o tom, že mobilní index bude aktuálnější, zaměřený na více na zprávy a dění v reálném čase.

Další střípky z Google, které by vám rozhodně neměly uniknout:

  • 11. proběhl hangout českých specialistů právě s Johnem ze švýcarského Google. Zodpověděl řadu technických dotazů i otázky na aktuální priority Google. Přečtěte si přepis toho nejzajímavějšího, nebo se podívejte na celý záznam.

A jaké novinky zaujaly letos na podzim vás? Budeme rádi za každé doplnění.

Xenu, pomocník pro technické SEO

V následujících několika článcích předvedu komplexní SEO analýzu webu Kasa.cz. Předem avizuji, že pro Kasu nepracuji a nemám s nimi nic společného. Jedná se o obrovský e-shop, proto se soustředím primárně na sekci Televize audio video.

V dnešní části seriálu se zaměřím výhradně na technický rozbor webu pomocí Xenu.

Příprava dat

Nástroj Xenu Link Sleuth spouštím jako první při SEO analýze nového webu. Pomůže odhalit především:

  • Duplicitní stránky webu,
  • stránky s nevhodnými nebo chybějícími titulky,
  • nevhodná přesměrování a neexistující stránky.

Analýzu spouštím se zapnutými volbami:

  • Check external links – Zkontrolujte si, jestli neodkazujete na neexistující stránky.
  • Treat redirections as errors – Pomůže tak odhalit nevhodná přesměrování na webu.

Po spuštění začne Xenu procházet všechny stránky analyzovaného webu. Analýza může v závislosti na počtu stránek webu trvat i několik hodin. Pokud stáhne více než 80 000 stránek, je vhodné ho ručně zastavit. Při větším množství stránek totiž většinou nic nového nezjistíte, jen vám bude zpracování dat trvat mnohem déle.

Po dokončení si seznam stránek z Xenu vyexportujeme do csv (File -> Export to TAB separated file). Následně jej naimportujeme do Excelu pomocí Data -> Z textu (verze 2007). Nyní začneme s filtrováním stránek. Vybereme názvy sloupečků a přidáme filtrovátka pomocí Data -> Filtr.

Neexistující stránky a přesměrování

Pomocí filtru vybereme stránky se statusem jiným než 200.

Projdeme stránky podivnými status kódy (např. 12017, 12030). Většinou v nich nic důležitého není, takže je odstraníme.

Nyní zkontrolujeme všechny neexistují nebo jinak problematické stránky (status 404, 403). Objevíme tak nefungující sitemapu na http://www.kasa.cz/sitemap/ a několik dalších neexistujících stránek, na které vedou interní odkazy. Po kontrole je opět smažeme.

Nezapomeňme na přesměrované stránky (status 301/302). Pokud by jich na webu bylo větší množství, je asi něco špatně. Interní odkazy na webu by měly vést v ideálním případě vždy na nové URL, ne na staré, které se přesměrovává. Po kontrole mažeme.

Soustřeďme se teď pouze na klasické HTML stránky (type = text/html). Všechny ostatní pomocí filtru opět smažeme. Více jak 80 000 stránek na začátku jsme tak omezili na „rozumnějších“ 37 000.

Hledáme další chyby

Stránky si seřadíme abecedně podle titulku a hledáme podobnosti. Vyzkoušejte také zvýraznění duplicitních titulků pomocí Domů -> Podmíněné formátování -> Zvýraznit pravidla buněk -> Duplicitní hodnoty.

Zjistíme například následující:

Kasa má speciální stránky pro fotografie (např. http://www.kasa.cz/display-photo/1007000.jpg). I když je přípona souboru .jpg, jedná se o HTML stránku. Ta je zcela zbytečná a nutí návštěvníka odcházet z hlavní stránky produktu.

Titulek kategorie LCD Televizory -> Finlux -> 15-22″ by měl být např. LCD Televizory Finlux 15-22 | Kasa.cz. Ne Finlux – 15-22 – LCD televizory | Televizory, DVD přehrávače, Panasonic Sony Pioneer Hyundai LG Thomson na splátky | KASA.cz. Proč jsou v titulku DVD přehrávače a ostatní nerelevantní slova? Jeho délka by navíc měla být maximálně poloviční, jinak nebude ve výsledcích vyhledávání zobrazen celý.

Jedna stránka je k dispozici na více URL, ale má stále stejný obsah:

  • http://www.kasa.cz/televize-audio-video/obchod/10164/15-22/?view=0&sort=1&page=0
  • http://www.kasa.cz/televize-audio-video/obchod/10164/15-22/?view=0&sort=2&page=0
  • http://www.kasa.cz/televize-audio-video/obchod/10164/15-22/?view=1&sort=1&page=0

Tento problém by v ideálním případě měl být vyřešen pomocí Canonical.

URL http://www.kasa.cz/televize-audio-video (bez lomítka na konci) se nepřesměrovává na http://www.kasa.cz/televize-audio-video/, takže opět mohou vznikat duplicity a síla zpětných odkazů se může tříštit mezi obě stránky.

Mnoho stránek na webu je duplicitních díky parametru session, což je přímo školácká chyba.

Pokračování příště

Xenu je bezesporu výborným nástrojem pro technickou analýzu webu nejen pro účely SEO. Pokud jste ho doposud neznali, určitě ho vyzkoušejte.

V příštím díle budu analyzovat další technické aspekty webu Kasa.cz jako soubor robots.txt, chybové stránky nebo sitemapu. Pokud se vám dnešní článek líbil, pošlete ho na Twitter nebo Facebook pomocí odkazů níže.