SEO presmerovanie pri migrácii webu bez prístupu do pôvodnej Google Search Console

SEO presmerovanie pri migrácii webu bez prístupu do pôvodnej Google Search Console

SEO presmerovanie pri migrácii webu bez prístupu do pôvodnej Google Search Console 1920 1080 Maroš Vavro

Migrácia webu patrí medzi projekty, ktoré sa zvyknú skomplikovať práve vtedy, keď vstupné podmienky nie sú ideálne. Tento článok zdieľa konkrétne skúsenosti z jedného klientského projektu. Situácia na začiatku bola nepríjemná: stará doména, nulový prístup do Google Search Console, Google indexuje stovky URL a štruktúra nového webu sa kompletne zmenila oproti pôvodnej. Na starý server prístup nebol. Žiadny export a prístup do databázy, žiadna mapa URL. Článok popisuje, ako sa s tým pracovalo, kde sa stratil čas zbytočne a čo by pri podobnom projekte ušetrilo hodiny práce hneď od začiatku.

Presmerovanie, konkrétne 301 redirecty, sú pri každej migrácii webu kľúčovým krokom pre SEO (optimalizácia pre vyhľadávače). Keď URL zmení adresu bez platného presmerovania, Google tú stránku zaindexuje ako chybu 404 a akumulovaná autorita z odkazov sa stratí. Pri webe so stovkami indexovaných URL to nie je detail. Je to priamy, merateľný dopad na organickú návštevnosť.

Migrácia s prázdnymi rukami: nulový prístup, stovky indexovaných stránok a zmenená štruktúra webu

Diagram1

Situácia na začiatku projektu je typická pre prípady, keď klient preberá web od predchádzajúcej agentúry bez riadneho odovzdania prístupov. Na vstupe chýbalo všetko:

  • Google Search Console nebol overený na novom vlastníkovi domény
  • Starý server bol nedostupný
  • Prístup k FTP ani databáze neexistoval

Google pritom stiahol a zaindexoval stovky URL zo starej štruktúry webu. Nový web mal inú URL hierarchiu: nové kategórie, premenované produktové stránky, zlúčené sekcie. Keby sa presmerovanie vynechalo alebo urobilo len čiastočne, Google by po spustení nového webu narazil na masívnu vlnu 404 chýb. Organická návštevnosť by výrazne klesla a obnovenie stratených pozícií by trvalo mesiace, nie týždne.

Ručné mapovanie stoviek URL nie je pri bežnom projektovom rozpočte reálna možnosť. Keby sa každá URL zadávala manuálne, práca by zabrala desiatky hodín len pri zbere dát. Bol potrebný iný prístup. Riešením sa stal Python skript, ktorý celý proces automatizoval a zvládol v zlomku pôvodného času.

Wayback Machine ako jediný dostupný zdroj historickej URL štruktúry

Wayback Machine je archív internetu prevádzkovaný organizáciou Internet Archive na adrese web.archive.org. Uchováva historické snímky webových stránok od roku 1996. Pre účely mapovania presmerovaní je zaujímavé CDX API, cez ktoré sa dá programovo získať zoznam všetkých URL zachytených pre konkrétnu doménu.

Tento prístup nevyžaduje žiadny API kľúč ani platený účet. Funguje výlučne cez verejne dostupné dáta, čo z neho robí riešenie dostupné bez ohľadu na rozpočet projektu. CDX API vracia URL filtrovateľné podľa stavového kódu HTTP, podľa časového obdobia aj podľa typu obsahu. Pre migráciu sú kľúčové URL so stavovým kódom 200, teda stránky, ktoré boli v minulosti reálne dostupné a mohli byť zaindexované Googlom.

Výhodou tohto prístupu je nezávislosť od akéhokoľvek externého spolupracovníka:

  • Nie je potrebné, aby predchádzajúca agentúra odovzdala dáta
  • Nie je potrebný prístup na server ani FTP
  • Nie je potrebný export zo Search Console

Všetky tieto vstupy sú samozrejme ideálne, keď sú k dispozícii. V praxi na ne ale nemožno vždy spoliehať, čo potvrdil aj tento projekt. Jednou z nevýhod Wayback Machine je, že nezachytáva úplne každú URL, ktorá kedy existovala. Niektoré stránky mohli byť zaindexované Googlom, ale archív ich nikdy nenavštívil. Práve preto skript pred spustením webu tvorí len prvú líniu obrany a 404 monitor po spustení sa stáva nevyhnutnou súčasťou celého procesu.

Python skript cez CDX API: od historických URL ku CSV pripravenému na import

Visual code1

Skript bol napísaný s pomocou Claude AI a pracuje v troch logických krokoch:

  • Krok 1: Pripojí sa na CDX API Wayback Machine a stiahne zoznam všetkých zachytených URL pre zadanú doménu. Filtruje výlučne URL so stavovým kódom 200, čím sa odstránia historické presmerovania a stránky, ktoré nikdy nefungovali správne.
  • Krok 2: Porovná historické URL s aktuálnym zoznamom URL nového webu. Nový web možno prehľadať jednoduchým crawlom alebo ručne pripraveným zoznamom exportovaným zo sitemaps. Skript hľadá zhody na základe štruktúry URL, slug segmentov a kľúčových slov v adresách.
  • Krok 3: Vygeneruje CSV súbor s dvomi základnými stĺpcami: zdrojová URL (stará adresa) a cieľová URL (nová adresa). Výsledný súbor je pripravený na priamy import do nástroja na správu presmerovaní.

Celý proces od spustenia skriptu po výsledný CSV trvá minúty, nie hodiny. Pri jednoduchších weboch, kde nová štruktúra URL kopíruje logiku starej, skript dokáže automaticky spárovať väčšinu adries. Pri komplexnejších prípadoch, kde sa kategórie premenovali alebo produkty zlúčili do nových celkov, je nevyhnutná manuálna kontrola výsledného CSV a doplnenie chýbajúcich párov. Aj tak je to výrazne rýchlejšie ako začínať od nuly. Skript je uverejnený na GitHub repozitári vrátane podrobného návodu, ktorý zahŕňa inštaláciu závislostí a nastavenie prostredia vo VS Code. Návod je napísaný tak, aby ho zvládol aj niekto, kto Python bežne nepoužíva a stretol sa s ním prvýkrát.

Pro verzia s Tavily a Gemini API: keď ručné mapovanie prestáva byť únosné

Visual code2

Základná verzia skriptu funguje spoľahlivo, ale má limit. Pri webe s tromi desiatkami URL sa manuálna kontrola CSV zvládne za hodinu. Pri webe s päťsto URL, kde sa logika kategorizácie kompletne zmenila, je to celkom iná situácia. Práve táto skúsenosť viedla k vytvoreniu rozšírenej, pro verzie skriptu.

Pro verzia pracuje s dvomi externými službami:

  • Tavily je vyhľadávací nástroj navrhnutý pre AI agentov. Pre každú starú URL vie zistiť sémantický obsah zodpovedajúcej novej stránky.
  • Gemini API je jazykový model od Google, ktorý na základe porovnania obsahu starej a novej stránky navrhne konkrétne mapovanie.

Každý riadok vo výslednom CSV dostane okrem URL páru aj hodnotenie miery istoty, tzv. confidence score, vyjadrené ako číslo od 0 do 100. Riadky s hodnotou 90 a viac možno schváliť skupinovo bez hlbokej revízie. Riadky s hodnotou pod 60 si vyžiadajú manuálne overenie. Výsledkom je, že celková revízia CSV zaberá výrazne menej času ako pri základnej verzii. Pro verzia vznikla ako priama reakcia na skúsenosť z projektu, kde ručné mapovanie pri väčšom webe zabralo neúmerne veľa hodín. Základná verzia bola funkčná, ale pri škálovaní na väčší počet URL nestačila.

Rank Math FREE a import presmerovaní: funkcia, ktorú tam jednoducho nenájdete

Rankamath Free

Rankamath Free

Tu sa stratilo niekoľko hodín zbytočne. Rank Math je populárny SEO plugin pre WordPress, ktorý má aj vlastný modul na správu presmerovaní. Logika bola priamočiara: vygenerovať CSV, naimportovať ho do Rank Math, hotovo.

Problém je v tom, že import presmerovaní cez CSV je výlučne funkcia Rank Math Pro. Bezplatná verzia tento import nepodporuje vôbec. Pri pokuse nájsť tlačidlo importu v bezplatnej verzii nenájdete nič. Žiadnu chybovú hlášku. Žiadne upozornenie, že funkcia neexistuje. Jednoducho nič, na čo by bolo možné kliknúť.

Toto nie je kritika produktu ako takého. Je to fakt, ktorý nie je dostatočne viditeľne zdokumentovaný na miestach, kde ho vývojári hľadajú. Skúšate iný formát CSV, iné poradie stĺpcov, rôzne nastavenia. Výsledok je vždy rovnaký, pretože funkcia v bezplatnej verzii jednoducho neexistuje. Overenie, či požadovaná funkcia existuje v bezplatnej verzii nástroja, by malo byť prvým krokom ešte pred výberom pracovného postupu. Pri tomto projekte to tak nebolo.

Plugin Redirection: bezplatné riešenie, ktoré funguje od prvého kliknutia

Plugin Redirection od autora Johna Godleyho je dostupný zadarmo priamo vo WordPress repozitári a pokrýva správu presmerovaní kompletne vrátane importu CSV. Inštalácia prebehne štandardne cez menu Pluginy v administrácii WordPress. Po aktivácii sa v menu Nástroje objaví položka Redirection. Import CSV funguje cez záložku Import/Export. Po nahratí súboru plugin automaticky rozpozná stĺpce a priradí zdrojové a cieľové URL bez potreby ručného namapovania polí. Celý proces od inštalácie po dokončený import trval menej ako pätnásť minút.

Z pohľadu bežného projektu je to plnohodnotné riešenie bez nutnosti plateného predplatného. Pri projekte s väčším rozpočtom, kde je Rank Math Pro súčasťou zásobníka nástrojov, je logickejšie mať správu presmerovaní na jednom mieste. Ak platená verzia nie je k dispozícii, Redirection plugin je priamočiara alternatíva, ktorá funguje bez kompromisov. Dôležitým krokom po importe je overenie, že redirecty skutočne fungujú. Na rýchle manuálne testovanie stačí niekoľko vzorových URL priamo v prehliadači. Na hromadnú kontrolu stavových kódov je vhodný nástroj ako Screaming Frog SEO Spider alebo online redirect checker pre menšie weby.

404 monitor po spustení webu: systematické dolaďovanie toho, čo skript nestihol pokryť

Wayback Machine nezachytáva každú URL, ktorá kedy existovala. Niektoré stránky mohli byť zaindexované Googlom, ale archív ich nikdy nenavštívil. Ďalšie URL vznikli z parametrických odkazov, zo starých e-mailových kampaní, z interných vyhľadávacích dotazov alebo zo stránok generovaných dynamicky. Pre všetky tieto prípady existuje riešenie, ktoré funguje priamo v reálnej prevádzke.

Rank Math FREE má jednu oblasť, kde je skutočne užitočný aj bez Pro verzie: 404 monitor. Nájdete ho v sekcii General Settings pod záložkou 404 Monitor. Po aktivácii začne plugin zaznamenávať každú požiadavku, ktorá na webe skončí chybou 404. Zaznamenáva URL, čas požiadavky, zdroj návštevníka aj informáciu o tom, či požiadavku generoval Google Bot alebo reálny návštevník.

Po týždni až dvoch bežnej prevádzky je výsledok cenný. V zozname sa objavujú URL, na ktoré prichádzajú návštevníci zo starých záložiek, starých odkazov z iných webov alebo zo stránok, kde je stále uvedená pôvodná adresa. Postup pri spracovaní záznamu je jednoduchý:

  • Otvoriť záznam 404 monitora po týždni prevádzky
  • Identifikovať URL, ktoré sa opakujú alebo prichádzajú od Google Bota
  • Každú chýbajúcu URL doplniť do zoznamu presmerovaní s odkazom na najbližšiu relevantnú stránku nového webu
  • Opakovať kontrolu každé dva týždne v prvých dvoch mesiacoch po spustení

Mapa presmerovaní sa takto systematicky dolaďuje v reálnej prevádzke namiesto jednorazového prístupu pred spustením. Kombinácia skriptu pred spustením a 404 monitora po spustení tvorí spoľahlivý dvojkrokový postup, ktorý pokryje väčšinu prípadov bez plateného nástroja.

Záverečné zhodnotenie projektu a osobný pohľad

Čo fungovalo a čo by bolo zopakované

Wayback Machine cez CDX API bol spoľahlivý zdroj dát a bez neho by mapovanie URL za daných podmienok vôbec nebolo realizovateľné. Prístup cez verejne dostupné dáta bez API kľúčov fungoval bez problémov. Rovnaký postup by bol použitý pri každej ďalšej migrácii, kde chýba prístup do GSC alebo na pôvodný server. Kombinácia základného skriptu a pluginu Redirection sa osvedčila ako plnohodnotné riešenie bez závislosti na platenom softvéri. Inštalácia, import a overenie trvali dohromady menej ako hodinu, čo je výrazne menej, ako by zabralo ručné zadávanie presmerovaní pri rovnakom počte URL.

Postup s 404 monitorom po spustení webu sa stal štandardnou súčasťou každého nasledujúceho migračného projektu. Nie ako záchranná sieť pre prípad zlyhania, ale ako plánovaný krok, ktorý dopĺňa predspustačnú prípravu a uzatvára celý proces. Najväčšia zbytočná strata času pri tomto projekte vznikla pri Rank Math FREE. Overenie funkcií bezplatnej verzie pred začatím práce je triviálny krok, ktorý jeden pohľad do changelog stránky alebo porovnávacej tabuľky verzií ukáže okamžite.

Pri tomto projekte sa tento krok preskočil a výsledkom bolo zbytočné hľadanie chyby, ktorá neexistovala. Odporúčanie je jednoduché: pred výberom nástroja overiť, či konkrétna funkcia existuje v dostupnej verzii, nielen to, či ju produkt celkovo ponúka.

Pro verzia skriptu s Tavily a Gemini API potrebuje ďalšie testovanie na väčšom objeme dát. Výsledky pri pilotnom použití boli sľubné, ale confidence score si vyžaduje kalibráciu pri rôznych typoch webov a odvetviach. Plánuje sa testovanie na ďalších migráciách a zverejnenie porovnania presnosti mapovania medzi základnou a pro verziou priamo na GitHub repozitári. Plánuje sa tiež rozšírenie skriptu o variant pre situácie, kde Wayback Machine nemá dostatočné pokrytie danej domény. V takýchto prípadoch môže ako vstupný zdroj slúžiť exportovaný crawl zo Screaming Frog zo starej domény alebo archívna sitemap. Obe možnosti sú technicky realizovateľné bez väčších úprav jadra skriptu.

Maroš Vavro

Špecializujem sa na správu sociálnych sietí, tvorbu obsahových stránok, online projekty a SEO optimalizáciu, s dôrazom na tvorbu webstránok v WordPress.

Prečítajte si aj ďalšie články od autora - Maroš Vavro