jak działa Google

Jak działa wyszukiwarka Google w 2026 – crawling, ranking, AI Overviews

Zrozumienie, jak działa Google, to punkt wyjścia do każdej decyzji SEO. W 2026 roku wyszukiwarka to już nie tylko 10 niebieskich linków – to potok trzech procesów (crawling, indeksowanie, ranking) plus warstwa AI Overviews generowana przez Gemini. Każda z tych warstw ma własne reguły, ale wszystkie startują z tego samego crawla.

Ten artykuł rozkłada mechanikę Google na czynniki pierwsze: od momentu, kiedy Googlebot trafia na Wasz URL, aż po pojawienie się strony w odpowiedzi AI. Bez mitów, z konkretnymi liczbami i tym, co z każdego etapu wynika dla pozycjonowania. Całość osadzamy w kontekście przewodnika po SEO podstawy, który porządkuje wszystkie tematy klastra.

W skrócie

  • Google = 3 etapy: crawling (robot odwiedza URL), indeksowanie (treść trafia do bazy), ranking (algorytm porządkuje wyniki pod zapytanie).
  • Googlebot ma ograniczony crawl budget – decyduje, co odwiedzić na podstawie autorytetu i jakości.
  • Rendering JavaScript dzieje się w drugiej fali (osobny proces po pierwszym crawlu).
  • AI Overviews to warstwa Gemini ponad SERP – cytuje 3-10 źródeł z top 10 i wybiera treści gęste w fakty.
  • Algorytm rankingu to zestaw systemów (BERT, MUM, RankBrain, SpamBrain, Helpful Content System) działających równolegle.

Jak działa Google – trzy etapy, które musicie znać

Google funkcjonuje jako trzy niezależne, ale połączone systemy: crawler, indexer i ranking engine. Każdy z nich ma własne budżety, własne logi błędów i własne pułapki. Strona może wypaść na dowolnym etapie – i jeśli nie wiecie, na którym, nie naprawicie problemu.

Crawler (Googlebot) to zautomatyzowany klient HTTP. Odwiedza URL-e znane ze sitemapy, z linków zewnętrznych i z linków wewnętrznych. Zapisuje odpowiedź (HTML, nagłówki, status) i przekazuje dalej. Nie ocenia jakości – tylko zbiera.

Indexer analizuje pobraną treść: renderuje JavaScript, wyciąga tekst, metadane, schema, linki. Decyduje, czy strona trafi do indeksu (bazy wszystkich znanych dokumentów). Strona może być scrawlowana, ale niezaindeksowana – to najczęstszy problem w 2026.

Ranking engine uruchamia się dopiero, gdy użytkownik wpisuje zapytanie. Z indeksu wybiera dokumenty dopasowane do intencji, ustawia je w kolejności według setek sygnałów i generuje SERP (czasami z AI Overview, z featured snippet, z mapą). Ten etap jest w pełni dynamiczny – ten sam URL może być 3 w poniedziałek i 11 w czwartek.

Crawling – jak Googlebot trafia na Waszą stronę

Googlebot to user agent Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) plus warianty (smartphone, image, video, AdsBot). W 2026 Google crawluje głównie mobilną wersję strony (mobile-first indexing od 2019), ale dla starszych domen są jeszcze wyjątki.

Jak Googlebot odkrywa URL:

  1. Sitemap XML – podana w robots.txt albo w Search Console.
  2. Wewnętrzne linki – z innych stron tej samej domeny.
  3. Zewnętrzne linki – z innych domen (najsilniejszy sygnał odkrycia).
  4. Zgłoszenie w URL Inspection – ręczna prośba o crawl w GSC.
  5. Kanały RSS i aktualizacje w CMS – automatycznie pingują Google.

Kiedy Googlebot odwiedza URL, oczekuje statusu 200 OK (zindeksuj), 301/302 (przekieruj), 404/410 (nie ma strony) albo 5xx (błąd serwera – spróbuj później). Status 503 przez 24-48 godzin sygnalizuje „prace konserwacyjne” i Google nie dewaluuje strony. Dłużej niż 48 godzin = ryzyko spadku.

Crawl budget – jak działa w praktyce

Crawl budget to liczba żądań, które Googlebot jest skłonny wykonać na Waszej domenie w jednostce czasu. Zależy od dwóch zmiennych: crawl rate limit (żeby nie przeciążyć serwera) i crawl demand (jak Google chce tę stronę odwiedzać).

Dla bloga z 200 artykułami typowy budżet to 50-300 żądań/dobę. Dla dużego portalu – 5000-50000. Mały sklep e-commerce z 2000 produktów ma 500-2000. Liczby są widoczne w Search Console > Ustawienia > Statystyki indeksowania.

Co pożera crawl budget na niekorzyść: tagi i filtry indeksowane przez pomyłkę, paginacja bez wartości SEO, masowe 404, wolny serwer, łańcuchy redirectów. Czyszcząc to, można zwiększyć crawl budget dla ważnych stron o 2-4x.

Renderowanie JavaScript – dlaczego czasem trwa tygodniami

Google renderuje JS w drugiej fali. Najpierw crawler pobiera surowy HTML, zapisuje i przekazuje do kolejki renderingu. Rendering odbywa się headless Chromium (Chrome 120+ w 2026), wymaga czasu i zasobów. Dlatego JS-owe strony czasem są indeksowane z opóźnieniem.

Dla SPA (Next.js bez SSR, React, Vue) oznacza to: treść, która pojawia się tylko po renderze JS, może być niewidoczna przez pierwsze 7-30 dni. Rozwiązaniem jest Server-Side Rendering albo pre-rendering – wtedy pierwszy pass crawlera widzi pełny HTML.

Kompletny przegląd mechaniki crawlowania i indeksowania znajdziecie w artykule crawlowanie i indeksowanie – co musi wiedzieć każdy początkujący SEO. Tam pokazujemy, jak czytać logi serwera pod kątem Googlebota i jak odróżnić problemy crawlowania od problemów indeksowania.

Indeksowanie – czemu zindeksowana strona to nie wszystko

Indeksowanie to dodanie strony do bazy danych Google. Warunek minimum: crawl się udał, strona nie ma noindex, canonical wskazuje na siebie (lub na podobną stronę z tej samej grupy), treść przechodzi próg jakości.

W 2026 Google coraz ostrzej filtruje indeksowanie. Raport „Indeksowanie stron” w Search Console pokazuje pięć głównych statusów:

Status Co znaczy Jak reagować
Zindeksowana Strona jest w bazie Google Monitoruj impresje i pozycje
Crawled – currently not indexed Google odwiedził, ale uznał za zbyt słabą Popraw jakość, rozbuduj treść, dodaj linki
Discovered – currently not indexed Google wie o URL, ale go nie odwiedził Zgłoś w URL Inspection, sprawdź crawl budget
Duplicate without user-selected canonical Treść duplikuje się z inną stroną Ustaw canonical lub scal strony
Blocked by robots.txt Robots.txt blokuje crawler Sprawdź robots.txt, odblokuj ważne strony

„Crawled – currently not indexed” to status, który masowo pojawił się w 2023-2024 na małych blogach. To sygnał, że Google uznał treść za zbyt słabą – nie za brak techniczny. Naprawa to nie sitemapa, tylko rozbudowa artykułu o dowody, dane, autora, linkowanie.

Canonical – dlaczego tyle stron znika bez kary

Tag <link rel="canonical"> mówi Google, która wersja strony jest „tą właściwą”. Google traktuje canonical jako sugestię, nie rozkaz – może wybrać inną wersję, jeśli jego algorytm uważa ją za lepszą.

Przykład: w sklepie macie 10 wariantów produktu (rozmiary, kolory). Ustawiacie canonical wszystkich wariantów na stronę główną produktu. Google indeksuje tylko wersję główną, 9 wariantów jest „wchłoniętych”. To nie jest błąd – to zamierzone działanie. Ale jeśli canonical jest zepsuty (wskazuje na homepage zamiast na produkt), tracicie 9 z 10 stron.

Algorytm rankingu – co naprawdę decyduje o kolejności

Ranking w Google to wynik pracy setek algorytmów, które oceniają każdy dokument z indeksu pod kątem dopasowania do konkretnego zapytania. W 2026 najważniejsze systemy to:

  • Helpful Content System – ocenia ogólną wartość strony i witryny.
  • BERT (2019) i MUM (2021) – rozumienie języka naturalnego.
  • RankBrain (2015) – dopasowanie intencji do wyniku.
  • SpamBrain (2018, aktywny od 2022) – wykrywanie spamu.
  • Reviews System (2021) – ocena artykułów recenzenckich.
  • Core Web Vitals – sygnał jakości doświadczenia.
  • PageRank – autorytet oparty na linkach (wciąż działa, mimo odejścia od „PR Score”).

Żaden z tych systemów nie dominuje. Przy zapytaniu „najlepszy smartfon 2026” dominuje Reviews System i HCS. Przy „jak zrobić omlet” – BERT i PageRank. Przy „kup iphone” – Product Knowledge Graph i Shopping Graph. Szczegółowy przegląd każdego algorytmu rozkładamy w tekście algorytmy Google 2026 w praktyce.

Ranking signals – ile ich naprawdę jest

Google od dawna podaje „ponad 200 sygnałów”. Liczba jest marketingowa, realna to raczej 300-400 mniejszych sygnałów zagregowanych w 10-15 głównych obszarach:

  1. Trafność treści (BERT, MUM, embedding semantyczny).
  2. Autorytet domeny i strony (PageRank, Trust Flow).
  3. User experience (Core Web Vitals, HTTPS, mobile).
  4. Świeżość (freshness dla wrażliwych zapytań).
  5. Lokalizacja (IP, GPS, historia lokalna).
  6. Historia kliknięć i CTR (nie potwierdzony wprost, ale obserwowany).
  7. E-E-A-T (ocena raterska, przekładana na algorytm).
  8. Schema.org (zrozumienie intencji strony).
  9. Linki wewnętrzne (rozkład PageRank).
  10. Czynniki negatywne (spam, cloaking, hacked content).

AI Overviews – najważniejsza zmiana od 2004 roku

AI Overviews (wcześniej Search Generative Experience, SGE) to blok generowany przez Gemini, który pojawia się ponad wynikami organicznymi. W 2026 widoczny jest w 35-45% zapytań informacyjnych w USA i 10-20% w Polsce (wzrost ciągły).

Mechanika AI Overviews:

  1. Użytkownik wpisuje zapytanie informacyjne (zwykle „jak”, „co to”, „czy”, „ile”).
  2. Google uruchamia ranking tradycyjny i pobiera top 10 dokumentów.
  3. Gemini generuje odpowiedź na podstawie treści top 10 + własnej wiedzy.
  4. Odpowiedź zawiera cytowania (3-10 linków) do źródeł użytych w generacji.
  5. Użytkownik widzi blok AI Overview + organic pod nim.

Cytowane źródła to te, z których Gemini „wyciągnął” konkretne fakty. Nie muszą być na pozycji 1 – mogą być na 6 lub 8. Decyduje jakość struktury (krótkie akapity, tabele, FAQ) i gęstość faktów. Artykuł z 200 konkretnymi liczbami ma większe szanse niż artykuł z 5000 słów ogólników.

Jak się pojawić w AI Overview

Techniki, które realnie zwiększają prawdopodobieństwo cytowania:

  • Odpowiadaj na pytania w 40-80 słowach tuż pod nagłówkiem.
  • Używaj tabel dla porównań – AI wycina je bez zmian.
  • Listy numerowane dla procedur.
  • FAQ w details/summary – blok, który Gemini uwielbia.
  • Schema Article z autorem – wzmacnia wybór źródła.
  • Top 10 w organic – warunek wstępny (rzadko cytowane są strony z poza top 10).

Więcej o mechanice cytowań w modelach AI opisujemy w przewodniku o widoczności w AI. Tam pokazujemy też, jak mierzyć cytowania w Profound i AthenaHQ.

People Also Ask, Knowledge Panel, Featured Snippet

Poza AI Overview w SERP 2026 funkcjonuje kilka innych bloków wyróżnionych. Każdy z nich to okazja do „wyjścia” ponad konkurencję bez walki o pozycję #1.

People Also Ask (PAA)

Blok rozwijanych pytań uzupełniających. W 2026 pojawia się w 60-70% zapytań. Kliknięcie w PAA generuje więcej pytań – mechanizm „infinite scroll”. Jak się tam dostać: odpowiadajcie w tekście na pytania, które PAA zadaje. Zwykle odpowiedź 40-60 słów pod nagłówkiem H2 w formie pytania wystarcza.

Knowledge Panel

Panel po prawej stronie (lub na górze na mobile) z faktami o osobie, firmie, produkcie, filmie. Źródła: Wikipedia, Wikidata, Google Business Profile, schema Organization / Person. Jak się tam dostać: pełne wypełnienie GBP, strona O nas, schema Organization z sameAs do social media, Wikipedia jeśli zasadne.

Featured Snippet

„Pozycja zerowa” – fragment strony wyświetlony na górze SERP. W 2026 ustępuje miejsca AI Overview, ale wciąż pojawia się w 15-25% zapytań. Jak zdobyć: odpowiadajcie bezpośrednio na pytanie w 40-60 słowach w akapicie, liście lub tabeli.

Bing, DuckDuckGo, Brave – czy warto?

Google ma w Polsce ~97% udziału w wyszukiwaniu desktop i mobile. Ale Bing odzyskał znaczenie dzięki partnerstwu z OpenAI – ChatGPT Search i Copilot używają indeksu Binga. W praktyce: pozycjonowanie w Bingu = pozycjonowanie w ChatGPT Search.

DuckDuckGo używa indeksu Binga z dodatkowymi filtrami prywatności. Brave Search buduje własny indeks (~40% stron). Oba razem mają ~3% rynku, ale generują ruch specyficzny (tech, security, privacy).

Praktyka 2026: zarejestrujcie stronę w Bing Webmaster Tools (za darmo), wgrajcie sitemapę, ustawcie IndexNow (Bing indeksuje w minutach). Reszta wyszukiwarek podąża za Google albo Bingiem automatycznie. Porównanie silników AI – jak dokładnie wybierają źródła – w tekście wyszukiwarki AI kontra klasyczne.

Core updates – duże aktualizacje, które trzęsą SERP

Core update to szeroka aktualizacja algorytmu rankingu. Google publikuje 3-6 core updates rocznie, każdy trwa 7-14 dni i dotyka 30-60% zapytań. Żadnego nie można „targetować” – to ocena ogólnej jakości witryny, nie konkretnych technik.

Typowy przebieg:

  1. Dzień 0 – Google ogłasza rollout core update.
  2. Dzień 1-3 – pierwsze wahania, widoczne w Search Console.
  3. Dzień 4-10 – szczyt ruchu (wzrosty i spadki), narzędzia do śledzenia (Semrush Sensor, Mozcast) pokazują „pomarańczowe” lub „czerwone” dni.
  4. Dzień 10-14 – stabilizacja.
  5. Dzień 14+ – analiza, strategia ratowania lub rozbudowy.

Co robić przy spadku po core update: nie panikujcie, nie róbcie masowych zmian przez 7 dni (czekacie na stabilizację). Następnie: audyt jakości treści, porównanie z konkurentami, którzy wygrali, planowa rozbudowa słabszych artykułów.

Narzędzia do monitorowania Google w 2026

Żeby zrozumieć, jak Google widzi Waszą stronę, potrzebujecie zestawu narzędzi. Minimum to:

Narzędzie Co pokazuje Koszt
Google Search Console Indeksacja, impresje, crawl 0 zł
Bing Webmaster Tools Indeksacja Bing + ChatGPT Search 0 zł
GA4 Ruch, konwersje, źródła 0 zł
PageSpeed Insights Core Web Vitals 0 zł
Rich Results Test Walidacja schema 0 zł
Mozcast / Semrush Sensor Wolatalność SERP (core updates) 0 zł / 149 zł
Screaming Frog (500 URL) Lokalny crawl 0 zł

Najczęstsze mity o Googlu w 2026

  • „Google karze za duplikaty” – nie karze, wybiera jedną wersję i ignoruje pozostałe.
  • „Strona w top 10 musi być długa” – liczy się dopasowanie do intencji, czasem 800 słów wystarcza.
  • „Keyword density wpływa na ranking” – od BERT nie wpływa.
  • „Linki nofollow są bezwartościowe” – Google od 2019 traktuje je jako „wskazówki”, mogą nadal dawać sygnał.
  • „Wystarczy dobry artykuł, Google sam znajdzie” – bez linków wewnętrznych i sitemapy czeka się tygodniami.
  • „SEO nie liczy się w erze AI” – AI Overviews cytuje źródła z top 10 organic, więc SEO jest warunkiem.

Co z tego wynika dla Waszego SEO

Zrozumienie mechaniki Google przekłada się bezpośrednio na decyzje operacyjne. Zamiast „pisać więcej” albo „kupić linki”, wiecie, co konkretnie zablokować, co zoptymalizować, gdzie jest wąskie gardło.

Cztery priorytety, które wynikają z tego artykułu:

  1. Najpierw techniczne fundamenty – sitemapa, robots.txt, kanoniczne, szybkość. Bez tego reszta nie liczy się. Szczegóły w technicznej liście kontrolnej.
  2. Potem jakość treści – Helpful Content System ocenia całą witrynę, więc jeden słaby dział psuje też dobre strony.
  3. Potem E-E-A-T i autorytet – biogramy, schema, linki. Rozbudowane w materiale o E-E-A-T.
  4. Na koniec AIO – kiedy fundamenty są, dostrajamy treść pod cytowania w modelach AI.

Dane z logów serwera – jak zobaczyć, kiedy Googlebot naprawdę przyszedł

Najbardziej wiarygodne dane o crawlowaniu znajdziecie nie w Search Console, a w logach serwera. Google Search Console pokazuje zagregowane statystyki, ale szczegóły (który URL, o której, jaki status, z którego Googlebota) ma tylko log dostępu Waszego hostingu.

Typowy wpis w logu Apache/Nginx dla Googlebota:

66.249.66.1 - - [20/Apr/2026:10:15:32 +0000] "GET /blog/seo-2026/ HTTP/1.1" 200 45678 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

Z tego wpisu wyciągniecie: IP (weryfikujcie reverse DNS – prawdziwe IP Googlebota należą do googlebot.com), URL, status (200 OK), rozmiar odpowiedzi (45678 bajtów), user agent. Narzędzia takie jak Screaming Frog Log File Analyser, Semrush Log File Analyzer albo ELK stack agregują te dane i pokazują wzorce: które URL Googlebot kocha, które ignoruje, gdzie generuje 404.

Co zobaczysz w logach po godzinie analizy

  1. URL, które Googlebot odwiedza najczęściej – często to homepage, kategoria główna, 2-3 rankingowe artykuły.
  2. URL, które Googlebot ignoruje – stare artykuły bez linków wewnętrznych, sieroty (orphan pages).
  3. URL zwracające 404 lub 5xx – pożeracze crawl budgetu.
  4. Crawl depth – jak głęboko Googlebot dociera w strukturę strony.
  5. Udział Googlebot-Smartphone vs Desktop – w 2026 powinno być 80%+ mobile.

Ewolucja algorytmu Google – od 1998 do 2026

Krótka linia czasu, która pomaga zrozumieć, skąd wzięły się obecne reguły:

  • 1998 – PageRank. Pierwotny algorytm oparty na linkach. Nadal aktywny w 2026, choć zmodyfikowany.
  • 2011 – Panda. Pierwsza duża walka z thin content i content farm. W 2016 wcielony do core algorithm.
  • 2012 – Penguin. Walka ze spamem linkowym. Wchłonięty w 2016.
  • 2013 – Hummingbird. Pierwsza przebudowa pod rozumienie semantyczne.
  • 2015 – RankBrain. Pierwszy element uczenia maszynowego w rankingu.
  • 2019 – BERT. Przetwarzanie języka naturalnego (20% zapytań od startu).
  • 2021 – MUM i Page Experience Update. Wielojęzyczne rozumienie + Core Web Vitals.
  • 2022 – Helpful Content System i SpamBrain V2. Walka z AI content.
  • 2023 – Reviews System rozbudowany, E-E-A-T formalny.
  • 2024 – Search Generative Experience (SGE) debutuje.
  • 2025 – AI Overviews wdrażane globalnie.
  • 2026 – Gemini Ultra zintegrowany z SERP, AI Overviews dla 40%+ zapytań.

Każdy kamień milowy przełożył się na konkretne zmiany taktyczne – nauczenie się historii pozwala rozpoznać wzorce przyszłych update’ów.

Search Console w 2026 – raporty, które czyta się codziennie

Search Console to najważniejsze narzędzie SEO. Jest darmowe, pochodzi bezpośrednio od Google i pokazuje dane, których nie ma żaden inny tool. Pięć raportów, które warto sprawdzać regularnie:

  1. Wyniki wyszukiwania – impresje, kliki, CTR, pozycja. Podstawa monitorowania.
  2. Indeksowanie stron – co Google zindeksował, co odrzucił i dlaczego.
  3. Statystyki indeksowania – crawl budget, czas odpowiedzi, statusy odpowiedzi.
  4. Core Web Vitals – LCP, INP, CLS dla mobile i desktop.
  5. Linki – backlinki, top linkujące domeny, wewnętrzne linki.

Raport Wyniki wyszukiwania pokazuje dane z 16 miesięcy wstecz. Eksportujcie do Looker Studio albo arkuszy Google co miesiąc, żeby mieć pełną historię (Google ogranicza do 16 miesięcy, potem dane znikają).

Sztuczka – filtr „średnia pozycja 4-10”

W Wynikach wyszukiwania filtrujcie po pozycji 4-10. Widzicie frazy, na które Google już Was pokazuje, ale klienta jeszcze nie ma. To najszybsze wygrane – drobna optymalizacja (tytuł, meta, wewnętrzny link z rankingującego artykułu) potrafi przesunąć pozycję z 6 na 2 w 14 dni.

Google a Waszy konkurencja – jak algorytm porównuje

Google nie ocenia strony w próżni. Każde zapytanie ma własny zestaw top 10, a strona rankuje wtedy, gdy jest „lepsza niż średnia z top 10” według setek sygnałów.

Dlatego strategia SEO to nie „osiągnąć próg X”, tylko „być lepszym od konkurentów na tę konkretną frazę”. Dla łatwych fraz (long-tail, małe wolumeny) wystarczy 2000 słów z autorem i kilkoma linkami. Dla trudnych („najlepsze narzędzia SEO”) potrzeba 8000 słów, 50+ linków, 20+ źródeł, własnych danych.

Narzędzia takie jak Surfer SEO, Clearscope, Frase pomagają w tej analizie – pokazują, jakie terminy, długość i strukturę mają top 10 na daną frazę. Nie są magicznymi wyrocznikami, ale dają punkt odniesienia.

Jak Google rozumie intencję – klasyfikacja zapytań

Wewnętrznie Google klasyfikuje każde zapytanie według dominującej intencji. Klasyfikacja jest dynamiczna (zmienia się w czasie i między regionami). Typowe klasy:

Klasa intencji Przykład Format SERP
Informacyjne „jak działa SEO” Artykuły, AI Overview, PAA
Nawigacyjne „allegro logowanie” Strona docelowa + sitelinks
Komercyjne „najlepsze laptopy 2026” Listicle, porównania, Reviews System
Transakcyjne „kup iphone 15” Shopping, karty produktów
Lokalne „restauracja wrocław” Mapa + 3-pack
Wizualne „stroje weselne 2026” Images + pins
Wideo „tutorial excel” YouTube + video carousel

Jeśli celujecie w słowo kluczowe, sprawdźcie, jaka dominująca intencja wygrywa SERP. Jeśli to intencja wizualna, a Wy piszecie 4000 słów tekstu – nie wygracie, niezależnie od jakości.

Shopping Graph i Knowledge Graph – drugie życie Google

Poza klasycznym indeksem Google utrzymuje dwie wyspecjalizowane bazy: Knowledge Graph (encje: osoby, miejsca, firmy, wydarzenia) i Shopping Graph (produkty, ceny, dostępność). Obie są coraz ważniejsze dla rankingu.

Knowledge Graph czerpie z Wikipedii, Wikidata, Google Business Profile, schemy Organization i Person. Kiedy Google wie, że „Jan Kowalski z Kancelarii X” to prawdziwa encja z LinkedIn, referencjami prasowymi i schema – artykuł jego autorstwa dostaje wyższe E-E-A-T.

Shopping Graph to baza produktów z cenami, recenzjami, dostępnością, obrazkami. Sklepy przekazują dane przez Merchant Center (feed produktowy) i schema Product. Dla e-commerce w 2026 to praktycznie warunek pokazania się w Shopping, Images i AI Overviews dla fraz transakcyjnych.

Google a prywatność użytkowników – co się zmieniło od 2023

Od 2023-2024 Google stopniowo wycofuje third-party cookies, wprowadza Topics API, wdraża Google Analytics 4 (bez IP w podstawowej konfiguracji). Dla SEO to dobra wiadomość: metryki z GA4 są bardziej „agregowane”, ale dane z Search Console pozostają nietknięte.

Consent Mode V2 (obowiązkowy w UE od 2024) wymaga od każdej strony poprawnego baneru cookie. Strona bez zgody pomija wiele eventów analitycznych – w rezultacie widzicie w GA4 20-40% ruchu mniej niż realnie jest. Search Console nie jest tym dotknięta.

FAQ – najczęstsze pytania o działanie Google

Jak często Googlebot odwiedza moją stronę?

Częstotliwość zależy od crawl budgetu. Małe blogi – raz na 3-7 dni na pojedynczy artykuł, homepage – codziennie. Duże portale – co godzinę lub częściej. Dokładne dane widzicie w Search Console > Statystyki indeksowania. Jeśli nowy artykuł nie jest odwiedzony w 48 godzin, zgłoście go ręcznie przez URL Inspection. Nie ma sensu sprawdzać 10 razy dziennie – Googlebot działa według własnego harmonogramu, a nadużywanie URL Inspection nie przyspiesza procesu.

Dlaczego moja strona jest „crawled – currently not indexed”?

Ten status oznacza, że Google odwiedził stronę, ale uznał ją za zbyt słabą, żeby dodać do indeksu. Najczęstsze przyczyny: thin content (poniżej 500 słów bez dowodów), treść nadmiernie podobna do innych stron w serwisie, brak sygnałów autorytetu, brak linków wewnętrznych. Rozwiązanie: rozbudowa treści do 2000+ słów z konkretami, dodanie autora, schema, 3-5 linków wewnętrznych z innych rankingowych stron. Po zmianie ponownie zgłoście URL w URL Inspection.

Czym różni się indeksowanie od rankingu?

Indeksowanie to dodanie strony do bazy Google – warunek minimum. Ranking to układanie zindeksowanych stron w kolejności dla konkretnego zapytania. Strona może być zaindeksowana, ale niskiej pozycji, albo w top 3 dla jednej frazy i na 50 pozycji dla drugiej. Indeksowanie jest statyczne (tak/nie), ranking dynamiczny (inna pozycja przy każdym zapytaniu). Praca SEO obejmuje oba etapy, ale różnymi technikami – indeksowanie to głównie techniczne SEO, ranking to treść, linki i E-E-A-T.

Czy Google używa kliknięć jako sygnału rankingu?

Google oficjalnie temu zaprzecza, ale w dokumentach procesu antymonopolowego z DOJ (2023) pojawiły się dowody, że system Navboost wykorzystuje dane kliknięć w procesie trenowania algorytmów. W praktyce: CTR i czas spędzony na stronie wpływają pośrednio na ranking – przez dostrajanie algorytmów, nie jako bezpośredni sygnał na każdą stronę. Zatem: dobry tytuł, który podnosi CTR, pomaga. Ale sztuczne pompowanie kliknięć botem nie działa – Google rozróżnia naturalny i sztuczny traffic.

Jak długo zajmuje, żeby nowa strona pojawiła się w Google?

Indeksacja nowego URL zajmuje zwykle 3-14 dni dla istniejącej domeny i 14-60 dni dla nowej domeny bez historii. Pierwsza widoczna pozycja (choćby na stronie 5-10) pojawia się zwykle w ciągu 4-12 tygodni. Dojście do top 10 na konkurencyjną frazę to 6-18 miesięcy pracy nad treścią, linkami i E-E-A-T. Można przyspieszyć zgłoszeniem w URL Inspection i dodaniem linków wewnętrznych z rankingujących stron, ale trzydniowych skrótów do top 3 nie ma.

Co to jest Google Caffeine i czy nadal istnieje?

Caffeine (2010) to była zmiana infrastruktury indeksowania – z batchowej na real-time. Dzisiaj nazwa nie jest już używana oficjalnie, ale zasada została: Google indeksuje w czasie rzeczywistym, bez czekania na batch. Dla Was oznacza to: nowa publikacja może pojawić się w SERP w godzinach (w przypadku dużych domen newsowych) lub w dniach (w przypadku mniejszych blogów). Caffeine został zastąpiony przez nowszy system (Google nie podaje nazwy), który integruje się z AI Overviews.

Czy Google crawluje JavaScript jak zwykły HTML?

Tak, ale w dwóch krokach. Pierwszy crawl pobiera surowy HTML. Drugi krok (rendering) uruchamia headless Chromium i wykonuje JS. Opóźnienie między pierwszym a drugim krokiem może wynosić od godzin do tygodni. Strony SPA (bez SSR) są przez to indeksowane wolniej. Rozwiązanie: Server-Side Rendering (Next.js, Nuxt), Static Site Generation albo pre-rendering. Wtedy pierwszy pass Googlebota widzi pełną treść i rendering nie jest potrzebny.

Jak Google wybiera źródła do AI Overview?

Gemini (model generujący AI Overview) startuje z top 10 organic dla danego zapytania. Z tych 10 wybiera 3-10 źródeł, z których wyciąga konkretne fragmenty do odpowiedzi. Kryteria wyboru: gęstość faktów w treści, czytelna struktura (akapity, tabele, listy), schema (szczególnie Article, FAQPage, HowTo), E-E-A-T (autor, źródła, autorytet domeny). Nie musicie być na pierwszym miejscu – wystarczy top 10 z dobrą strukturą. Artykuł z 200 konkretami cytowany jest chętniej niż tekst 5000 słów ogólników.

Co dalej

Jeśli interesuje Was dalej techniczna strona działania Google, logicznym krokiem jest szczegółowy przewodnik po crawlowaniu i indeksowaniu, a potem rozkład algorytmów na czynniki pierwsze. Oba artykuły rozszerzają wątki z tego tekstu o konkretne kroki wdrożeniowe. Jeśli wolicie pójść szeroko, wróćcie do pillara SEO podstawy 2026, który łączy te tematy w jedną strategię i dodaje kontekst AIO.