Boty AI przejęły ruch w sieci: dane Cloudflare a SEO

Po raz pierwszy w historii internetu maszyny generują więcej ruchu niż ludzie. Z danych Cloudflare Radar wynika, że na początku czerwca 2026 roku zautomatyzowane zapytania odpowiadały za 57,5 proc. ruchu HTML w sieci, a na realnych użytkowników przypadało już tylko 42,5 proc. Dla branży SEO i AIO to nie jest ciekawostka statystyczna, lecz sygnał, że ekonomia treści w sieci właśnie zmienia fundamenty.

Najświeższe zestawienia operatora infrastruktury internetowej pokazują jeszcze jedną, znacznie bardziej niepokojącą prawidłowość: boty sztucznej inteligencji pobierają dziś treści w skali nieporównywalnej z ruchem, jaki odsyłają z powrotem do wydawców. W przypadku niektórych dostawców mówimy o tysiącach pobranych stron na każde jedno przekierowanie. To realne wyzwanie dla każdego, kto opiera model biznesowy na widoczności w wyszukiwarce.

O symbolicznym przekroczeniu granicy poinformował na początku czerwca sam szef Cloudflare, Matthew Prince, publikując dane z platformy Radar. To pierwszy raz, gdy automaty utrzymały większość ruchu HTML w dłuższym ujęciu, a nie tylko w pojedynczych skokach generowanych przez kampanie scrapingu. Komunikat odbił się echem nie tylko w środowisku technicznym, ale też wśród wydawców, dla których ruch z wyszukiwarek to często główne źródło przychodu.

Kontekst: dlaczego ruch botów nagle stał się problemem

Przez lata roboty indeksujące były dla wydawców czymś oczywistym i pożądanym. Googlebot odwiedzał stronę, indeksował treść, a w zamian kierował do niej użytkowników z wyników wyszukiwania. Ta wymiana była uczciwa: pozwól się zaindeksować, a w nagrodę dostaniesz ruch. Cały ekosystem SEO zbudowano wokół tej cichej umowy.

Wejście dużych modeli językowych zaburzyło tę równowagę. Crawlery takie jak GPTBot, ClaudeBot czy PerplexityBot pobierają treści głównie po to, aby trenować modele albo generować odpowiedzi w asystentach AI. Problem w tym, że odpowiedź wygenerowana przez asystenta często zaspokaja potrzebę użytkownika w całości, więc nie ma on powodu, aby kliknąć w źródło. Treść jest konsumowana, ale ruch zwrotny nie wraca do wydawcy.

Cloudflare nazwał to zjawisko stosunkiem crawl-to-refer, czyli proporcją między liczbą pobranych stron a liczbą przekierowań odsyłanych do źródła. Im wyższy wskaźnik, tym mniej korzystna dla wydawcy jest obecność danego bota. Wcześniej tematyka ta przewijała się przy okazji dyskusji o tym, jak Google oficjalnie uznał GEO i AEO jako nowe dyscypliny optymalizacji, ale dopiero twarde liczby pokazały skalę nierównowagi.

Kluczowe fakty z danych Cloudflare

Według danych zebranych przez Cloudflare za maj 2026 roku struktura ruchu generowanego przez crawlery AI rozkłada się następująco. Trening modeli pozostaje zdecydowanie dominującym celem pobierania treści, choć udział crawlowania na potrzeby wyszukiwania wyraźnie rośnie.

Cel crawlowania AI	Udział (maj 2026)
Trening modeli	51,8 proc.
Cel mieszany	35,71 proc.
Wyszukiwanie (search)	9,33 proc.
Działania agentów (user action)	2,58 proc.
Niezadeklarowane	0,59 proc.

Najbardziej wymowny jest skok udziału crawlowania pod wyszukiwanie: z około 7,5 proc. w kwietniu do 9,33 proc. w maju. To sygnał, że asystenci AI coraz częściej sięgają po treści w czasie rzeczywistym, aby budować odpowiedzi oparte na aktualnych źródłach, a nie tylko na wiedzy z treningu. Dla optymalizacji pod AIO to dobra wiadomość, bo świeża, dobrze ustrukturyzowana treść ma szansę trafić do generowanych odpowiedzi.

Zmienił się też ranking samych crawlerów. Jak podaje Cloudflare, w maju 2026 roku GPTBot wyprzedził ClaudeBota i stał się trzecim największym crawlerem AI, odwracając kolejność z kwietnia.

Bot	Udział w ruchu crawlerów	Operator
Googlebot	27,26 proc.	Google
Meta-ExternalAgent	13,23 proc.	Meta
GPTBot	11,48 proc.	OpenAI
Bytespider	10,25 proc.	ByteDance
ClaudeBot	9,73 proc.	Anthropic
Bingbot	8,45 proc.	Microsoft
Applebot	7,01 proc.	Apple

Stosunek crawl-to-refer, czyli kto naprawdę płaci za AI

Najmocniejszy wniosek z analizy dotyczy proporcji między pobieraniem a odsyłaniem ruchu. W oknie pomiarowym z przełomu maja i czerwca 2026 roku różnice między operatorami okazały się dramatyczne. Poniższe liczby mówią, ile stron dany operator pobiera średnio na każde jedno przekierowanie odesłane do wydawcy.

Operator	Pobrane strony na 1 przekierowanie
Anthropic	11 122:1
OpenAI	857:1
Perplexity	190:1
Microsoft	34:1
Google	5:1

Skala mówi sama za siebie. Google, mimo całej presji ze strony AI Overviews i trybu AI Mode, wciąż odsyła wydawcom jedno przekierowanie na każde pięć pobranych stron. Anthropic w tym samym okresie pobierał ponad jedenaście tysięcy stron, zanim odesłał jedno kliknięcie. Cloudflare we wcześniejszych pomiarach raportował dla tego operatora wskaźniki sięgające nawet kilkudziesięciu tysięcy stron na jedno przekierowanie.

Warto dodać ważne zastrzeżenie metodologiczne, które podnosi sam Cloudflare. Ruch generowany przez natywne aplikacje asystentów AI często nie przenosi nagłówka odsyłającego (referer), więc realne wskaźniki mogą być nieco zawyżone. Nie zmienia to jednak kierunku zjawiska: konsumpcja treści przez boty rośnie szybciej niż ruch zwrotny, jaki te boty oddają.

Co to znaczy dla SEO i AIO

Pierwszy wniosek jest strategiczny. Klasyczny model, w którym indeksacja automatycznie przekłada się na ruch, przestaje być uniwersalną prawdą. Treść może być intensywnie pobierana, cytowana w odpowiedziach asystentów i jednocześnie nie generować ani jednej wizyty. To wymusza zmianę miary sukcesu: obok pozycji w wynikach i liczby sesji organicznych liczy się dziś również obecność i atrybucja w odpowiedziach modeli.

Drugi wniosek dotyczy struktury treści. Skoro udział crawlowania pod wyszukiwanie rośnie, a asystenci coraz częściej budują odpowiedzi z aktualnych źródeł, wygrywają strony, które łatwo przeczytać maszynowo. Jasne nagłówki, zwięzłe definicje, dane w tabelach, sekcje FAQ i poprawne dane strukturalne zwiększają szansę, że to właśnie nasz fragment trafi do generowanej odpowiedzi. To jest sedno optymalizacji pod AIO i powód, dla którego coraz więcej zespołów traktuje GEO oraz AEO jako odrębne dyscypliny.

Trzeci wniosek jest finansowy. Jeśli boty pobierają treści hojnie, a oddają ruch oszczędnie, wydawcy zaczynają szukać dźwigni. Stąd rosnące zainteresowanie kontrolą dostępu crawlerów, plikami robots oraz nowymi standardami opisu wiedzy, takimi jak format, w ramach którego Google Cloud wydał Open Knowledge Format dla agentów AI. Zamiast biernie godzić się na asymetrię, część wydawców chce świadomie decydować, kto i na jakich zasadach korzysta z ich treści.

Licencjonowanie treści jako nowa dźwignia

Jednym z najczęściej powtarzanych wniosków z danych Cloudflare jest to, że wydawcy przestają być wyłącznie biernymi dostawcami treści dla modeli. Skoro crawlery AI traktują otwartą sieć jak darmowe źródło danych treningowych, naturalną odpowiedzią staje się próba wyceny tego dostępu. W praktyce oznacza to rosnące zainteresowanie mechanizmami, które pozwalają przepuszczać boty dopiero po spełnieniu określonych warunków, na przykład po wykupieniu dostępu lub zawarciu umowy licencyjnej.

Dla rynku to istotna zmiana filozofii. Przez dwie dekady SEO polegało na tym, aby maksymalnie ułatwić robotom dostęp do treści. Teraz pojawia się druga warstwa decyzji: którym automatom dostęp ułatwiać, a od których oczekiwać rekompensaty. Wydawcy z silną, unikalną treścią mają w tej rozgrywce najmocniejszą pozycję, bo to właśnie ich materiały są dla modeli najbardziej wartościowe. Mniejsze serwisy będą musiały działać wspólnie albo polegać na rozwiązaniach oferowanych przez dostawców infrastruktury.

Niezależnie od tego, jak rozwinie się rynek licencji, kierunek wydaje się przesądzony. Era, w której każdy bot dostawał treść za darmo i bez pytania, powoli się kończy. Zastępuje ją model bardziej selektywny, w którym dostęp do treści staje się przedmiotem świadomej decyzji biznesowej, a nie domyślnym ustawieniem.

Reakcje branży

W środowisku SEO dane Cloudflare odbiły się szerokim echem, bo potwierdziły to, co wielu specjalistów obserwowało w analityce: spadek ruchu organicznego przy jednoczesnym wzroście tak zwanych wyświetleń bez kliknięć. Argument, że asystenci AI po prostu przejmują intencje informacyjne użytkowników, zyskał twarde liczbowe poparcie.

Część komentatorów zwraca uwagę, że nie wszystkie crawlery są sobie równe i że strategia blokowania powinna być selektywna. Bot wyszukiwarki, który realnie odsyła ruch, to zupełnie inny przypadek niż crawler trenujący model bez żadnej atrybucji. Pojawiają się głosy, że branża potrzebuje przejrzystych deklaracji celu crawlowania oraz mechanizmów licencjonowania treści, które wynagrodzą wydawcom udostępnianie danych do modeli.

Wątek konkurencji między asystentami też nie schodzi z agendy. Przesunięcia w udziałach rynkowych, o których pisaliśmy między innymi przy okazji tego, jak ChatGPT tracił udział na rzecz Gemini i Claude, mają bezpośrednie przełożenie na to, których botów ruch będzie dla wydawców istotny w kolejnych miesiącach. Im większy asystent, tym ważniejsze staje się to, jak traktuje źródła.

Polski kontekst: co z tego wynika dla rodzimych wydawców

Dane Cloudflare mają charakter globalny, ale wnioski przekładają się wprost na polski rynek. Rodzimi wydawcy, sklepy internetowe i serwisy contentowe od kilkunastu miesięcy raportują podobny obraz: liczba wyświetleń w Search Console rośnie albo utrzymuje się na stałym poziomie, podczas gdy współczynnik klikalności i realny ruch organiczny spadają. To klasyczny objaw środowiska, w którym odpowiedź użytkownik dostaje już na poziomie wyszukiwarki lub asystenta, bez wejścia na stronę.

Dla polskojęzycznych treści dochodzi dodatkowy czynnik: asystenci AI mają mniej źródeł w naszym języku niż w angielskim, więc dobrze przygotowany, rzetelny artykuł po polsku ma realną szansę zostać cytowany w odpowiedziach. To paradoksalna okazja. Tam, gdzie konkurencja językowa jest mniejsza, staranna optymalizacja pod AIO może przynieść widoczność, o jaką w anglojęzycznym internecie trzeba walczyć znacznie mocniej.

Warto też pamiętać o praktycznej stronie kosztów. Intensywne crawlowanie przez boty AI obciąża serwer i generuje transfer, za który płaci wydawca. W modelu, w którym ten ruch nie wraca w postaci wizyt, rośnie pokusa, aby ograniczyć dostęp najbardziej zachłannym crawlerom. Decyzja powinna być jednak oparta na danych z logów, a nie na emocjach, bo część botów wciąż realnie wspiera widoczność.

Praktyczna lista kontrolna

Dla zespołów, które chcą zareagować na nową rzeczywistość, oto zestaw konkretnych kroków do wdrożenia w najbliższych tygodniach:

Przeanalizuj logi serwera i rozdziel crawlery AI według operatora, aby zobaczyć, kto pobiera najwięcej, a kto realnie odsyła ruch.
Skonfiguruj plik robots oraz reguły dostępu tak, aby świadomie zarządzać botami, które nie wnoszą żadnej wartości zwrotnej.
Uporządkuj strukturę najważniejszych treści: krótkie definicje na początku sekcji, nagłówki opisujące intencję, dane w tabelach.
Wdroż i zweryfikuj dane strukturalne, bo to one ułatwiają maszynom poprawne zrozumienie i cytowanie treści.
Dodaj do raportowania metryki widoczności w asystentach AI obok klasycznych pozycji i ruchu organicznego.
Monitoruj udział wyświetleń bez kliknięć, aby wcześnie wychwycić treści, które tracą ruch na rzecz odpowiedzi generatywnych.

Co dalej

Najbliższe miesiące prawdopodobnie przyniosą trzy równoległe procesy. Po pierwsze, dalszy wzrost udziału crawlowania pod wyszukiwanie, w miarę jak asystenci coraz mocniej opierają odpowiedzi na aktualnych źródłach. Po drugie, rozwój narzędzi kontroli dostępu i licencjonowania treści, bo wydawcy nie zaakceptują w nieskończoność asymetrii crawl-to-refer. Po trzecie, dojrzewanie metryk widoczności w AI, które pozwolą mierzyć obecność marki w odpowiedziach modeli równie precyzyjnie jak dziś mierzymy pozycje w wynikach.

Dla zespołów SEO i AIO praktyczny plan na teraz jest dość konkretny. Warto przejrzeć logi serwera pod kątem aktywności crawlerów AI i ocenić, którzy z nich faktycznie odsyłają ruch. Warto zadbać o maszynową czytelność najważniejszych treści, bo to ona decyduje o cytowalności w odpowiedziach. I warto traktować widoczność w asystentach jako osobny kanał, z własnymi celami, a nie jako dodatek do klasycznego SEO.

Moment, w którym maszyny przejęły większość ruchu w sieci, najlepiej potraktować jako punkt zwrotny, a nie powód do paniki. Treść nadal ma wartość, a często ma jej nawet więcej niż dawniej, skoro to właśnie ona zasila odpowiedzi, z których korzystają miliony użytkowników asystentów. Zmienia się tylko sposób, w jaki tę wartość trzeba dziś chronić, wyceniać i mierzyć. Wydawcy, którzy zrozumieją to wcześniej niż konkurencja, zbudują przewagę nie tylko w klasycznych wynikach wyszukiwania, ale też w nowej warstwie widoczności, jaką tworzą modele językowe.

FAQ

Czym jest stosunek crawl-to-refer?

To proporcja między liczbą stron pobranych przez crawler danego operatora a liczbą przekierowań, jakie ten operator odsyła do wydawcy. Wysoki wskaźnik, na przykład 11 122:1, oznacza, że bot pobiera bardzo dużo treści, a w zamian generuje minimalny ruch zwrotny. To kluczowa miara opłacalności obecności danego bota dla wydawcy.

Czy to znaczy, że trzeba blokować boty AI?

Niekoniecznie i nie wszystkie. Bot wyszukiwarki, który realnie odsyła ruch, taki jak Googlebot ze wskaźnikiem 5:1, działa na korzyść wydawcy. Selektywna kontrola dostępu ma sens głównie wobec crawlerów, które pobierają treści do treningu bez żadnej atrybucji. Decyzję najlepiej oprzeć na analizie własnych logów serwera.

Dlaczego udział crawlowania pod wyszukiwanie rośnie?

Bo asystenci AI coraz częściej budują odpowiedzi z aktualnych źródeł pobieranych w czasie rzeczywistym, a nie wyłącznie z wiedzy zapisanej podczas treningu. Według danych Cloudflare udział ten wzrósł z około 7,5 proc. w kwietniu do 9,33 proc. w maju 2026 roku. Dla optymalizacji pod AIO to korzystny trend.

Jak przygotować treść pod cytowanie przez asystentów AI?

Stawiaj na maszynową czytelność: jasne nagłówki, zwięzłe definicje na początku sekcji, dane w tabelach, sekcje FAQ oraz poprawne dane strukturalne. Taka struktura zwiększa szansę, że konkretny fragment Twojej strony trafi do generowanej odpowiedzi i zostanie powiązany z marką.

Czy klasyczne SEO przestaje mieć znaczenie?

Nie, ale przestaje być jedyną miarą. Pozycje w wynikach i ruch organiczny nadal się liczą, jednak obok nich pojawia się nowy cel: obecność i atrybucja w odpowiedziach modeli. Najrozsądniejsze podejście to traktowanie widoczności w asystentach jako osobnego kanału z własnymi metrykami.