Indeks cytowań AI 2026: 50 domen sterujących LLM

Reddit, Wikipedia i YouTube w praktyce kontrolują dziś, które marki pojawiają się w odpowiedziach generatywnych asystentów. Tak wynika z opublikowanego 1 maja 2026 raportu agencji 5WPR pod nazwą AI Platform Citation Source Index 2026, który zsyntetyzował ponad 680 milionów indywidualnych cytowań z ChatGPT, Google AI Overviews, Perplexity, Gemini oraz Claude. Dla zespołów SEO i AIO to pierwsza tak konkretna mapa tego, kto naprawdę ma wpływ na widoczność w erze odpowiedzi.

Kontekst: dlaczego ten raport powstał

Przez ostatnie osiemnaście miesięcy branża operowała na wyrywkach. Studium z jednej platformy pokazywało Reddit jako lidera, kolejne wskazywało na Wikipedię, a jeszcze inne sugerowało dominację YouTube. Wnioski wzajemnie się wykluczały, bo każdy zbiór danych obejmował inny moment, inną pulę zapytań i inną metodologię. Marketerzy podejmowali decyzje budżetowe na podstawie pojedynczych próbek, zamiast porównywalnego obrazu rynku.

5WPR, jedna z największych amerykańskich agencji PR, uznała ten stan za nieakceptowalny dla klientów alokujących budżety na widoczność w odpowiedziach AI. Zespół analityczny agencji zebrał sześć największych opublikowanych studiów cytowań przeprowadzonych między sierpniem 2024 a kwietniem 2026, ujednolicił metryki i zsyntetyzował z nich pierwszy skonsolidowany ranking pięćdziesięciu domen, które najczęściej pojawiają się w generatywnych odpowiedziach. Tak powstał Citation Source Index 2026.

Jak podaje sama agencja w komunikacie prasowym dystrybuowanym przez PR Newswire, indeks ma być aktualizowany kwartalnie i służyć działom strategii jako benchmark. To istotne, bo cytowania w LLM nie są stabilne: wahania rzędu kilkudziesięciu punktów procentowych potrafią wystąpić w cyklu kilkutygodniowym.

Kluczowe fakty z raportu

Wnioski 5WPR są dla wielu redakcji niewygodne. Ekosystem cytowań w generatywnym AI jest znacznie bardziej skoncentrowany niż klasyczny Google PageRank, a publishera z drugiej setki SERP w wynikach LLM praktycznie nie ma.

Top 15 domen absorbuje 68% wszystkich cytowań w pięciu głównych silnikach odpowiedzi. To koncentracja głębsza niż jakakolwiek znana z klasycznego SEO.
Reddit jest źródłem numer jeden globalnie, cytowanym z częstotliwością około 40% w skali wszystkich modeli LLM.
Dziennikarstwo redakcyjne odpowiada za 27% cytowań, a dla zapytań wrażliwych czasowo (newsy, wybory, katastrofy) skacze do 49%.
Treść tworzona przez użytkowników (UGC) przeważa nad redakcyjną dla większości tematów horyzontalnych, w tym konsumenckich, recenzji i porad praktycznych.
Zmienność udziału jest tygodniowa, nie roczna. PR Newswire, Forbes i Medium absorbowały cytowania uwolnione przez zmiany algorytmiczne u konkurencji.

Najbardziej niepokojąca dla branży jest dynamika. W raporcie pojawia się przypadek z końcówki 2025 roku, kiedy udział Reddita w cytowaniach ChatGPT spadł z około 60% do 10% w sześć tygodni po jednej zmianie parametru w pipeline’ie wyszukiwarki Google, której ChatGPT wówczas używał. To sygnał, że strategie oparte na pojedynczym kanale są kruche.

Mapa preferencji każdej platformy

Indeks pokazuje, że pięć największych silników odpowiedzi zachowuje się jak pięć różnych redakcji z odrębnymi gustami. Bez tej wiedzy planowanie obecności w AIO przypomina strzelanie w ciemno.

Platforma	Dominujące źródła	Charakter cytowań
ChatGPT	Wikipedia (26–48% top-10), Reddit, Forbes, Business Insider	Mieszanka encyklopedyczna i konsumencka, 56% cytowań dziennikarskich z ostatnich 12 miesięcy
Google AI Overviews	YouTube (200x przewaga nad innymi wideo), Reddit, własne SERP-y	Silna preferencja dla wideo i UGC społecznościowego
Perplexity	Źródła pierwotne, NIH/PubMed, autorytety B2B z imienia i nazwiska	Najbardziej akademicki profil, premiuje treści naukowe i ekspertów
Claude (Anthropic)	The New York Times, The Atlantic, The New Yorker, The Economist	Bardzo długie cytowania premium, jedynie 36% z ostatnich 12 miesięcy
Gemini	Google Knowledge Graph, własne właściwości Google, wybrane media	Silnie zwrócony do wewnątrz ekosystemu Google

Z perspektywy polskiego rynku ten obraz oznacza, że jednolita strategia „publikujemy wszędzie tak samo” nie ma sensu. Inaczej trzeba pracować nad obecnością w Wikipedii (klucz dla ChatGPT), inaczej na YouTube (klucz dla AI Overviews), a jeszcze inaczej dla Perplexity, gdzie liczy się oryginalność źródła i nazwisko autora.

Co to znaczy dla SEO i AIO w Polsce

Polski rynek treści nie ma jeszcze odpowiednika Reddita o porównywalnej skali, ale tendencje globalne przekładają się na lokalne zachowania modeli. Badania 5WPR wskazują, że społecznościowy charakter źródła ma większe znaczenie niż jego pochodzenie geograficzne, dlatego polscy redaktorzy realnie konkurują z anglojęzycznymi forami branżowymi o cytowanie w odpowiedziach kierowanych do użytkowników z Polski.

Dla zespołów SEO oznacza to, że audyt obecności w AI musi wyjść poza monitoring własnej domeny. Pierwszym krokiem jest sprawdzenie, czy marka w ogóle istnieje na platformach UGC w sposób autentyczny: czy ktoś o niej rozmawia na Reddicie, czy jest wątek na Wykopie, czy są odpowiedzi na Quora, czy istnieją nagrania na YouTube z udziałem ekspertów firmy. Bez tego LLM po prostu nie ma czego cytować.

Drugim wnioskiem jest urealnienie inwestycji we własne treści. Skoro top 15 domen zabiera 68% cytowań, walka o miejsce w tej grupie wymaga konsekwencji wieloletniej, a nie pojedynczych kampanii contentowych. Dla większości polskich serwisów realistyczną drogą nie jest wbicie się do top 15, lecz zostanie cytowanym ekspertem powoływanym przez te domeny. To zupełnie inna gra: zamiast publikować, trzeba dostarczać treści, które domeny premium uznają za warte powołania.

Po trzecie, jak opisaliśmy w naszym przewodniku po fundamentach AIO, decydujące staje się rozpoznawanie kontekstu, w jakim model może chcieć powołać dany fragment. Nie wystarczy publikować dłuższe treści, potrzebne są konkretne, dobrze ujęte fakty z wyraźną atrybucją autorską, datami i liczbami, których model nie znajdzie w sposób równie przejrzysty u konkurencji.

Reakcje branży

Pierwsze odczyty raportu w środowisku marketingowym są mieszane. Specjaliści od PR cieszą się, że dotychczasowe inwestycje w obecność w prasie premium (NYT, The Atlantic, Forbes) zaczynają się zwracać w nowym kanale. Działy contentowe są mniej zadowolone, bo widzą, że ich własne blogi mają strukturalnie ograniczony udział w torcie odpowiedzi.

Wedle doniesień serwisu CMSWire, część stratergów AEO (Answer Engine Optimization) twierdzi, że „treść społecznościowa stała się rdzeniem strategii widoczności AI”, a nie dodatkiem. Cytowany przez serwis ekspert Ricardo McCoy, założyciel McCoy Marketing Services, postuluje, by marki przestały traktować Reddit jak forum promocyjne i stały się tam realnymi rozwiązującymi problemy uczestnikami dyskusji. To wprost przeciwne do dotychczasowej praktyki większości polskich marek, które na Reddicie pojawiają się głównie w kontekście kontrolowanych kampanii.

Z drugiej strony pojawiają się głosy sceptyczne. Cytowania Reddita w Perplexity spadły o 86% niemal natychmiast po pozwie Reddita przeciwko tej platformie w październiku 2025 roku, a w skali listopada 2025 ogólny udział Reddita w cytowaniach LLM zmalał o 23%. Dla zespołów planujących długoterminowe budżety to przypomnienie, że wszystkie te liczby są zakładnikami zarówno regulacji, jak i pojedynczych decyzji prawnych.

Co dalej: prognozy 5WPR i innych ośrodków

Sama 5WPR zapowiada kwartalną aktualizację indeksu. Następna edycja, planowana na sierpień 2026, ma rozszerzyć zakres o platformy aukcyjne i e-commerce, gdzie generatywne odpowiedzi zaczynają wpierać konkretne rekomendacje produktowe. Z punktu widzenia polskich e-sklepów to kluczowe okno, bo decyzje zakupowe coraz częściej startują w ChatGPT, a nie w Google.

Niezależnie od raportu 5WPR widać kilka równoległych trendów, które warto śledzić w drugim kwartale 2026. Po pierwsze, OpenAI w kwietniu udostępniło GPT-5.5, model szczególnie mocny w zadaniach wyszukiwawczych i grouning’u dokumentów. Jeżeli nowy model trafi do darmowej wersji ChatGPT, wzorce cytowań mogą znów się przemodelować, podobnie jak działo się to po premierze GPT-5.

Po drugie, Google dynamicznie rozwija funkcję Preferred Sources w obrębie AI Overviews i zwykłych wyników. Użytkownicy mają już zaznaczone ponad 200 tysięcy unikalnych witryn jako preferowane, co oznacza, że personalizacja zaczyna realnie wpływać na to, jakie domeny dany użytkownik widzi w odpowiedziach. Indeks zagregowany jak ten od 5WPR będzie więc punktem startowym, a nie końcowym.

Po trzecie, polskie wydawnictwa zaczynają testować bezpośrednie partnerstwa z platformami AI, co teoretycznie może poprawić ich widoczność lokalnych domen w cytowaniach Gemini i Perplexity. To szansa dla tych redakcji, które wcześnie zainwestują w licencje i protokoły takie jak llms.txt, opisywane szerzej w artykule o ChatGPT jako wyszukiwarce 2026.

Praktyczne kroki dla zespołu SEO/AIO

Indeks 5WPR jest nie tylko ciekawostką, ale punktem zaczepienia dla rewizji strategii. W ciągu najbliższych dwóch tygodni warto zrobić co najmniej kilka konkretnych ruchów, zanim konkurencja zorientuje się, jak wykorzystać raport.

Zaktualizować audyt cytowań marki: wyszukać firmę w ChatGPT, Perplexity, Gemini, Claude i AI Overviews dla 20 najważniejszych zapytań i zapisać, które domeny model przywołuje jako źródło.
Odróżnić zapytania, w których model cytuje Wikipedię (kluczowe dla ChatGPT) od tych, w których cytuje fora i UGC (kluczowe dla AI Overviews).
Sprawdzić, czy istnieje dobrze utrzymane hasło na Wikipedii dotyczące marki lub kategorii produktowej. Jeśli nie, rozważyć przygotowanie merytorycznej wersji we współpracy z redaktorami społeczności.
Uruchomić obecność na Reddicie poprzez autentyczny udział w wątkach branżowych, nie kampanie. To inwestycja długoterminowa, a nie sprint.
Skonfigurować monitoring cytowań w narzędziach typu Profound, Authoritas, Ahrefs Brand Radar lub własnych skryptach, opartych o regularne odpalanie zestawu zapytań do każdego LLM.
Zweryfikować, czy najczęstsze błędy w treści, opisane przez nas w przeglądzie 12 powtarzających się problemów AIO, nie blokują cytowania własnych artykułów.

Powyższa lista nie zastępuje pełnej strategii, ale pozwala odpowiedzieć szefostwu na pytanie, jak zespół reaguje na publikację indeksu. To różnica między byciem w defensywie a kontrolowaniem narracji wewnętrznej.

Polski kontekst: kogo to najmocniej dotyczy

Dla rodzimych redakcji i agencji raport jest sygnałem, że dotychczasowe modele biznesowe wymagają korekty. Wydawcy contentowi, którzy budowali ruch na masowym pozycjonowaniu długim ogonem, widzą już teraz spadek odsłon idących z Google: AI Overviews zatrzymuje sporą część zapytań informacyjnych. Indeks 5WPR pokazuje, że ten ruch nie jest zwykłą stratą, lecz jest przekierowywany do koszyka kilkunastu domen globalnych, w którym polskich serwisów po prostu nie ma.

Najsilniej dotknięte zostają cztery typy podmiotów. Pierwszy to wydawcy poradnikowi i serwisy lifestylowe, którzy dotychczas żyli z kompilacji „10 sposobów na X”: ich treść jest najłatwiej zastępowalna odpowiedzią modelu. Drugi to porównywarki konsumenckie, które w starciu z ChatGPT i Perplexity tracą rolę pierwszego punktu kontaktu z konsumentem. Trzeci to klasyczne fora dyskusyjne, które przez lata budowały bazę UGC, a dziś widzą, że ich zawartość jest „konsumowana” przez modele, ale nie generuje ruchu zwrotnego. Czwarty to małe agencje SEO, których oferta opierała się głównie na linkach i tekstach pod robota, bez warstwy autorskiej i markowej.

Po stronie wygranych mogą być natomiast eksperci i marki osobiste, których nazwiska modele uznają za autorytatywne, oraz redakcje branżowe z wyraźną strukturą cytowań i jasnymi datami publikacji. Dla tych podmiotów raport 5WPR nie jest zagrożeniem, lecz mapą drogową: pokazuje, że obecność w mediach premium oraz dyscyplina autorska wracają do gry jako istotne czynniki widoczności.

Limity raportu

Indeks 5WPR ma trzy istotne ograniczenia, o których warto pamiętać przed wyciąganiem wniosków. Pierwsze to dominacja anglojęzycznych studiów: większość źródeł danych pochodzi z USA, więc rzeczywista mapa cytowań w odpowiedziach po polsku może wyglądać inaczej, szczególnie w niszowych branżach lokalnych. Drugie to migawkowy charakter danych: szybkie wahania udziału Reddita w ChatGPT pokazują, że indeks bardziej opisuje stan na dziś niż przewiduje przyszłość. Trzecie to brak rozróżnienia między cytowaniami widzialnymi a niewidzialnymi: model często pobiera fakt z domeny, której w odpowiedzi nie wymienia, co umyka tego rodzaju metodologii.

Mimo to indeks pełni rolę najbardziej kompletnego punktu odniesienia dostępnego publicznie. Dotychczasowe analizy obejmowały najczęściej jedną platformę i jeden moment, a 5WPR po raz pierwszy zsyntetyzowała sześć dużych zbiorów w spójny ranking. Dla zespołów strategicznych i prezentacji zarządczych to wartość, której wcześniej nie było.

Czym dokładnie jest AI Platform Citation Source Index 2026?

To opublikowany 1 maja 2026 ranking 50 domen najczęściej cytowanych przez generatywne silniki odpowiedzi (ChatGPT, Perplexity, Gemini, Claude, Google AI Overviews). Powstał ze zsyntetyzowania ponad 680 milionów cytowań z sześciu największych studiów branżowych przeprowadzonych między sierpniem 2024 a kwietniem 2026.

Dlaczego Reddit jest na pierwszym miejscu?

Reddit dostarcza długie wątki dyskusyjne z autentycznymi opiniami użytkowników, które modele językowe traktują jak sygnał intencji konsumenta. Dla zapytań typu „co kupić”, „czy ten produkt jest dobry”, „jak rozwiązać problem X” jest to materiał najmocniejszy, dlatego silniki odpowiedzi sięgają tam częściej niż do redakcyjnych przeglądów.

Czy raport oznacza, że własny blog firmowy nie ma sensu?

Nie, ale zmienia jego rolę. Własna treść coraz rzadziej wybija się jako bezpośrednie źródło cytowane w odpowiedzi LLM, częściej natomiast staje się surowcem, który modele wykorzystują do uzupełnienia odpowiedzi tworzonej z domen premium. Optymalizacja powinna iść w stronę faktów cytowalnych, danych liczbowych i autorstwa imiennego.

Jak długo trzymają się trendy z indeksu 5WPR?

Bardzo krótko. Dane z raportu pokazują, że udział pojedynczej domeny potrafi spaść o 86% w kilka tygodni po pozwie sądowym (jak w przypadku Reddita w Perplexity) lub po zmianie parametru w pipeline’ie wyszukiwarki. Dlatego warto traktować indeks jako migawkę i monitorować własną widoczność co najmniej co miesiąc.

Jak zacząć monitorować cytowania własnej marki?

Najprostszą drogą jest przygotowanie 20-30 zapytań, które klienci faktycznie mogą zadać LLM-om w temacie marki (rekomendacje, recenzje, alternatywy, ceny). Następnie odpalamy te same zapytania co tydzień w ChatGPT, Perplexity i Gemini, zapisując widoczność marki i listę domen cytowanych przez model. To minimalny zestaw danych do podejmowania decyzji.