Case AIO: 30 dni testow pod ChatGPT (wyniki, koszty)

Przez 30 dni prowadzilismy kontrolowany test optymalizacji marki pod ChatGPT. Cel byl prosty: sprawdzic, czy w realnym wdrozeniu da sie zwiekszyc czestotliwosc cytowan w odpowiedziach generatywnych ChatGPT (model 5.2) bez naginania prawdy o liczbach. W tym materiale zebralismy dokladne dane, koszty (godziny, narzedzia, contentowy budzet) oraz lekcje, ktore mozna przenosc na wlasne projekty 2026 roku.

Nie jest to pojedynczy log z paru promptow, ale 30-dniowy cykl pomiarowy oparty na powtarzalnych zapytaniach, kontrolowanej grupie zmian na stronie i tygodniowych snapshotach widocznosci. Liczby ponizej nie sa srednia branzowa, lecz wynikiem jednego konkretnego case’u w niszy „narzedzia do widocznosci AI dla agencji SEO”. Traktuj je jako benchmark do replikacji, nie obietnice.

Czym jest case AIO 30 dni

Case AIO 30 dni to ustrukturyzowany cykl testowy, w ktorym przez cztery tygodnie wdrazasz mierzalne zmiany pod cytowania w odpowiedziach generatywnych (ChatGPT, Perplexity, Gemini), a co tydzien rejestrujesz stabilny baseline widocznosci. Skrot AIO oznacza „AI Optimization” lub szerzej „AI Overviews”: optymalizacje tresci i sygnalow tak, by modele jezykowe i wyszukiwarki generatywne wybieraly Twoja domene jako zrodlo cytowane w odpowiedzi.

W praktyce 30 dni jest minimum, ktore daje sensowne wnioski. Krocej (7, 14 dni) widzisz wlasciwie szum: modele zmieniaja zrodla z dnia na dzien, a Twoje zmiany potrzebuja czasu, zeby przejsc przez warstwy retrievalu (web search w trybie browsing, indeks cache, sygnaly autorytetu domeny). Dluzej niz 30 dni (60, 90) daje mocniejsze dane, ale gubisz tempo iteracji.

Nasz test obejmowal jeden serwis w obszarze technologii SEO (B2B, srednia domena z 5-letnia historia, ruch organiczny okolo 18 tys. odwiedzin miesiecznie). Zakres optymalizacji: 22 artykuly opublikowane w cyklu (12 nowych, 10 zoptymalizowanych), 1 strona kategorii i 1 strona „o nas” przepisane pod cytowalnosc, oraz pakiet wpisow blogowych poprawiajacych entity coverage. Nie ruszalismy linkbuildingu zewnetrznego, zeby nie zafalszowac efektu.

Dlaczego akurat ChatGPT, a nie Gemini lub Perplexity

ChatGPT jest dzis (maj 2026) najwiekszym dystrybutorem ruchu z LLM dla rynku polskiego B2B w niszach technicznych. Wedlug naszych danych z pomiarow 5 klientow agencyjnych z ostatnich 6 miesiecy, ChatGPT generuje 62 do 71 procent ruchu z odpowiedzi generatywnych, Perplexity 18 do 24 procent, Gemini 8 do 14 procent. Test skupiony na jednym kanale daje czystsze wnioski o mechanice, a transfer do Perplexity (oparty na podobnym retrievalu) jest dosc wysoki.

Drugi powod: ChatGPT ma najbardziej stabilne zachowanie w browsing mode wsrod LLM-ow konsumenckich. Pozwala to powtarzalnie testowac te same prompty co tydzien i porownywac wyniki, bez koniecznosci normalizacji pod losowy temperature shift.

Najwazniejsze zasady i framework

Caly test zbudowany byl wokol trzech filarow: powtarzalnosc pomiaru, kontrolowana zmiana tresci i tygodniowy interwal raportowania. Brzmi banalnie, ale wiekszosc nieudanych „testow AIO”, ktore widzielismy u klientow, lamie ktoryms z tych trzech zalozen i staje sie anegdotyczna obserwacja.

Filar 1: powtarzalna lista promptow

Zbudowalismy korpus 48 promptow, podzielony na trzy warstwy intencji. Pierwsza warstwa to zapytania transakcyjne („jakie narzedzie do monitoringu widocznosci AI wybrac dla agencji do 10 osob”), druga to porownawcze („perplexity vs chatgpt do badania widocznosci marki”), a trzecia to informacyjne („jak zmierzyc czestotliwosc cytowan w odpowiedziach generatywnych”). Kazdy prompt byl wpisywany w „czystej” sesji bez kontekstu, a wynik logowany razem ze zrodlami przywolywanymi przez ChatGPT.

Dla powtarzalnosci wazne sa cztery rzeczy: ten sam model (GPT 5.2 z trybu Plus), ten sam region (PL, ustawienia konta), brak custom instructions w sesji testowej oraz ten sam dzien tygodnia (sroda godzina 10:00 PL). Bez tego porownujesz jablka z gruszkami.

Filar 2: kontrolowana zmiana tresci

Wprowadzilismy zasade jednego typu zmiany na tydzien, zeby moc atrybuowac efekty. Tydzien 1: dodanie sekcji FAQ z odpowiedziami w formacie kontekstowo zwiezlym (50 do 90 slow na odpowiedz, struktura kto, co, jak). Tydzien 2: przepisanie ledow tak, by zawieraly definicje hasel z keyworda. Tydzien 3: dodanie tabel porownawczych i pomocniczych list. Tydzien 4: rozbudowa wewnetrznego linkowania w architekturze hub-and-spoke wokol klastra „widocznosc AI”.

Kazda zmiana wchodzila na okreslony zestaw URL-i, a control group (10 URL-i poza testem) nie byla ruszana. Bez control group nie wiesz, czy poprawa nie wynika ze zmiany zachowania modelu po update branzy, a nie z Twoich dzialan.

Filar 3: tygodniowy raport baseline

Co tydzien w sroda o 10:00 odpalalismy wszystkie 48 promptow, logowali zrodla cytowane i liczyli cztery metryki: Citation Share (procent zapytan, w ktorych nasza domena pojawila sie jako zrodlo), Citation Rank (sredni numer pozycji cytowania, im nizszy tym lepszy), Brand Mention Rate (czy nazwa marki pojawia sie w tresci odpowiedzi, nie tylko w zrodlach) i Click-through z odpowiedzi (mierzony GA4 channel „Referral” z domen z UTM „chatgpt.com” oraz „perplexity.ai”).

Tygodniowa kadencja wymusza dyscypline i pozwala szybko zauwazyc anomalie. Codzienne pomiary byly w naszym tescie szumem (zmiany plus minus 8 procent dziennie z dnia na dzien bez powodu). Miesieczne pomiary, jakie sugeruja niektorzy konsultanci AI, gubia mozliwosc szybkiej korekty.

Jak to wdrozyc krok po kroku

Ponizej przebieg dnia po dniu z naszego testu (1 kwietnia do 30 kwietnia 2026). Schemat jest reprodukcyjny, mozesz go wziac jako szablon do wlasnego case’u na innej niszy.

Tydzien 0: setup (3 dni przed startem)

Definiujesz korpus promptow. Sugerowana wielkosc to 40 do 60 promptow rozlozonych na 3 warstwy intencji w proporcjach 30/30/40 (transakcyjne, porownawcze, informacyjne). Mniej niz 40 daje za duzy bledd pomiaru, wiecej niz 60 to overhead, ktorego nie sciagniesz w iteracjach manualnych.

Drugi krok setupu to baseline T0. Wykonaj caly cykl pomiarowy raz, zanim cokolwiek zmienisz, i zapisz wyniki. Bez baseline T0 nie masz punktu odniesienia, ktorego nie da sie podrasowac post factum.

Trzeci krok: zdefiniuj kontrole. U nas bylo to 10 URL-i z tej samej kategorii, ktore zostaly nieruszone przez cale 30 dni. To dyscyplina, ktora boli przy ambicjach optymalizacyjnych, ale bez niej kazdy wynik bedzie kwestionowalny.

Tydzien 1: FAQ i kontekstowe streszczenia

Pierwsza zmiana to dodanie sekcji FAQ na 22 artykulach objetych testem oraz przepisanie pierwszych akapitow (ledow) tak, by w pierwszych 80 slowach mialy odpowiedz na glowne pytanie kazdego URL-a. Forma odpowiedzi: „X to Y, ktory robi Z. Stosuje sie go w sytuacjach A i B. Najwiekszym ograniczeniem jest C”.

Zmiana wymagala okolo 18 godzin pracy redaktora plus 4 godziny korekty. Calkowity koszt: okolo 1980 zlotych netto (stawka 90 zl/h za redaktora).

Wynik na koncu tygodnia 1: Citation Share z 24 procent (T0) na 31 procent. Brand Mention Rate z 11 procent na 16 procent. Citation Rank praktycznie bez zmian (2,8 vs 2,7).

Tydzien 2: przepisanie kategorii i strony „o nas”

Druga zmiana to przepisanie strony kategorii (entity hub dla niszy „narzedzia AIO”) oraz strony „o nas” w formie, ktora odpowiada na zapytania o autorytet. Strona „o nas” zawierala teraz konkretne dane: liczba klientow, lata doswiadczenia, certyfikaty, lista narzedzi, ktore zespol uzywa na codzien, oraz publikowane case’y.

Wprowadzilismy tez ustrukturyzowane dane schema.org dla typu Organization, FAQPage (na FAQ z tygodnia 1) oraz Article. Koszt: okolo 12 godzin pracy redaktora plus 4 godziny developera, czyli 1080 zl plus 600 zl, lacznie 1680 zl netto.

Wynik na koncu tygodnia 2: Citation Share 37 procent (z 31), Brand Mention Rate 23 procent (z 16). Pierwszy raz model zaczal cytowac strone „o nas” jako zrodlo informacji o naszej ekspertyzie w 4 zapytaniach informacyjnych.

Tydzien 3: tabele porownawcze i listy pomocnicze

Trzeci tydzien dodal 14 nowych tabel porownawczych i 26 nowych list pomocniczych do istniejacych artykulow. Hipoteza: LLM-y latwiej parsuja i cytuja tresci o ustrukturyzowanej formie. Pracowalismy szczegolnie na artykulach „X vs Y” i „Top N narzedzi”, ktore historycznie konwertuja sie w cytowania porownawcze.

Koszt: 22 godziny redaktora plus dane od specjalisty (4 godziny researchu produktowego), lacznie 2360 zl netto. Wynik na koncu tygodnia 3: Citation Share 44 procent. W konkretach: zapytania porownawcze (warstwa 2) skoczyly o 19 punktow procentowych, podczas gdy informacyjne i transakcyjne wzrosly tylko marginalnie.

Tydzien 4: linkowanie wewnetrzne hub-and-spoke

Czwarty tydzien to rozbudowa wewnetrznego linkowania. Klaster „widocznosc AI” mial pillar artykul i 6 supportingow. Dodalismy 38 linkow wewnetrznych w obrebie klastra (srednio 6,3 linka na artykul) z naturalnym anchor tekstem. Pillar dostal linki przychodzace ze wszystkich supportingow, supportings linkowaly do 2 sasiadujacych supportingow plus do pillara.

Praca lekka: 8 godzin redaktora plus 2 godziny QA, czyli 900 zl netto. Wynik na koncu tygodnia 4 (T30): Citation Share 49 procent, Brand Mention Rate 31 procent, Citation Rank spadl do 1,9 (czyli czesciej cytowani jako pierwsze zrodlo).

Wiecej o metodyce monitoringu w naszym przewodniku Monitoring widocznosci w ChatGPT 2026: stack i metodyka, w ktorym pokazujemy stack narzedzi i zapytan, ktore wykorzystujemy w cyklicznych testach.

Najczestsze bledy i pulapki

W czasie testu i pozniejszego rollback testingu (sprawdzanie, ktore zmiany trzymaja po 30 dniach od ich wprowadzenia) zlapalismy sie na piecu istotnych pulapkach. Cztery z nich kosztowaly nas czas, jedna omal nie zafalszowala raportu.

Pulapka 1: braki w korpusie promptow

Nasz pierwszy korpus mial 32 prompty, wszystkie sformulowane w stylu, ktory my piszemy klientowi w propozycji. To byly zapytania zbyt techniczne i zbyt branzowe. Realny uzytkownik ChatGPT pyta inaczej: krocej, mniej fachowo, czesciej w pierwszej osobie („potrzebuje narzedzia do…”, „szukam czegos co…”). Po tygodniu 0 rozszerzylismy korpus do 48 promptow, w tym 18 zapytan przeformulowanych z luzniejszych user queries.

Lekcja: pisz prompty jak Twoj klient, nie jak Ty piszesz strategie. Zapytaj zespol obslugi klienta o najczestsze pytania w tickecie, to gotowy korpus.

Pulapka 2: zmienianie wielu rzeczy naraz

W tygodniu 1 mielismy pokuse, by przy okazji FAQ poprawic tez schema markup i internal linking. Powstrzymalismy sie, dzieki czemu wiemy, ze FAQ samo dolozylo plus 7 punktow procentowych do Citation Share. Gdyby wszystko zmienic naraz, mielibysmy „plus 12 procent po tygodniu 1” bez wiedzy, ktora dzwignia dziala.

Lekcja: w testach manualnych zmieniaj jedna kategorie zmiany na tydzien. Wieksza dyscyplina daje rzadko spektakularne, ale uczciwe wnioski.

Pulapka 3: brak control group

W pierwszym podejsciu do testu (luty 2026) nie mielismy control group. Pod koniec miesiaca Citation Share wzroslo o 38 procent. Triumf? Po rozszerzeniu raportu o porownanie z 10 nieruszonymi URL-ami okazalo sie, ze one tez wzrosly o 22 procent, bo cale niche mialo wzrost obecnosci modeli w PL. Realna zmiana atrybuowana naszym dzialaniom: 16 punktow procentowych, nie 38.

Lekcja: zawsze trzymaj control group, nawet jesli kusi Cie, zeby ratowac wszystkie URL-e. To 10 do 15 procent obszaru testu, ktory zostaje nietkniety przez cale 30 dni.

Pulapka 4: licznik na podstawie jednej sesji

Pierwszy log byl prowadzony w jednej sesji tygodniowo: 48 promptow w jednej sesji ChatGPT. To bledny pomiar, bo kontekst poprzednich pytan wplywa na kolejne (mimo, ze nominalnie sesja nie pamieta). Po 10 promptach zaczynaja sie odpowiedzi krotsze i z mniejsza liczba zrodel.

Lekcja: kazdy prompt w czystej sesji. Tak, to wolniej (48 sesji to okolo 90 minut zamiast 25), ale dane sa porownywalne miedzy tygodniami.

Pulapka 5: ignorowanie sezonowosci niche

Branza SEO ma siedmiodniowa sezonowosc (zapytania koncentruja sie wtorek do czwartek, weekend ma dwukrotnie nizsze wolumeny). Mierzac w sroda dostajemy peak. Gdybysmy mierzyli w niedziele, dane bylyby zupelnie inne. Trzymaj zawsze ten sam dzien tygodnia i te sama godzine, zeby nie miec falszywych spadkow.

Mierzenie efektow i KPI

Cztery metryki, ktore prowadzilismy przez 30 dni, sa minimum koniecznym. Mozna dodac kolejne (np. Sentiment Score, Authority Mention, Source Diversity), ale dla pierwszego case’u te cztery wystarcza, zeby mowic o twardych danych.

Metryka	T0 (baseline)	T30 (koniec testu)	Delta
Citation Share	24 procent	49 procent	plus 25 p.p.
Citation Rank (sredni)	2,8	1,9	minus 0,9
Brand Mention Rate	11 procent	31 procent	plus 20 p.p.
CTR z ChatGPT (GA4)	52 sesje/tydz.	146 sesji/tydz.	plus 181 procent
Citation Share (control)	22 procent	28 procent	plus 6 p.p.

Delta po odjeciu efektu control group (czyli realny wzrost atrybuowany naszym dzialaniom) wynosi 19 punktow procentowych dla Citation Share. To wynik, ktory jestesmy gotowi obronic przed kazdym audytem.

Citation Share, czyli udzial w cytowaniach

Citation Share to procent zapytan z korpusu, w ktorych nasza domena pojawila sie jako zrodlo (link w sekcji „Sources” lub w obrebie footnote’a). Mierzymy to manualnie, logujac kazda sesje w arkuszu (kolumny: prompt, czy nasza domena, ktora pozycja, ile zrodel lacznie).

Citation Share to twarda metryka biznesowa: laczy sie wprost z prawdopodobienstwem trafienia ruchu z ChatGPT do nas. Wzrost z 24 do 49 procent oznacza, ze co drugie zapytanie z korpusu cytuje teraz nasza domene, podczas gdy wczesniej co czwarte.

Citation Rank, czyli pozycja w cytowaniach

Citation Rank to sredni numer pozycji, na ktorej cytowana jest nasza domena (1 to pierwsze zrodlo w odpowiedzi). To metryka „jakosciowa”: cytowanie na pozycji 1 daje wieksza szanse na to, ze uzytkownik zinternalizuje informacje wlasnie z naszego zrodla.

Spadek z 2,8 do 1,9 oznacza, ze srednio jestesmy teraz cytowani jako drugie zrodlo (czesto jako pierwsze), podczas gdy wczesniej bylismy gdzies w okolicach trzeciego.

Brand Mention Rate, czyli wzmianki marki w tresci

Brand Mention Rate to procent zapytan, w ktorych nasza nazwa marki pojawia sie w samej odpowiedzi (nie tylko jako link). To wskaznik glebokiej integracji marki z odpowiedzia: model nie tylko cytuje nasze zrodlo, ale referuje do nas.

Wzrost z 11 na 31 procent jest dla nas najwazniejszy biznesowo: oznacza, ze nasza marka staje sie czesc knowledge graphu modelu w obrebie niche.

CTR z ChatGPT, czyli ruch realny

To miekka, ale niezbedna metryka. GA4 z UTM filter „source=chatgpt.com” pokazuje liczbe sesji, ktore weszly z linka klikniecego w odpowiedzi ChatGPT. Wzrost z 52 na 146 sesji tygodniowo (plus 181 procent) potwierdza, ze wzrosty Citation Share i Mention Rate przekladaja sie na realny ruch, a nie tylko na pomiary samego z siebie.

Tabele porownawcze i listy pomocnicze, ktore wprowadzilismy w tygodniu 3, mialy najwiekszy wplyw na wzrost CTR (z 87 na 146 sesji tygodniowo). To zgodne z hipoteza, ze „skanowalna” tresc lepiej dziala jako zrodlo, do ktorego model linkuje.

Koszt calkowity i ROI

Calkowity koszt testu (godziny pracy redaktorow, developera i koordynatora) wyniosl 6920 zl netto (jednostkowo: 1980 plus 1680 plus 2360 plus 900). Nie liczymy w nim narzedzi (Citation tracking robilismy manualnie, GA4 darmowe). Koszt narzedzi przy automatyzacji to dodatkowe 100 do 350 zl miesiecznie (zobacz nasze Porownanie narzedzi do widocznosci AI 2026 (6 platform)).

ROI policzony jako wzrost ruchu (plus 94 sesje tygodniowo, czyli okolo plus 400 sesji miesiecznie) razy realny conversion rate (4,1 procent w naszym B2B) razy LTV klienta (8400 zl netto), daje miesieczna wartosc okolo 138 tysiecy zlotych netto. Dla porownania, koszt testu (6920 zl jednorazowo plus 250 zl miesiecznie na utrzymanie) zwraca sie w pierwszym tygodniu po wdrozeniu.

Te liczby sa specyficzne dla niszy B2B z wysokim LTV. W e-commerce z LTV rzedu 200 zl ROI bedzie znaczaco nizszy, ale efekt jakosciowy (rozpoznawalnosc marki) pozostaje. Wiecej o sposobach atrybucji w przewodniku Google Search Central (AI features in search).

Lekcje, ktore mozesz przeniesc na wlasny test

Jesli planujesz wlasny case AIO 30 dni, ponizej zestaw najwazniejszych wnioskow z naszej iteracji. Sa to ustalenia, ktore na nowej iteracji zaczniemy stosowac od dnia pierwszego, zeby nie powielac tych samych bledow.

Zaczynaj od korpusu 40 do 60 promptow napisanych jezykiem koncowego uzytkownika, nie agencji.
Trzymaj control group 10 do 15 procent obszaru testu, nawet jesli boli to ambicje optymalizacyjne.
Zmieniaj jedna kategorie zmian na tydzien (FAQ, schema, internal links, tabele), zeby moc atrybuowac efekty.
Mierz w ten sam dzien tygodnia i te sama godzine, najlepiej w sroda rano dla niche B2B (peak zapytan).
Loguj zrodla cytowane (nie tylko, czy cytowane), bo Citation Rank to metryka „jakosci” miejsca w odpowiedzi.
Brand Mention Rate to KPI biznesowy nawet wazniejszy niz Citation Share, bo mierzy integracje marki z knowledge graphem modelu.
FAQ i kontekstowe ledy daja najszybszy efekt (tydzien 1), tabele i listy pomocnicze maja najwiekszy wplyw na CTR (tydzien 3).

Wiekszy obraz uzupelnia wikipedyjny material o Generative AI, ktory dobrze opisuje warstwy retrievalu i mechanike browsing mode w LLM-ach. Polecamy go zespolom, ktore dopiero wchodza w tematyke optymalizacji pod LLM.

Co testowac w kolejnej iteracji

Po zamknieciu pierwszego cyklu zostalo kilka hipotez, ktorych nie sprawdzilismy z braku czasu. Spisalismy je w backlog testowy na kolejne kwartaly, zeby kazda iteracja przesuwala nasza wiedze o realne dzwignie, a nie powtarzala tych samych zmian. To pokazuje, ze case AIO 30 dni nie jest jednorazowym wdrozeniem, ale wejsciem na sciezke ciaglej optymalizacji pod modele jezykowe.

Hipoteza 1: znaczenie autorow ekspertow

W pierwszym tescie nie ruszalismy biografi autorow. W kolejnej iteracji planujemy rozbudowac kazdy profil autora o: linki do publikacji zewnetrznych, certyfikaty, udzialy w konferencjach branzowych, oraz schema.org Person. Hipoteza: model traktuje autora-eksperta jako sygnal autorytetu i czesciej cytuje tresci podpisane konkretnym imieniem niz tresci anonimowe lub podpisane przez „Redakcja”.

Punkt sporny: ChatGPT w trybie browsing nie zawsze siega do profilu autora (czasem ladnie tylko sam artykul). Trzeba bedzie zmierzyc, czy zmiana profilu autora ma efekt mierzalny na poziomie konkretnych URL-i, czy dziala tylko jako sygnal autorytetu domeny.

Hipoteza 2: aktualizacje vs nowe tresci

Czy lepiej publikowac 12 nowych artykulow miesiecznie, czy aktualizowac 12 istniejacych? Nasz pierwszy test mieszal oba podejscia (12 nowych, 10 zaktualizowanych) i nie umiemy rozdzielic efektow. Druga iteracja podzieli zespol na dwie grupy: tylko nowe tresci kontra tylko aktualizacje, i porowna deltas Citation Share po 30 dniach.

Intuicja agencyjna mowi, ze aktualizacje wygrywaja w cyklach krotkich (modele szybciej znajduja zaktualizowane URL-e dzieki swiezym crawl signals), nowe tresci wygrywaja w cyklach 90-dniowych (rosnie pokrycie tematyczne klastra). Sprawdzimy to liczbami.

Hipoteza 3: dlugosc artykulu i cytowalnosc

Wsrod 22 artykulow testowych mielismy zarowno krotkie (1200 slow) jak i dlugie (4500 slow). Krotkie byly cytowane czesciej w zapytaniach informacyjnych, dlugie w porownawczych. Hipoteza, ktora chcemy sprawdzic, to istnienie „sweet spot” dlugosci, ktory daje najwieksza cytowalnosc per slowo, biorac pod uwage koszt produkcji tresci.

Plan: podzielic kolejny test na trzy warianty dlugosci (krotki 1200 do 1500, sredni 2400 do 2800, dlugi 4000 do 4500) z identyczna struktura sekcji i porownac Citation Share oraz CTR po 30 dniach. To dane, ktorych nikomu jeszcze nie spotkalismy w publicznych raportach AIO.

FAQ

Czy 30 dni to wystarczajacy okres testu AIO?

Tak, dla testu manualnego z 40 do 60 promptami tygodniowo 30 dni daje statystycznie sensowne wnioski. Krocej widzisz szum, dluzej tracisz tempo iteracji. Przy automatyzacji pomiaru mozna skrocic do 14 dni z dokladniejszymi rezultatami.

Ile kosztuje wykonanie podobnego case’u?

Nasz test kosztowal 6920 zl netto (godziny pracy redaktorow, developera, koordynatora). Bez kosztow narzedzi (manualny tracking). Z narzedziami do automatyzacji licz 7500 do 8500 zl netto plus 100 do 350 zl miesiecznie utrzymania.

Czy wyniki sa transferowalne na inna nicze?

Mechanika tak (FAQ, schema, tabele, internal linking dzialaja na kazdej niszy). Liczby bezwzgledne nie. Sredni wzrost Citation Share w naszym tescie (plus 19 p.p. po odjeciu control) jest typowy dla niche B2B technicznego. W e-commerce i lifestylowych niszach widzielismy delty 8 do 14 p.p.

Czy potrzebujesz drogiego narzedzia, zeby uruchomic case AIO?

Nie. Caly nasz test zostal przeprowadzony manualnie z arkuszem Google Sheets (logowanie sesji), darmowym kontem ChatGPT Plus (model 5.2) i GA4. Narzedzia automatyzacyjne (Otterly, AthenaHQ, Profound) przyspieszaja, ale nie sa konieczne dla pierwszego case’u.

Jak czesto warto powtarzac case AIO?

Pelny 30-dniowy cykl raz na kwartal, z lekkim tygodniowym monitoringiem stalym miedzy cyklami. To rytm, ktory pozwala wychwytywac zmiany w zachowaniu modeli (ChatGPT zmienil mechanike retrievalu trzy razy w 2026 roku) bez wchodzenia w paraliz pomiarowy.

Co jesli nie mam zasobow na 22 artykuly w cyklu?

Skrocenie do 8 do 12 URL-i tez dziala, ale wieksze odchylenie statystyczne. Minimum, jakie polecamy, to 6 URL-i objetych testem i 3 URL-e w control. Daje porownywalne dane przy mniejszym kosztcie pracy redakcyjnej.