Fable 5 Is BACK… But GPT 5.6 Is Almost Here

O czym jest ten film

Anthropic ponownie udostępnił Fable 5 — najpotężniejszy model na świecie wraca, ale z ograniczeniami, limitami i mechanizmami nadzoru.
Trzy tygodnie wcześniej, po zaledwie około 78 godzinach od premiery, model został zawieszony na mocy dyrektywy rządu USA jako potencjalne zagrożenie dla bezpieczeństwa narodowego.
Riley pokazuje grę strategiczną w stylu StarCrafta („wyścig do superinteligencji”), którą zbudował w czterech promptach — kosztowało go to 174 dolary.
Fable 5 jest dostępny w płatnych planach tylko do 7 lipca i maksymalnie do 50% tygodniowego limitu; potem zostaje wyłącznie drogie rozliczenie API.
Model potrafi w trakcie pracy „przekierować” zadanie do Opusa 4.8 — jeden ze streamerów zapłacił 321 dolarów za sesję, z której tylko 78 dolarów faktycznie trafiło do Fable 5.
Anthropic wypuścił też Sonnet 5, ale zdaniem Rileya to model „meh” — na papierze tańszy, w praktyce droższy w przeliczeniu na wykonane zadanie niż Opus 4.8.
Kluczowa lekcja: nie mierz kosztów AI ceną za milion tokenów, tylko kosztem ukończenia konkretnego zadania.
OpenAI zapowiedziało trzy nowe modele — Soul, Terra i Luna — z których Soul ma być blisko poziomu Fable 5 przy cenie GPT 5.5; wszystkie przechodzą teraz taki sam rządowy proces weryfikacji.
Cursor wydał aplikację na iOS z agentami w chmurze, które piszą kod, testują aplikację, nagrywają ekran i odsyłają wideo z pull requestem — zdaniem Rileya to najbardziej niedoceniona premiera tygodnia.
Nadchodząca era SaaS to sprzedawanie agentów zamiast aplikacji — agenci osadzeni w Slacku (jak Claude Tag) czy iMessage zastąpią klasyczne narzędzia produktywności.

Redakcyjne tłumaczenie

Fable 5 wraca — ale na nowych zasadach

Tak, to prawda: Fable 5 wrócił. Anthropic ponownie udostępnił najpotężniejszy model na świecie, ale z pewnymi restrykcjami, limitami i dość dziwnymi mechanizmami nadzoru, o których dziś opowiem. Anthropic wypuścił też zupełnie nowy model, Sonnet 5, który zbiera — delikatnie mówiąc — mieszane recenzje. Porozmawiamy również o OpenAI, które zapowiedziało trzy nowe modele; jeden z nich jest bardzo blisko poziomu Fable 5 i znacząco wzmocni Codex, zwłaszcza gdy przyspieszą go dziesięciokrotnie. Do tego dochodzi nowa aplikacja Cursora na iOS oraz temat, który uważam za kolejną erę SaaS: sprzedawanie agentów zamiast aplikacji.

Oglądacie Agent Native — program o najnowszych wiadomościach dotyczących platform i modeli agentowych, ale patrzymy na nie przez konkretny pryzmat: jak te aktualizacje pomagają nam stawać się bardziej „agent native” i skuteczniej wykorzystywać agentów w biznesie. Nazywam się Riley Brown. Zaczynajmy.

Gra za 174 dolary w cztery prompty

Fable 5 wrócił, więc wziąłem go na test — i w czterech promptach stworzyłem grę. Pokazałem ją Vashallowi, który jest programistą. Ta gra kosztowała mnie 174 dolary. To „wyścig do superinteligencji”: gram jako Anthropic, muszę zbierać moc obliczeniową i dane. Mogę postawić centrum danych — i postać naprawdę je buduje. Mogę zbudować elektrownię. OpenAI jest gdzieś na mapie, która odsłania się dopiero, gdy wyślę postać na zwiad — dokładnie jak w StarCrafcie. Można zawierać umowy rządowe, na przykład podpisać kontrakt obronny. Można zbierać zasoby i toczyć walki — choć jeszcze nie wiem, jak tworzyć nowe jednostki, więc OpenAI regularnie mnie rozbija. Vashall żartował, że brakuje mi postaci Dario na dachu budynku Anthropica i „oddziału Claude Code” z Borisem na czele. (Informacja dodatkowa: chodzi o Dario Amodeia, CEO Anthropica, i Borisa Chernego, twórcę Claude Code.)

Tak czy inaczej: wielki Fable 5 wrócił — z zabezpieczeniami, regułami i dziwnym nadzorem, do którego dojdziemy. Ale ten model jest po prostu niesamowicie przyjemny w użyciu. Drogi, ale naprawdę daje frajdę.

Jak do tego doszło — kalendarium zawieszenia

Zanim wejdziemy w szczegóły, warto uporządkować oś czasu. Trzy tygodnie temu, 9 czerwca, Anthropic wypuścił Fable 5 — wszędzie. Można było z niego korzystać w aplikacji desktopowej Claude, w Claude Code w terminalu, przez API — czyli w Cursorze, Replicie, Lovable i praktycznie każdej platformie. Model był hostowany na Amazon Web Services i podbijał świat.

A potem, zaledwie trzy dni później — jakieś 78 godzin po premierze — model został faktycznie tymczasowo zablokowany. Anthropic otrzymał około godziny 17:00 czasu wschodniego dyrektywę rządu USA nakazującą zawieszenie dostępu do Fable 5 i Mythos 5 dla obywateli innych państw — i po prostu wyłączył model dla wszystkich. W skrócie: rząd USA uznał go za zagrożenie dla bezpieczeństwa narodowego, a do tego zgłaszano wiele przypadków jailbreaków. Nie chciano, by model trafił w ręce cudzoziemców, a Anthropic nie miał żadnego sposobu, żeby szybko zweryfikować narodowość każdego użytkownika — więc zablokował model wszystkim.

To ma zresztą konsekwencje dla nas, użytkowników Claude Code: firma musi teraz weryfikować naszą narodowość, co oznacza, że przy każdym użyciu Claude Code do Anthropica trafia więcej informacji, niż mogłoby się wydawać.

Kilkutygodniowy okres po banie był jednym z najciekawszych momentów, jakie widziałem w świecie AI. Deweloperzy, z którymi rozmawiałem w Dolinie Krzemowej i tu, w Nowym Jorku, tkwili w „fable’owej depresji” — po prostu czekali na powrót modelu. W tym czasie trwał przegląd: Anthropic weryfikował Fable 5 wspólnie z rządem USA, przy wsparciu Amazona, wzmacniając zabezpieczenia.

Przełom nastąpił 26 czerwca, gdy OpenAI zapowiedziało trzy nowe modele: Soul, Terra i Luna. Soul jest najpotężniejszy — i co ciekawe, ma kosztować tyle samo co GPT 5.5, czyli będzie tańszy od Claude Fable, a jednocześnie ma być niemal równie mocny co Fable 5. Kilka dni później Anthropic ogłosił, że Fable 5 wraca — najpierw do wąskiego grona zaufanych partnerów testowych — a wczoraj model wrócił dla wszystkich.

Teraz czekamy na oficjalną premierę modeli OpenAI, które przechodzą ten sam proces co Anthropic — dlatego jeszcze ich nie ma. Od premiery Fable 5 wszystkie nowe modele przechodzą zaostrzoną procedurę przeglądu i tak już zostanie: każda premiera będzie trwała znacznie dłużej, bo trzeba ją „przepchnąć” przez rząd USA, żeby — przynajmniej z jego perspektywy — była bezpieczna dla publiczności. Ale sądzę, że w ciągu najbliższych dni zobaczymy nowy model OpenAI, który dorówna Fable’owi i prawdopodobnie będzie od niego szybszy. Bardzo na to czekam.

Limity, ceny i pułapka rozliczeń API

Anthropic ogłosił, że wszystkie płatne plany z wliczonym użyciem mają dostęp do Fable 5 do 7 lipca. Można z niego korzystać do 50% tygodniowego limitu, po czym trzeba przełączyć się na inny model. Można też płacić dalej kredytami za użycie.

Jak to wygląda w praktyce? W aplikacji desktopowej Claude — gdzie głównie pracuję, czy to w czacie, w co-work, czy w Claude Code — jest okrągły wskaźnik pokazujący zużycie. W szczegółach widać bieżącą sesję i limity tygodniowe. Do tej pory był jeden pasek limitów: zależnie od planu (20, 100 albo 200 dolarów miesięcznie) dostajesz określoną pulę tygodniową, a różne modele zużywają ją w różnym tempie. Jest Haiku — najmniejszy model, niezbyt dobry. Jest Sonnet — środkowy, całkiem niezły. I jest Opus — dotąd ich najlepszy model i jeden z najlepszych na świecie (moim zdaniem odrobinę słabszy od GPT 5.5), ale też najdroższy.

Fable jest tak dobry i tak drogi, że Anthropic musiał stworzyć dla niego zupełnie osobny pasek limitów tygodniowych. Wyczerpiecie go dużo szybciej — a na planie za 20 dolarów miesięcznie błyskawicznie. Po przekroczeniu limitu jesteście odcinani i przechodzicie na rozliczenie API: płacicie za każdy zużyty token. Tak właśnie powstała moja gra za 174 dolary — cztery prompty. Muhammad, inżynier pracujący ze mną w Nowym Jorku, odpalił jeden prompt analizujący bazę kodu — model rozkręcił mnóstwo subagentów, a on tylko zadawał pytania o kolejną funkcję do dodania. Ten jeden prompt kosztował 135 dolarów.

Smutna część tej historii: użycie Fable 5 jest wliczone w plany tylko do 7 lipca. Za pięć dni zostaje wyłącznie rozliczenie API — i każde użycie modelu będzie znacząco droższe.

Przekierowania do Opusa — kontrowersja tygodnia

Model jest nie tylko drogi — częściej też „przekierowuje”. To znaczy: czasem w trakcie odpowiedzi Fable 5 po prostu przełącza się na Opusa 4.8 i to on kończy pracę, co mocno irytuje użytkowników. Bridgemind, jeden z moich ulubionych streamerów — człowiek, który vibe-koduje na żywo pięć dni w tygodniu — napisał: „Właśnie zapłaciłem 321 dolarów za sesję kodowania, w której Fable 5 odmówił wykonania pracy”. Z tych 321 dolarów tylko 78 poszło na Fable 5, a Opus 4.8 „zjadł” 242. Skarży się więc, że wybrany przez niego model wykonał ćwierć roboty. Anthropic twierdzi, że przekierowanie ma dotyczyć tylko wąskiego zbioru zadań — tych z ryzykiem cyberbezpieczeństwa — ale on pokazał paragony, a te proporcje nie wyglądają dobrze. Nie wiem, nad czym pracował w tej sesji.

Z drugiej strony Theo, którego treściom bardzo ufam, mówi, że Fable 5 ani razu nie przekierował go przy prawdziwej pracy nad kodem i że obawy były mocno przesadzone. A Jack Dorsey napisał: „Trafiam na to za każdym razem, gdy pracuję nad czymkolwiek związanym z Torem albo kryptografią” — co akurat ma sens. W teorii Fable 5 powinien być przekierowywany tylko przy zadaniach dotyczących cyberbezpieczeństwa lub stwarzających ryzyko, ale sporo osób zgłasza przekierowania przy przypadkowych zadaniach. W miarę jak będę się dowiadywał więcej, wrócę do tematu w kolejnych odcinkach Agent Native.

Sonnet 5 — dlaczego „tańszy” model może być droższy

To nie była jedyna premiera tygodnia. We wtorek Anthropic wypuścił Sonnet 5 — swój najnowszy model. Znajdziecie go w aplikacji Claude (w czacie, co-work i Claude Code) i praktycznie na każdej platformie AI: w Cursorze, Lovable, Replicie i podobnych.

Mój główny wniosek z tej premiery: mierzymy efektywność modeli AI kompletnie źle. Spójrzmy na cennik Sonneta 5 na tle Opusa i Fable 5. W teorii powinien być prawie trzy razy tańszy od Opusa 4.8 i prawie pięć razy tańszy od Fable 5. Surowe koszty za milion tokenów: Sonnet 5 to 12 dolarów (wejście plus wyjście za milion tokenów łącznie), Opus — 30 dolarów. Czyli Sonnet powinien wychodzić blisko trzykrotnie taniej niż Opus i pięciokrotnie taniej niż Fable.

Tyle że w praktyce tak nie jest. Jeśli zmierzyć nie tokeny, a koszt na zadanie, Claude Opus okazuje się tańszy od Sonneta. W przytoczonym porównaniu Opus zużywał na tyle mniej tokenów, że wykonanie zadania kosztowało 1,80 dolara, podczas gdy Sonnet 5 potrzebował 2,29 dolara. Jak zauważył użytkownik Palm: „Ałć — to mniej więcej poziom GLM 5.2 (otwartoźródłowego modelu chińskiego Z.ai), tylko pięć razy drożej”.

Jeśli macie wynieść z tej części jedną rzecz, to tę: nie ufajcie ślepo surowym cenom tokenów. Patrzcie, ile kosztuje ukończenie konkretnego zadania — tak powinno się mierzyć wykorzystanie modeli AI.

Spędziłem około trzech godzin, testując Sonneta w dniu premiery i szukając czegoś ciekawego do powiedzenia. Wszystko, co mam do powiedzenia o tym modelu, to: „meh”. Wydaje się nieco gorszą wersją Opusa 4.8, nie jest dużo tańszy i z mojej perspektywy niewiele zyskacie, przechodząc na niego. Taka jest brutalna prawda.

Cursor na iOS — najbardziej niedoceniona premiera tygodnia

Teraz to, co uważam za najbardziej niedocenioną premierę tygodnia: aplikacja Cursora na iOS. Cursor wypuścił aplikację na iPhone’a — możecie budować aplikacje z telefonu, niezależnie od tego, czy umiecie programować. I robią coś naprawdę ciekawego z agentami w chmurze. Nie zdawałem sobie sprawy, że budują infrastrukturę, która pozwala tworzyć aplikacje z telefonu: uruchamia się „komputer w chmurze”, który pisze cały kod, potem faktycznie testuje aplikację, nagrywa ekran i wysyła nagranie prosto do aplikacji na iOS.

W materiale promocyjnym Cursora pokazano trzy sposoby użycia: agent testuje i obsługuje oprogramowanie w chmurze tymi samymi narzędziami, których użylibyśmy na MacBooku, a potem odsyła wideo-demo pokazujące, że wszystko działa — można przejrzeć kod, dać modelowi feedback i zmergować zmiany z telefonu. Można nagrywać bardzo długie notatki głosowe z maksymalną ilością szczegółów i odpalać agentów w przerwie na lunch albo przed snem, a postęp śledzić przez powiadomienia lub live activity na iOS. A gdy coś nie gra w interfejsie, wystarczy zrobić zrzut ekranu, narysować na nim uwagi i zostawić komentarz w stylu „zmniejsz odstępy”, a potem dorzucić ulubione skille, jak „/thermonuclear code quality review”. Aplikacja działa też jako pilot do agentów uruchomionych na własnym komputerze.

Jedno zastrzeżenie: Cursor — przynajmniej w wersji iOS — wymaga pewnego poziomu technicznego. To nie jest aplikacja jak Replit na iOS, gdzie po prostu stawiacie szybką stronę. Ta aplikacja musi łączyć się z GitHubem, więc trzeba wiedzieć, czym jest GitHub i czym jest repozytorium. Trzeba też zrozumieć, że przy agentach chmurowych można tylko kontynuować istniejące projekty, a nie tworzyć nowe: agent bierze wasz istniejący kod, uruchamia się w chmurze (czyli na komputerze w chmurze zamiast na waszej maszynie), generuje nowy kod, testuje aplikację, nagrywa ekran i odsyła wam wynik razem z pull requestem aktualizującym kod. To narzędzie dla deweloperów pracujących nad istniejącymi projektami.

Gdybym miał ocenić wymagany poziom wiedzy programistycznej w skali 1–10, dałbym jakieś 5. Ale gdy już opanujecie podstawy i umiecie założyć repozytorium, możecie odpalać z telefonu całą flotę agentów, które napiszą kod, przetestują aplikację, nagrają ekran i wyślą wam wynik — a wy możecie jeszcze nanosić na niego adnotacje. To naprawdę świetne doświadczenie.

Myślę, że w przyszłości dodadzą wbudowaną przeglądarkę, co pozwoli w pełni vibe-kodować, bo jednym z celów Cursora jest zbudowanie „GitHuba dla kodowania AI”. Idą po GitHuba — i szczerze uważam, że im się uda. W kwestii AI-kodowania stawiam na Cursora, bo jako jedyni skupiają się wyłącznie na deweloperach, podczas gdy OpenAI i Anthropic budują dużo także pod pracę biurową. Będę was informował, gdy dodadzą nowe funkcje — zwłaszcza jeśli aplikacja stanie się ważniejszym narzędziem dla marketingu, operacji i pracy umysłowej w ogóle. Na razie jednak: jeśli nie jesteście techniczni, nie polecam jej pobierać.

Agenci to nowy SaaS

Ostatni temat na dziś to coś, co poruszył Greg Eisenberg w swoim ostatnim wideo: idea, że agenci AI to nowy SaaS. Czy ludzie zaczną sprzedawać agentów zamiast aplikacji? Myślę o tym od bardzo dawna. Czy aplikacje produktywnościowe i SaaS-y po prostu umrą? Bo aplikacja produktywnościowa to w gruncie rzeczy tylko powierzchnia — nakładka na bazę danych, jakieś dane i funkcje. Narzędzia jak Typefully czy Hootsuite, gdzie z jednego miejsca publikujecie na wszystkie platformy społecznościowe, to po prostu powierzchnie, które pomagają ludziom wykonywać pracę. A agenci AI mogą tę pracę wykonać bezpośrednio. Im będą mądrzejsi, tym bardziej będą przypominać współpracowników.

To jeden z głównych powodów, dla których Anthropic wypuścił Claude Tag, zamiast — jak się spodziewałem — wkładać mnóstwo wysiłku w aplikację desktopową. Anthropic obstawia zupełnie inne podejście: ich teza brzmi, że nie wygra żadna „superaplikacja”, tylko pracownicy-agenci wewnątrz narzędzi, których ludzie już używają — czyli Slacka. Każdy zespół czy firma może dodać agentów do Slacka i oznaczać Claude’a przez @, jak człowieka. Ta „superludzka” istota żyjąca w Slacku rozumie cały kontekst waszego biznesu, zna umiejętności wszystkich działów i pracuje ramię w ramię z ludźmi.

Pomyślcie o ekranie głównym iPhone’a. Każda pobrana aplikacja to kolejna powierzchnia i kolejna platforma do nauczenia się: gdzie są przyciski, przełączniki, ustawienia. Agenci AI nie tylko wykonują pracę, którą robilibyście w wielu aplikacjach — oni dodatkowo żyją w powierzchniach, których już używacie. Możecie wstawić agenta do iMessage. Możecie wstawić agenta do Slacka. W tę stronę zmierzają agenci Claude’a.

Partner biznesowy Grega Eisenberga — na Twitterze znany jako Boring Marketer — sprzedawał kiedyś produkt, skille dla agentów AI i społeczność. Teraz jego głównym produktem na boringmarketing.com jest agent, którego dodaje się do Slacka. Mówię wam: to będzie największy trend w AI wśród przedsiębiorców i ludzi, którzy chcą na tym zarabiać. Wiele osób budujących narzędzia SaaS przestawi się na „SaaS-agentów” — wyspecjalizowanych agentów, których po prostu dodaje się do narzędzi już używanych w firmie.

Moja prognoza: platforma szablonów agentów

Moja wielka prognoza na tę erę: wierzę, że w ciągu najbliższych sześciu miesięcy powstanie platforma pozwalająca ludziom budować własnych agentów. Nazywam to „szablonami agentów” i mówię o tym od trzech do sześciu miesięcy: kto pozwoli ludziom tworzyć agentów albo szablony, które można dostosować do konkretnych workflow, i dodawać je do Slacka — ten zbuduje ogromną, bardzo udaną firmę.

Jak się do tego przygotować? Zrozumcie, jak działają agenci AI i jak budować naprawdę solidnych agentów rozwiązujących bardzo konkretne zadania. Rzeczy, które warto studiować:

Instrukcje — plik instrukcji, który agent czyta przy każdym uruchomieniu; to w praktyce jego system prompt.
Skille agentów — dlatego warto używać Codexa albo Claude co-work: skille, których tam używacie, będzie w teorii można dodać do agenta, gdy platformy do tworzenia i sprzedawania agentów staną się prostsze.
Połączenia (integracje) — dodawanie ich jest coraz łatwiejsze: w Codexie bez trudu podepniecie Notion, zewnętrzne narzędzia jak Hootsuite czy Typefully, albo Convex jako bazę danych. Jeśli chcecie sprzedawać agentów, to kluczowa umiejętność.
Zabezpieczenia (safeguards) — szczególnie jeśli chcecie sprzedawać agentów firmom. Jeśli budujecie startup agentowy w Dolinie Krzemowej, to absolutnie kluczowe, bo firmy myślą o tym nieustannie: czy moje dane są bezpieczne? Gdy agent korzysta ze wszystkich moich integracji, gdzie są te dane? Jakie jest ryzyko?
Platformy — nie jestem pewien, czy to Slack wygra. Zastanówcie się, czy chcecie dodać agenta do Slacka, do iMessage, czy może chcecie móc do niego zadzwonić głosowo.
Automatyzacje — co agent powinien robić automatycznie, bez polecenia.

Wierzę, że w ciągu najbliższych sześciu miesięcy będziecie mogli stworzyć agenta, dostroić jego instrukcje, skille i połączenia, założyć zabezpieczenia i udostępniać go innym. A jeśli dodacie go do Slacka — świetną cechą Claude Tag jest tryb multiplayer. Używanie agenta wspólnie, w trybie wieloosobowym, to zupełnie inne doświadczenie niż pisanie do własnego agenta. I szczerze wierzę, że to jest przyszłość pracy.

Polecam wideo Grega — mówi w nim, jakich klientów szukać przy sprzedaży agentów AI i że budując agenta, warto zacząć wąsko: wybrać bardzo konkretne zadanie, przetestować, jak dobrze agent je wykonuje, a dopiero potem poszerzać jego możliwości. Zaczynajcie wąsko i rozszerzajcie w miarę używania. To będzie ogromna szansa w najbliższym półroczu i będę ją dokładnie dokumentował w kolejnych odcinkach Agent Native. Będziemy też robić buildy z moim zespołem przed kamerą — agentów od zera do zadań marketingowych, operacyjnych i programistycznych.

Dziękuję, że oglądacie. Minęło trochę czasu — ostatni odcinek Agent Native nagrałem jakieś dwa tygodnie temu. Jestem wreszcie w studiu: cała tylna ściana będzie wielką kurtyną, pojawią się fajne rzeźby. To będzie moje studio w Nowym Jorku. Nie mogę się doczekać, aż je urządzę — mam zaplanowane naprawdę ciekawe odcinki. Do zobaczenia.

10 najważniejszych takeaways — z kontekstem zastosowania

1.Mierz koszt na zadanie, nie cenę za milion tokenów

Na czym polega: Sonnet 5 jest na papierze prawie trzy razy tańszy od Opusa 4.8, ale zużywa tyle więcej tokenów, że ukończenie tego samego zadania kosztuje więcej (2,29 USD vs 1,80 USD).

Jak stosować: Porównując modele, uruchamiaj identyczne, reprezentatywne zadania na każdym z nich i sumuj rzeczywisty koszt sesji — dopiero to jest podstawa decyzji o wyborze modelu do produkcji.

Na co uważać: Wynik zależy od typu zadania — model tańszy „na zadanie” w kodowaniu może wypaść inaczej w analizie dokumentów. Testuj na własnych workflow, nie na cudzych benchmarkach.

2.Fable 5 daje wyniki nieosiągalne dla innych modeli — ale za bardzo realne pieniądze

Na czym polega: Cztery prompty wystarczyły do zbudowania działającej gry strategicznej, ale kosztowały 174 dolary; pojedynczy prompt analizy bazy kodu z subagentami — 135 dolarów.

Jak stosować: Rezerwuj Fable 5 na zadania o najwyższej wartości — architekturę, trudne bugi, prototypy niemożliwe dla słabszych modeli — a rutynową pracę deleguj do Opusa czy Sonneta.

Na co uważać: Prompty spawnujące wiele subagentów (np. analiza całego repozytorium) potrafią zjeść budżet w jednym strzale. Ustaw twarde limity wydatków w rozliczeniu API, zanim zaczniesz eksperymentować.

3.Okno taniego dostępu do Fable 5 zamyka się 7 lipca

Na czym polega: Fable 5 jest wliczony w płatne plany tylko do 7 lipca i tylko do 50% tygodniowego limitu; potem zostaje wyłącznie znacznie droższe rozliczenie API.

Jak stosować: Zaplanuj najbardziej wymagające zadania (refaktoryzacje, prototypy, analizy) przed tą datą, żeby wykorzystać wliczone limity, zamiast płacić później za każdy token.

Na co uważać: Osobny pasek limitów Fable wyczerpuje się bardzo szybko, zwłaszcza na planie za 20 dolarów — po jego przekroczeniu przechodzisz automatycznie na płatność za użycie, więc pilnuj wskaźnika zużycia w aplikacji.

4.Przekierowania do Opusa 4.8 mogą pochłonąć budżet bez twojej zgody

Na czym polega: Fable 5 potrafi w trakcie odpowiedzi przełączyć się na Opusa 4.8; streamer Bridgemind z sesji za 321 dolarów zobaczył, że tylko 78 dolarów faktycznie poszło do wybranego modelu.

Jak stosować: Po drogich sesjach sprawdzaj rozbicie kosztów na modele w rozliczeniu — jeśli płacisz za Fable, a pracuje Opus, wiesz, że nie dostajesz tego, za co płacisz.

Na co uważać: Przekierowania oficjalnie dotyczą tematów z ryzykiem cyberbezpieczeństwa (Jack Dorsey trafia na nie przy Torze i kryptografii), ale użytkownicy zgłaszają je też przy przypadkowych zadaniach. Praca w tych obszarach niemal gwarantuje reroute.

5.Rządowa weryfikacja modeli to nowa norma — wliczaj ją w plany

Na czym polega: Po zawieszeniu Fable 5 dyrektywą rządu USA każda premiera modelu frontier przechodzi zaostrzony przegląd; dlatego zapowiedziane modele OpenAI (Soul, Terra, Luna) wciąż czekają na wydanie.

Jak stosować: Nie buduj biznesu ani harmonogramu projektu wokół daty zapowiedzi modelu — planuj na moment jego faktycznej, stabilnej dostępności i miej model zapasowy w architekturze.

Na co uważać: Model może zniknąć z dnia na dzień, jak Fable po 78 godzinach. Jeśli twój produkt zależy od jednego modelu, nagłe zawieszenie zatrzymuje ci firmę — projektuj z możliwością szybkiej podmiany.

6.Korzystanie z Claude Code oznacza weryfikację narodowości i szerszą telemetrię

Na czym polega: Warunkiem powrotu Fable 5 było ograniczenie dostępu dla obywateli innych państw, więc Anthropic musi weryfikować narodowość użytkowników — Claude Code wysyła do firmy więcej danych, niż się wydaje.

Jak stosować: Jeśli pracujesz z wrażliwym kodem lub danymi klientów, uwzględnij tę telemetrię w ocenie ryzyka i polityce bezpieczeństwa firmy, zanim wdrożysz narzędzie zespołowo.

Na co uważać: Zakres zbieranych danych nie jest w pełni jasny (autor zapowiada, że będzie temat drążył) — nie zakładaj, że sesje terminalowe są prywatne.

7.Sonnet 5 prawdopodobnie nie jest wart migracji

Na czym polega: Po trzech godzinach testów werdykt autora brzmi „meh”: Sonnet 5 to nieco gorszy Opus 4.8, który w przeliczeniu na zadanie wcale nie wychodzi taniej — koszt na poziomie open-source’owego GLM 5.2, tylko pięć razy wyższy.

Jak stosować: Jeśli masz działające workflow na Opusie 4.8, nie przełamuj go dla Sonneta 5 tylko dlatego, że cennik wygląda atrakcyjnie — najpierw porównaj koszt swoich realnych zadań.

Na co uważać: To wrażenia z pierwszych dni; charakterystyka modelu może się zmienić po aktualizacjach. Zanim skreślisz go na stałe, powtórz test na własnych przypadkach użycia.

8.Aplikacja Cursora na iOS zmienia telefon w pilot do agentów — ale wymaga podstaw

Na czym polega: Agent w chmurze pisze kod, testuje aplikację, nagrywa ekran i odsyła wideo z pull requestem; feedback dajesz notatką głosową albo rysując na zrzucie ekranu.

Jak stosować: Używaj jej do kontynuowania istniejących projektów w martwych momentach dnia (lunch, dojazdy): nagraj szczegółową notatkę głosową, odpal kilku agentów, a wyniki przejrzyj i zmerguj z telefonu.

Na co uważać: Aplikacja wymaga konta GitHub i rozumienia, czym jest repozytorium (ok. 5/10 w skali techniczności) — nie stworzysz w niej nowego projektu od zera z agentem chmurowym. Dla osób nietechnicznych autor jej na razie nie poleca.

9.Przyszły SaaS to agent dodany do Slacka, nie kolejna aplikacja

Na czym polega: Aplikacje produktywnościowe to tylko „powierzchnie” nad danymi i funkcjami — agenci wykonują tę pracę bezpośrednio i żyją w narzędziach już używanych (Claude Tag w Slacku, agenci w iMessage). Boring Marketer sprzedaje już jako główny produkt agenta do Slacka.

Jak stosować: Jeśli budujesz lub planujesz produkt SaaS, rozważ pivot na wyspecjalizowanego agenta osadzonego tam, gdzie klienci już pracują — zamiast uczyć ich kolejnego interfejsu.

Na co uważać: Zacznij wąsko: jeden bardzo konkretny task, testuj skuteczność agenta i dopiero po osiągnięciu jakości poszerzaj zakres. Nie zakładaj też, że Slack na pewno wygra jako platforma — przemyśl także iMessage i interfejs głosowy.

10.Ucz się teraz sześciu elementów budowy agentów — zanim powstanie platforma szablonów

Na czym polega: Autor przewiduje, że w ciągu sześciu miesięcy powstanie platforma „szablonów agentów” do budowy, konfiguracji i sprzedaży agentów; przygotowanie to opanowanie instrukcji (systemowego pliku czytanego przy każdym uruchomieniu), skilli, integracji, zabezpieczeń, wyboru platformy i automatyzacji.

Jak stosować: Ćwicz już dziś w Codexie lub Claude co-work — pisz pliki instrukcji, buduj skille, podpinaj integracje (Notion, Convex, narzędzia do publikacji). Te kompetencje przeniosą się wprost na przyszłe platformy agentowe.

Na co uważać: Przy sprzedaży agentów firmom kluczowe są zabezpieczenia i pytania o dane: gdzie trafiają, gdy agent używa integracji, i jakie jest ryzyko. Bez przekonującej odpowiedzi na te pytania klienci biznesowi nie kupią, choćby agent działał świetnie.