Your Best Prompts Make the New Claude Worse

O czym jest ten film

Nowa generacja modeli (Fable 5, GPT-5.6) ma odwrotny problem niż poprzednie: nie robi za mało, lecz za dużo.
Stare, długie i drobiazgowe prompty, które sprawdzały się przy starszych modelach, przy nowych obniżają jakość odpowiedzi.
Anthropic w oficjalnym przewodniku po Fable 5 wprost zaleca radykalne skracanie promptów i „odblokowywanie” modelu.
Podstawowy schemat promptu opiera się na trzech elementach: cel, odbiorca oraz — najważniejsze — jasna definicja tego, co znaczy „gotowe”.
Pierwsza kontrola to „płot” (fence) — rozdzielenie fazy myślenia od fazy działania i ograniczanie modelu do najprostszego rozwiązania.
Druga kontrola to „pokrętło” (dial) — poziom wysiłku rozumowania (low, medium, high, extra, max).
Wyższe poziomy rozumowania uruchamiają subagentów i mocno zwiększają koszt oraz czas — używaj ich oszczędnie.
Trzecia kontrola: gdy model się z tobą nie zgadza, potraktuj to jako sygnał, a nie błąd — dopytaj, dlaczego.
Fable 5 po ok. 7 lipca ma być płatny osobno, niezależnie od posiadanej subskrypcji.
Wbudowane zabezpieczenia mogą po cichu przełączyć rozmowę na słabszy model przy „wrażliwych” tematach.

Redakcyjne tłumaczenie

Nowy problem: model, który robi za dużo

Od jakichś dwóch lat wszyscy uczyliśmy się tej samej umiejętności w pracy ze sztuczną inteligencją — jak ją „docisnąć”. Dłuższe prompty, więcej kroków, cokolwiek, byle skłonić model do zrobienia tego, czego potrzebujemy. Ale nowy Claude, czyli Fable 5, ma problem odwrotny. Robi za dużo. Potrafi pracować godzinami, podejmować działania, o które nikt go nie prosił, albo nawet twierdzić, że skończył zadanie, którego w ogóle nie dotknął.

Jeśli trafiasz tu po raz pierwszy: nazywam się Dylan i prowadzę firmę doradczą w obszarze AI. Po latach uczenia ludzi, jak wyciskać z modeli więcej, teraz uczę ich, jak te modele okiełznać. Pokażę trzy narzędzia kontroli, których używam z klientami, oraz jedno zdanie, które zmusza model do udowodnienia, że wykonana praca jest prawdziwa.

Problem, z którym coraz więcej osób zaczyna się mierzyć przy nowej generacji modeli — takich jak Fable 5 czy GPT-5.6 — jest taki: dawne prompty, które świetnie działały przy poprzedniej generacji (Opus 4.8, GPT-5.5), teraz przeszkadzają. Kiedyś, żeby uzyskać dobry wynik, budowaliśmy długie polecenia z wieloma krokami, ograniczeniami i preferencjami. Dziś, gdy modele są tak inteligentne, musimy je raczej powściągać, żeby nie przesadzały z zadaniem — i jednocześnie nie wchodzić im w drogę.

(Informacja dodatkowa: „Fable 5”, „Opus 4.8”, „GPT-5.6”, „GPT-5.5” to nazwy kolejnych generacji modeli językowych. Fable 5 i Opus 4.8 to modele Anthropic — twórcy Claude’a; GPT to linia modeli OpenAI.)

Uwaga o kosztach Fable 5

Zanim przejdę do samych narzędzi kontroli, jedna ważna uwaga. Fable 5 po pewnej dacie — o ile dobrze pamiętam, po 7 lipca — ma być płatny za użycie. Nie będzie wliczony w subskrypcję, niezależnie od tego, jaki masz plan. Max, Enterprise — bez znaczenia, i tak trzeba dopłacać. Dlatego nie polecałbym używać go do wszystkiego, a jedynie do najważniejszych, naprawdę złożonych zadań, przy których zależy ci na najwyższej jakości. Zakładam, że z czasem to się zmieni — gdy Anthropic zyska więcej mocy obliczeniowej, prawdopodobnie wróci ten model do oferty subskrypcyjnej. Na razie jednak trzeba za niego płacić i warto o tym pamiętać.

Zasada pierwsza: drastycznie skróć swoje prompty

Pierwsza rzecz, którą trzeba zrobić, to wziąć stare prompty i mocno je skrócić. To nie moja fanaberia — mówi o tym wprost sam Anthropic. W swoim przewodniku dla użytkowników Fable 5 wyraźnie zaznaczają, że stare prompty, które sprawdzały się przy wcześniejszych modelach, są często zbyt drobiazgowe i mogą obniżać jakość wyników nowszych modeli. Dzieje się tak, ponieważ nowe modele są na tyle inteligentne, że całe rusztowanie i mikrozarządzanie, które budowaliśmy dla starszych wersji, przestaje być potrzebne.

I nie jest to tylko teoria, którą głoszą — sami tak robią. W swoim narzędziu Claude Code (to techniczna odmiana Claude’a do współpracy) usunęli 80% kodu promptu działającego w tle właśnie dla tych nowszych modeli. Cała ta nadbudowa wokół AI trzymała je w ryzach. W Anthropic nazywają to „un-hobbling” — odblokowywaniem modelu. Schodzimy mu z drogi, bo jest tak inteligentny, że chcemy uniknąć krępowania jego prawdziwej mocy.

(Informacja dodatkowa: „Claude Code” to narzędzie Anthropic przeznaczone głównie do zadań programistycznych. „Un-hobbling” to dosłownie „zdejmowanie pęt” — usuwanie ograniczeń, które wcześniej narzucaliśmy modelowi.)

Najważniejszy schemat: cel, odbiorca, definicja „gotowe”

To prawdopodobnie najważniejsza część całego materiału — jeśli nic więcej nie zapamiętasz, zapamiętaj to. Prompując nową generację modeli (Fable 5, GPT-5.6), warto dać im trzy rzeczy: cel, odbiorcę, którego obsługujesz przy tym celu, oraz — co najważniejsze — jasny obraz tego, co oznacza „gotowe”.

Ten szablon również pochodzi z przewodnika Anthropic; możesz go po prostu skopiować i używać. Sens jest taki, że pokazujemy modelowi kierunek, w którym zmierzamy, ale nie dyktujemy każdego pojedynczego kroku po drodze. Model jest na tyle inteligentny, że prawdopodobnie sam lepiej niż my zaplanuje kroki prowadzące do celu. Naszym zadaniem jest wskazać kierunek i opisać, jak wygląda ukończone zadanie.

W praktyce prompt brzmi mniej więcej tak: „Pracuję nad [tu wpisujesz cel — duże zadanie]. Robię to dla [tu wpisujesz odbiorcę].” Potem możesz dodać dodatkowe zastrzeżenia — na przykład, że odbiorcy potrzebują jeszcze czegoś konkretnego. Następnie: „Mając to na uwadze, oto moja konkretna prośba o pomoc.” A na koniec — element najważniejszy: „Będziesz wiedzieć, że skończyłeś, kiedy…” i opisujesz, jak wygląda ukończona praca, najlepiej według kryteriów binarnych (spełnione / niespełnione).

Ten ostatni fragment jest kluczowy, ponieważ jeśli nie ustawisz takiego ograniczenia, model przesadzi — stworzy mnóstwo rzeczy, zwykle zbyt złożonych i przeinżynierowanych. To podstawowy sposób, w jaki warto rozmawiać z nową generacją modeli.

Kontrola pierwsza: płot (fence)

Skoro wiemy już, jak z modelami rozmawiać, jak je faktycznie kontrolować — poza samym promptem? Są trzy narzędzia kontroli szyte na miarę nowej generacji.

Pierwsze nazywam „płotem”. Powód jest taki, że nowe modele to skrajni nadgorliwcy. Model przeanalizuje każdy niuans tego, co napisałeś, i może wykonać całą masę rzeczy, o które w ogóle nie prosiłeś. Wielu ludzi już tego doświadczyło — ja też. Zdarza się, że model idzie i sam z siebie pisze e-mail, tworzy pliki, wykonuje serię pobocznych zadań, o których nigdy nie było mowy, a które „wyczytał między wierszami”. Czyta między wierszami tam, gdzie nie powinien.

Kontrolujemy to w dwóch fazach. Faza pierwsza to moment, gdy dopiero myślisz i szukasz pomysłów razem z modelem. W tej roli jest bardzo dobrym doradcą i partnerem do burzy mózgów, więc można go używać nawet do ważnych zadań. Kiedy chcemy, żeby pozostał w trybie myślenia, a nie działania, musimy to jasno zaznaczyć. Można wkleić do promptu coś takiego: „Opiszę ci problem. Twoim zadaniem jest myśleć, nie działać. Chcę usłyszeć twoją ocenę, a potem masz się zatrzymać i nie robić nic więcej. Nie naprawiaj niczego, nie pisz niczego, niczego nie zmieniaj.” W ten sposób mówimy modelowi: najpierw przemyślmy to razem, zanim podejmiemy jakiekolwiek działanie.

Gdy jesteśmy zadowoleni z efektu, przechodzimy do fazy drugiej — działania. Tu zakładamy kolejny płot: model, gdy już działa w naszym imieniu, ma działać tylko do momentu, w którym realizuje interesujące nas zadanie. Mówimy mu wprost: „Zrób najprostszą rzecz, która wykona to konkretne zadanie. Nie dodawaj niczego, o co nie prosiłem.” To wraca do wcześniejszej myśli — mamy do czynienia ze skrajnym nadgorliwcem. Jeśli nie postawisz jasno wymogu najprostszego rozwiązania, model przeinżynieruje sprawę, skomplikuje ją i zrobi dziesięć rzeczy zamiast tej jednej, o którą prosiłeś. To dobry sposób, żeby go powściągnąć. To nasza pierwsza kontrola.

Kontrola druga: pokrętło (dial)

Drugie narzędzie to proste pokrętło, o którym mówiłem już we wcześniejszych filmach. Każdy model je ma — to poziom wysiłku, jaki AI wkłada w rozumowanie nad zadaniem. W Claude te poziomy, które można przełączać, to: low, medium, high, extra oraz max.

(Informacja dodatkowa: to poziomy „reasoning effort” — im wyżej, tym dłużej i intensywniej model rozumuje, ale też więcej czasu i pieniędzy to kosztuje.)

Mogę pokazać, jak to wygląda w interfejsie Claude. Po wybraniu Fable 5 widać dostępne modele oraz poziom wysiłku. Wybierając dany poziom, określasz, jak długo i jak intensywnie model będzie myślał nad zadaniem.

Przy Fable 5 to bardzo ważne, żeby poziomy extra i max wybierać wyłącznie do naprawdę krytycznych, trudnych zadań, przy których chcesz, by model wyszedł poza standard. Powód jest podwójny: to zajmuje dużo czasu i spala dużo pieniędzy, jeśli płacisz za użycie. Z mojego doświadczenia wynika, że przy włączonym extra lub max model uwielbia uruchamiać całą serię subagentów. Subagent to w uproszczeniu „mały model”, którego model nadrzędny sam powołuje. Te „małe AI” pracują równolegle nad różnymi elementami, które model uznaje za istotne dla realizacji głównego zadania. A kiedy tak się dzieje, koszty rosną wykładniczo. Nie mówię, że nie należy ich używać — trzeba tylko z rozmysłem wybierać moment, i to tylko dla najważniejszych zadań.

O poziomach rozumowania w Fable 5 warto myśleć tak: low i medium najlepiej nadają się do burzy mózgów i do trudnych pytań na temat skomplikowanych dokumentów. Jeśli masz duży, trudny dokument, możesz zadawać modelowi naprawdę trudne pytania, a on świetnie sobie z tym radzi nawet na niskim poziomie wysiłku. Wyższe poziomy — high, extra i max — rezerwuj wtedy, gdy delegujesz modelowi całe zadanie: coś, nad czym może pracować 30 minut, godzinę albo kilka godzin. Zadanie z wieloma krokami, setkami plików, coś, co człowiekowi zajęłoby tydzień lub dwa. Takie rzeczy warto oddawać modelowi na poziomie high, extra lub max. Tak myślę o tym pokrętle i o tym, jak dozować „wysiłek” modelu.

Kontrola trzecia: potraktuj sprzeciw modelu jako sygnał

Ostatnie narzędzie jest naprawdę nowe dla tej generacji modeli i bardzo mnie ekscytuje. Kiedy pracujesz z modelami takimi jak Fable 5 czy GPT-5.6 i dajesz im jasną informację zwrotną, istnieje szansa, że model — zwłaszcza Fable 5 — będzie się jej sprzeciwiał. Może się z tobą nie zgodzić i stanowczo obstawać przy swoim: „Uważam, że się mylisz, i sądzę, że powinniśmy pójść w tę stronę.”

Większość ludzi w takiej sytuacji po prostu się irytuje i mówi modelowi: „Przestań się ze mną spierać i zrób to, co powiedziałem.” To błąd, bo jest wyraźny powód, dla którego model oponuje. Trzeba docenić ten moment i zadać dwa konkretne pytania, żeby zrozumieć dlaczego. Pierwsze: „Co ty wiesz, czego ja nie wiem, a co konkretnie waży na tej decyzji?” Drugie: „Co mogłoby zmienić twoje zdanie?”

Zadając te dwa pytania, dostaniesz od modelu informacje, których prawdopodobnie sam nie masz, a które powinny wpłynąć na twoją decyzję. Pamiętaj — model często dysponuje wiedzą, której ty nie masz. Warto się na to otworzyć i zrozumieć, o co chodzi. To nasza trzecia i ostatnia kontrola.

Uwaga o zabezpieczeniach i cichym „obniżaniu” modelu

Jedna szybka uwaga o tym modelu i prawdopodobnie o kolejnych. Ta nowa generacja — Fable 5, GPT-5.6 i pozostałe — została, jak zapewne wiesz, wstrzymana przez regulatorów. Uznano, że trzeba je wdrażać ostrożnie, bo są bardzo potężne. W trakcie tego wdrażania wbudowano w nie serię zabezpieczeń, a w początkowej fazie — pewnie przez najbliższe miesiące — będą one uruchamiane dość pochopnie.

(Informacja dodatkowa: autor mówi o mechanizmach bezpieczeństwa nadzorowanych regulacyjnie; to jego interpretacja, nie oficjalny komunikat.)

W praktyce oznacza to, że gdy zapytasz Fable 5 o coś z zakresu biologii albo cyberbezpieczeństwa, model może automatycznie „obniżyć” cię do słabszego modelu, na przykład Opus 4.8 — i może, ale nie musi, cię o tym poinformować. Jeśli więc zauważysz spadek jakości i inteligencji odpowiedzi, możliwe, że właśnie to się stało. I zostanie tak do końca tej rozmowy. Żeby wrócić do Fable 5, trzeba rozpocząć nową rozmowę od nowa. Warto o tym wiedzieć: w modelu działają teraz filtry wyszukujące „niebezpieczne” tematy i w początkowej fazie bywają nadgorliwe, dopóki nie zostaną dostrojone.

Podsumowanie

W skrócie: jak rozmawiać z nową generacją modeli i jak je kontrolować, skoro są tak potężne. Rzecz najważniejsza do zapamiętania — dawaj modelowi trzy rzeczy: cel, odbiorcę, któremu ten cel służy, oraz, przede wszystkim, obraz tego, co oznacza „gotowe”. A mówiąc o „gotowe”, opisuj, co znaczy „dobrze”, w kryteriach binarnych. Jeśli tego nie zrobisz, model przekombinuje i zrobi znacznie więcej, niż prosiłeś — nie tylko komplikując samo zadanie, ale i dorzucając zbędne podzadania.

Kontrolować model można na kilka sposobów. Pierwszy to płot: rozdzielasz fazę myślenia i fazę działania, jasno mówiąc, żeby na razie nie działał, tylko wspólnie z tobą myślał — a gdy już zacznie działać, żeby dawał najprostszą wersję tego, co chcesz osiągnąć. Drugi to pokrętło: regulacja tego, jak intensywnie model rozumuje. Przy Fable 5 większość czasu spędzisz na niższych poziomach, a wyższe (high, extra, max) rezerwujesz dla naprawdę złożonych zadań z wieloma plikami i krokami. Trzeci to świadomość nowych możliwości tych modeli — czasem mają własne zdanie i je pokazują. Jeśli model się z tobą nie zgadza, nie ignoruj tego, tylko zrozum, dlaczego zajął takie stanowisko, bo kryje się tam wiedza, którą warto poznać przed podjęciem decyzji.

Na koniec zapowiedź: wszystko, co pokazałem, to sposób, w jaki z modelem radzi sobie jedna osoba. Ale co, gdy w ten sposób działa cała firma? OpenAI, konkurent Anthropic, już tak robi — i opublikowali swój „playbook”. Omówię go w kolejnym materiale.

10 najważniejszych takeaways — z kontekstem zastosowania

1.Nowe modele trzeba powściągać, a nie „dociskać”

Na czym polega: Odwrotnie niż przy starszych modelach, Fable 5 i GPT-5.6 mają skłonność do robienia zbyt wiele — działają godzinami i podejmują akcje, o które nikt nie prosił.

Jak stosować: Zmień nastawienie: zamiast wymuszać więcej, świadomie ograniczaj zakres i wskazuj, gdzie model ma się zatrzymać.

Na co uważać: Model potrafi twierdzić, że skończył pracę, której nie wykonał — zawsze weryfikuj realny efekt, nie tylko deklarację.

2.Skracaj stare prompty — drobiazgowość szkodzi

Na czym polega: Długie, wieloetapowe prompty z poprzedniej generacji przy nowych modelach obniżają jakość, bo są zbyt narzucające.

Jak stosować: Przejrzyj sprawdzone prompty i usuń zbędne rusztowanie: listy kroków, nadmiar ograniczeń i preferencji. Zostaw kierunek, nie instrukcję krok po kroku.

Na co uważać: Skracanie nie oznacza bylejakości — usuwaj mikrozarządzanie, ale zachowaj jasny cel i kryteria sukcesu.

3.Zawsze podawaj cel, odbiorcę i definicję „gotowe”

Na czym polega: To trójczłonowy szkielet dobrego promptu dla nowej generacji: po co, dla kogo i po czym poznasz, że praca jest skończona.

Jak stosować: Buduj polecenie wg schematu: „Pracuję nad… dla… Moja prośba to… Będę wiedzieć, że skończyłeś, gdy…”, dodając kryteria binarne.

Na co uważać: Pominięcie definicji „gotowe” to główna przyczyna przeinżynierowania — bez niej model dorzuci zbędne podzadania.

4.Rozdzielaj fazę myślenia od działania (płot)

Na czym polega: Wprost każesz modelowi najpierw tylko myśleć — oceniać, doradzać — bez tworzenia plików, pisania czy zmian.

Jak stosować: Na etapie koncepcji dodaj instrukcję w stylu: „Twoim zadaniem jest myśleć, nie działać. Daj ocenę i zatrzymaj się.”

Na co uważać: Model „czyta między wierszami” i może zacząć działać z samego kontekstu — sygnał zakazu działania musi być jednoznaczny.

5.Wymuszaj najprostsze rozwiązanie w fazie działania

Na czym polega: Gdy przechodzisz do wykonania, ograniczasz model do minimum potrzebnego do zadania.

Jak stosować: Dopisz: „Zrób najprostszą rzecz, która wykona to zadanie. Nie dodawaj niczego, o co nie prosiłem.”

Na co uważać: Bez tego ograniczenia skrajnie nadgorliwy model zrobi dziesięć rzeczy zamiast jednej i skomplikuje wynik.

6.Dobieraj poziom rozumowania do zadania (pokrętło)

Na czym polega: Poziomy low, medium, high, extra i max decydują, jak intensywnie model myśli.

Jak stosować: Low/medium do burzy mózgów i pytań o trudne dokumenty; high/extra/max do dużych, wieloetapowych zadań delegowanych na dłużej.

Na co uważać: Extra i max potrafią uruchomić subagentów i wykładniczo podnieść koszt oraz czas — rezerwuj je dla naprawdę krytycznych zadań.

7.Pilnuj kosztów Fable 5

Na czym polega: Fable 5 ma być płatny osobno (wg autora po ok. 7 lipca), niezależnie od posiadanej subskrypcji.

Jak stosować: Używaj go świadomie — tylko do najważniejszych, złożonych zadań, gdzie jakość realnie się opłaca.

Na co uważać: Zasady mogą się zmienić w czasie; sprawdzaj aktualny status rozliczeń, zanim oprzesz na nim rutynową pracę.

8.Sprzeciw modelu to sygnał, nie usterka

Na czym polega: Fable 5 potrafi się nie zgodzić z twoją informacją zwrotną i obstawać przy swoim zdaniu.

Jak stosować: Zamiast go uciszać, zadaj dwa pytania: „Co wiesz, czego ja nie wiem, a co waży na tej decyzji?” oraz „Co mogłoby zmienić twoje zdanie?”

Na co uważać: Model nie zawsze ma rację — traktuj jego argumenty jako dodatkowy wkład do decyzji, a nie wyrocznię.

9.Uważaj na ciche przełączenie na słabszy model

Na czym polega: Przy „wrażliwych” tematach (np. biologia, cyberbezpieczeństwo) model może automatycznie obniżyć rozmowę do słabszego modelu, np. Opus 4.8 — czasem bez informacji.

Jak stosować: Jeśli zauważysz nagły spadek jakości odpowiedzi, rozpocznij nową rozmowę, by odzyskać dostęp do pełnego modelu.

Na co uważać: To interpretacja autora dotycząca początkowej, „nadgorliwej” fazy filtrów — zachowaj dystans i weryfikuj, czy jakość faktycznie spadła.

10.Żądaj dowodu wykonanej pracy

Na czym polega: Skoro model bywa nadgorliwy i potrafi deklarować nieistniejące efekty, warto go zmusić do udowodnienia realności pracy.

Jak stosować: Dołącz zdanie każące pokazać konkretny, weryfikowalny dowód wykonania (np. rzeczywisty rezultat, a nie samo zapewnienie), zanim uznasz zadanie za zakończone.

Na co uważać: Nie przyjmuj deklaracji „zrobione” na słowo — sprawdzaj efekty, zwłaszcza przy długich, wieloetapowych zadaniach.