The Real Story Behind the Government GPT 5.6 Freeze

O czym jest ten film

OpenAI wydało GPT-5.6, ale na razie dostęp mają tylko wybrani partnerzy zatwierdzeni przez rząd USA — Washington bada ryzyko cyberbezpieczeństwa.
To nie jest odwołanie premiery, ale poważne wyhamowanie tempa udostępniania najnowszych modeli frontierowych.
Autor łączy tę sytuację z czterema innymi wydarzeniami tygodnia: nową Siri od Apple, Claude Tag od Anthropic, modelem GLM 5.2 od Z.AI oraz badaniem OpenAI nad adopcją Codexa.
Teza filmu: wszystkie te historie dotyczą tego samego — walki o dostęp do kontekstu pracy użytkownika, nie tylko o surową inteligencję modelu.
Apple próbuje naprawić Siri, dając jej dostęp do wiadomości, zdjęć, e-maili, notatek i ekranu — stawia na kontekst, nie na podniesienie poziomu inteligencji.
Anthropic wprowadza Claude Tag w Slacku, dający Claude dostęp do wybranych kanałów, narzędzi i danych firmowych — z naciskiem na uprawnienia i kontrolę administracyjną.
Badanie OpenAI nad Codexem pokazuje, że narzędzie musiało “zarobić” zaufanie pracowników, a jego popularność skoczyła po wydaniu modelu 5.5.
Autor kontrastuje podejścia: Claude jest “kształtem rozmowy” (przychodzi do użytkownika, w Slacku), a Codex jest “kształtem plików” (użytkownik przynosi pracę do niego).
Spowolnienie wydawania modeli frontierowych przez rządowe restrykcje daje modelom open source (np. GLM 5.2) czas, by w warstwie publicznej dogonić liderów, nawet jeśli prywatnie przewaga Anthropic i OpenAI się utrzymuje.
Wniosek: wojna o inteligencję przekształca się w wojnę o kontekst — kluczowe pytanie to nie “kiedy wyjdzie kolejny model”, lecz “kto najszybciej i najbezpieczniej połączy AI z realnym kontekstem pracy”.

Redakcyjne tłumaczenie

Spowolnienie GPT-5.6 i jego prawdziwe znaczenie

OpenAI właśnie wydało Chat GPT 5.6, ale nie w normalny sposób. Na razie dostęp jest ograniczony do małej grupy partnerów zatwierdzonych przez rząd, podczas gdy Washington analizuje ryzyko związane z cyberbezpieczeństwem. To nie jest odwołanie premiery, ale ogromne wyhamowanie tempa, w jakim najnowsza technologia frontierowa trafia na rynek.

Do końca tego materiału chcę, żebyście zrozumieli, czemu to opóźnienie, nowa Siri, Claude Tag, GLM 5.2 i Codex dotyczą w gruncie rzeczy tego samego: bitwy o tę część waszego mózgu, która rozumie pracę. Nie mówię tu o kontroli umysłu w stylu science fiction, ale o codziennej części — która wiadomość jest ważna, który plik jest aktualny, co klient naprawdę miał na myśli, co zespół postanowił, co można udostępnić, a czego nie, i co liczy się jako “zrobione”.

Jeśli inteligencja frontierowa zwalnia, nawet na kilka tygodni, kolejną przewagą nie jest posiadanie najnowszego modelu. Jest nią posiadanie kontekstu, który czyni dobry model użytecznym. Spójrzcie na ten tydzień przez ten obiektyw i wszystkie newsy zaczynają się ze sobą rymować.

Apple próbuje naprawić Siri, dając jej dostęp do wiadomości, zdjęć, e-maili, notatek, ekranu i aplikacji. Anthropic wprowadziło Claude Tag w Slacku, gdzie zespół może dać Claude dostęp do wybranych kanałów, narzędzi, danych i repozytoriów kodu. GLM 5.2 od Z.AI sprawił, że tania, prawie-frontierowa inteligencja open source stała się dużo bliższa rzeczywistości niż jeszcze kilka tygodni temu. A OpenAI opublikowało badanie pokazujące, że wewnątrz firmy Codex stał się dominującą powierzchnią dla pracy wykonywanej z pomocą AI.

To brzmi jak zupełnie różne historie — OpenAI dostaje nakaz zwolnienia tempa, Apple próbuje uczynić Siri mniej żałosną, Anthropic wstawia Claude do Slacka. Jak to się ze sobą łączy? Problem leżący pod tym wszystkim jest ten sam: model może być mądry i wciąż nie wiedzieć, co się dzieje.

Problem kontekstu, który już znacie

Jeśli korzystacie z AI codziennie, znacie to uczucie. Otwieracie Codex, Chat GPT, Claude albo Gemini i model jest bardzo zdolny — pisze, rozumuje, streszcza, pomaga myśleć. Ale zanim zrobi coś użytecznego, musicie wnieść całą sytuację do okna kontekstu — często wgrywając pliki do czatu. Wklejacie e-mail, wklejacie notatkę, wyjaśniacie, kim jest klient, która wersja prezentacji jest aktualna, że wątek na Slacku zmienił wczoraj decyzję.

To, czym stał się dzisiaj prompting, w miarę jak prosimy te modele o coraz więcej. A kiedy już to wszystko wprowadzimy, AI staje się naprawdę użyteczne. To jest ogromny punkt tarcia — i to właśnie nazywamy “problemem agentów”: problemem, który chcemy rozwiązać przez agenty atakujące właśnie okno kontekstu. To jest obietnica, którą próbujemy zrealizować z agentami od kilku miesięcy.

W tym materiale przejdę przez trzy powierzchnie: Siri od Apple, Claude Tag i wykorzystanie Codexa wewnątrz OpenAI, a także przez punkty presji wokół nich — GLM 5.2 z jednej strony, opóźnienie Chat GPT 5.6 z drugiej. Po drodze pokażę, czemu inteligencja robi się tańsza, czemu najnowsza inteligencja frontierowa wychodzi coraz wolniej i co to znaczy dla nas wszystkich w kwestii kontekstu.

Fundamentalnie: następny użyteczny produkt AI prawdopodobnie nie będzie tym, który wygra benchmark. Będzie tym, który wie, gdzie jest praca, co mu wolno widzieć, co mu wolno robić — i który wie to bezszwowo.

Siri: kontekst zamiast inteligencji

Zacznijmy od Siri, bo to coś, co wszyscy — na dobre i na złe — rozumiemy. Siri jest tak długo zła, że stała się żartem. Można ją zapytać o coś normalnego i w połowie przypadków albo źle zrozumie pytanie, albo zwróci wynik wyszukiwania, po którym zastanawiacie się, czemu w ogóle mówiliście na głos.

Łatwy nagłówek od dawna brzmi: “Apple wreszcie próbuje coś zrobić z Siri. Nie wiemy, czy to faktycznie dobre, mamy lekki sceptycyzm, ale Apple efektywnie relauncza Siri”. Rozumiem, skąd ta historia się bierze — sam Apple mówi o Siri jako o konwersacyjnym asystencie AI, obiecuje bardziej naturalne rozmowy, bogatsze odpowiedzi, dedykowaną aplikację Siri, i to wszystko jest częścią tej historii. Może się to nawet sprawdzić — sam miałem okazję trochę z tym popracować.

Ale nie sądzę, że historią jest “Siri staje się Chat GPT”. Myślę, że historią jest to, że Apple próbuje uczynić Siri użyteczną, łącząc ją z kontekstem waszego życia. Na przykład pytanie “kiedy ląduje mama” wymaga kontekstu z kalendarza, numeru lotu, potwierdzenia e-mailowego, informacji, czy inny członek rodziny mówił, że może po nią pojedzie, czy samolot jest spóźniony. Wyzwaniem dla Apple jest znalezienie sposobu na prywatne i bezpieczne połączenie Siri z miejscami, gdzie ten kontekst żyje na telefonie — zdjęciami, kalendarzem, notatkami, e-mailem, stanem aplikacji, ekranem.

Jeśli Siri może to zrobić, jej poziom inteligencji nie musi być bardzo wysoki, żeby była niesamowicie użyteczna. Ostatecznie pytanie o zdolności Siri może być pytaniem niewłaściwym. Odpowiedź Apple nie jest odpowiedzią o zdolnościach — jest odpowiedzią o kontekście. Jest odpowiedzią o tym, gdzie żyje inteligencja, a Apple próbuje przybliżyć ją możliwie blisko waszych systemów. Przetwarzanie na urządzeniu jest celem Apple wszędzie, gdzie to możliwe, a tam, gdzie nie — prywatny chmurowy backend.

Jedną z naprawdę interesujących rzeczy w kształcie tego produktu jest to, że Apple zasadniczo mówi: “wasz asystent staje się lepszy, gdy jest blisko was”. I bardzo wygodnie, gdy jest blisko was, można zbudować architekturę prywatności, w której jest tylko wasz. To jest konsumencka odpowiedź na problem kontekstu — odpowiedź, w której Siri nie musi być bardzo mądra, by korzystając z waszego telefonu, być niezwykle użyteczna.

I tak, niespodziewanie, przewaga Apple nie pochodzi już z ekosystemu App Store czy ze sprzętu — pochodzi z tego, że mamy produkty Apple i mamy kontekst, który żyje wewnątrz iPhone’a, a Apple może uzyskać do niego dostęp w sposób bardzo dla nas użyteczny. Zapamiętajcie to, gdy przejdziemy na stronę pracy i porozmawiamy o Claude Tag.

Claude Tag: kontekst firmowy w Slacku

Ogłoszenie produktu Anthropic na pierwszy rzut oka jest dość proste. Claude Tag startuje w Slacku. Zespół może dać Claude dostęp do wybranych kanałów, narzędzi, danych, repozytoriów kodu. Można go oznaczyć (zatagować), a Claude zaczyna przechodzić przez zadania i etapy w miarę bycia tagowanym, odpowiadając w wątku. Może pamiętać istotne informacje z kanałów, w których jest, i działać w ramach określonych zakresów uprawnień, limitów wydatków i logów, do których ma dostęp.

To brzmi jak Slackbot — ale nie mówcie tego zbyt szybko, bo w Slacku boty są od dawna. Ciekawą rzeczą jest to, że Anthropic próbuje umieścić asystenta wewnątrz kontekstu zespołu. Na telefonie kontekst jest prywatny i chaotyczny, bo to wasze życie. W firmie kontekst jest współdzielony, podlega uprawnieniom, jest polityczny, nieaktualny, na wpół napisany i rozsiany po sześciu miejscach.

I to jest interesujące, bo praca dzieje się właśnie w tych chaotycznych miejscach. Od dawna AI było od tego dość odseparowane, poza kilkoma wyjątkami. Devin odniósł duży sukces z perspektywy programistycznej, ale nie ma wielu gotowych, naprawdę inteligentnych rozwiązań AI wchodzących w taki chaotyczny kontekst.

Dlatego gdy Anthropic mówi, że Claude Tag może budować kontekst w czasie, to nie jest tylko realne twierdzenie — to serce tego, dokąd firma zmierza. To jest bardzo mocne i niebezpieczne stwierdzenie, bo im użyteczniejszy Claude staje się w Slacku, tym bardziej potrzebuje dostępu do brudnych rzeczy, którymi firmy słabo zarządzają: decyzji inżynieryjnych, zgłoszeń klientów, debat cenowych, danych o ludziach.

Anthropic to wie, dlatego język komunikacji o premierze tak dużo mówi o zakresach i uprawnieniach, o kontrolach administracyjnych, o pamięciach zdefiniowanych per kanał. Rozumieją, że będą musieli zapracować na to zaufanie, bo jeśli wpuści się asystenta AI do Slacka, a on przekroczy granice, stworzono wyciek kontekstu — stworzono korporacyjną odpowiedzialność prawną.

To, co Anthropic mówi, to: “możecie nam zaufać z tym kontekstem, bo wy macie kontrolę przez cały czas”. Myślę, że Claude Tag jest dużo lepszym sygnałem niż większość rzeczy na rynku w całym tym zjawisku “AI jako współpracownika”, bo mamy mnóstwo startupów w tej przestrzeni. Jedną z bardzo świadomych rzeczy, które Anthropic robi, jest mówienie: “dawaliście nam formalny kontekst przez prompty, przez Co-work, przez Claude Code od jakiegoś czasu. Teraz zaufajcie nam z nieformalnym kontekstem i pozwólcie nam być współpracownikiem, który dzięki temu jest jeszcze bardziej użyteczny”. Żadna inna firma nie może powiedzieć tego w ten sam sposób. To jest Anthropic robiące dla pracy to, co Apple robi dla waszego telefonu.

Codex: kontekst zarobiony plikami

Teraz wprowadźmy Codex. Badanie dotyczące Codexa łatwo odrzucić, bo nie brzmi jak news, ale uważam, że ten artykuł jest naprawdę użyteczny w tej rozmowie, ponieważ software ukazuje nam problem kontekstu asystenta w najczystszej formie. Codex jest narzędziem programistycznym, a opublikowane badanie pokazuje, w jaki sposób faktyczni pracownicy OpenAI z czasem wybierali — albo nie wybierali — adopcję Codexa i do czego go używali. Innymi słowy: jakiemu kontekstowi zaufali Codexowi?

To mnie fascynuje, bo można by myśleć, że w OpenAI to jest wymóg i wszyscy są zobligowani do używania Codexa. Tak to nie działało. Codex musiał zarobić zaufanie wszystkich — najpierw inżynierów, potem innych pracowników wiedzy w OpenAI.

To, co dla mnie najważniejsze w tym badaniu, to fakt, że nawet w firmie, która jest jedną z najbardziej “AI-natywnych” na planecie, wciąż trzeba myśleć o tym, gdzie ufa się danej aplikacji AI z kontekstem — i nie jest to przełącznik z zera na jedynkę. Ale prawdą jest, że widać punkty zwrotne, a jednym z nich widocznym w danych z OpenAI — i który widziałem osobiście — jest to, że Codex stał się dużo bardziej użyteczny w ostatnich kilku miesiącach po wydaniu modelu 5.5. Dane adopcji pokazują, że popularna adopcja Codexa po 5.5 w kręgach nietechnicznych w OpenAI gwałtownie wzrosła.

To, co rzuca mi się w oczy w kontekście naszej rozmowy, to fakt, że Codex z modelem 5.5 zarobił zaufanie, by wpuszczać do siebie brudny kontekst prawny, rekrutacyjny, sprzedażowy — tak jak wcześniej zarobił zaufanie inżynierów do kodu. W badaniu jest jeszcze dużo więcej — zachęcam, żebyście je przeczytali, mogę je zalinkować.

Codex robi coś odwrotnego niż Claude Tag. Jeśli Claude Tag zasadniczo mówi “pracujesz w Slacku, więc zataguj Claude”, to Codex mówi “twoja praca jest ważna i wrażliwa — wskaż Codexowi lokalne pliki, na których ci zależy, a Codex zajmie się resztą”. To ramowanie czyni Codexa waszą platformą startową, waszym sztabem głównym, podczas gdy ramowanie Claude jest bardziej takie, że Claude przychodzi tam, gdzie już jesteście, i można mu dać chaotyczny kontekst.

W obu przypadkach jest pewien bałagan, ale Claude mówi, że potrafi poradzić sobie z ludzką rozmową i kontekstem, a wciąż wykonać użyteczną pracę, a Codex mówi: “dajcie nam pliki, dajcie nam zadania, a my wyprodukujemy wam świetne wyniki” — niezależnie, czy jesteście w dziale prawnym, sprzedaży czy HR.

Podoba mi się to rozróżnienie — nie dlatego, że nie wierzę, że OpenAI wkrótce wyda swój własny “tagowany” Codex (te modele mają zwyczaj kopiować się nawzajem), ale ponieważ pokazuje różnicę w kształcie produktu wokół kontekstu między tymi dwoma laboratoriami. Claude od zawsze jest produktem typu “my przyjdziemy do was, owinięte wokół was nasz interfejs”. Claude Code był bardzo ekscytujący, podobnie Co-work, częściowo dlatego, że mówiły zasadniczo: “po prostu wpisz, czego chcesz, w terminalu, wpisz, czego chcesz, w Co-work, a my się tym zajmiemy”. Teraz robią kolejny krok do Slacka. To dzieje się w sandboksie — po prostu wykona pracę tam, a wy otrzymacie wynik. To jest jak przywiezienie taczki pracy i pozwolenie im się nią zająć, a potem dostajemy wynik.

Stało się to dużo szersze, gdy w ostatnich miesiącach pojawiło się “computer use”, co uczyniło to dużo bardziej użytecznym — widać to w badaniu — ale wciąż fundamentalnie jest to narzędzie “ukształtowane przez pliki”, a Claude jest raczej narzędziem “ukształtowanym przez czat”. Zdaję sobie sprawę, że to gruba generalizacja, bo obie firmy radzą sobie z plikami i z czatem — nie mówię, że to jedno albo drugie, to nie jest sytuacja zero-jedynkowa. Claude od dawna myślał o problemie kontekstu jako o czymś konwersacyjnym w sposobie, w jaki projektuje swój produkt, a Codex od dawna myślał o problemie kontekstu w kategoriach plików, dając odpowiedź “ukształtowaną przez pliki”. I wciąż widać dziedzictwo tego podejścia w wydarzeniach tego tygodnia.

Spowolnienie GPT-5.6 jako presja na kontekst

To przenosi nas do kolejnej historii OpenAI — opóźnienia Chat GPT 5.6. Jeśli model frontierowy spędza kilka kolejnych tygodni lub miesięcy w ograniczonym podglądzie, co wygląda na to, że dotyczy prawie wszystkich modeli, świat nie zatrzymuje się i nie czeka. Firmy wciąż mają Claude, mają modele OpenAI, mają teraz GLM 5.2 i będą mieć kolejny nowy model open source, który wyjdzie tuż po nim — może nowy DeepSeek, kto wie. Będą mieć przeczucie, ale nie realność przyszłej pracy frontierowej od Anthropic i OpenAI, które, nawiasem mówiąc, wciąż się rozwijają i wciąż bardzo szybko gromadzą wiedzę wewnętrznie — po prostu nie mogą jej wydawać tak szybko.

Rządowe restrykcje wprowadzają tarcie na froncie inteligencji. To zwiększa presję na Anthropic i OpenAI, by wydawały funkcje takie jak Claude Tag — bo trzeba zwiększyć użyteczność posiadanej już inteligencji, przybliżając ją do kontekstu, żeby uzyskać więcej wartości dla klienta. Jeśli możecie spędzić 2 minuty albo 30 sekund na zataguwaniu Claude, zamiast 10 minut na briefowanie AI, zaoszczędziliście sobie dużo czasu. To się kumuluje — jeśli coś staje się bezszwową częścią waszej pracy, postrzegacie z tego dużo więcej użyteczności, nawet jeśli model nie stał się mądrzejszy.

To znaczy, że jesteśmy w środku wojny o kontekst, i tak należy czytać newsy w nadchodzących tygodniach. Patrzcie na to tak: Apple walczy o wasz osobisty kontekst, co — bo zabieramy nasze urządzenia do pracy — staje się rozmową o kontekście zawodowym. Anthropic i OpenAI definitywnie walczą o kontekst pracy, mając różne kształty na to, jak to robią.

Jedną z najbardziej interesujących rzeczy jest to, że rządowe spowolnienie efektywnie daje modelom open source czas, by dogonić w przestrzeni publicznej, nawet jeśli nie dogania ich w przestrzeni prywatnej. Anthropic i OpenAI mogą zachować swoją 6-, 7-, 8-miesięczną przewagę nad modelami open source prywatnie, ale modele publiczne, do których mamy dostęp, mogą zacząć się zbliżać, bo rząd USA spowalnia wydania modeli frontierowych. To prowadzi do ogromnej presji na warstwę użyteczności w kontekście. Będzie wielka wojna o to, jak szybko i łatwo model AI może zastosować inteligencję do tego kontekstu.

Co to znaczy dla nas

Spójrzcie na Apple, Anthropic i OpenAI jako na firmy znajdujące się w tej samej łodzi, choć normalnie nie wkładamy ich do jednej kategorii. Pomyślcie o swoim kontekście. Pomyślcie, jaki kontekst jesteście gotowi oddać tym firmom. Pomyślcie, jaki kontekst chcecie zachować dla siebie. I pomyślcie, czy jesteście gotowi poświęcić czas, żeby faktycznie zbudować elementy “uprzęży” (harness), która pozwoli wam decydować, dokąd kierować swój kontekst.

(Informacja dodatkowa: autor odnosi się tu do swoich wcześniejszych materiałów na kanale, w których używał terminów „open brain” i „open engine” na opisanie narzędzi i metod budowania niezależnej od jednego dostawcy infrastruktury kontekstu AI.)

Gdy mówiłem ostatnio o “open brain” i “open engine”, w dużej mierze budowałem publicznie elementy takiej uprzęży, żebyście mieli więcej wyborów. Nie jestem jedyny, który to robi — inni też się tym zajmują, to dobra praca, jestem zadowolony, że jest powszechna. Jest wokół tego duży ruch. Myślę, że ważne jest, żebyśmy mieli wybór — nie powinniśmy czuć się zamknięci w jednym dostawcy modelu, powinniśmy mieć opcję zachowania naszego kontekstu i wykorzystania inteligencji, żeby uzyskać realną pracę.

Im dłużej patrzę na tę historię, tym bardziej staje się ona opowieścią o tym, jak wojny o inteligencję przekształcają się w wojny o kontekst. Coraz mniej będzie chodziło o to, kiedy wyjdzie 5.6, a w przyszłości o to, kiedy wyjdzie Fable, a coraz bardziej o to, kiedy będziemy w stanie zrobić kolejny krok w zastosowaniu inteligencji tak, by była użyteczna. Historia Siri pokazuje nam — przepraszam, historia Apple — że nie trzeba mieć niezwykle inteligentnego modelu, żeby mieć niesamowitą użyteczność. Model Siri nie musi maksymalizować wyników w benchmarkach — to nie jest to, co Siri zrobi — ale Siri zastosowana bezszwowo na całym waszym kontekście na telefonie wciąż może być niezwykle potężna.

To jest historia pod historią tego tygodnia. Zwracajcie uwagę na warstwę kontekstu — będzie miała duże znaczenie.

10 najważniejszych takeaways — z kontekstem zastosowania

1.Spowolnienie GPT-5.6 to nie koniec wyścigu, a przesunięcie pola walki

Na czym polega: Rządowe restrykcje cyberbezpieczeństwa ograniczyły na razie dostęp do GPT-5.6 do zatwierdzonych partnerów, co realnie wyhamowuje tempo publicznego udostępniania najnowszej inteligencji frontierowej.

Jak stosować: Nie planujcie strategii produktowej wokół założenia, że “najnowszy model rozwiąże problem za kilka tygodni” — traktujcie obecnie dostępne modele jako punkt wyjścia na dłużej, niż się wydawało.

Na co uważać: Opóźnienie dotyczy dostępności publicznej, nie rozwoju wewnętrznego — laboratoria nadal się rozwijają prywatnie, więc przewaga technologiczna może się powiększać, nawet gdy publiczne tempo wygląda na zatrzymane.

2.Następna przewaga konkurencyjna to kontekst, nie najnowszy model

Na czym polega: Gdy tempo wydawania nowych modeli zwalnia, firmy i użytkownicy zyskują najwięcej nie z surowej inteligencji, a z tego, jak dobrze AI rozumie ich konkretną sytuację, pliki i decyzje.

Jak stosować: Inwestujcie czas w organizowanie i udostępnianie kontekstu swojej pracy AI (dokumentacja, struktury danych, dostęp do narzędzi), a nie tylko w testowanie najnowszych modeli.

Na co uważać: Budowanie dobrego dostępu do kontekstu wymaga uporządkowania danych firmowych, które często są rozproszone, nieaktualne i niejednoznaczne pod względem uprawnień — to jest praca, nie jednorazowa konfiguracja.

3.Apple stawia na kontekst lokalny, nie na podniesienie inteligencji Siri

Na czym polega: Apple łączy Siri z danymi z telefonu (kalendarz, zdjęcia, e-mail, notatki, ekran), zamiast konkurować poziomem modelu z Chat GPT czy Claude.

Jak stosować: Jeśli budujecie produkt z AI, rozważcie, czy łatwiejszy dostęp do kontekstu użytkownika nie da większej wartości niż wymiana na mocniejszy, ale “głuchy” na kontekst model.

Na co uważać: Taka strategia wymaga zaufania użytkowników co do prywatności — architektura on-device i prywatny cloud są częścią obietnicy, nie tylko marketingiem.

4.Claude Tag testuje, czy firmy zaufają AI z “brudnym” kontekstem

Na czym polega: Claude Tag w Slacku daje Claude dostęp do wybranych kanałów, narzędzi i danych — w tym do nieformalnych, niejasnych i wrażliwych informacji firmowych.

Jak stosować: Wprowadzając podobne narzędzia w organizacji, zaczynajcie od ograniczonych zakresów uprawnień i limitów, zamiast od pełnego dostępu — budujcie zaufanie etapami, tak jak robi to Anthropic.

Na co uważać: Im więcej dostępu do “brudnego” kontekstu (decyzje cenowe, dane o ludziach, tickety klientów), tym większe ryzyko wycieku kontekstu i odpowiedzialności prawnej firmy.

5.Codex zdobywał zaufanie pracowników stopniowo, nawet wewnątrz OpenAI

Na czym polega: Badanie OpenAI pokazało, że adopcja Codexa przez pracowników nie była wymuszona — narzędzie musiało zarobić zaufanie najpierw inżynierów, potem innych działów, a istotny skok adopcji nastąpił po wydaniu modelu 5.5.

Jak stosować: Wdrażając narzędzia AI w firmie, oczekujcie, że adopcja będzie procesem stopniowym z punktami zwrotnymi, a nie jednorazowym przełącznikiem — monitorujcie, które działy zaczynają ufać narzędziu i dlaczego.

Na co uważać: Sukces adopcji może silnie zależeć od jakości konkretnej wersji modelu — wcześniejsze niepowodzenia adopcji nie muszą oznaczać, że narzędzie się nie sprawdzi po aktualizacji.

6.Claude i Codex reprezentują dwa różne “kształty” podejścia do kontekstu

Na czym polega: Claude jest zorientowany na rozmowę i przychodzi tam, gdzie pracujecie (np. do Slacka), a Codex jest zorientowany na pliki — oczekuje, że wskażecie mu konkretne dokumenty i zadania.

Jak stosować: Wybierając narzędzie AI do konkretnego zadania, rozważcie, czy wasza praca jest bardziej “rozmowowa” (decyzje, dyskusje, niejasne ustalenia) czy “plikowa” (konkretne dokumenty, kod, dane) — i dopasujcie narzędzie do tego kształtu.

Na co uważać: To rozróżnienie jest uproszczeniem — obie firmy obsługują zarówno pliki, jak i czat, więc nie traktujcie go jako sztywnej reguły wykluczającej.

7.Spowolnienie frontierowe daje modelom open source szansę dogonić w przestrzeni publicznej

Na czym polega: Modele takie jak GLM 5.2 stają się relatywnie bardziej konkurencyjne, bo liderzy rynku (Anthropic, OpenAI) nie mogą publicznie wydawać swoich najnowszych osiągnięć tak szybko jak wcześniej.

Jak stosować: Jeśli wasza strategia technologiczna zależała od ciągłego dostępu do najnowszych modeli frontierowych, sprawdźcie, czy tańsze modele open source nie domykają już różnicy na tyle, by były realną alternatywą w niektórych zastosowaniach.

Na co uważać: Przewaga prywatna (wewnętrzna) liderów rynku może wciąż się powiększać, nawet jeśli przewaga publicznie dostępnych modeli się zmniejsza — nie traktujcie dogonienia w publicznym dostępie jako dogonienia w ogóle.

8.Niski koszt przejścia kontekstu (np. “tagowanie”) ma realną wartość biznesową

Na czym polega: Skrócenie czasu briefowania AI z kilku minut do kilkudziesięciu sekund (np. przez zatagowanie Claude w Slacku) kumuluje się w realne oszczędności czasu, nawet jeśli model nie staje się mądrzejszy.

Jak stosować: Mierzcie wartość narzędzi AI nie tylko po jakości odpowiedzi, ale po tym, ile czasu i wysiłku trzeba poświęcić, by dostarczyć im potrzebny kontekst.

Na co uważać: Łatwość dostarczania kontekstu często idzie w parze z szerszym dostępem do danych — niska tarcie dla użytkownika może oznaczać wyższe ryzyko dla bezpieczeństwa danych firmy.

9.Świadomie decydujcie, jakiemu dostawcy AI ufacie własnym kontekstem

Na czym polega: Autor zachęca do refleksji nad tym, jaki kontekst (osobisty i firmowy) jesteśmy gotowi oddać konkretnym firmom (Apple, Anthropic, OpenAI) i czy chcemy zachować niezależność od jednego dostawcy.

Jak stosować: Rozważcie budowanie własnej “uprzęży” (harness) — narzędzi i procesów pozwalających kierować wasz kontekst do różnych modeli według potrzeb, zamiast wiązać się trwale z jednym ekosystemem.

Na co uważać: Budowa takiej niezależności wymaga inwestycji czasu i wiedzy technicznej — dla części użytkowników wygoda jednego zintegrowanego ekosystemu może w praktyce przeważyć nad korzyściami z elastyczności.

10.Pytanie “kiedy wyjdzie kolejny model” przestaje być najważniejsze

Na czym polega: Autor przewiduje, że narracja rynku AI przesunie się od ekscytacji nowymi wersjami modeli (5.6, kolejne wersje Fable itd.) do tego, jak szybko i bezpiecznie inteligencja może być stosowana w realnym kontekście pracy.

Jak stosować: Przy ocenie nowości na rynku AI pytajcie nie tylko “jak dobry jest ten model w benchmarkach”, ale “jak łatwo połączy się z moim realnym kontekstem pracy i jak szybko zacznie być użyteczny”.

Na co uważać: Ta zmiana narracji nie oznacza, że jakość samego modelu nie ma znaczenia — chodzi o to, że w krótkim okresie (przy spowolnieniu wydań) różnice w użyteczności mogą bardziej wynikać z integracji z kontekstem niż z surowej mocy modelu.