O czym jest ten film
- Hermes Agent (agentowy system operacyjny, o którym mówi autor) wypuścił swoją największą jak dotąd aktualizację, obejmującą cztery kluczowe nowości.
- Pierwsza nowość to „Ministry of Experts” — funkcja typu mixture of agents, w której kilka modeli równolegle odpowiada na pytanie, a jeden model-agregator (orkiestrator) syntetyzuje ich odpowiedzi w finalną.
- Dzięki mechanizmowi cache’owania kontekstu ten „komitet modeli” jest znacznie tańszy niż w typowych rozwiązaniach mixture-of-agents, a Hermes twierdzi, że osiąga wynik nawet 8% lepszy od samego Opusa 4.8 (na własnym benchmarku „Hermes Bench”).
- Autor demonstruje krok po kroku, jak skonfigurować orkiestratora (Opus 4.8) i modele referencyjne (DeepSeek V4 Pro, GLM 5.2, ChatGPT 5.5) oraz jak podłączyć klucz OpenRouter i subskrypcję ChatGPT.
- Druga nowość: Hermes może przejąć kontrolę nad komputerem i wykonywać czynności w interfejsie graficznym (klikanie, wypełnianie formularzy) na Mac OS, Windows i Linux — przydatne wszędzie, gdzie nie ma API/MCP.
- Trzecia nowość — komenda
/learn— pozwala Hermesowi zamieniać dowolne materiały (repozytoria, foldery, rozmowy, notatki) w trwałe „skille”, do których wraca automatycznie, gdy rozpozna podobne zadanie w przyszłości. - Czwarta nowość to rozmowa głosowa z Hermesem (np. z użyciem modelu Whisper), którą można prowadzić w tle podczas innych zadań.
- Autor porusza temat zgodności z RODO/HIPAA dla firm wdrażających Hermesa i wspomina o sponsorowanej współpracy z firmą Vanta, która automatyzuje procesy compliance.
- Dodatkowe („quickfire”) aktualizacje: integracja z iMessage i WhatsApp, bardziej stabilna pamięć (operacje atomowe), agenci działający w tle przy dłuższych zadaniach oraz natywna aplikacja desktopowa z profilami i harmonogramami zadań („automation blueprints” zamiast crona).
- Wideo jest zapowiedzią płatnego kursu autora o Hermes Agent oraz odsyła do linków w opisie (m.in. do repozytorium z przykładowym skillem i do oferty Vanty).
Redakcyjne tłumaczenie
Cztery duże nowości w Hermes Agent
Hermes Agent wypuścił swoją największą jak dotąd aktualizację — taką, która ma jednocześnie poprawić skuteczność agenta, zmniejszyć koszty i zwiększyć dokładność odpowiedzi. W tym materiale omawiam cztery kluczowe zmiany, o których musisz wiedzieć, żeby nie zostać w tyle i wykorzystać swojego agenta Hermes na nowym poziomie.
(Informacja dodatkowa: Hermes Agent to agentowy system operacyjny promowany przez autora kanału — framework do budowania i zarządzania agentami AI, integrujący różne modele językowe, pamięć długoterminową i automatyzacje.)
Ministry of Experts — komitet modeli zamiast jednego mózgu
Pierwsza rzecz, o której chcę powiedzieć, to tak zwane „Ministerstwo Ekspertów” (Ministry of Experts). Chodzi o architekturę, w której mamy agenta orkiestrującego oraz trzech „ekspertów”, do których ten agent się odwołuje. Można to też opisać jako radę (council), którą Hermes „wyrósł” i którą teraz można wykorzystać wewnątrz agenta.
Idea mixture of agents nie jest nowa — ten framework istnieje już jakiś czas. Ale Hermes robi z nim coś unikalnego, co czyni go trochę bardziej efektywnym kosztowo niż gdzie indziej, a jednocześnie znacznie wzmacnia jakość finalnych odpowiedzi.
Zasada działania: kilka modeli referencyjnych niezależnie próbuje odpowiedzieć na twoje pytanie, a agregator odczytuje wszystkie ich propozycje i na tej podstawie pisze właściwą odpowiedź oraz uruchamia narzędzia. Można na przykład ustawić Opusa 4.8 jako agregatora, a pod nim mieć modele referencyjne, które najpierw „próbują swoich sił”, po czym Opus 4.8 formułuje finalną odpowiedź.
To ma znaczenie, ponieważ różne modele popełniają różne błędy. Finalny model, syntetyzując kilka niezależnych podejść, łapie te „martwe punkty”, które łatwo przeoczyć, korzystając tylko z jednego modelu.
Mechanizm cache’owania obniża koszty. Uruchamianie komitetu modeli było dotąd kosztowne. Wcześniej cache obejmował cały kontekst, jaki trzeba było wczytać dla każdej wysłanej wiadomości — czyli za każdym razem, gdy ktoś powtarzał to ćwiczenie samodzielnie, cały kontekst trzeba było wczytywać od nowa, co po prostu kosztowało więcej. Hermes wykorzystuje ten cache tak, że cały kontekst jest odczytywany raz i później używany ponownie bezpłatnie — twórcy „przypięli” ten panel modeli na końcu (tail), więc cache nigdy się nie zrywa. W efekcie całość wychodzi znacznie taniej niż robienie tego ręcznie, a odpowiedzi są przy tym lepsze.
Na wykresie kosztów widać porównanie: samo użycie Opusa, mixture of agents oraz odpalanie dwóch agentów samodzielnie. Czerwony to stary sposób, niebieski to obecny, a pomarańczowy to sam Opus. Kluczowe jest jednak podejście z wykorzystaniem modelu subskrypcyjnego — koszt jest wtedy dosłownie groszowy, tylko odrobinę wyższy niż użycie samego Opusa 4.8, a jakość — jak twierdzą twórcy — wyraźnie lepsza.
Twórcy Hermesa opracowali też własny benchmark, „Hermes Bench”, i twierdzą, że ten system uzyskuje wynik o 8% lepszy niż Opus 4.8 działający samodzielnie. To ma sens, jeśli Opus 4.8 pełni funkcję orkiestratora, a inne modele są „dotagowywane”, żeby łapać jego błędy.
Jak to skonfigurować w praktyce. W Hermes Agentic Operating System wchodzimy do sekcji Pantheon, a w niej do „Ministry of Experts”. Widać tam wszystkie dostępne modele. Wybieramy model, który ma być orkiestratorem — w tym przypadku Opus 4.8. Modele można swobodnie przestawiać. Widoczne są też statystyki: szybkość, koszt, a także ranking modelu na platformie Arena, gdzie modele „ślepo” konkurują ze sobą, a użytkownicy oceniają, która odpowiedź była lepsza — miejsce pierwsze zwykle zajmuje model preferowany przez większość.
Autor wybiera Opusa 4.8 jako orkiestratora, a jako modele referencyjne: DeepSeek V4 Pro (koszt zaledwie 87 centów za milion tokenów, bardzo szybki i mocny), GLM 5.2 (niektórzy uznają go za rywala Opusa 4.8) oraz ChatGPT 5.5.
Aby to uruchomić, trzeba skopiować odpowiednią konfigurację (link w opisie filmu) i wkleić ją w czacie Hermes Agent lub na Telegramie. Zalecane jest podanie własnego klucza API OpenRouter, który daje dostęp do wszystkich modeli (GPT 5.2, Opus 4.8 i innych) w jednym połączeniu, a także posiadanie subskrypcji ChatGPT — za 20 dolarów miesięcznie dostaje się dostęp do GPT 5.5 z bardzo dużym limitem użycia.
Można też dostosować liczbę tokenów (np. od 4000 do 16 tys.) — mniej, jeśli chcemy krótszej, bardziej bezpośredniej odpowiedzi, więcej, jeśli tematyka jest bardziej rozbudowana. Warto zaznaczyć: te agenty nie mogą uruchamiać subagentów — to zawsze jeden model na raz.
Test na żywo. Autor prosi Hermesa: „Użyj Ministerstwa Ekspertów, żeby odpowiedzieć na pytanie, jak działa pamięć agenta Hermes”, z limitem 4000 tokenów, prosząc też o rozbicie, jak dana odpowiedź została wypracowana i co zaczerpnięto od poszczególnych modeli.
System uruchamia równolegle wszystkie trzy modele, a Hermes zwraca pełną odpowiedź wraz z opisem procesu: te same zapytanie trafiło równolegle do GPT 5.5, GLM i DeepSeek, każda propozycja została dołączona do prywatnego kontekstu promptu, a finalną odpowiedź napisał Opus 4.8, syntetyzując wszystkie sygnały. Widać dokładnie, co wniósł każdy model — to jak zespół, w którym każdy wnosi coś swojego do wspólnego stołu.
Ważna cecha: nie liczy się „najlepszy” model. Listę ekspertów można aktualizować dynamicznie — na przykład zastąpić Opusa 4.8 modelem 4.3 i system nadal działa analogicznie. GLM sprawdziłby się równie dobrze jako orkiestrator, bo przy podobnej wydajności kosztuje z grubsza szesnaście razy mniej.
To odróżnia Ministry of Experts od rozwiązań typu Sakana Fugu: tu mamy komitet, nie router. Ministerstwo Ekspertów odpytuje ten sam, ustalony panel modeli przy każdym zapytaniu — nie analizuje zadania, żeby samodzielnie wybrać model. Modele wybiera człowiek. System zawsze uruchamia skonfigurowany, ustalony panel i łączy wszystkie odpowiedzi, dzięki czemu jest zoptymalizowany pod jakość i stanowi zabezpieczenie przed „martwymi punktami” poszczególnych modeli.
Sterowanie komputerem
Kolejna niedawna aktualizacja to zdolność Hermesa do kontrolowania komputera. Jest to istotne, bo nie wszystko, z czego korzystamy, ma API lub MCP. Wszystko, co robimy na komputerze, Hermes może wykonać za nas — pod warunkiem, że laptop jest włączony, czy to lokalnie, czy w wersji wirtualnej. To jeden z powodów, dla których autor woli uruchamiać system na własnym sprzęcie („na swoim metalu”), we własnym domowym laboratorium AI.
Przykład zastosowania: jeśli zapomnisz o czymś — na przykład o wypełnieniu formularza albo zrobieniu rezerwacji na kolację — Hermes może otworzyć przeglądarkę, klikać odpowiednie przyciski i wykonać te czynności za ciebie. Działa to w tle, bez fizycznego przejmowania kontroli nad komputerem, i wspiera różne systemy operacyjne: macOS, Windows, Linux. Potrafi między innymi przenosić okna i wykonywać inne podobne operacje.
Umiejętność „/learn” — Hermes zapamiętuje na dobre
Trzecia funkcja, na której autor chce się skupić, to komenda /learn. Jeśli razem z Hermesem uda się coś ważnego wypracować — na przykład rozwiązać skomplikowaną integrację — można powiedzieć: „Hermes, nauczysz się tego, co ci właśnie pokazałem?”. Hermes bierze wtedy całą wykonaną pracę i zamienia ją w trwały „skill”. Można też wskazać mu adresy URL, foldery, całe rozmowy albo dowolny tekst — pokazane raz, trafia do pamięci długotrwałej jako gotowy skill.
W przyszłości, jeśli zadamy pytanie, które ten skill „wyzwala”, Hermes rozpozna sytuację — „to wygląda jak skill, którego niedawno się nauczyłem” — i po prostu go zastosuje, bez potrzeby ponownego wyjaśniania wszystkiego od nowa. To realna oszczędność czasu.
Praktycznie: wskazujemy /learn na folder, URL, treść rozmowy albo wklejone notatki, a Hermes samodzielnie napisze plik ze skillem — nigdy nie trzeba mu podawać gotowego skill.md. Do zdobycia materiału źródłowego Hermes używa swoich standardowych narzędzi: czyta, przeszukuje, wykonuje ekstrakcję treści z sieci. Działa to identycznie w CLI, na bramce iMessage, w interfejsie TUI i w dashboardzie.
Przykład na żywo. Autor bierze losowe, popularne repozytorium GitHub Reaper, dotyczące tworzenia prezentacji PowerPoint (choć zaznacza, że jego zdaniem nikt już w 2026 roku nie robi prezentacji w PowerPoincie — wszyscy używają HTML). Kopiuje kod repozytorium, wkleja komendę /learn w Hermes Agent razem z prośbą: „przejrzyj to repozytorium i nauczysz się go”. Hermes uczy się skilla na podstawie opisanego materiału.
(Informacja dodatkowa: aby korzystać z komendy /learn, trzeba mieć zainstalowaną najnowszą wersję Hermes Agent.)
Autor zauważa, że w praktyce bardziej użyteczne jest podejście reaktywne niż proaktywne. Przykład: jeśli budujemy prezentację albo piszemy wstęp do filmu na Instagram i po długich poprawkach jesteśmy zadowoleni z efektu, wystarczy powiedzieć: „nauczysz się tego, zrób z tego skill” — i nigdy więcej nie trzeba prosić o to samo od nowa. Autor stosuje tę technikę od dawna w Claude Code, więc docenia, że Hermes formalnie skodyfikował ten sam mechanizm. Można to robić i proaktywnie, i reaktywnie.
Rozmowa głosowa z Hermesem
Czwarta funkcja, którą autor uważa za świetną, to możliwość prowadzenia rozmowy głosowej z Hermes Agent. Jest wiele sposobów, by to zrobić — można podłączyć ElevenLabs, a autor w swoim systemie korzysta z modelu Whisper, ponieważ jest szybki.
Interfejs głosowy można wyświetlić na pełnym ekranie i połączyć z wybranym interfejsem czatu, a następnie zacząć rozmowę głosową (autor demonstruje krótką wymianę powitalną z asystentem). Interfejs może zmieniać kolor w zależności od tego, czy Hermes myśli, mówi czy słucha.
Taką rozmowę można prowadzić w tle podczas wykonywania innych zadań — nie trzeba jej mieć włączonej non-stop (choć teoretycznie można), można ją włączać w dowolnym momencie, np. pracując na wspólnym projekcie i dopytując Hermesa w miarę potrzeby, albo po prostu „wygadując się” głosowo, żeby przemyśleć jakiś problem.
Zgodność (compliance) przy wdrożeniach firmowych
Autor odnotowuje pytania od społeczności o wdrażanie takich rozwiązań w firmach i korporacjach. Przy funkcjach typu speech-to-text bardzo ważna jest zgodność z RODO. Firmą, którą poleca w tym kontekście, jest Vanta — automatyzuje ona procesy zgodności (np. RODO, HIPAA) dla firm korzystających z agentowych systemów operacyjnych, w tym Hermesa. Autor zaznacza, że wielu przedstawicieli firm i przedsiębiorstw kontaktuje się z nim właśnie w sprawie wdrożeń Hermesa, i podkreśla, że kwestie zgodności trzeba mieć „pod kontrolą”, bo duże firmy często odmawiają rozmowy, jeśli te wymagania nie są spełnione.
(Informacja dodatkowa: Vanta jest sponsorem tego fragmentu wideo — autor zaznacza, że korzysta z ich usługi po pełnej cenie, bez rabatu, i przekazuje tylko subiektywną opinię o produkcie.)
Pozostałe aktualizacje w skrócie
- iMessage i WhatsApp — można teraz rozmawiać z Hermesem bezpośrednio w iMessage, i to bardzo szybko. Kierunek rozwoju produktu to docieranie do użytkownika tam, gdzie faktycznie pracuje — iMessage, WhatsApp itd.
- Bardziej stabilna pamięć — dodawanie, edytowanie i usuwanie wpisów pamięci odbywa się teraz w ramach jednej operacji atomowej, więc nie ma już ryzyka „częściowo zapisanego”, niespójnego stanu.
- Agenci działający w tle — można zlecić dłuższe zadanie badawcze albo budowlane, a agent będzie kontynuować pracę w tle, zamieniając czas czekania na realną pracę wykonywaną równolegle.
- Natywna aplikacja desktopowa — bardziej przyjazna dla użytkownika wersja terminala, z możliwością tworzenia profili, „zwierzątkami” (element czysto kosmetyczny) oraz harmonogramowaniem zadań przez tzw. „automation blueprints” — czyli mechanizm typu cron, tylko opisany bardziej przystępnym językiem („powiedz Hermesowi, żeby coś zautomatyzował”, a on to rozumie).
Podsumowanie
Znajomość Hermesa na dobrym poziomie to jedno, ale jeśli nie wiesz, jakie są kolejne poziomy jego możliwości i jakie jest największe ograniczenie na twoim aktualnym poziomie, zostawiasz na stole zbyt dużo wartości. Kolejnym krokiem jest więc poznanie tych poziomów i sposobu przechodzenia na wyższy.
10 najważniejszych takeaways — z kontekstem zastosowania
1.Mixture of agents jako sposób na łapanie błędów jednego modelu
Na czym polega: Ministry of Experts w Hermesie uruchamia kilka modeli równolegle do tego samego zapytania, a wybrany model-agregator syntetyzuje ich odpowiedzi w jedną finalną.
Jak stosować: Do zadań, w których dokładność jest krytyczna (np. analiza danych, decyzje biznesowe, kod produkcyjny), skonfiguruj panel 2-3 modeli referencyjnych i jeden mocny model jako agregator/orkiestrator.
Na co uważać: To wciąż komitet o ustalonym składzie, nie router — modele nie są automatycznie dobierane do zadania, trzeba je świadomie skonfigurować i regularnie weryfikować, czy nadal są opłacalne cenowo i jakościowo.
2.Cache kontekstu jako realny czynnik kosztowy
Na czym polega: Koszt komitetu modeli drastycznie spada, jeśli kontekst jest wczytywany raz i ponownie wykorzystywany (cache), a nie odczytywany od nowa przez każdy model.
Jak stosować: Przy projektowaniu własnych rozwiązań multi-model sprawdź, czy dostawca/framework wspiera cache’owanie kontekstu — to może zmienić ekonomię całego rozwiązania z „kosztownego” w „opłacalne”.
Na co uważać: Deklarowane oszczędności i wyniki benchmarkowe (np. „8% lepiej niż Opus 4.8”) pochodzą z wewnętrznego benchmarku producenta („Hermes Bench”) — warto traktować je jako punkt wyjścia do własnej weryfikacji, nie jako niezależnie potwierdzony fakt.
3.Wybór orkiestratora nie musi oznaczać wyboru „najlepszego” modelu
Na czym polega: Model wiodący (orkiestrator) w komitecie można zmieniać dynamicznie, a jakość wyniku niekoniecznie drastycznie spada — tańszy model (np. GLM) może dawać zbliżoną jakość za wielokrotnie niższą cenę.
Jak stosować: Testuj różne kombinacje orkiestrator/eksperci pod kątem stosunku jakości do kosztu, zamiast automatycznie wybierać najdroższy dostępny model.
Na co uważać: Deklaracje typu „szesnastokrotnie taniej za tę samą wydajność” są subiektywną oceną autora filmu, nie wynikiem formalnego testu — przed wdrożeniem produkcyjnym warto zweryfikować to na własnych przypadkach użycia.
4.Sterowanie komputerem jako obejście braku API/MCP
Na czym polega: Hermes może wykonywać czynności w interfejsie graficznym systemu operacyjnego (klikanie, wypełnianie formularzy) tam, gdzie nie istnieje żadne API czy integracja MCP.
Jak stosować: Rozważ tę funkcję do automatyzacji powtarzalnych zadań w serwisach bez API — rezerwacje, formularze, proste operacje w przeglądarce — zwłaszcza jeśli masz komputer stale włączony (lokalnie lub w wirtualnym środowisku).
Na co uważać: Automatyzacja działań w przeglądarce i systemie operacyjnym wiąże się z ryzykiem — błędne kliknięcie może wywołać niezamierzoną akcję (np. potwierdzić płatność lub rezerwację). Warto testować na zadaniach niskiego ryzyka, zanim zaufa się temu w pełni.
5.Komenda „/learn” do budowania trwałych umiejętności agenta
Na czym polega: Po wykonaniu wartościowej pracy z Hermesem (np. rozwiązanie integracji, dopracowanie treści) można polecić agentowi „nauczenie się” tego jako trwałego skilla, do którego wróci automatycznie przy podobnym zadaniu w przyszłości.
Jak stosować: Stosuj podejście reaktywne — gdy skończysz pracę, z której jesteś zadowolony, każ Hermesowi zapisać ją jako skill, zamiast z góry projektować skille teoretycznie.
Na co uważać: Wymaga aktualnej wersji Hermes Agent; warto też okresowo przeglądać wygenerowane skille, żeby uniknąć nawarstwiania się nieaktualnych lub sprzecznych „nauczonych” zachowań.
6.Interfejs głosowy jako sposób pracy równoległej z agentem
Na czym polega: Rozmowa głosowa z Hermesem (np. poprzez model Whisper) pozwala konsultować się z agentem w tle, bez przerywania innej pracy przy klawiaturze.
Jak stosować: Wykorzystaj to do „myślenia na głos” podczas pracy nad projektem albo do szybkich pytań kontrolnych bez przełączania się do interfejsu tekstowego.
Na co uważać: Rozmowy głosowe generują dane wrażliwe (nagrania, transkrypcje), co ma znaczenie zwłaszcza w kontekście firmowym — patrz punkt o zgodności z RODO.
7.Zgodność z RODO/HIPAA jako warunek wejścia do biznesu
Na czym polega: Firmy, zwłaszcza duże, mogą odmówić współpracy z rozwiązaniem AI, jeśli nie ma ono uregulowanej zgodności z RODO czy HIPAA — dotyczy to szczególnie funkcji przetwarzających głos i dane osobowe.
Jak stosować: Jeśli planujesz wdrożenie agenta typu Hermes w środowisku firmowym, zadbaj o kwestie zgodności zanim zaczniesz rozmowy z klientami korporacyjnymi — może to być twardy warunek wejścia do rozmów.
Na co uważać: Wzmianka o firmie Vanta w materiale to płatna współpraca sponsorska — potraktuj ją jako punkt wyjścia do własnego researchu dostawców compliance, nie jako jednoznaczną rekomendację niezależną od interesu autora.
8.Integracja z komunikatorami jako element strategii „bądź gdzie użytkownik pracuje”
Na czym polega: Możliwość rozmowy z Hermesem przez iMessage i WhatsApp odzwierciedla ogólny trend przenoszenia agentów AI do kanałów, z których ludzie już korzystają codziennie.
Jak stosować: Jeśli twoi odbiorcy (zespół, klienci) nie chcą instalować kolejnej aplikacji, rozważ dostęp do agenta przez istniejący komunikator, zamiast wymuszać nowy interfejs.
Na co uważać: Komunikatory konsumenckie mają inne standardy bezpieczeństwa i prywatności niż dedykowane narzędzia firmowe — warto to uwzględnić przy pracy z danymi wrażliwymi.
9.Atomowe operacje na pamięci zmniejszają ryzyko niespójności
Na czym polega: Dodawanie, edycja i usuwanie wpisów pamięci agenta odbywa się teraz jako jedna operacja, co eliminuje ryzyko „częściowo zapisanego” stanu pamięci.
Jak stosować: Jeśli wcześniej rezygnowałeś z funkcji pamięci długoterminowej z powodu niestabilności, warto ponownie ją przetestować po tej aktualizacji.
Na co uważać: To poprawka techniczna zgłoszona przez producenta — nie zastępuje regularnego audytu tego, co agent faktycznie zapamiętał, zwłaszcza przy pracy z danymi osobowymi lub firmowymi.
10.Agenci w tle do zadań długodystansowych
Na czym polega: Zadania badawcze lub budowlane można zlecić agentowi do wykonania w tle, bez konieczności aktywnego czekania na wynik.
Jak stosować: Zarezerwuj tę funkcję dla zadań, które faktycznie wymagają dłuższego czasu (research, budowa większego elementu), żeby efektywnie wykorzystać czas, który inaczej spędziłbyś na czekaniu.
Na co uważać: Zadania działające w tle wymagają jednak okresowej kontroli — brak nadzoru nad długo trwającym procesem może prowadzić do tego, że błąd popełniony na starcie zostanie powielony w całym wyniku.

