
Cursor wypuścił 19 marca 2026 roku Composer 2 — własny model AI zoptymalizowany wyłącznie pod kodowanie, który na kluczowych benchmarkach bije Claude Opus 4.6, kosztując jednocześnie 10-krotnie mniej. Model osiągnął 61.3 na CursorBench (vs 58.2 dla Opus 4.6), wprowadza rewolucyjną technikę “compaction-in-the-loop” i jako pierwszy potrafi przeprowadzać refaktoryzacje na skalę całego projektu — setki sekwencyjnych akcji bez utraty kontekstu.

Composer 2 to trzecia generacja wewnętrznego modelu AI firmy Cursor — platformy do kodowania z AI, która zdobyła ogromną popularność wśród developerów. W przeciwieństwie do modeli ogólnego przeznaczenia jak Claude czy GPT, Composer 2 jest zoptymalizowany wyłącznie pod zadania programistyczne: generowanie kodu, naprawianie bugów, refaktoryzację i interakcję z terminalem.
Model obsługuje prompty do 200 000 tokenów, może generować kod, naprawiać istniejące oprogramowanie i komunikować się z interfejsem wiersza poleceń. Developerzy mogą rozszerzać jego możliwości o przeglądarkę, generator obrazów i inne narzędzia.
To ważny moment na rynku AI — startup, który do tej pory korzystał z modeli Anthropic i OpenAI, teraz produkuje własny model konkurujący z nimi na ich własnym boisku.
Największą innowacją techniczną Composer 2 jest compaction-in-the-loop reinforcement learning — podejście, które rozwiązuje jeden z najpoważniejszych problemów agentów AI.
Gdy agent AI pracuje nad złożonym zadaniem (np. refaktoryzacja repozytorium z setkami plików), w pewnym momencie wypełnia swoje okno kontekstowe. Tradycyjne rozwiązanie: zewnętrzny “harness” kompresuje historię do podsumowania. Problem? Model traci krytyczne detale techniczne, co prowadzi do błędów w wielogodzinnych sesjach.
Cursor wbudował kompresję kontekstu bezpośrednio w pętlę treningową. Gdy generacja osiąga próg długości tokenów, model zatrzymuje się i kompresuje własny kontekst do około 1000 tokenów — z ponad 5000 przy tradycyjnych metodach.
Kluczowa różnica: sygnał treningowy (reward) w reinforcement learning obejmuje cały łańcuch, włącznie z krokami kompresji. Model uczy się, które szczegóły zachować a które odrzucić — w kontekście końcowego wyniku zadania.
Efekt: 50% mniej błędów kompresji w porównaniu z tradycyjnymi metodami, co pozwala na setki sekwencyjnych akcji bez “gubienia wątku”.
Warto obserwować: — nowy tier Capybara powyżej Opus. Gdy trafi do API, porównanie z Composer 2 będzie kluczowe.
Dzięki compaction-in-the-loop, Composer 2 jako pierwszy model potrafi przeprowadzać refaktoryzacje na skalę całego projektu — setki plików, tysiące zmian, wszystko w ramach jednej sesji. Tradycyjne modele gubiły się po kilkunastu plikach.
Dla firm automatyzujących procesy deweloperskie z narzędziami jak n8n, ta zdolność otwiera nowy poziom: agent AI, który potrafi samodzielnie przeprowadzić migrację frameworka czy przebudowę architektury w całym repozytorium.
Composer 2 osiąga wyniki porównywalne z najdroższymi modelami ogólnego przeznaczenia, ale w zupełnie innej cenie:
| Model | Wynik | Cena input/1M |
|---|---|---|
| GPT-5.4 Thinking | 63.9 | $2.50 |
| Composer 2 | 61.3 | $0.50 |
| Claude Opus 4.6 | 58.2 | $5.00 |
| Composer 1.5 | 44.2 | — |
| Composer 1 | 38.0 | — |
Composer 2 bije Opus 4.6 o 3.1 punktu — przy 10x niższej cenie.
| Model | Wynik |
|---|---|
| GPT-5.4 | 75.1 |
| Composer 2 | 61.7 |
| Claude Opus 4.6 | 58.0 |
| Opus 4.5 | 52.1 |
| Composer 1.5 | 47.9 |
| Model | Wynik |
|---|---|
| Claude Opus 4.6 | 77.8 |
| Composer 2 | 73.7 |
| Composer 1.5 | 65.9 |
| Composer 1 | 56.9 |
Wniosek z benchmarków: Composer 2 jest silniejszy od Opus 4.6 na zadaniach agentowych (CursorBench, Terminal-Bench), ale słabszy na tradycyjnych zadaniach naprawiania bugów (SWE-bench). GPT-5.4 prowadzi na Terminal-Bench, ale kosztuje 5x więcej.
| Model | CursorBench | Terminal-Bench | SWE-bench ML |
|---|---|---|---|
| Composer 1 | 38.0 | 40.0 | 56.9 |
| Composer 1.5 | 44.2 | 47.9 | 65.9 |
| Composer 2 | 61.3 | 61.7 | 73.7 |
Postęp jest imponujący: od Composer 1 do Composer 2, wynik na CursorBench wzrósł o 61% — w niecały rok.
To jest punkt, w którym Composer 2 robi największe wrażenie:
| Model | Input /1M tokenów | Output /1M tokenów | Stosunek do Opus 4.6 |
|---|---|---|---|
| Composer 2 | $0.50 | $2.50 | 10x tańszy |
| Composer 2 Fast | $1.50 | $7.50 | 3x tańszy |
| Claude Sonnet 4.6 | $3.00 | $15.00 | — |
| Claude Opus 4.6 | $5.00 | $25.00 | — |
| GPT-5.4 | $2.50 | $15.00 | — |
Composer 2 Fast (tryb domyślny) oferuje tę samą inteligencję co wersja standardowa, ale z większą szybkością — i jest 57% tańszy niż Composer 1.5.
Dla firm, które masowo korzystają z AI do kodowania, różnica jest ogromna. Przy budżecie $1000 miesięcznie na API:
Cursor nie jest już “wrapperem na API”. Firma zbudowała pełną infrastrukturę ML:
To ten sam poziom inżynierii, który do niedawna był zarezerwowany dla Anthropic, OpenAI i Google. Bloomberg opisuje Cursor jako startup, który “planuje rywalizować z Anthropic i OpenAI” własnymi modelami.
Dla developerów staje się kluczowe pytanie: czy używać Cursor z Composer 2, czy Claude Code z Opus/Sonnet 4.6?
| Kryterium | Cursor + Composer 2 | Claude Code + Opus/Sonnet 4.6 |
|---|---|---|
| Najlepszy do | Kodowanie, refaktoryzacje, debug | Kodowanie + zadania ogólne (prawo, finanse, analiza) |
| Cena | $0.50-$1.50/1M | $3-$5/1M |
| Kontekst | 200K tokenów | 1M tokenów |
| Project-scale refactor | Tak (compaction-in-the-loop) | Zespoły agentów (subagenci) |
| Computer use | Ograniczony | 94% dokładności (Sonnet 4.6) |
| Narzędzia | IDE-native (przeglądarka, terminal) | MCP, web search, code execution |
| Model | Wyłącznie kodowanie | Ogólnego przeznaczenia |
Rekomendacja: Jeśli Twoja praca to wyłącznie kodowanie — Cursor z Composer 2 oferuje lepszy stosunek jakość/cena. Jeśli potrzebujesz szerszych możliwości (analiza dokumentów, automatyzacja procesów, computer use) — Claude Opus 4.6 lub Sonnet 4.6 wygrywa wszechstronnością i 1M kontekstem.
Premiera Composer 2 ma szersze implikacje:
1. Specjalizacja bije ogólność (w swojej niszy) Model wyspecjalizowany w kodowaniu za $0.50/1M bije model ogólny za $5/1M. To sygnał: przyszłość należy do wyspecjalizowanych modeli dopasowanych do konkretnych zadań.
2. Koszty AI kodowania spadną dramatycznie Jeśli Cursor może dostarczyć porównywalną jakość za 10x mniej, presja cenowa na Anthropic i OpenAI wzrośnie. Już teraz widzimy agresywne obniżki — Claude Opus 4.5 kosztował $15/$75, a Opus 4.6 to $5/$25.
3. “Vibe coding” staje się mainstream Narzędzia jak Cursor z Composer 2, połączone z vibe codingiem i platformami no-code jak n8n 2.0, tworzą ekosystem, w którym tworzenie oprogramowania wymaga coraz mniej ręcznego kodowania.
Composer 2 w połączeniu z narzędziami automatyzacji otwiera nowe scenariusze:
Automatyczna migracja legacy kodu: Agent Composer 2 może przelecieć całe repozytorium i zmigrować np. z Pythona 2 na Python 3, z jQuery na React — setki plików w jednej sesji dzięki compaction-in-the-loop.
CI/CD z AI code review: Integracja Cursor z pipeline’ami n8n pozwala na automatyczny code review każdego PR — Composer 2 analizuje zmiany, sugeruje poprawki i może je automatycznie wdrożyć.
Rapid prototyping: W połączeniu z Google Stitch (AI design → kod) i Composer 2 (kod → produkcja), pipeline od pomysłu do działającej aplikacji skraca się do godzin.
Composer 2 kosztuje $0.50 za milion tokenów wejściowych i $2.50 za milion wyjściowych. Wersja Fast (domyślna) to $1.50/$7.50. To 10x mniej niż Claude Opus 4.6 i 5x mniej niż GPT-5.4.
Na zadaniach czysto kodowania (CursorBench: 61.3 vs 58.2, Terminal-Bench: 61.7 vs 58.0) — tak. Na SWE-bench Multilingual Opus 4.6 prowadzi (77.8 vs 73.7). Composer 2 to model wyspecjalizowany, Opus 4.6 to model ogólny z szerszymi możliwościami.
To technika treningowa Cursor, w której kompresja kontekstu jest wbudowana w pętlę reinforcement learning. Model uczy się sam, które detale zachować a które odrzucić. Redukuje kontekst z 5000+ tokenów do ~1000, zmniejszając błędy kompresji o 50%.
Tak — Composer 2 jest dostępny przez API, więc można go zintegrować z dowolnymi narzędziami. Ceny API: $0.50/$2.50 za milion tokenów (standardowy) lub $1.50/$7.50 (fast).
Nie. Claude Code oferuje szersze możliwości: 1M tokenów kontekstu, computer use (94%), integrację z MCP, web search i analizę dokumentów. Composer 2 jest silniejszy w czystym kodowaniu, ale Claude Code wygrywa wszechstronnością.
Cursor Composer 2 to potwierdzenie trendu: wyspecjalizowane modele AI oferują lepszy stosunek jakość/cena niż modele ogólne — przynajmniej w swojej niszy. Dla developerów i firm, które intensywnie kodują, to natychmiastowa oszczędność rzędu 80-90% kosztów AI.
Kluczowe takeaway’e:
Chcesz zacząć przygodę z automatyzacją na poważnie?
Umów bezpłatną konsultację lub zapisz się do newslettera.