Płatne plany ChatGPT pozostają dziś głównym źródłem utrzymania dla OpenAI (poza finansowaniem przez Microsoft i ostatnio również Project Stargate), ale firma nie zapomina też o deweloperach. Oferuje ona programistom dostęp do swoich usług za pośrednictwem AI, aby mogli oni integrować AI w swoich aplikacjach i agentach. Najnowsze narzędzia znacznie to ułatwią. To przede wszystkim nowy interfejs API oraz zestaw narzędzi programistycznych.
Tworzenie agentów AI na poziomie produkcyjnym może stanowić duże wyzwanie przy korzystaniu z dzisiejszych narzędzi. Aby to ułatwić, OpenAI wypuszcza nowe narzędzia dla deweloperów. Ułatwią one tworzenie zaawansowanych agentów AI zdolnych do obsługi złożonych, wielokrokowych operacji zarówno dla programistów, jak i firm. Firma uruchamia następujące narzędzia:
- Nowy interfejs Responces API łączący prostotę Chat Completions API z możliwością korzystania z narzędzi Assistants API do budowania agentów.
- Wbudowane narzędzia, w tym wyszukiwanie w internecie, wyszukiwanie plików i użycie komputera.
- Nowy zestaw narzędzi Agents SDK to orkiestracji przepływów pracy z jednym i wieloma agentami.
- Zintegrowane narzędzia obserwacyjne do śledzenia i inspekcji wykonywania przepływu pracy agenta.
Responces API i jego składniki
Responces API umożliwi wykorzystanie wbudowanych narzędzi OpenAI do budowania agentów. Jako że możliwości modelu stale ewoluują, wydawca wierzy, że nowy API zapewni bardziej elastyczną podstawę dla deweloperów tworzących aplikacje agentów. Poprzez pojedyncze wywołanie Responces API deweloperzy będą mogli rozwiązywać zadania o rosnącej złożoności, używając wielu narzędzi i kolejek modelu - wyjaśnia wydawca. Responses API oferuje szereg wbudowanych narzędzi.
- Wyszukiwanie w internecie (Web search) pozwala deweloperom uzyskiwać szybkie, aktualne odpowiedzi z jasnymi i adekwatnymi cytatami z sieci. Wyszukiwanie jest dostępne jako narzędzie przy korzystaniu z modeli gpt-4o i gpt-4o-mini oraz może być sparowane z innymi narzędziami lub wywołąniami funkcji.
- Wyszukiwanie plików (File search) pozwala programistom łatwo pozyskiwać adekwatne informacje z dużych zbiorów dokumentów przy użyciu ulepszonego narzędzia wyszukiwania. Dzięki obsłudze wielu typów plików, optymalizacji zapytań, filtrowaniu metadanych i niestandardowemu ponownemu rankingowaniu funkcja ta może zapewnić szybkie i dokładne wyniki wyszukiwania. Jego integracja z Responses API wymaga jedynie dodania kilku linijek kodu.
- Użycie komputera (Computer use) pozwala agentowi AI wykonywać zadania na komputerze. Funkcja ta, teraz zintegrowana z Responces API, napędzana jest przez ten sam model Computer-Using Agent (CUA), którego używa OpenAI Operator. Ma on na koncie rekordowe osiągnięcia, takie jak 38,1% wskaźnik powodzenia w zadaniach z pełnym użyciem komputera na OSWorld, 58,1% na WebArena oraz 87% na WebVoyager dla interakcji w internecie.
Agents SDK do tworzenia agentów AI
Ważną nowością zapowiedzianą przez OpenAI jest też zestaw narzędzi programistycznych Agents SDK. Oprócz budowania kluczowej logiki agentów i zapewnieniu im dostępu do narzędzi, które są przydatne, deweloperzy potrzebują też orkiestrować przepływy pracy agentów. Nasz nowy open-source'owy Agents SDK upraszcza orkiestrację przepływów pracy typu multi-agent i oferuje znaczące ulepszenia w Swarm, eksperymentalnym SDK, który wypuściliśmy w zeszłym roku, który został szeroko zaadaptowany przez społeczność deweloperów i z powodzeniem wdrożony przez wielu klientów - wyjaśnia OpenAI.
Agents SDK ma wiele zastosowań w aplikacjach korzystających z AI z prawdziwego świata, wliczając w to automatyzację obsługi klienta, wielokrokowe badania, generowanie treści, przeglądanie kodu czy pozyskiwania klientów. Agents SDK współpracuje z Responses API oraz Chat Completions API, a także z wybranymi modelami od innych dostawców.