Na wczorajszym streamingu Spring Update firma OpenAI ogłosiła następny duży model językowy (LLM) o nazwie GPT-4o. Będzie on dostępny dla wszystkich, wliczając w to użytkowników darmowej wersji ChatGPT. Dotąd jedynie płatna wersja usługi dawała dostęp do GPT-4 (był on jednak od dawna dostępny za darmo w Microsoft Copilot). Czym charakteryzuje się ta wersja?
Podczas prezentacji zespół OpenAI rozmawiał z GPT-4o przy użyciu naturalnych poleceń głosowych. Wystarczy kilka sugestii od człowieka, aby czatbot zmienił ton głosu na bardziej dramatyczny czy przypominający robota. W innej demonstracji pokazano czatbotowi równanie matematyczne poprzez kamerę smartfona, a głos AI był w stanie opisać to równanie i nie tylko. Jak podaje Sam Altman, GPT-4o zacznie być udostępniany w następnych tygodniach. GPT-4o jest już dostępny w wersji zapoznawczej w Microsoft Azure OpenAI Service. A gdy pojawi się w ChatGPT, jego użytkownicy będą wreszcie mogli:
- Korzystać ze sztucznej inteligencji na poziomie GPT-4.
- Otrzymywać odpowiedzi od modelu i z Internetu.
- Analizować dane i tworzyć wykresy.
- Czatować na temat wykonywanych zdjęć.
- Przesyłać pliki, by AI pomogła w podsumowaniu, pisaniu lub analizie.
- Odkrywać i używać GPTs i GPT Store.
- Budować bardziej pomocne doświadczenie z Memory.
OpenAI pisze na blogu, że nowa wersja GPT potrafi odpowiadać na zawartość audio w zaledwie 232 milisekundy (średnio 320 ms), co jest zbliżone do ludzkiego tempa konwersacji. GPT-4o i GPT-4 Turbo mają taką samą wydajność pod względem tekstu i kodowania, a także znaczną poprawę w przetwarzaniu tekstu w językach innych niż angielski. Nowy model jest też znacznie szybszy i o 50% tańszy w API. W szczególności zaś GPT-4o jest znacznie lepszy w rozumieniu zawartości wizualnej i dźwiękowej w porównaniu do istniejących modelów.
Źródło: https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/