OpenAI poinformowało o wprowadzeniu ulepszeń do GPT-4o, swojego modelu AI, który napędza m.in. ChatGPT. Zyskał on bardziej aktualną wiedzę, głębsze zrozumienie i umiejętność analizowania obrazów, lepsze wyniki w STEM, a także... zwiększone użycie emoji. Szczegóły poniżej.
Bardziej aktualna wiedza
ChatGPT-4o nie jest już ograniczony pod względem wiedzy do wydarzeń sprzed listopada 2023. Teraz granicę stanowi czerwiec 2024, dzięki czemu model może oferować bardziej adekwatne, aktualne i kontekstowo poprawne odpowiedzi, zwłaszcza na pytania dotyczące kulturowych i społecznych trendów. Świeższe dane treningowe ułatwiają też modelowi ubieranie w ramy jego odpowiedzi z Internetu.
Głębsze zrozumienie i analiza przesłanych obrazów
GPT-4o jest teraz lepszy w rozumieniu i odpowiadaniu na pytania dotyczące obrazów (wprowadzanych jako dane wejściowe), wliczając w to lepsze wyniki w multimodalnych benchmarkach MMMU i MathVista. Model lepiej radzi sobie z interpretacją zależności przestrzennych na obrazach, analizowaniem złożonych wykresów czy schematów, a także z łączeniem danych wizualnych z zawartością tekstową. Odpowiedzi na przesłane obrazy będą zawierały bogatsze wglądy i dokładniejsze wskazówki w obszarach, takich jak planowanie przestrzenne i projektowanie layoutów, a także rozwiązywanie problemów matematycznych lub technicznych opartych na wizualizacji.
Większe umiejętności w zakresie STEM
ChatGPT radzi sobie teraz lepiej z problemami matematycznymi, naukowymi i programistycznymi. Model osiągnął lepsze oceny w benchmarkach akademickich, takich jak GPQA i MATH, a także MMLU – wszechstronnym benchmarku sprawdzającym umiejętności językowe, rozpiętość wiedzy i wnioskowanie. To oznacza, że może teraz podołać bardziej złożonym problemom z tych domen.
Zwiększone użycie emoji
GPT-4o jest teraz bardziej entuzjastyczny w wykorzystaniu emoji i będzie stosował je częściej! ✨