Есть шанс что вчерашнее обновление gpt-4o это не просто минорное обновление.
Да, основная цель точно выполнена, на lmarena gpt-4o опять лидер, однако после проведения независимых тестов видно уменьшение качество модели на таких тестах как MATH и GPQA Diamond. Однако кроме этого, новая gpt-4o в 2(!) раза быстрее предыдущей версии. Самый реалистичный вариант как это произошло - новая модель меньше предыдущей. Также нельзя исключать улучшения в сфере декодинга или просто временное ускорение(которое было и раньше после релиза новой модели, но не такое сильное).
Да, основная цель точно выполнена, на lmarena gpt-4o опять лидер, однако после проведения независимых тестов видно уменьшение качество модели на таких тестах как MATH и GPQA Diamond. Однако кроме этого, новая gpt-4o в 2(!) раза быстрее предыдущей версии. Самый реалистичный вариант как это произошло - новая модель меньше предыдущей. Также нельзя исключать улучшения в сфере декодинга или просто временное ускорение(которое было и раньше после релиза новой модели, но не такое сильное).