Недавно DeepSeek выпустили 3-ю версию своей LLM, и она стала лучшей Open-Source моделью за все время[фото 1].
Этого результата они достигли за счет, в том числе, большого размера - 671B параметров.
DeepSeek даже смог немного обогнать Claude 3.5 Sonnet в тесте программирования Aider, в котором LLM тестируется на различных задачах на разных языках. Среди протетированных моделей впереди только o1[фото 2].
И несмотря на отличную производительность, эта модель ещё и очень дешёвая, и в соотношении цена-качество она также является лучшей моделью.
С техническими подробностями можно ознакомиться здесь.
Китайцы напрягаясь под конец года.
Этого результата они достигли за счет, в том числе, большого размера - 671B параметров.
DeepSeek даже смог немного обогнать Claude 3.5 Sonnet в тесте программирования Aider, в котором LLM тестируется на различных задачах на разных языках. Среди протетированных моделей впереди только o1[фото 2].
И несмотря на отличную производительность, эта модель ещё и очень дешёвая, и в соотношении цена-качество она также является лучшей моделью.
С техническими подробностями можно ознакомиться здесь.
Китайцы напрягаясь под конец года.