Во время праздников особо ничего не происходило, все праздновали и отдыхали, но сейчас надо заново включатся.
Но конечно мир не останавливался, поэтому коротко о наиболее интересном что произошло за это время:
Microsoft в документе о создании нового теста
MEDEC подтвердили слова
аналитиков о размерах моделей. Хоть у них также "предположения", но они более-менее совпадают со сказанным ранее. Так gpt-4o они также оценили в 200B и GPT-4 в почти 2T. Однако Claude 3.5 Sonnet они оценили в 185B. Но также они оценили o1-preview который составляет всего 300B, а 4o-mini, по их оценкам, всего лишь 8B(!).
Если это более-менее верный оценки, то 4o-mini вполне может претендовать на лучшую модель в своей "весовой категории".
В январе OpenAI должны показать
Operator, так и много других компаний должны выпускать свои агентные системы. Microsoft и тут внесла свою лепту показав
Large Action Models. Суть похожа в каком-то смысле на o1, LAM тренируется на связках "задача-план", это позволяет давольно чётко выполнять задачи в различных приложениях.
31 декабря в преддверии Нового Года xAI начали выдавать доступ некоторым людям на бету веб-версии Grok. В общем, он как внешне так и по функционалу очень похож на ChatGPT. Одно крупное отличие - качественный нативный просмотр PDF(у ChatGPT такой возможности впринцыпе нет). В веб-версии, думаю, и будет использоваться новый
логотип(пока еще его там нет)
Alibabba
разработали 1.58 bit FLUX. Квантизированную(уменьшенную) версию FLUX 1 Dev которая требует
намного меньше VRAM и памяти, при этом сохраняя высокое качество изображений. К сожалению пока без кода.
И небольшой оффтоп, Илон Маск, как минимум хочет, купить TikTok в этом году.
В общем, в этом году должен быть четкий переход на уровень 3, и кроме обычных агентов скорее всего будут хорошие улучшения в сфере гуманоидных роботов.