OpenAI анонсировала новую модель o1. (Сильно заслоупочил, ну уж извините). Вкратце на что модель способна:
- решает олимпиадные задачи по математике (AIME) на уровне 500 лучших студентов США и превосходит точность уровня PhD в тестах по физике, биологии и химии (GPQA).
- решает задачи по программированию на уровне топ 11% лучших в соревновании CodeForces.
- способна имитировать пошаговое мышление в решении задач, что и дала прирост возможностей и правильных ответов
- лучше следует инструкциям и prompt engineering, больше вредит, чем помогает
Модель уже можно пощупать, если оплачена подписка на ChatGPT+
Как они до этого добились?
Если вкратце и приближенно к правде, то они обучили модель таким образом, чтобы она последовательно решала задачу через размышления (Chain of Thought). Т.е. модель перед тем как ответить сначала последовательно разбивает задачу на подзадачи и потом на основании своих же ответов приходит постепенно к решению. Из-за этого модель стоит дороже и ответ даже может занимать по времени до нескольких минут, пока она думает.
Что это значит для нас, простых смертных?
А то что, грузчики в будущем более защищены от увольнения, чем люди занятые интеллектуальным трудом. Это наверно первый прецедент, грядущей массовой автоматизации умственной работы, а не физической. Но это шутка (да?), такие инструменты станут крутым дополнением в работе, и тот кто раньше их освоит, то получит преимущество на рынке труда. Но сейчас стоимость такой модели дорога и скорее всего нужна людям, которые решают сложные и комплексные задачи в науке или похожих смежных областях. Мне например навскидку, сложно придумать, чтобы такое спросить, чтобы использовать такую модель.
Что значит для индустрии LLM моделей?
А то что OpenAI очередной раз продемонстрировал закон масштабирования. Чем больше вкладываешь ресурсов (в виде видеокарт и чипов для прогона LLM моделей), тем выше качество ответов. И это только укрепит уверенность инвесторов, в том что вливаемые деньги помогут. Больше вычислительных мощностей = Более умная и качественная модель. И снова укрепляет позиции больших корпораций, у которых есть на это деньги, энтузиасты и маленькие компании вряд ли смогут запускать у себя такие модели, пока не будет прорыва в научном плане.
На почитать, кому мало:
Лонгрид на русском про o1 и в чем прорыв
Анонс от OpenAI
- решает олимпиадные задачи по математике (AIME) на уровне 500 лучших студентов США и превосходит точность уровня PhD в тестах по физике, биологии и химии (GPQA).
- решает задачи по программированию на уровне топ 11% лучших в соревновании CodeForces.
- способна имитировать пошаговое мышление в решении задач, что и дала прирост возможностей и правильных ответов
- лучше следует инструкциям и prompt engineering, больше вредит, чем помогает
Модель уже можно пощупать, если оплачена подписка на ChatGPT+
Как они до этого добились?
Если вкратце и приближенно к правде, то они обучили модель таким образом, чтобы она последовательно решала задачу через размышления (Chain of Thought). Т.е. модель перед тем как ответить сначала последовательно разбивает задачу на подзадачи и потом на основании своих же ответов приходит постепенно к решению. Из-за этого модель стоит дороже и ответ даже может занимать по времени до нескольких минут, пока она думает.
Что это значит для нас, простых смертных?
А то что, грузчики в будущем более защищены от увольнения, чем люди занятые интеллектуальным трудом. Это наверно первый прецедент, грядущей массовой автоматизации умственной работы, а не физической. Но это шутка (да?), такие инструменты станут крутым дополнением в работе, и тот кто раньше их освоит, то получит преимущество на рынке труда. Но сейчас стоимость такой модели дорога и скорее всего нужна людям, которые решают сложные и комплексные задачи в науке или похожих смежных областях. Мне например навскидку, сложно придумать, чтобы такое спросить, чтобы использовать такую модель.
Что значит для индустрии LLM моделей?
А то что OpenAI очередной раз продемонстрировал закон масштабирования. Чем больше вкладываешь ресурсов (в виде видеокарт и чипов для прогона LLM моделей), тем выше качество ответов. И это только укрепит уверенность инвесторов, в том что вливаемые деньги помогут. Больше вычислительных мощностей = Более умная и качественная модель. И снова укрепляет позиции больших корпораций, у которых есть на это деньги, энтузиасты и маленькие компании вряд ли смогут запускать у себя такие модели, пока не будет прорыва в научном плане.
На почитать, кому мало:
Лонгрид на русском про o1 и в чем прорыв
Анонс от OpenAI