Future Insider


Гео и язык канала: Беларусь, Русский
Категория: Технологии


Новинки и инсайды из мира технологий, ИИ, гаджетов и всего остального.

Связанные каналы

Гео и язык канала
Беларусь, Русский
Категория
Технологии
Статистика
Фильтр публикаций


На презентации Galaxy Unpacked, которая должны состояться в январе, Samsung могут показать фото/видео своего прототипа XR-очков которые должны выйти примерно в 3-ем квартале 2025 года.

Данные очки должны весить около 50 грамм, на борту будет Gеmini и они будут распознавать жесты, эмоции/лица и возможность оплаты(хоть не совсем понятно каким образом). Камера которая будет отвечать за зрение вероятней всего будет 12MP сенсор Sony IMX681 CMOS.
Также XR-платформа на основе которой будут работать очки должны быть показана в этом месяце.


Появилось упоминание об ещё одном виде подписки - "quorum".

Возможно это будет чем-то на подобии корпоративного плана(Enterprisey, не особо понимаю что это значит) и будет похож на уже существующие ChatGPT Edu и ChatGPT Enterprise


В скором времени в приложение Gemini добавят функционал NotebookLM.

На данный момент эту функцию не смогли запустить полностью(подкаст не генерируется), но можно увидеть то, как это будет выглять[фото].


Похоже все оказалось куда проще и Straw это "Рождественский голос" с анимацией снега, и также данный эксперимент эаменяет обычную иконку голосового режима на снежинку


Помните такую штуку в бразуре Chrome как "I'm feeling lucky" которая давала случайный запрос в бразуер?

Google остались верны себе и в последней бете приложения Gemini заметили такую же кнопку которая находится вместе с случайными предложениями для запросов(как это например реализованно у ChatGPT). При нажатии на данное "предложение" Gemini получить случайный запрос, например при тестировании в первый раз было "расскажи как работает радуга в детском стиле", а во втором "напомни мне каждый понедельник мыть машину".


Уже некоторое время на lmarena видны модели под названиями "goblin" и "gremlin" которые говорят что они разработанны Google.

После тестов сказать наверняка что какая-то из этих моделей является Gemini 2.0 либо просто какой-то тестовой моделью трудно. Но думаю есть связь с сообщением ранее о новом релизе Gemini на второй неделе декабря


Если вдруг кто-то считает что OpenAI уже нечего показывать, то это очень большое заблуждение.
Как минимум, они планируют достичь 1 миллиарда(!) пользователей в следующем году покупая новые датацентры, портнерству с Apple, но и кроме этого, новыми продуктами.

Ну начать следует с того, что до сих пор они не развернули все функции которые умеет делать *реальный* gpt-4o. Это как минимум нативная генерация изображений, а не через DALL•E 3, как сейчас.
Все ещё не известно когда они уже наконец это сделают, но это точно должно показывать то, что они на голову впереди конкурентов и они часто просто ждут релизов от них перед тем как выпускать что-то свое.

Также какой-то новой информации о "подарках" нет. Есть какие-то намёки на вторник, но вторник и четверг это стандартные даты для релизов OpenAI.


Итак, что мы имеем:

-максимально простые и небольшие поздравления от некоторых сотрудников
-Сэм Альтман показал как он с братом построили домик на дереве(оно как раз было опубликованно в этот промежуток времени)[фото]
-ещё один сотрудник ушёл из OpenAI(Рози Камбелл - Policy Research, AGI Readiness).

Получается ждём рабочей недели потомучто Сэм был занят строительством.

Уже сложно предполагать что же OpenAI решат предоставить нам, я уже вижу сообщения что будут обновления к 4o, есть намёки о улучшенном/нативном генкераторе изображений.
Но к сожалению все пока на уровне слухов, и с o1-full обманули😔

(Что удивительно, даже всем любимого блог-поста небыло, похоже выходные на то и выходные чтобы отдыхать)


Потенциальное "что-то" намеченно на 5-7 pm по Сан-Франциско, что на наше время примерно 4 ночи, поэтому если что-то и произойдёт, то сообщение тут появится "с запозданием".

Ну или OpenAI решили что выходные это хорошее оправдание чтобы не "поздравлять" ChatGPT(до сих пор небыло ни одного "поздравления" в отличии от предыдущего года) и в выходные можно только распространить дезинфу среди инсайдеров просто почему бы и нет.

Скоро узнаем.


Amazon разрабатывает Olympus - собственную мультимодальную LLM сфокусированную на понимании видео и изображений.

Они создают ее для того чтобы затем использовать(продавать) их в такие индустрии как нефть и газ или спорт:
Консультант нефтяных компаний отметил, что модель может помочь таким отраслям, как нефтегазовая, автоматизировав анализ видео, например, для обнаружения проблем с подводным оборудованием по записям с беспилотников, а спортивные и развлекательные компании могут использовать ее для анализа архивов, создания ярких моментов или получения новых потоков прибыли.

И хоть, по сообщениям, Olympus хуже с точки зрения генерации текста или решения сложных проблем, но он будет должен предложить более дешевую и эффективную обработку видео.


Если кто помнит про Sana от NVidia, они уже некоторое время назад выпустили две модели, 0.6 и 1.6B. Как говорилось ранее, это Open-source, поэтому можно использовать локально, нудно 9 и 12Гб VRAM соответственно.


o1-full сегодня


Репост из: Чёрный Треугольник
Видео недоступно для предпросмотра
Смотреть в Telegram
☝🏻Kling AI анонсировал обновление своего видеогенератора, которое позволяет пользователям изменять наряды персонажей.

Для этого достаточно загрузить фотографию с новым нарядом и выбрать модель или использовать собственное изображение.🤔

После создания изображения с новым образом, пользователи могут активировать функцию "Bring to life", чтобы сгенерировать видео.

В системе предусмотрена возможность менять как отдельные части одежды, так и целые образы.🤖
================
😎 @black_triangle_tg


a-new-golden-age-of-discovery_nov-2024.pdf
1.4Мб
Недавно Google DeepMind опубликовали статью "Golden age of discovery" в котором, как следует из названия, описали почему же мы живем в "золотой век открытий".

Кратко про эту статью за меня рассказал другой пользователь, я только перевел, почитать можно здесь. Полный документ прикреплён к сообщению. В общем серьезных инсайдов там нет и там акцентируется внимание на уже созданных инструментах(в том числе от самих DeepMind - AlphaFold\AlphaProteo, AlphaProof и т.д. про который я уже рассказывал) и на том, как они помогают исследователям делать свою работу лучше, быстрее и точнее.


Вышла INTELLECT-1 первая модель(10B) которая использовала децентрализованную тренировку среди любых желающих.

На карте видно[фото 1] кто участвовал в тренировке и в сумме это было схоже с использованием 112 H100 и сама тренировка длилась 43 дня.
По сравнению с другими SLM она показывает хорошие результаты[фото 2], не SOTA, но всеравно хорошо учитывая необычный подход.
Посмотреть на плоды работы, можно сказать, со всей Земли, можно тут.


Сегодня нашему любимому ChatGPT исполняется 2 годика. Круто, особенно осознавая как много изменилось с этого времени что многие вещи которых небыло 2 года назад кажутся нормальными, а много ещё впереди.

Также самое интересное это то, какой подарок ChatGPT подготовили OpenAI. Тут ничего неизвестно, но самые популярные предположения это или Sora или o1-full(и по "счастливому" обстоятельству и к тому и к другому уже был случайно или специально выдан доступ🙃). Но сейчас выходные, поэтому скорее всего "подарок" должны подарить на неделе.


В скором времени OpenAI "запустят" новый уровень подписки "Pro". Что конкретно он будет в себя включать неизвестно, но скорее всего там будут "тяжелые" модели как o1-full или Sora.

Также уже несколько дней в коде замечают различные вещи связанные с "straw". Также неизвестно что это конкретно значит и есть предположение что э о связанно с o1-full(straw-berry). Но этот "Straw" работает как в чате, как в Canvas(web/electron composer) так и в Voice Mode


Runner H 0.1 веб-агент разработанный H Company.

Runner H имеет на борту специализированную 3B модель, что намного меньше конкурентов, и достигает лучшего качества работы в том числе сравнивая с Computer Use от Anthropic.[фото 1-2]
Runner H кроме более точного выполнения задачи, также выполняет ее намного быстрее(за меньшее количество шагов).[видео 1-4]

Также в Studio при помощи Runner H можно создавать собственные "паттерны" для автоматизации какой либо задачи, и агент вполне возможно что справиться с задачей, даже если изменится UI.

На данный момент Runner H находится в закрытой бете(waitlist) и о сроках выпуска неизвестно. Очень хороший конкурент веб-агенту от OpenAI.


Видео недоступно для предпросмотра
Смотреть в Telegram
NotebookLM, но от ElevenLabs.

В приложении ElevenReader от ElevenLabs теперь можно создавать подкасты на основе своих документов/книг при помощи нового инструмента GenFM(доступно только для iOS). На Android будет доступно на следующей неделе


xAI планируют запустить собственное мобильное приложение, как есть например у ChatGPT, в следующем месяце. Это в основном нужно для увеличения прибыли.

Показано 20 последних публикаций.