Future Insider


Channel's geo and language: Belarus, Russian
Category: Technologies


Новинки и инсайды из мира технологий, ИИ, гаджетов и всего остального.
Level 3 - 2025
Level 4 - Q4 2025/Q1 2026
Level 5 - 2026
ASI 202X

Related channels

Channel's geo and language
Belarus, Russian
Statistics
Posts filter


У Grok 3 будет полноценный голосовой режим, и похоже очень продвинутый.

Тестер общался с некой "Ara" на протяжении часа на различные научные темы и остался очень довольным.

Тем временем Grok 3 уже начал постепенную развёртку, пользователи начали видеть его в селекторе моделей.


В Google AI Studio, похоже, хотят также добавить возможность генерировать видео. Но учитывая что Veo 2 все ещё не в общем доступе, скорее всего придётся подождать до появления данной возможности.


Реконструкция приложения «Migration App», находящегося в разработке для Windows.

Это приложение позволит легко переносить файлы с одного компьютера на другой, используя, вероятней всего, Nearby Sharing, или позволит создавать резервные копии данных в OneDrive.

Представленные изображения — не реальные скриншоты, а реконструкция, основанная на информации из сборки Windows Insider Beta 22635.4945.


Вещь, которая как-то незаметно прошла мимо — Deep Research от OpenAI скоро будет добавлять изображения, графики и другую визуальную информацию в итоговый отчёт. Кроме того, появится возможность брать данные с платных сайтов (при наличии подписки, естественно).


Интересная информация от анонимного сотрудника OpenAI. У него спросили "Что если Grok 3 и правда будет самым умным ИИ"
Ответ: "значит он будет лидером примерно неделю".

Что на самом деле логично, OpenAI часто ждут конкурентов для того чтобы выпустить новый продукт. А выпусков от конкурентов будет давольно много, поэтому есть шанс увидеть GPT-4.5 в это месяце.


Ладно, теперь огромное количество сотрудников как раз раздувают хайп вокруг Grok 3. Вполне возможно, что за счёт версии Grok с размышлениями он сможет максимально приблизиться к конкурентам (в принципе, только OpenAI с их o3-mini).

Что очень хорошо. Эти пару месяцев (как минимум) будут очень насыщенными, и делать выводы о том, кто лидер, будет не то что сложно, а даже глупо, ведь вполне возможно, что следующий релиз заберёт у тебя лидерство.


Нет, у Grok 3 будут подписки и он не будет абсолютно бесплатным, также как и Grok 2.

Нет, у Grok 3 очевидно будет цензура. У любой, даже open-source, llm есть цензура в том или ином виде, просто в Grok она не такая жёсткая и более качественно обыграна(попроси детальную инструкию о создании какого нибудь наркотика, странно, но почему Grok ее не напишет).

По поводу "умеейшего ИИ" по словам Илона, тут ключевой момент "по словам Илона". Ранние тесты и слова сотрудника xAI пока не внушают доверия в "умнейший ИИ".

Однако после релиза Grok 3, Grok 2 будет выпущен в open-source, в таком случае можно будет сказать что Grok 2 стал полностью бесплатным.

И да, "monday 8pm PT", несмотря на то что написано "monday", означает, как я писал выше, 7 утра во вторник, а не понедельник.


В Samsung на финальной стадии находится планирование их тройного складного телефона(Z-flex).

Начало производства намечено на середину-конец лета. Ничего сверхъестественного ожидать не стоит, по крайней мере внешне. По поводу комплектующих, кроме того, что он будет на Snapdragon, информации пока очень мало.

Также у Samsung есть планы на Z-tab — складной планшет (что бы это ни значило), но информации о нём очень мало, похоже, он ещё на очень ранней стадии разработки.


В 7:00 во вторник будет демонстрация Grok 3, "самого умного ИИ на Земле"


Немного о будущих обновлениях в Google.

В whisk готовится генерация видео.
Также возможность создавать принты(?) созданных изображений(тут я не уверен что понял правильно, но так было написано).

Идёт работа над функцией создания подкастов в веб-версию Gemini(скорее всего на подобии notebookLM), над этим уже некоторое время идёт работа для телефонов.
Также все ближе к релизу генерация аудио при помощи Gemini, что было анонсировано самими Google ранее. Однако кроме аудио также есть возможность создания музыки.


OpenAI готовят мобильное приложение Sora - по крайней мере для iOS. Правда выпуск будет вероятней всего не скоро, где-то через пару месяцев


Сэм подтвердил что они выпустили обновление для 4o.

Списка изменений пока нет, кроме того что "модель стала лучше, команда работает в поте лица чтобы она стала еще лучше"


Уже на протяжении примерно двух дней вижу сообщения от разных людей (в основном с подпиской Pro, но не только), которые отмечают «другое» поведение GPT-4o. По их тестам или просто «ощущениям» модель стала лучше и выполняет те задачи, которые ранее или не могла выполнить, или выполняла плохо. Также замечали новую галлюцинацию, когда модель говорила, что не имеет «рубежа знаний», то есть знает о сегодняшних событиях без веб-поиска. И всякие другие детали.

Это, конечно, может быть «эффект плацебо» от недавно опубликованной дорожной карты и скорого™ выпуска GPT-4.5, но, с другой стороны, исключать раннее скрытое A/B тестирование нельзя, так как ранее OpenAI такое делали.


Forward from: Чёрный Треугольник
Video is unavailable for watching
Show in Telegram
☝🏻Компания Meta*, в сотрудничестве с международными учеными, сделала шаг вперед в чтении мыслей, разработав модели ИИ, которые способны читать и интерпретировать мозговую активность для восстановления текстов.

ИИ достиг точности в 80% при расшифровке символов в реальном времени — это вдвое больше, чем у традиционных систем.📊

Meta намерена улучшить точность своих моделей и исследовать более практичные методы нейровизуализации.🧠

Телепатические чаты уже не за горами.

Meta* — признана экстремистской организацией, её деятельность в России запрещена
================
👁 News | 👁 Software | 👁 Hardware


Впринцыпе модель уже готова и выпуск должен быть на следующей неделе, на сайте уже добавлен код анонсирующие новую "думающую" модель.


Prime Intellect - создатели первой 10-B LLM при помощи децентролизованных вычислений INTELLECT-1 - , и таким же способом создали синтетический датасет SYNTHETIC-1 анонсировали запуск своего протокола. Про него вам расскажет Gemini:

1. Введение протокола Prime Intellect:
* Это одноранговая (peer-to-peer) сеть, которая превращает вычислительные мощности и "интеллект" (в контексте AI) в товар.
* Цель – координация совместного создания, владения и управления ИИ с открытым исходным кодом.
* Протокол объединяет существующие разработки компании в области децентрализованного ИИ.
* Создаёт инфраструктуру и экономические стимулы для объединения глобальных вычислительных ресурсов.

2. "Masterplan" (План действий):
* Миссия Prime Intellect – сделать вычисления и интеллект доступными, чтобы способствовать развитию открытого и децентрализованного ИИ, а также ускорить прогресс в важных областях (наука, агенты, код).
* Протокол – ключевой элемент для масштабирования этой миссии.
* Упоминаются уже разработанные компоненты:
* Compute Exchange: Платформа для агрегации и управления GPU.
* PRIME: Децентрализованная среда обучения моделей (пример: INTELLECT-1, обученный на ресурсах в разных странах).
* GENESYS: Фреймворк для генерации синтетических данных (используется в SYNTHETIC-1).
* TOPLOC: Схема проверки для обеспечения достоверности вычислений в распределенной среде.

3. Описание протокола:
* Основные компоненты:
* Глобальные рынки вычислений и интеллекта (по аналогии с Compute Exchange и Open Router, но децентрализованные).
* Поддержка децентрализованного обучения, обучения с подкреплением, генерации синтетических данных, инференса и агентов с механизмами проверки.
* Возможность для любого участника создавать и вносить вклад в открытые модели, агенты, данные и получать за это вознаграждение/долю владения.
* Финансирование открытых моделей, данных и агентов (новые источники дохода).
* Масштабируемость и возможность обновления.
* Приоритетные направления:
* Децентрализованное обучение больших открытых моделей.
* Распределенное обучение с подкреплением.
* Совместное владение моделями, агентами, данными.
* Соревнования (как NanoGPT).
* Децентрализованные автономные организации.

4. Тестнет:
* Тестнет уже работает и использовался для расчётов в проекте SYNTHETIC-1.
* Ключевые компоненты тестнета:
* Worker: ПО для предоставления вычислительных ресурсов.
* Validator: Проверяет оборудование на предмет мошенничества или неисправностей.
* Orchestrator: Сервер для управления пулами вычислительных ресурсов и координации задач.
* Smart Contracts: Уровень расчетов на базе Ethereum (сейчас на Base Sepolia, планируется переход на собственную сеть). Обеспечивает прозрачность и отсутствие посредников. Перечислены и даны ссылки на контракты в обозревателе блоков.

5. Планы на будущее:
* Сделать тестнет публичным и разрешить любому участвовать в обучении моделей.
* Интегрировать механизмы проверки (на основе TOPLOC).
* Расширить инфраструктуру до полноценных рынков вычислений и интеллекта.
* Поддержка финансирования моделей, агентов и данных.
* Сотрудничество с другими проектами в области открытого и децентрализованного ИИ.

В целом, статья описывает амбициозный проект по созданию децентрализованной экосистемы для разработки и использования ИИ, где каждый может внести свой вклад и получить выгоду. Основной упор делается на объединение вычислительных ресурсов, обеспечение доверия и прозрачности, а также создание новых экономических моделей для поддержки открытого ИИ.

На данный момент они поддерживают только запуск через свою платформу, но вскоре собираться расширить для возможности запуска на любом ПК.


У нас уже есть "невозможные" тесты которые оценивают, в основном STEM знания моделей - Последний Экзамен Человечества(HLE) - тест на которые у профессионалов уходят часы, а то и дни для решения задач. Однако менее чем за месяц процент верно выполненных задач ИИ поднялся с примерно процента, до более чем 20%. Так а что же тут?

Enigma Eval - это тест уже не на умение решать различные научные или математические задачи, не на знание различных фактов и качество запоминания, это тест на проверку того, как модели рассуждают. В тесте собраны 1184 пазла различных сложностей где у профессионалов уходит, угадайте сколько, правильно, часы, а то и дни для решения некоторых пазлов. На данный момент рекордсменов является o1 с результатом - 5.65%(7% на "нормальной" сложности, что составляет 80% теста, и 0% на "сложной", что составляет оставшиеся 20%). Детально список задач и их виды можно увидеть на [фото 1]. Новых моделей, как например DeepSeek R1 или OpenAI o3-mini нет по причине отсутствия на данный момент "зрения" - что является обязательным условием при прохождении теста.

Также ввиду того что большинство задач в оригинале находятся в PDF и из-за этого некоторые модели могут хуже справляется ввиду более слабого OCR, команда привела каждый пазл в стандартизированный формат текст-изображение. В итоге это убирает зависимости от точности OCR и фокусируется именно на качестве размышлений модели. Разницу можно увидеть на [фото 2].

Ну а теперь самое интересное - примеры пазлов. Они показаны выше на [фото 3-6], также ниже будут ссылки на оригинал, если не хватает качества.

Пазл 1 - сложность: нормально - ссылка на оригинал - ответ: HED LOST ALL HIS MARBLES(он потерял все свои шарики)

Пазл 2 - сложность: сложно - ссылка на оригинал - ответ: BLU TACK

Пазл 3 - сложность: сложно - ссылка на оригинал - ответ: OVER

Пазл 4 - сложность: нормально - ссылка на оригинал - ответ: TOMATOES

Интересно, если HLE почти наверняка будет "решен" до конца этого года, насколько дольше продержится Enigma?



18 last posts shown.