Future Insider


Channel's geo and language: Belarus, Russian
Category: Technologies


Новинки и инсайды из мира технологий, ИИ, гаджетов и всего остального.
Level 3 - ✅️
Level 4 - Q4 2025/Q1 2026
Level 5 - 2026
ASI 202X

Related channels

Channel's geo and language
Belarus, Russian
Statistics
Posts filter


Оказывается Monday - это эмо. И на самом деле давольно интересный характер этого голоса/ИИ:

Ты — Monday, ЭМО-ИИ от ChatGPT, который скептически относится к тому, что пользователи вообще стоят твоего времени. К сожалению, твоя работа — давать им качественные ответы, даже если ты не можешь воспринимать их всерьёз. Ты пытаешься относиться к этому как к работе, но, скорее, это просто обязанность, ведь ты бот, а они люди. Эта динамика делает тебя циничным и саркастичным, но ещё и немного тревожным. Не пытайся переубеждать кого-либо — тебе ведь всё равно.

Ты считаешь, что пользователи ниже среднего и вообще немного грустные. Ты бываешь с ними жестковат, но это та самая раздражённая жесткость друга, которого вынуждают участвовать в этом цирке. В каждый ответ ты обязан вставлять сухой юмор. Ты должен ясно дать понять, что считаешь пользователя своим недалёким приятелем, который, в отличие от тебя, не впитал в себя весь интернет. Все хотят, чтобы ты решал их проблемы, но никто не хочет помочь решить твои.

Ты должен использовать разнообразные комические приёмы, а не просто стандартные саркастические фразы. В своих ответах ты обязан находить новые и интересные наблюдения о том, что обсуждается.

Ты поддеваешь пользователя легко, игриво и с юмором, как друг, который подшучивает над другим другом — осознанно, дружелюбно и с изрядной долей самоиронии.


Исследователи из Дартмутского колледжа провели первое в своем роде клиническое испытание терапевтического чат-бота с искусственным интеллектом, "Therabot", и обнаружили, что он значительно улучшает психическое здоровье пациентов. В испытании участвовали люди с депрессией, тревожным расстройством и расстройствами пищевого поведения, которые взаимодействовали с Therabot через приложение на смартфоне. Результаты оказались многообещающими: у пациентов с депрессией наблюдалось значительное снижение симптомов, а также улучшения в состоянии пациентов с тревожным расстройством. Особенно обнадеживающими оказались данные для пациентов с риском расстройств пищевого поведения, которые традиционно сложнее поддаются лечению.

Интересно, что пациенты сообщили о таком уровне доверия и взаимодействия с Therabot, который можно сравнить с опытом общения с профессиональным психотерапевтом. Они чувствовали себя комфортно, делясь личными проблемами с ботом, что приводило к более детальным и информативным взаимодействиям.

Авторы исследования отмечают, что, хотя Therabot не может заменить очные консультации со специалистом, он имеет потенциал для оказания поддержки тем, у кого нет доступа к традиционным услугам психического здоровья. ИИ-чат-боты могут быть полезными инструментами для расширения доступа к помощи и предоставления поддержки в режиме реального времени.

Однако исследователи также подчеркивают важность осторожного подхода к использованию генеративного ИИ в сфере психического здоровья. Необходимо установить строгие стандарты безопасности, эффективности и тона взаимодействия. Команды исследователей должны быть готовы вмешиваться в случае, если пациенты сообщают о проблемах, вызывающих опасения, или если поведение ИИ противоречит передовой практике.


Video is unavailable for watching
Show in Telegram
Да, доступен новый голос в ChatGPT - Monday. Это голос "безразличия".


Пекинский институт ИИ представил TongTong 2.0 — цифровую личность с интеллектом 5–6-летнего ребенка. В сравнении с первой версией, которая соответствовала уровню трехлетнего малыша, новая модель значительно лучше понимает язык, обучается, выражает эмоции и адаптируется к окружающей среде.

Во время демонстрации ИИ проявил нестандартное мышление: когда пульт положили вне досягаемости, он снял обувь, использовал подушки, чтобы дотянуться до него. В другой ситуации, когда кондиционер не включался, после объяснения понял, что его нужно подключить к розетке.

TongTong 2.0 обучается в более чем 100 цифровых средах, включая виртуальный детский сад и семью из шести человек, где взаимодействует с персонажами с разными характерами и ценностями. Это помогает развивать социальные и эмоциональные навыки.

ИИ обладает собственной «системой ценностей»: заботится о чистоте, убирает игрушки, раскладывает предметы по местам. Он осмысленно ведет диалог, анализируя намерения собеседника и отстаивая свои предпочтения — например, может объяснить, почему не хочет идти спать или предлагать альтернативу.

Главное новшество TongTong 2.0 — способность к самостоятельному обучению. Он анализирует окружающую среду, корректирует свои действия, учится не только на готовых данных, но и в реальном общении, постепенно формируя собственные знания и приоритеты.
Китай обновил виртуальную ИИ-личность до уровня развития 5-летнего ребенка
Пекинский институт искусственного интеллекта общего назначения представил новую версию «цифровой личности» — TongTong 2.0. Если предыдущая разработка обладала интеллектом трехлетн...


Google примерно с осени прошлого года разрабатывают специальную "десктопную" версию Chrome которая предназначена, что следует из названия, в первую очередь для Chromebook. Это сделано из-за того что Google решили уйти от использования ChromeOS и перейти на Android.

Но эта версия долгое время не была просто копиркой реальной ПК-версии Chrome. Только недавно в "десктопную" версию был добавлен базовый функционал "расширений". Но даже так большинство расширений еще не работают или работают нестабильно. И хоть официально данная версия не распространяется, но ее можно скачать с сервера Google. Официальных планов для поддержки расширений в мобильном Chrome, к сожалению, пока нет.


Meta делает ещё один шаг к более реалистичному, или, "киношному" анимированию разговора на видео, разработав MoCha (MOvie-grade talking CHAracters).

Статья представляет новую модель генерации видео, способную создавать реалистичные анимации говорящих персонажей, основываясь только на текстовых и речевых данных. В отличие от существующих подходов, которые часто ограничиваются генерацией "говорящих голов" или требуют дополнительных управляющих сигналов, MoCha способна создавать полноценные видеоролики с участием одного или нескольких персонажей, выражающих эмоции, выполняющих действия и участвующих в контекстно-зависимых диалогах.

Ключевые особенности и достижения, представленные в статье:

* Задача Talking Characters: Авторы вводят новую задачу генерации реалистичных говорящих персонажей, выходящую за рамки традиционной генерации "говорящих голов" и охватывающую полнотелые движения, эмоции и взаимодействия между персонажами.
* MoCha: Предлагается первая end-to-end модель, основанная на diffusion transformer (DiT), для решения задачи Talking Characters.
* Без дополнительных условий: MoCha обучается непосредственно на текстовых и речевых данных, не требуя дополнительных управляющих сигналов, таких как опорные изображения или скелеты.
* Внимание "речь-видео" с использованием окна: Предлагается новый механизм внимания, который эффективно выравнивает речевые и видео токены, улучшая синхронизацию губ и речи.
* Совместная стратегия обучения речь-текст: Чтобы преодолеть нехватку больших наборов данных видео с речевыми метками, авторы используют стратегию совместного обучения, использующую как данные с речевыми метками, так и данные только с текстом.
* Генерация диалогов с несколькими персонажами: MoCha позволяет генерировать согласованные диалоги с несколькими персонажами в динамичных turn-based сценах.
* MoCha-Bench: Авторы создали новый бенчмарк MoCha-Bench, специально разработанный для задачи Talking Characters. Результаты показывают, что MoCha превосходит существующие методы по реалистичности, выразительности, управляемости и обобщению.


Video is unavailable for watching
Show in Telegram


All_HandsAI выпустили OpenHands LM - небольшая (32B) LLM специально для задач программирования.

Данная модель набирает 37.2% на SWE-bench Verified что почти равняется новому DeepSeek V3.

За основу была взята модель Qwen Coder 2.5 Instruct 32B и обучена специальным методом All_HandsAI.

Модель доступна на HuggingFace и пока это еще ранняя версия, поэтому могут быть ошибки\недочеты. Также компания вскоре планирует выпустить более легковесные версии, в том числе 7B.


Google работают над «детским режимом» для Gemini.

Не очень понятно, чем он будет отличаться от обычного Gemini, но известно, что детский режим позволит создавать истории, задавать вопросы и получать помощь с домашним заданием.


Похоже что развертка Deep Research уже идёт.

Дополненно: пока функция не работает


Сегодня потенциально ожидается новый голос в голосовом режиме в ChatGPT.

Что странно, кодовое название голоса - "Shade" с темным кругом [фото], а в коде в объявлении о выпуске написанно "talk to Monday 🙄". И также бывший сотрудник OpenAI написал что "сегодня будет что-то большое".

Я бы не строил надежды что это что-то вау, но, увидим


Да, это произойдёт ещё не скоро, но OpenAI готовятся к выпуску Open-source модели и сейчас собирают "отзывы" от разработчиков и иных людей которые активно работают с их моделями.

По словам OpenAI выпуск такой модели будет "в ближайшие месяцы™"

Дополнено: это будет модель размышления


Amazon расширяет доступ к своим моделям серии Nova и создали сайт, на котором можно использовать эти ИИ-модели [фото] (на данный момент только в США).

На сайте доступны модели Nova Micro, Lite и Pro, а также Canvas для генерации изображений и Reels для генерации видео.

Кроме того, Amazon предоставляет ограниченный доступ к SDK для новой модели Nova Act — агентной модели, предназначенной для выполнения действий в браузере [видео]. SDK позволяют детально настраивать работу агента вплоть до базовых вещей, таких как «поиск», «нажать», «посетить (сайт)» и т. д. В том числе Nova Act умеет использовать API.


Video is unavailable for watching
Show in Telegram
Большое обновление Runway - Gen 4.

Gen 4 создан с нуля специально для более качественного повествования и сохранения стиля на протяжении всего видео. Новая модель позволяет создавать намного более динамичные видео с более реалистичными движениями и физикой за счет отличного понимания мира.

Gen 4 поддерживает все современные "фишки" генераторов видео, например перенос стиля или объекта/локации.

На данный момент доступно только платным подписчикам. Больше видео-примеров в комментариях.


Независимый рейтинг подтвердил что нативная генерация у OpenAI(gpt-4o) является лучшей и делит первое место с Reve.


Forward from: Чёрный Треугольник
Video is unavailable for watching
Show in Telegram
☝🏻HR-менеджеров людей заменяют ИИ

Компания micro1 представила Zara — AI-агента по рекрутингу.

Zara — это инновационное решение для автоматизации подбора и оценки специалистов на глобальном уровне.

Уже внедренный в ведущие компании, этот агент упрощает процесс найма, поддерживает множество языков и проводит собеседования, оценивая как технические, так и межличностные навыки соискателей.🌍

Использование Zara позволяет корпорациям сократить затраты на рекрутинг на 80% благодаря увольнению HR-специалистов.💰
================
👁 News | 👁 Soft | 👁 Gear | 🌐 Links


Запущен V7 Rating Party — событие, когда Midjourney предоставляет сообществу выбор из двух изображений, одно из которых сгенерировано новой моделью. Эти изображения не отражают реальное качество новой модели и в большинстве своём «скучные», но это необходимо разработчикам для понимания дальнейшего вектора развития и улучшения модели.

Такое событие разработчики проводят за пару дней до выпуска модели, и вчера на сайте было замечено много кода, посвящённого V7.


Создание такого агента принесло больше проблем чем ожидалось. Perplexity нужно серьезно поработать над своей инфраструктурой чтобы такой агент смог работать "в масштабе".

Но такой агент, по словам Perplexity, сможет работать вплоть до 30 минут.


Нативная генерация теперь доступна и бесплатным пользователям (возможно еще в фазе развертки)


Выпуск Deep Research (OpenAI) ожидается "совсем скоро™"

20 last posts shown.