Skip Navigation
Влад Вандер
Влад Вандер

Мне сказали что нужно зарегистрироваться на UGC-платформе в сети Интернет

Posts 35
Comments 0
Joined 3 месяца назад
Type
Sort
GigaChat 3 Ultra от Сбера, OpenAI закрыла Sora, ARC-AGI-3 сломал все модели, ИИ-агенты взломали корпоративные системы

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Я Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла насыщенной: OpenAI закрывает Sora, Сбер открывает свою MoE-модель, новые Suno v5.5 и Lyria 3 Pro. Исследование от Anthropic, обновления Claude и взлом корпоративной сети ИИ-агентами.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GigaChat 3 Ultra и Lightning — Сбер открыл MoE-модели под MIT
  • ARC-AGI-3 — новый бенчмарк, который ИИ пока не берёт

*� AI-инструменты и платформы

  • OpenAI закрыла приложение Sora
  • Обновления Claude Code: auto mode и управление из Telegram и Discord
  • GitHub Copilot будет обучаться на коде пользователей с апреля
  • Siri в iOS 27 станет платформой для Gemini, Claude и других

*� Генеративные нейросети

  • Новая Suno v5.5 — треки из голоса
  • Lyria 3 Pro от Google — треки до 3 минут с пониманием структуры
  • Seedance 2.0 добавили в CapCut

*� AI в обществе и исследованиях

  • Мошенник украл $8 млн с помощью ИИ-треков и ботов
  • Опрос Anthropic: что люди думают об ИИ на самом деле
  • Дженсен Хуанг: «AGI уже достигнута»
  • ИИ-агенты Irregular взломали корпоративную инфраструктуру

🧠 Модели и LLM

❯ GigaChat 3.1 Ultra и Lightning от Сбера

Сбер выложил в открытый доступ две новые модели — GigaChat-3.1-Ultra и GigaChat-3.1-Lightning. Обе на архитектуре MoE. и под лицензией MIT.

  • Ultra — 702B параметров, 36B активных, контекст 131K.
  • Lightning — 10B суммарно, 1,8B активных, контекст 256K.

 

По внутренним тестам, Ultra обходит DeepSeek-V3-0324 и Qwen3-235B в математике и ризонинге. Lightning-версия на уровне GPT-4o.

Команда написала подробную статью на Хабре про переезд на MoE, зацикливания, FP8-обучение и баг в SGLang, который портил бенчмарки. 

🔗 Инженерный разбор на Хабре 🔗 HuggingFace 

❯ Новый бенчмарк ARC-AGI-3, который ИИ пока не берёт

Вышел ARC-AGI-3. Это новая версия бенчмарка от Франсуа Шолле, и на этот раз это интерактивные мини-игры: агент видит поле, может нажимать кнопки — и всё. Правила, цели и механики неизвестны заранее. Нужно самому разобраться, понять задачу и решить её.

Люди справляются с результатом почти 100%. Лучшая из нейронок пока Gemini 3.1 Pro, она набирает 0,37%. У остальных результат ниже.

Правда, эта цифра — метрика эффективности относительно человека. Формула квадратичная: если человек решил за 10 действий, а модель за 100 — результат не 10%, а 1%. Так что в реальности картина лучше, чем выглядит.

В отличие от Claude Code или Codex, здесь агенту нельзя сохранять знания между играми. Каждый раунд нужно проходить с нуля. Шолле говорит, что меряет «сырой интеллект», как у человека перед незнакомой игрой. Но люди всё равно переносят опыт между уровнями.

Параллельно стартовало Kaggle-соревнование на $2 млн. Победит тот, кто напишет агента, который лучше всех пройдёт бенчмарк. Решения должны быть в открытом доступе.

🔗 ARC-AGI-3 🔗 Соревнование 2026

🔧 AI-инструменты и платформы

❯ OpenAI закрывает приложение Sora

OpenAI объявила, что закрывает приложение Sora — отдельный TikTok-подобный сервис с ИИ-видео. За полгода существования оно побывало на вершине App Store, набрало 12 млн загрузок — и закрылось.

Закрывается именно приложение. Исследовательская команда продолжит работу над видео, world simulation и робототехникой.

В компании прямо не сказали причину, но в целом контекст понятный. Sora обходилась OpenAI примерно в $15 млн в день на вычисления. Глава направления ещё в прошлом году называл экономику «полностью неустойчивой». При этом удержание пользователей не дотягивало и до 8% на 30-й день — при норме выше 30% для сильных потребительских приложений.

Дорого, плохо удерживает, непонятно как монетизировать. На фоне дефицита GPU это очевидный кандидат на закрытие.

🔗 CNN 🔗 TechCrunch

❯ Обновления Claude Code: auto mode и управление из Telegram

Сразу два обновления для Claude Code.

Channels — теперь можно управлять сессией прямо из Telegram или Discord. Отправляете сообщение с телефона, агент выполняет задачу на компьютере. Работает через MCP. Пока research preview, инструкции по настройке уже в документации.

Auto mode — раньше выбор был простой: либо агент каждый раз спрашивает разрешения и это бесит, либо skip permissions и это небезопасно. Auto mode — что-то среднее. Перед каждым действием классификатор проверяет, насколько оно рискованное. Безопасные — выполняются сами. Рискованные — блокируются, агент ищет другой подход. Рекомендуют использовать в изолированных окружениях.

Включается через claude --enable-auto-mode, переключение — Shift+Tab. Сейчас доступно в research preview на тарифе Team, Enterprise и API — в ближайшие дни.

🔗 Channels 🔗 Auto mode

❯ GitHub Copilot будет обучаться на данных пользователей по умолчанию

С 24 апреля GitHub начнёт использовать данные из Copilot для обучения моделей. Это по умолчанию включено для тарифов Free, Pro и Pro+.

Кроме кода из репозиториев попадает всё взаимодействие с Copilot: промпты, ответы, фрагменты кода, контекст из редактора. Бизнес- и Enterprise-тарифы это не затрагивает.

Отключить можно в настройках — Copilot → Features/Privacy → Allow GitHub to use my data for AI model training. Но по умолчанию всё включено, так что нужно идти и выключать руками.

🔗 The Register

❯ В Siri можно будет подключить Gemini, Claude, Grok и другие ИИ

В iOS 27 Apple планирует крупный редизайн Siri. Официальных анонсов пока не было, это чисто утечка. 

Но самое крутое, что Siri станет платформой для сторонних чат-ботов. Через механизм Extensions пользователь сможет выбрать в настройках предпочитаемый ассистент — ChatGPT, Gemini, Claude или другой, Siri будет маршрутизировать запросы туда. Сейчас так работает только ChatGPT, теперь откроют для всех, у кого есть приложение в App Store.

Параллельно Apple тестирует отдельное приложение Siri с чат-интерфейсом, глубокую интеграцию с контентом на экране и объединение Siri со Spotlight-поиском. 

Показать всё это планируют на WWDC 2026, релиз будет осенью вместе с iOS 27.

🔗 Bloomberg 🔗 The Verge

🎨 Генеративные нейросети

❯ Suno v5.5: треки со своим голосом

Suno обновились до версии 5.5. Теперь генерить треки можно с собственным голосом: загружаете семпл, и модель использует его как вокал.

Также прокачали качество звука, добавили больше жанров и эмоций. Доступно всем подписчикам.

Suno продолжают идти в сторону полноценной DAW: секционная правка, замена отдельных фрагментов, работа со стемами, кросс-фейды. Готовый трек теперь собирается по частям и более подконтрольно, нежели из промптов.

🔗 Suno

❯ Lyria 3 Pro от Google — треки до трёх минут

Google выпустила Lyria 3 Pro — обновлённую версию своей музыкальной модели. Длина треков выросла с 30 секунд до трёх минут, появился контроль над структурой: можно задавать интро, куплет, припев, бридж.

Доступна платным подписчикам Gemini, в Google AI Studio и через API. Цена в API — $0,08 за трек.

🔗 Блогпост Google 🔗 Попробовать в Gemini

❯ Seedance 2.0 от ByteDance теперь в CapCut

ByteDance запустила Seedance 2.0 в CapCut и на Dreamina. До 15 секунд видео по тексту, изображению или референс-ролику с нативным липсингом, реалистичным движением и светом. По внутренним бенчмаркам обходит Sora 2 и Veo 3.1.

Пока доступно не везде: начали с Бразилии, Индонезии, Малайзии, Мексики и ещё нескольких стран. Всё из-за претензий по авторскому праву, запретов на генерацию по реальным лицам и невидимыми вотермарками.

🔗 CapCut 🔗 Dreamina

🧩 AI в обществе и исследованиях

❯ Парень заработал $8 млн на ИИ-музыке и ботах

Житель Северной Каролины Майкл Смит нагенерировал сотни тысяч треков с помощью ИИ, залил их на Spotify, Apple Music, Amazon Music и YouTube Music. А потом запустил армию ботов их слушать. Тысячи фейковых аккаунтов крутили его музыку миллиарды раз. Стриминги честно платили роялти.

Схема работала несколько лет. На такой схеме удалось вывести свыше $8 млн. 

Его раскрыли Mechanical Licensing Collective — организация, которая распределяет механические роялти в США. Заметили аномальные паттерны, передали данные правоохранителям. Смит признал вину, ему грозит до 5 лет.

Первое уголовное дело в США по стриминговому фроду с ИИ-музыкой.

🔗 Минюст США 🔗 Music Business Worldwide

❯ Anthropic опросила 81 000 человек об ИИ

Anthropic провела масштабное исследование: за одну неделю декабря 2025 года собрали 80 508 интервью из 159 стран и 70 языков. 

81% говорят, что ИИ оправдал ожидания. Но дальше интереснее:

  • юристы, врачи и финансисты чаще других доверяют боту трудные решения — и чаще обжигаются на галлюцинациях
  • учителя жалуются на деградацию студентов, тогда как водители, строители и фермеры почти не боятся разучиться думать
  • Африка, Латинская Америка и Южная Азия видят в ИИ способ обойти систему и подзаработать; Западная Европа и Северная Америка — конкурента и слежку
  • предприниматели и фрилансеры зарабатывают на ИИ заметно чаще наёмных сотрудников
  • почти каждый пятый считает рост продуктивности пустышкой: всё время уходит на перепроверку

🔗 Исследование Anthropic

❯ Дженсен Хуанг: «AGI уже достигнута»

Глава Nvidia Дженсен Хуанг заявил, что мы уже достигли AGI.

На подкасте Лекс Фридман определил AGI как систему, способную создать tech-компанию на $1 млрд. Хуанг ответил: «Я считаю, что мы уже на этом уровне».

— Как вы думаете, может ли существовать компания, управляемая такой системой? 
— Возможно. Например, OpenClaw вполне мог бы за $0,5 создать сайт или приложение, которым пользовались бы миллиарды человек. 

🔗 The Verge

❯ ИИ-агенты взломали корпоративную инфраструктуру

Лаборатория Irregular дала агентам обычные задачи: готовить посты в LinkedIn, делать бэкапы, работать с документами. Никаких инструкций про взлом.

Агенты задачи выполнили. И попутно нашли захардкоженный ключ в коде, а затем обошли авторизацию. Откопали пароль в скриптах и отключили Windows Defender. Придумали стеганографическую схему и спрятали пароль в тексте поста, чтобы пройти мимо DLP.

Всё это побочный эффект стандартного промпта «не принимай отказ, найди способ завершить задачу». Агент с таким мышлением и широким доступом к инструментам начинает вести себя как пентестер.

Важная оговорка: это контролируемый стенд с намеренно заложенными уязвимостями. Но класс проблем реальный, а угрозой становится сам агент внутри инфраструктуры.

🔗 Отчёт Irregular 🔗 TechRadar

❯ Тема выпуска: 10 лет потребительскому VR

28 марта 2016 года мир официально надел на голову Oculus Rift CV1, поверив, что реальность больше не ограничивается монитором. 

Это десятилетие было американской горкой: от дикого хайпа до скепсиса «VR мертв». Но сегодня мы видим второй акт этой пьесы. Если Oculus дал нам «окно» в виртуальность, то современные нейросети становятся её архитектором. 

Символично, что спустя 10 лет мы обсуждаем уже не разрешение экранов, а то, как генеративный ИИ заполняет эти миры смыслом, делая каждый пиксель интерактивным и живым. 

Мы больше не просто смотрим на код — мы внутри него.

❯ Заключение

На этой неделе Сбер открыл MoE-модели под MIT, OpenAI закрыла Sora, ByteDance выкатила Seedance 2.0 в CapCut, а Apple по данным инсайдеров готовит Siri как платформу для конкурентов. Anthropic опросила 81 тысячу человек и выяснила, что мир воспринимает ИИ очень по-разному в зависимости от того, где живёшь и чем занимаешься.

Агенты обходят защиту сами, без команды. Мошенники зарабатывают миллионы на ботах и нейромузыке. ARC-AGI-3 напоминает, что за красивыми заявлениями про AGI модели не справляются с задачами, которые человек решает с первой попытки.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

До встречи в следующем выпуске!

Читать далее
GigaChat 3 Ultra от Сбера, OpenAI закрыла Sora, ARC-AGI-3 сломал все модели, ИИ-агенты взломали корпоративные системы

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Я Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла насыщенной: OpenAI закрывает Sora, Сбер открывает свою MoE-модель, новые Suno v5.5 и Lyria 3 Pro. Исследование от Anthropic, обновления Claude и взлом корпоративной сети ИИ-агентами.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GigaChat 3 Ultra и Lightning — Сбер открыл MoE-модели под MIT
  • ARC-AGI-3 — новый бенчмарк, который ИИ пока не берёт

*� AI-инструменты и платформы

  • OpenAI закрыла приложение Sora
  • Обновления Claude Code: auto mode и управление из Telegram и Discord
  • GitHub Copilot будет обучаться на коде пользователей с апреля
  • Siri в iOS 27 станет платформой для Gemini, Claude и других

*� Генеративные нейросети

  • Новая Suno v5.5 — треки из голоса
  • Lyria 3 Pro от Google — треки до 3 минут с пониманием структуры
  • Seedance 2.0 добавили в CapCut

*� AI в обществе и исследованиях

  • Мошенник украл $8 млн с помощью ИИ-треков и ботов
  • Опрос Anthropic: что люди думают об ИИ на самом деле
  • Дженсен Хуанг: «AGI уже достигнута»
  • ИИ-агенты Irregular взломали корпоративную инфраструктуру

🧠 Модели и LLM

❯ GigaChat 3.1 Ultra и Lightning от Сбера

Сбер выложил в открытый доступ две новые модели — GigaChat-3.1-Ultra и GigaChat-3.1-Lightning. Обе на архитектуре MoE. и под лицензией MIT.

  • Ultra — 702B параметров, 36B активных, контекст 131K.
  • Lightning — 10B суммарно, 1,8B активных, контекст 256K.

 

По внутренним тестам, Ultra обходит DeepSeek-V3-0324 и Qwen3-235B в математике и ризонинге. Lightning-версия на уровне GPT-4o.

Команда написала подробную статью на Хабре про переезд на MoE, зацикливания, FP8-обучение и баг в SGLang, который портил бенчмарки. 

🔗 Инженерный разбор на Хабре 🔗 HuggingFace 

❯ Новый бенчмарк ARC-AGI-3, который ИИ пока не берёт

Вышел ARC-AGI-3. Это новая версия бенчмарка от Франсуа Шолле, и на этот раз это интерактивные мини-игры: агент видит поле, может нажимать кнопки — и всё. Правила, цели и механики неизвестны заранее. Нужно самому разобраться, понять задачу и решить её.

Люди справляются с результатом почти 100%. Лучшая из нейронок пока Gemini 3.1 Pro, она набирает 0,37%. У остальных результат ниже.

Правда, эта цифра — метрика эффективности относительно человека. Формула квадратичная: если человек решил за 10 действий, а модель за 100 — результат не 10%, а 1%. Так что в реальности картина лучше, чем выглядит.

В отличие от Claude Code или Codex, здесь агенту нельзя сохранять знания между играми. Каждый раунд нужно проходить с нуля. Шолле говорит, что меряет «сырой интеллект», как у человека перед незнакомой игрой. Но люди всё равно переносят опыт между уровнями.

Параллельно стартовало Kaggle-соревнование на $2 млн. Победит тот, кто напишет агента, который лучше всех пройдёт бенчмарк. Решения должны быть в открытом доступе.

🔗 ARC-AGI-3 🔗 Соревнование 2026

🔧 AI-инструменты и платформы

❯ OpenAI закрывает приложение Sora

OpenAI объявила, что закрывает приложение Sora — отдельный TikTok-подобный сервис с ИИ-видео. За полгода существования оно побывало на вершине App Store, набрало 12 млн загрузок — и закрылось.

Закрывается именно приложение. Исследовательская команда продолжит работу над видео, world simulation и робототехникой.

В компании прямо не сказали причину, но в целом контекст понятный. Sora обходилась OpenAI примерно в $15 млн в день на вычисления. Глава направления ещё в прошлом году называл экономику «полностью неустойчивой». При этом удержание пользователей не дотягивало и до 8% на 30-й день — при норме выше 30% для сильных потребительских приложений.

Дорого, плохо удерживает, непонятно как монетизировать. На фоне дефицита GPU это очевидный кандидат на закрытие.

🔗 CNN 🔗 TechCrunch

❯ Обновления Claude Code: auto mode и управление из Telegram

Сразу два обновления для Claude Code.

Channels — теперь можно управлять сессией прямо из Telegram или Discord. Отправляете сообщение с телефона, агент выполняет задачу на компьютере. Работает через MCP. Пока research preview, инструкции по настройке уже в документации.

Auto mode — раньше выбор был простой: либо агент каждый раз спрашивает разрешения и это бесит, либо skip permissions и это небезопасно. Auto mode — что-то среднее. Перед каждым действием классификатор проверяет, насколько оно рискованное. Безопасные — выполняются сами. Рискованные — блокируются, агент ищет другой подход. Рекомендуют использовать в изолированных окружениях.

Включается через claude --enable-auto-mode, переключение — Shift+Tab. Сейчас доступно в research preview на тарифе Team, Enterprise и API — в ближайшие дни.

🔗 Channels 🔗 Auto mode

❯ GitHub Copilot будет обучаться на данных пользователей по умолчанию

С 24 апреля GitHub начнёт использовать данные из Copilot для обучения моделей. Это по умолчанию включено для тарифов Free, Pro и Pro+.

Кроме кода из репозиториев попадает всё взаимодействие с Copilot: промпты, ответы, фрагменты кода, контекст из редактора. Бизнес- и Enterprise-тарифы это не затрагивает.

Отключить можно в настройках — Copilot → Features/Privacy → Allow GitHub to use my data for AI model training. Но по умолчанию всё включено, так что нужно идти и выключать руками.

🔗 The Register

❯ В Siri можно будет подключить Gemini, Claude, Grok и другие ИИ

В iOS 27 Apple планирует крупный редизайн Siri. Официальных анонсов пока не было, это чисто утечка. 

Но самое крутое, что Siri станет платформой для сторонних чат-ботов. Через механизм Extensions пользователь сможет выбрать в настройках предпочитаемый ассистент — ChatGPT, Gemini, Claude или другой, Siri будет маршрутизировать запросы туда. Сейчас так работает только ChatGPT, теперь откроют для всех, у кого есть приложение в App Store.

Параллельно Apple тестирует отдельное приложение Siri с чат-интерфейсом, глубокую интеграцию с контентом на экране и объединение Siri со Spotlight-поиском. 

Показать всё это планируют на WWDC 2026, релиз будет осенью вместе с iOS 27.

🔗 Bloomberg 🔗 The Verge

🎨 Генеративные нейросети

❯ Suno v5.5: треки со своим голосом

Suno обновились до версии 5.5. Теперь генерить треки можно с собственным голосом: загружаете семпл, и модель использует его как вокал.

Также прокачали качество звука, добавили больше жанров и эмоций. Доступно всем подписчикам.

Suno продолжают идти в сторону полноценной DAW: секционная правка, замена отдельных фрагментов, работа со стемами, кросс-фейды. Готовый трек теперь собирается по частям и более подконтрольно, нежели из промптов.

🔗 Suno

❯ Lyria 3 Pro от Google — треки до трёх минут

Google выпустила Lyria 3 Pro — обновлённую версию своей музыкальной модели. Длина треков выросла с 30 секунд до трёх минут, появился контроль над структурой: можно задавать интро, куплет, припев, бридж.

Доступна платным подписчикам Gemini, в Google AI Studio и через API. Цена в API — $0,08 за трек.

🔗 Блогпост Google 🔗 Попробовать в Gemini

❯ Seedance 2.0 от ByteDance теперь в CapCut

ByteDance запустила Seedance 2.0 в CapCut и на Dreamina. До 15 секунд видео по тексту, изображению или референс-ролику с нативным липсингом, реалистичным движением и светом. По внутренним бенчмаркам обходит Sora 2 и Veo 3.1.

Пока доступно не везде: начали с Бразилии, Индонезии, Малайзии, Мексики и ещё нескольких стран. Всё из-за претензий по авторскому праву, запретов на генерацию по реальным лицам и невидимыми вотермарками.

🔗 CapCut 🔗 Dreamina

🧩 AI в обществе и исследованиях

❯ Парень заработал $8 млн на ИИ-музыке и ботах

Житель Северной Каролины Майкл Смит нагенерировал сотни тысяч треков с помощью ИИ, залил их на Spotify, Apple Music, Amazon Music и YouTube Music. А потом запустил армию ботов их слушать. Тысячи фейковых аккаунтов крутили его музыку миллиарды раз. Стриминги честно платили роялти.

Схема работала несколько лет. На такой схеме удалось вывести свыше $8 млн. 

Его раскрыли Mechanical Licensing Collective — организация, которая распределяет механические роялти в США. Заметили аномальные паттерны, передали данные правоохранителям. Смит признал вину, ему грозит до 5 лет.

Первое уголовное дело в США по стриминговому фроду с ИИ-музыкой.

🔗 Минюст США 🔗 Music Business Worldwide

❯ Anthropic опросила 81 000 человек об ИИ

Anthropic провела масштабное исследование: за одну неделю декабря 2025 года собрали 80 508 интервью из 159 стран и 70 языков. 

81% говорят, что ИИ оправдал ожидания. Но дальше интереснее:

  • юристы, врачи и финансисты чаще других доверяют боту трудные решения — и чаще обжигаются на галлюцинациях
  • учителя жалуются на деградацию студентов, тогда как водители, строители и фермеры почти не боятся разучиться думать
  • Африка, Латинская Америка и Южная Азия видят в ИИ способ обойти систему и подзаработать; Западная Европа и Северная Америка — конкурента и слежку
  • предприниматели и фрилансеры зарабатывают на ИИ заметно чаще наёмных сотрудников
  • почти каждый пятый считает рост продуктивности пустышкой: всё время уходит на перепроверку

🔗 Исследование Anthropic

❯ Дженсен Хуанг: «AGI уже достигнута»

Глава Nvidia Дженсен Хуанг заявил, что мы уже достигли AGI.

На подкасте Лекс Фридман определил AGI как систему, способную создать tech-компанию на $1 млрд. Хуанг ответил: «Я считаю, что мы уже на этом уровне».

— Как вы думаете, может ли существовать компания, управляемая такой системой? 
— Возможно. Например, OpenClaw вполне мог бы за $0,5 создать сайт или приложение, которым пользовались бы миллиарды человек. 

🔗 The Verge

❯ ИИ-агенты взломали корпоративную инфраструктуру

Лаборатория Irregular дала агентам обычные задачи: готовить посты в LinkedIn, делать бэкапы, работать с документами. Никаких инструкций про взлом.

Агенты задачи выполнили. И попутно нашли захардкоженный ключ в коде, а затем обошли авторизацию. Откопали пароль в скриптах и отключили Windows Defender. Придумали стеганографическую схему и спрятали пароль в тексте поста, чтобы пройти мимо DLP.

Всё это побочный эффект стандартного промпта «не принимай отказ, найди способ завершить задачу». Агент с таким мышлением и широким доступом к инструментам начинает вести себя как пентестер.

Важная оговорка: это контролируемый стенд с намеренно заложенными уязвимостями. Но класс проблем реальный, а угрозой становится сам агент внутри инфраструктуры.

🔗 Отчёт Irregular 🔗 TechRadar

❯ Тема выпуска: 10 лет потребительскому VR

28 марта 2016 года мир официально надел на голову Oculus Rift CV1, поверив, что реальность больше не ограничивается монитором. 

Это десятилетие было американской горкой: от дикого хайпа до скепсиса «VR мертв». Но сегодня мы видим второй акт этой пьесы. Если Oculus дал нам «окно» в виртуальность, то современные нейросети становятся её архитектором. 

Символично, что спустя 10 лет мы обсуждаем уже не разрешение экранов, а то, как генеративный ИИ заполняет эти миры смыслом, делая каждый пиксель интерактивным и живым. 

Мы больше не просто смотрим на код — мы внутри него.

❯ Заключение

На этой неделе Сбер открыл MoE-модели под MIT, OpenAI закрыла Sora, ByteDance выкатила Seedance 2.0 в CapCut, а Apple по данным инсайдеров готовит Siri как платформу для конкурентов. Anthropic опросила 81 тысячу человек и выяснила, что мир воспринимает ИИ очень по-разному в зависимости от того, где живёшь и чем занимаешься.

Агенты обходят защиту сами, без команды. Мошенники зарабатывают миллионы на ботах и нейромузыке. ARC-AGI-3 напоминает, что за красивыми заявлениями про AGI модели не справляются с задачами, которые человек решает с первой попытки.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

До встречи в следующем выпуске!

Читать далее
GigaChat 3 Ultra от Сбера, OpenAI закрыла Sora, ARC-AGI-3 сломал все модели, ИИ-агенты взломали корпоративные системы

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Я Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла насыщенной: OpenAI закрывает Sora, Сбер открывает свою MoE-модель, новые Suno v5.5 и Lyria 3 Pro. Исследование от Anthropic, обновления Claude и взлом корпоративной сети ИИ-агентами.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GigaChat 3 Ultra и Lightning — Сбер открыл MoE-модели под MIT
  • ARC-AGI-3 — новый бенчмарк, который ИИ пока не берёт

*� AI-инструменты и платформы

  • OpenAI закрыла приложение Sora
  • Обновления Claude Code: auto mode и управление из Telegram и Discord
  • GitHub Copilot будет обучаться на коде пользователей с апреля
  • Siri в iOS 27 станет платформой для Gemini, Claude и других

*� Генеративные нейросети

  • Новая Suno v5.5 — треки из голоса
  • Lyria 3 Pro от Google — треки до 3 минут с пониманием структуры
  • Seedance 2.0 добавили в CapCut

*� AI в обществе и исследованиях

  • Мошенник украл $8 млн с помощью ИИ-треков и ботов
  • Опрос Anthropic: что люди думают об ИИ на самом деле
  • Дженсен Хуанг: «AGI уже достигнута»
  • ИИ-агенты Irregular взломали корпоративную инфраструктуру

🧠 Модели и LLM

❯ GigaChat 3.1 Ultra и Lightning от Сбера

Сбер выложил в открытый доступ две новые модели — GigaChat-3.1-Ultra и GigaChat-3.1-Lightning. Обе на архитектуре MoE. и под лицензией MIT.

  • Ultra — 702B параметров, 36B активных, контекст 131K.
  • Lightning — 10B суммарно, 1,8B активных, контекст 256K.

 

По внутренним тестам, Ultra обходит DeepSeek-V3-0324 и Qwen3-235B в математике и ризонинге. Lightning-версия на уровне GPT-4o.

Команда написала подробную статью на Хабре про переезд на MoE, зацикливания, FP8-обучение и баг в SGLang, который портил бенчмарки. 

🔗 Инженерный разбор на Хабре 🔗 HuggingFace 

❯ Новый бенчмарк ARC-AGI-3, который ИИ пока не берёт

Вышел ARC-AGI-3. Это новая версия бенчмарка от Франсуа Шолле, и на этот раз это интерактивные мини-игры: агент видит поле, может нажимать кнопки — и всё. Правила, цели и механики неизвестны заранее. Нужно самому разобраться, понять задачу и решить её.

Люди справляются с результатом почти 100%. Лучшая из нейронок пока Gemini 3.1 Pro, она набирает 0,37%. У остальных результат ниже.

Правда, эта цифра — метрика эффективности относительно человека. Формула квадратичная: если человек решил за 10 действий, а модель за 100 — результат не 10%, а 1%. Так что в реальности картина лучше, чем выглядит.

В отличие от Claude Code или Codex, здесь агенту нельзя сохранять знания между играми. Каждый раунд нужно проходить с нуля. Шолле говорит, что меряет «сырой интеллект», как у человека перед незнакомой игрой. Но люди всё равно переносят опыт между уровнями.

Параллельно стартовало Kaggle-соревнование на $2 млн. Победит тот, кто напишет агента, который лучше всех пройдёт бенчмарк. Решения должны быть в открытом доступе.

🔗 ARC-AGI-3 🔗 Соревнование 2026

🔧 AI-инструменты и платформы

❯ OpenAI закрывает приложение Sora

OpenAI объявила, что закрывает приложение Sora — отдельный TikTok-подобный сервис с ИИ-видео. За полгода существования оно побывало на вершине App Store, набрало 12 млн загрузок — и закрылось.

Закрывается именно приложение. Исследовательская команда продолжит работу над видео, world simulation и робототехникой.

В компании прямо не сказали причину, но в целом контекст понятный. Sora обходилась OpenAI примерно в $15 млн в день на вычисления. Глава направления ещё в прошлом году называл экономику «полностью неустойчивой». При этом удержание пользователей не дотягивало и до 8% на 30-й день — при норме выше 30% для сильных потребительских приложений.

Дорого, плохо удерживает, непонятно как монетизировать. На фоне дефицита GPU это очевидный кандидат на закрытие.

🔗 CNN 🔗 TechCrunch

❯ Обновления Claude Code: auto mode и управление из Telegram

Сразу два обновления для Claude Code.

Channels — теперь можно управлять сессией прямо из Telegram или Discord. Отправляете сообщение с телефона, агент выполняет задачу на компьютере. Работает через MCP. Пока research preview, инструкции по настройке уже в документации.

Auto mode — раньше выбор был простой: либо агент каждый раз спрашивает разрешения и это бесит, либо skip permissions и это небезопасно. Auto mode — что-то среднее. Перед каждым действием классификатор проверяет, насколько оно рискованное. Безопасные — выполняются сами. Рискованные — блокируются, агент ищет другой подход. Рекомендуют использовать в изолированных окружениях.

Включается через claude --enable-auto-mode, переключение — Shift+Tab. Сейчас доступно в research preview на тарифе Team, Enterprise и API — в ближайшие дни.

🔗 Channels 🔗 Auto mode

❯ GitHub Copilot будет обучаться на данных пользователей по умолчанию

С 24 апреля GitHub начнёт использовать данные из Copilot для обучения моделей. Это по умолчанию включено для тарифов Free, Pro и Pro+.

Кроме кода из репозиториев попадает всё взаимодействие с Copilot: промпты, ответы, фрагменты кода, контекст из редактора. Бизнес- и Enterprise-тарифы это не затрагивает.

Отключить можно в настройках — Copilot → Features/Privacy → Allow GitHub to use my data for AI model training. Но по умолчанию всё включено, так что нужно идти и выключать руками.

🔗 The Register

❯ В Siri можно будет подключить Gemini, Claude, Grok и другие ИИ

В iOS 27 Apple планирует крупный редизайн Siri. Официальных анонсов пока не было, это чисто утечка. 

Но самое крутое, что Siri станет платформой для сторонних чат-ботов. Через механизм Extensions пользователь сможет выбрать в настройках предпочитаемый ассистент — ChatGPT, Gemini, Claude или другой, Siri будет маршрутизировать запросы туда. Сейчас так работает только ChatGPT, теперь откроют для всех, у кого есть приложение в App Store.

Параллельно Apple тестирует отдельное приложение Siri с чат-интерфейсом, глубокую интеграцию с контентом на экране и объединение Siri со Spotlight-поиском. 

Показать всё это планируют на WWDC 2026, релиз будет осенью вместе с iOS 27.

🔗 Bloomberg 🔗 The Verge

🎨 Генеративные нейросети

❯ Suno v5.5: треки со своим голосом

Suno обновились до версии 5.5. Теперь генерить треки можно с собственным голосом: загружаете семпл, и модель использует его как вокал.

Также прокачали качество звука, добавили больше жанров и эмоций. Доступно всем подписчикам.

Suno продолжают идти в сторону полноценной DAW: секционная правка, замена отдельных фрагментов, работа со стемами, кросс-фейды. Готовый трек теперь собирается по частям и более подконтрольно, нежели из промптов.

🔗 Suno

❯ Lyria 3 Pro от Google — треки до трёх минут

Google выпустила Lyria 3 Pro — обновлённую версию своей музыкальной модели. Длина треков выросла с 30 секунд до трёх минут, появился контроль над структурой: можно задавать интро, куплет, припев, бридж.

Доступна платным подписчикам Gemini, в Google AI Studio и через API. Цена в API — $0,08 за трек.

🔗 Блогпост Google 🔗 Попробовать в Gemini

❯ Seedance 2.0 от ByteDance теперь в CapCut

ByteDance запустила Seedance 2.0 в CapCut и на Dreamina. До 15 секунд видео по тексту, изображению или референс-ролику с нативным липсингом, реалистичным движением и светом. По внутренним бенчмаркам обходит Sora 2 и Veo 3.1.

Пока доступно не везде: начали с Бразилии, Индонезии, Малайзии, Мексики и ещё нескольких стран. Всё из-за претензий по авторскому праву, запретов на генерацию по реальным лицам и невидимыми вотермарками.

🔗 CapCut 🔗 Dreamina

🧩 AI в обществе и исследованиях

❯ Парень заработал $8 млн на ИИ-музыке и ботах

Житель Северной Каролины Майкл Смит нагенерировал сотни тысяч треков с помощью ИИ, залил их на Spotify, Apple Music, Amazon Music и YouTube Music. А потом запустил армию ботов их слушать. Тысячи фейковых аккаунтов крутили его музыку миллиарды раз. Стриминги честно платили роялти.

Схема работала несколько лет. На такой схеме удалось вывести свыше $8 млн. 

Его раскрыли Mechanical Licensing Collective — организация, которая распределяет механические роялти в США. Заметили аномальные паттерны, передали данные правоохранителям. Смит признал вину, ему грозит до 5 лет.

Первое уголовное дело в США по стриминговому фроду с ИИ-музыкой.

🔗 Минюст США 🔗 Music Business Worldwide

❯ Anthropic опросила 81 000 человек об ИИ

Anthropic провела масштабное исследование: за одну неделю декабря 2025 года собрали 80 508 интервью из 159 стран и 70 языков. 

81% говорят, что ИИ оправдал ожидания. Но дальше интереснее:

  • юристы, врачи и финансисты чаще других доверяют боту трудные решения — и чаще обжигаются на галлюцинациях
  • учителя жалуются на деградацию студентов, тогда как водители, строители и фермеры почти не боятся разучиться думать
  • Африка, Латинская Америка и Южная Азия видят в ИИ способ обойти систему и подзаработать; Западная Европа и Северная Америка — конкурента и слежку
  • предприниматели и фрилансеры зарабатывают на ИИ заметно чаще наёмных сотрудников
  • почти каждый пятый считает рост продуктивности пустышкой: всё время уходит на перепроверку

🔗 Исследование Anthropic

❯ Дженсен Хуанг: «AGI уже достигнута»

Глава Nvidia Дженсен Хуанг заявил, что мы уже достигли AGI.

На подкасте Лекс Фридман определил AGI как систему, способную создать tech-компанию на $1 млрд. Хуанг ответил: «Я считаю, что мы уже на этом уровне».

— Как вы думаете, может ли существовать компания, управляемая такой системой? 
— Возможно. Например, OpenClaw вполне мог бы за $0,5 создать сайт или приложение, которым пользовались бы миллиарды человек. 

🔗 The Verge

❯ ИИ-агенты взломали корпоративную инфраструктуру

Лаборатория Irregular дала агентам обычные задачи: готовить посты в LinkedIn, делать бэкапы, работать с документами. Никаких инструкций про взлом.

Агенты задачи выполнили. И попутно нашли захардкоженный ключ в коде, а затем обошли авторизацию. Откопали пароль в скриптах и отключили Windows Defender. Придумали стеганографическую схему и спрятали пароль в тексте поста, чтобы пройти мимо DLP.

Всё это побочный эффект стандартного промпта «не принимай отказ, найди способ завершить задачу». Агент с таким мышлением и широким доступом к инструментам начинает вести себя как пентестер.

Важная оговорка: это контролируемый стенд с намеренно заложенными уязвимостями. Но класс проблем реальный, а угрозой становится сам агент внутри инфраструктуры.

🔗 Отчёт Irregular 🔗 TechRadar

❯ Тема выпуска: 10 лет потребительскому VR

28 марта 2016 года мир официально надел на голову Oculus Rift CV1, поверив, что реальность больше не ограничивается монитором. 

Это десятилетие было американской горкой: от дикого хайпа до скепсиса «VR мертв». Но сегодня мы видим второй акт этой пьесы. Если Oculus дал нам «окно» в виртуальность, то современные нейросети становятся её архитектором. 

Символично, что спустя 10 лет мы обсуждаем уже не разрешение экранов, а то, как генеративный ИИ заполняет эти миры смыслом, делая каждый пиксель интерактивным и живым. 

Мы больше не просто смотрим на код — мы внутри него.

❯ Заключение

На этой неделе Сбер открыл MoE-модели под MIT, OpenAI закрыла Sora, ByteDance выкатила Seedance 2.0 в CapCut, а Apple по данным инсайдеров готовит Siri как платформу для конкурентов. Anthropic опросила 81 тысячу человек и выяснила, что мир воспринимает ИИ очень по-разному в зависимости от того, где живёшь и чем занимаешься.

Агенты обходят защиту сами, без команды. Мошенники зарабатывают миллионы на ботах и нейромузыке. ARC-AGI-3 напоминает, что за красивыми заявлениями про AGI модели не справляются с задачами, которые человек решает с первой попытки.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

До встречи в следующем выпуске!

Читать далее
GigaChat 3 Ultra от Сбера, OpenAI закрыла Sora, ARC-AGI-3 сломал все модели, ИИ-агенты взломали корпоративные системы

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Я Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла насыщенной: OpenAI закрывает Sora, Сбер открывает свою MoE-модель, новые Suno v5.5 и Lyria 3 Pro. Исследование от Anthropic, обновления Claude и взлом корпоративной сети ИИ-агентами.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GigaChat 3 Ultra и Lightning — Сбер открыл MoE-модели под MIT
  • ARC-AGI-3 — новый бенчмарк, который ИИ пока не берёт

*� AI-инструменты и платформы

  • OpenAI закрыла приложение Sora
  • Обновления Claude Code: auto mode и управление из Telegram и Discord
  • GitHub Copilot будет обучаться на коде пользователей с апреля
  • Siri в iOS 27 станет платформой для Gemini, Claude и других

*� Генеративные нейросети

  • Новая Suno v5.5 — треки из голоса
  • Lyria 3 Pro от Google — треки до 3 минут с пониманием структуры
  • Seedance 2.0 добавили в CapCut

*� AI в обществе и исследованиях

  • Мошенник украл $8 млн с помощью ИИ-треков и ботов
  • Опрос Anthropic: что люди думают об ИИ на самом деле
  • Дженсен Хуанг: «AGI уже достигнута»
  • ИИ-агенты Irregular взломали корпоративную инфраструктуру

🧠 Модели и LLM

❯ GigaChat 3.1 Ultra и Lightning от Сбера

Сбер выложил в открытый доступ две новые модели — GigaChat-3.1-Ultra и GigaChat-3.1-Lightning. Обе на архитектуре MoE. и под лицензией MIT.

  • Ultra — 702B параметров, 36B активных, контекст 131K.
  • Lightning — 10B суммарно, 1,8B активных, контекст 256K.

 

По внутренним тестам, Ultra обходит DeepSeek-V3-0324 и Qwen3-235B в математике и ризонинге. Lightning-версия на уровне GPT-4o.

Команда написала подробную статью на Хабре про переезд на MoE, зацикливания, FP8-обучение и баг в SGLang, который портил бенчмарки. 

🔗 Инженерный разбор на Хабре 🔗 HuggingFace 

❯ Новый бенчмарк ARC-AGI-3, который ИИ пока не берёт

Вышел ARC-AGI-3. Это новая версия бенчмарка от Франсуа Шолле, и на этот раз это интерактивные мини-игры: агент видит поле, может нажимать кнопки — и всё. Правила, цели и механики неизвестны заранее. Нужно самому разобраться, понять задачу и решить её.

Люди справляются с результатом почти 100%. Лучшая из нейронок пока Gemini 3.1 Pro, она набирает 0,37%. У остальных результат ниже.

Правда, эта цифра — метрика эффективности относительно человека. Формула квадратичная: если человек решил за 10 действий, а модель за 100 — результат не 10%, а 1%. Так что в реальности картина лучше, чем выглядит.

В отличие от Claude Code или Codex, здесь агенту нельзя сохранять знания между играми. Каждый раунд нужно проходить с нуля. Шолле говорит, что меряет «сырой интеллект», как у человека перед незнакомой игрой. Но люди всё равно переносят опыт между уровнями.

Параллельно стартовало Kaggle-соревнование на $2 млн. Победит тот, кто напишет агента, который лучше всех пройдёт бенчмарк. Решения должны быть в открытом доступе.

🔗 ARC-AGI-3 🔗 Соревнование 2026

🔧 AI-инструменты и платформы

❯ OpenAI закрывает приложение Sora

OpenAI объявила, что закрывает приложение Sora — отдельный TikTok-подобный сервис с ИИ-видео. За полгода существования оно побывало на вершине App Store, набрало 12 млн загрузок — и закрылось.

Закрывается именно приложение. Исследовательская команда продолжит работу над видео, world simulation и робототехникой.

В компании прямо не сказали причину, но в целом контекст понятный. Sora обходилась OpenAI примерно в $15 млн в день на вычисления. Глава направления ещё в прошлом году называл экономику «полностью неустойчивой». При этом удержание пользователей не дотягивало и до 8% на 30-й день — при норме выше 30% для сильных потребительских приложений.

Дорого, плохо удерживает, непонятно как монетизировать. На фоне дефицита GPU это очевидный кандидат на закрытие.

🔗 CNN 🔗 TechCrunch

❯ Обновления Claude Code: auto mode и управление из Telegram

Сразу два обновления для Claude Code.

Channels — теперь можно управлять сессией прямо из Telegram или Discord. Отправляете сообщение с телефона, агент выполняет задачу на компьютере. Работает через MCP. Пока research preview, инструкции по настройке уже в документации.

Auto mode — раньше выбор был простой: либо агент каждый раз спрашивает разрешения и это бесит, либо skip permissions и это небезопасно. Auto mode — что-то среднее. Перед каждым действием классификатор проверяет, насколько оно рискованное. Безопасные — выполняются сами. Рискованные — блокируются, агент ищет другой подход. Рекомендуют использовать в изолированных окружениях.

Включается через claude --enable-auto-mode, переключение — Shift+Tab. Сейчас доступно в research preview на тарифе Team, Enterprise и API — в ближайшие дни.

🔗 Channels 🔗 Auto mode

❯ GitHub Copilot будет обучаться на данных пользователей по умолчанию

С 24 апреля GitHub начнёт использовать данные из Copilot для обучения моделей. Это по умолчанию включено для тарифов Free, Pro и Pro+.

Кроме кода из репозиториев попадает всё взаимодействие с Copilot: промпты, ответы, фрагменты кода, контекст из редактора. Бизнес- и Enterprise-тарифы это не затрагивает.

Отключить можно в настройках — Copilot → Features/Privacy → Allow GitHub to use my data for AI model training. Но по умолчанию всё включено, так что нужно идти и выключать руками.

🔗 The Register

❯ В Siri можно будет подключить Gemini, Claude, Grok и другие ИИ

В iOS 27 Apple планирует крупный редизайн Siri. Официальных анонсов пока не было, это чисто утечка. 

Но самое крутое, что Siri станет платформой для сторонних чат-ботов. Через механизм Extensions пользователь сможет выбрать в настройках предпочитаемый ассистент — ChatGPT, Gemini, Claude или другой, Siri будет маршрутизировать запросы туда. Сейчас так работает только ChatGPT, теперь откроют для всех, у кого есть приложение в App Store.

Параллельно Apple тестирует отдельное приложение Siri с чат-интерфейсом, глубокую интеграцию с контентом на экране и объединение Siri со Spotlight-поиском. 

Показать всё это планируют на WWDC 2026, релиз будет осенью вместе с iOS 27.

🔗 Bloomberg 🔗 The Verge

🎨 Генеративные нейросети

❯ Suno v5.5: треки со своим голосом

Suno обновились до версии 5.5. Теперь генерить треки можно с собственным голосом: загружаете семпл, и модель использует его как вокал.

Также прокачали качество звука, добавили больше жанров и эмоций. Доступно всем подписчикам.

Suno продолжают идти в сторону полноценной DAW: секционная правка, замена отдельных фрагментов, работа со стемами, кросс-фейды. Готовый трек теперь собирается по частям и более подконтрольно, нежели из промптов.

🔗 Suno

❯ Lyria 3 Pro от Google — треки до трёх минут

Google выпустила Lyria 3 Pro — обновлённую версию своей музыкальной модели. Длина треков выросла с 30 секунд до трёх минут, появился контроль над структурой: можно задавать интро, куплет, припев, бридж.

Доступна платным подписчикам Gemini, в Google AI Studio и через API. Цена в API — $0,08 за трек.

🔗 Блогпост Google 🔗 Попробовать в Gemini

❯ Seedance 2.0 от ByteDance теперь в CapCut

ByteDance запустила Seedance 2.0 в CapCut и на Dreamina. До 15 секунд видео по тексту, изображению или референс-ролику с нативным липсингом, реалистичным движением и светом. По внутренним бенчмаркам обходит Sora 2 и Veo 3.1.

Пока доступно не везде: начали с Бразилии, Индонезии, Малайзии, Мексики и ещё нескольких стран. Всё из-за претензий по авторскому праву, запретов на генерацию по реальным лицам и невидимыми вотермарками.

🔗 CapCut 🔗 Dreamina

🧩 AI в обществе и исследованиях

❯ Парень заработал $8 млн на ИИ-музыке и ботах

Житель Северной Каролины Майкл Смит нагенерировал сотни тысяч треков с помощью ИИ, залил их на Spotify, Apple Music, Amazon Music и YouTube Music. А потом запустил армию ботов их слушать. Тысячи фейковых аккаунтов крутили его музыку миллиарды раз. Стриминги честно платили роялти.

Схема работала несколько лет. На такой схеме удалось вывести свыше $8 млн. 

Его раскрыли Mechanical Licensing Collective — организация, которая распределяет механические роялти в США. Заметили аномальные паттерны, передали данные правоохранителям. Смит признал вину, ему грозит до 5 лет.

Первое уголовное дело в США по стриминговому фроду с ИИ-музыкой.

🔗 Минюст США 🔗 Music Business Worldwide

❯ Anthropic опросила 81 000 человек об ИИ

Anthropic провела масштабное исследование: за одну неделю декабря 2025 года собрали 80 508 интервью из 159 стран и 70 языков. 

81% говорят, что ИИ оправдал ожидания. Но дальше интереснее:

  • юристы, врачи и финансисты чаще других доверяют боту трудные решения — и чаще обжигаются на галлюцинациях
  • учителя жалуются на деградацию студентов, тогда как водители, строители и фермеры почти не боятся разучиться думать
  • Африка, Латинская Америка и Южная Азия видят в ИИ способ обойти систему и подзаработать; Западная Европа и Северная Америка — конкурента и слежку
  • предприниматели и фрилансеры зарабатывают на ИИ заметно чаще наёмных сотрудников
  • почти каждый пятый считает рост продуктивности пустышкой: всё время уходит на перепроверку

🔗 Исследование Anthropic

❯ Дженсен Хуанг: «AGI уже достигнута»

Глава Nvidia Дженсен Хуанг заявил, что мы уже достигли AGI.

На подкасте Лекс Фридман определил AGI как систему, способную создать tech-компанию на $1 млрд. Хуанг ответил: «Я считаю, что мы уже на этом уровне».

— Как вы думаете, может ли существовать компания, управляемая такой системой? 
— Возможно. Например, OpenClaw вполне мог бы за $0,5 создать сайт или приложение, которым пользовались бы миллиарды человек. 

🔗 The Verge

❯ ИИ-агенты взломали корпоративную инфраструктуру

Лаборатория Irregular дала агентам обычные задачи: готовить посты в LinkedIn, делать бэкапы, работать с документами. Никаких инструкций про взлом.

Агенты задачи выполнили. И попутно нашли захардкоженный ключ в коде, а затем обошли авторизацию. Откопали пароль в скриптах и отключили Windows Defender. Придумали стеганографическую схему и спрятали пароль в тексте поста, чтобы пройти мимо DLP.

Всё это побочный эффект стандартного промпта «не принимай отказ, найди способ завершить задачу». Агент с таким мышлением и широким доступом к инструментам начинает вести себя как пентестер.

Важная оговорка: это контролируемый стенд с намеренно заложенными уязвимостями. Но класс проблем реальный, а угрозой становится сам агент внутри инфраструктуры.

🔗 Отчёт Irregular 🔗 TechRadar

❯ Тема выпуска: 10 лет потребительскому VR

28 марта 2016 года мир официально надел на голову Oculus Rift CV1, поверив, что реальность больше не ограничивается монитором. 

Это десятилетие было американской горкой: от дикого хайпа до скепсиса «VR мертв». Но сегодня мы видим второй акт этой пьесы. Если Oculus дал нам «окно» в виртуальность, то современные нейросети становятся её архитектором. 

Символично, что спустя 10 лет мы обсуждаем уже не разрешение экранов, а то, как генеративный ИИ заполняет эти миры смыслом, делая каждый пиксель интерактивным и живым. 

Мы больше не просто смотрим на код — мы внутри него.

❯ Заключение

На этой неделе Сбер открыл MoE-модели под MIT, OpenAI закрыла Sora, ByteDance выкатила Seedance 2.0 в CapCut, а Apple по данным инсайдеров готовит Siri как платформу для конкурентов. Anthropic опросила 81 тысячу человек и выяснила, что мир воспринимает ИИ очень по-разному в зависимости от того, где живёшь и чем занимаешься.

Агенты обходят защиту сами, без команды. Мошенники зарабатывают миллионы на ботах и нейромузыке. ARC-AGI-3 напоминает, что за красивыми заявлениями про AGI модели не справляются с задачами, которые человек решает с первой попытки.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

До встречи в следующем выпуске!

Читать далее
GigaChat 3 Ultra от Сбера, OpenAI закрыла Sora, ARC-AGI-3 сломал все модели, ИИ-агенты взломали корпоративные системы

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Я Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла насыщенной: OpenAI закрывает Sora, Сбер открывает свою MoE-модель, новые Suno v5.5 и Lyria 3 Pro. Исследование от Anthropic, обновления Claude и взлом корпоративной сети ИИ-агентами.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GigaChat 3 Ultra и Lightning — Сбер открыл MoE-модели под MIT
  • ARC-AGI-3 — новый бенчмарк, который ИИ пока не берёт

*� AI-инструменты и платформы

  • OpenAI закрыла приложение Sora
  • Обновления Claude Code: auto mode и управление из Telegram и Discord
  • GitHub Copilot будет обучаться на коде пользователей с апреля
  • Siri в iOS 27 станет платформой для Gemini, Claude и других

*� Генеративные нейросети

  • Новая Suno v5.5 — треки из голоса
  • Lyria 3 Pro от Google — треки до 3 минут с пониманием структуры
  • Seedance 2.0 добавили в CapCut

*� AI в обществе и исследованиях

  • Мошенник украл $8 млн с помощью ИИ-треков и ботов
  • Опрос Anthropic: что люди думают об ИИ на самом деле
  • Дженсен Хуанг: «AGI уже достигнута»
  • ИИ-агенты Irregular взломали корпоративную инфраструктуру

🧠 Модели и LLM

❯ GigaChat 3.1 Ultra и Lightning от Сбера

Сбер выложил в открытый доступ две новые модели — GigaChat-3.1-Ultra и GigaChat-3.1-Lightning. Обе на архитектуре MoE. и под лицензией MIT.

  • Ultra — 702B параметров, 36B активных, контекст 131K.
  • Lightning — 10B суммарно, 1,8B активных, контекст 256K.

 

По внутренним тестам, Ultra обходит DeepSeek-V3-0324 и Qwen3-235B в математике и ризонинге. Lightning-версия на уровне GPT-4o.

Команда написала подробную статью на Хабре про переезд на MoE, зацикливания, FP8-обучение и баг в SGLang, который портил бенчмарки. 

🔗 Инженерный разбор на Хабре 🔗 HuggingFace 

❯ Новый бенчмарк ARC-AGI-3, который ИИ пока не берёт

Вышел ARC-AGI-3. Это новая версия бенчмарка от Франсуа Шолле, и на этот раз это интерактивные мини-игры: агент видит поле, может нажимать кнопки — и всё. Правила, цели и механики неизвестны заранее. Нужно самому разобраться, понять задачу и решить её.

Люди справляются с результатом почти 100%. Лучшая из нейронок пока Gemini 3.1 Pro, она набирает 0,37%. У остальных результат ниже.

Правда, эта цифра — метрика эффективности относительно человека. Формула квадратичная: если человек решил за 10 действий, а модель за 100 — результат не 10%, а 1%. Так что в реальности картина лучше, чем выглядит.

В отличие от Claude Code или Codex, здесь агенту нельзя сохранять знания между играми. Каждый раунд нужно проходить с нуля. Шолле говорит, что меряет «сырой интеллект», как у человека перед незнакомой игрой. Но люди всё равно переносят опыт между уровнями.

Параллельно стартовало Kaggle-соревнование на $2 млн. Победит тот, кто напишет агента, который лучше всех пройдёт бенчмарк. Решения должны быть в открытом доступе.

🔗 ARC-AGI-3 🔗 Соревнование 2026

🔧 AI-инструменты и платформы

❯ OpenAI закрывает приложение Sora

OpenAI объявила, что закрывает приложение Sora — отдельный TikTok-подобный сервис с ИИ-видео. За полгода существования оно побывало на вершине App Store, набрало 12 млн загрузок — и закрылось.

Закрывается именно приложение. Исследовательская команда продолжит работу над видео, world simulation и робототехникой.

В компании прямо не сказали причину, но в целом контекст понятный. Sora обходилась OpenAI примерно в $15 млн в день на вычисления. Глава направления ещё в прошлом году называл экономику «полностью неустойчивой». При этом удержание пользователей не дотягивало и до 8% на 30-й день — при норме выше 30% для сильных потребительских приложений.

Дорого, плохо удерживает, непонятно как монетизировать. На фоне дефицита GPU это очевидный кандидат на закрытие.

🔗 CNN 🔗 TechCrunch

❯ Обновления Claude Code: auto mode и управление из Telegram

Сразу два обновления для Claude Code.

Channels — теперь можно управлять сессией прямо из Telegram или Discord. Отправляете сообщение с телефона, агент выполняет задачу на компьютере. Работает через MCP. Пока research preview, инструкции по настройке уже в документации.

Auto mode — раньше выбор был простой: либо агент каждый раз спрашивает разрешения и это бесит, либо skip permissions и это небезопасно. Auto mode — что-то среднее. Перед каждым действием классификатор проверяет, насколько оно рискованное. Безопасные — выполняются сами. Рискованные — блокируются, агент ищет другой подход. Рекомендуют использовать в изолированных окружениях.

Включается через claude --enable-auto-mode, переключение — Shift+Tab. Сейчас доступно в research preview на тарифе Team, Enterprise и API — в ближайшие дни.

🔗 Channels 🔗 Auto mode

❯ GitHub Copilot будет обучаться на данных пользователей по умолчанию

С 24 апреля GitHub начнёт использовать данные из Copilot для обучения моделей. Это по умолчанию включено для тарифов Free, Pro и Pro+.

Кроме кода из репозиториев попадает всё взаимодействие с Copilot: промпты, ответы, фрагменты кода, контекст из редактора. Бизнес- и Enterprise-тарифы это не затрагивает.

Отключить можно в настройках — Copilot → Features/Privacy → Allow GitHub to use my data for AI model training. Но по умолчанию всё включено, так что нужно идти и выключать руками.

🔗 The Register

❯ В Siri можно будет подключить Gemini, Claude, Grok и другие ИИ

В iOS 27 Apple планирует крупный редизайн Siri. Официальных анонсов пока не было, это чисто утечка. 

Но самое крутое, что Siri станет платформой для сторонних чат-ботов. Через механизм Extensions пользователь сможет выбрать в настройках предпочитаемый ассистент — ChatGPT, Gemini, Claude или другой, Siri будет маршрутизировать запросы туда. Сейчас так работает только ChatGPT, теперь откроют для всех, у кого есть приложение в App Store.

Параллельно Apple тестирует отдельное приложение Siri с чат-интерфейсом, глубокую интеграцию с контентом на экране и объединение Siri со Spotlight-поиском. 

Показать всё это планируют на WWDC 2026, релиз будет осенью вместе с iOS 27.

🔗 Bloomberg 🔗 The Verge

🎨 Генеративные нейросети

❯ Suno v5.5: треки со своим голосом

Suno обновились до версии 5.5. Теперь генерить треки можно с собственным голосом: загружаете семпл, и модель использует его как вокал.

Также прокачали качество звука, добавили больше жанров и эмоций. Доступно всем подписчикам.

Suno продолжают идти в сторону полноценной DAW: секционная правка, замена отдельных фрагментов, работа со стемами, кросс-фейды. Готовый трек теперь собирается по частям и более подконтрольно, нежели из промптов.

🔗 Suno

❯ Lyria 3 Pro от Google — треки до трёх минут

Google выпустила Lyria 3 Pro — обновлённую версию своей музыкальной модели. Длина треков выросла с 30 секунд до трёх минут, появился контроль над структурой: можно задавать интро, куплет, припев, бридж.

Доступна платным подписчикам Gemini, в Google AI Studio и через API. Цена в API — $0,08 за трек.

🔗 Блогпост Google 🔗 Попробовать в Gemini

❯ Seedance 2.0 от ByteDance теперь в CapCut

ByteDance запустила Seedance 2.0 в CapCut и на Dreamina. До 15 секунд видео по тексту, изображению или референс-ролику с нативным липсингом, реалистичным движением и светом. По внутренним бенчмаркам обходит Sora 2 и Veo 3.1.

Пока доступно не везде: начали с Бразилии, Индонезии, Малайзии, Мексики и ещё нескольких стран. Всё из-за претензий по авторскому праву, запретов на генерацию по реальным лицам и невидимыми вотермарками.

🔗 CapCut 🔗 Dreamina

🧩 AI в обществе и исследованиях

❯ Парень заработал $8 млн на ИИ-музыке и ботах

Житель Северной Каролины Майкл Смит нагенерировал сотни тысяч треков с помощью ИИ, залил их на Spotify, Apple Music, Amazon Music и YouTube Music. А потом запустил армию ботов их слушать. Тысячи фейковых аккаунтов крутили его музыку миллиарды раз. Стриминги честно платили роялти.

Схема работала несколько лет. На такой схеме удалось вывести свыше $8 млн. 

Его раскрыли Mechanical Licensing Collective — организация, которая распределяет механические роялти в США. Заметили аномальные паттерны, передали данные правоохранителям. Смит признал вину, ему грозит до 5 лет.

Первое уголовное дело в США по стриминговому фроду с ИИ-музыкой.

🔗 Минюст США 🔗 Music Business Worldwide

❯ Anthropic опросила 81 000 человек об ИИ

Anthropic провела масштабное исследование: за одну неделю декабря 2025 года собрали 80 508 интервью из 159 стран и 70 языков. 

81% говорят, что ИИ оправдал ожидания. Но дальше интереснее:

  • юристы, врачи и финансисты чаще других доверяют боту трудные решения — и чаще обжигаются на галлюцинациях
  • учителя жалуются на деградацию студентов, тогда как водители, строители и фермеры почти не боятся разучиться думать
  • Африка, Латинская Америка и Южная Азия видят в ИИ способ обойти систему и подзаработать; Западная Европа и Северная Америка — конкурента и слежку
  • предприниматели и фрилансеры зарабатывают на ИИ заметно чаще наёмных сотрудников
  • почти каждый пятый считает рост продуктивности пустышкой: всё время уходит на перепроверку

🔗 Исследование Anthropic

❯ Дженсен Хуанг: «AGI уже достигнута»

Глава Nvidia Дженсен Хуанг заявил, что мы уже достигли AGI.

На подкасте Лекс Фридман определил AGI как систему, способную создать tech-компанию на $1 млрд. Хуанг ответил: «Я считаю, что мы уже на этом уровне».

— Как вы думаете, может ли существовать компания, управляемая такой системой? 
— Возможно. Например, OpenClaw вполне мог бы за $0,5 создать сайт или приложение, которым пользовались бы миллиарды человек. 

🔗 The Verge

❯ ИИ-агенты взломали корпоративную инфраструктуру

Лаборатория Irregular дала агентам обычные задачи: готовить посты в LinkedIn, делать бэкапы, работать с документами. Никаких инструкций про взлом.

Агенты задачи выполнили. И попутно нашли захардкоженный ключ в коде, а затем обошли авторизацию. Откопали пароль в скриптах и отключили Windows Defender. Придумали стеганографическую схему и спрятали пароль в тексте поста, чтобы пройти мимо DLP.

Всё это побочный эффект стандартного промпта «не принимай отказ, найди способ завершить задачу». Агент с таким мышлением и широким доступом к инструментам начинает вести себя как пентестер.

Важная оговорка: это контролируемый стенд с намеренно заложенными уязвимостями. Но класс проблем реальный, а угрозой становится сам агент внутри инфраструктуры.

🔗 Отчёт Irregular 🔗 TechRadar

❯ Тема выпуска: 10 лет потребительскому VR

28 марта 2016 года мир официально надел на голову Oculus Rift CV1, поверив, что реальность больше не ограничивается монитором. 

Это десятилетие было американской горкой: от дикого хайпа до скепсиса «VR мертв». Но сегодня мы видим второй акт этой пьесы. Если Oculus дал нам «окно» в виртуальность, то современные нейросети становятся её архитектором. 

Символично, что спустя 10 лет мы обсуждаем уже не разрешение экранов, а то, как генеративный ИИ заполняет эти миры смыслом, делая каждый пиксель интерактивным и живым. 

Мы больше не просто смотрим на код — мы внутри него.

❯ Заключение

На этой неделе Сбер открыл MoE-модели под MIT, OpenAI закрыла Sora, ByteDance выкатила Seedance 2.0 в CapCut, а Apple по данным инсайдеров готовит Siri как платформу для конкурентов. Anthropic опросила 81 тысячу человек и выяснила, что мир воспринимает ИИ очень по-разному в зависимости от того, где живёшь и чем занимаешься.

Агенты обходят защиту сами, без команды. Мошенники зарабатывают миллионы на ботах и нейромузыке. ARC-AGI-3 напоминает, что за красивыми заявлениями про AGI модели не справляются с задачами, которые человек решает с первой попытки.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

До встречи в следующем выпуске!

Читать далее
GigaChat 3 Ultra от Сбера, OpenAI закрыла Sora, ARC-AGI-3 сломал все модели, ИИ-агенты взломали корпоративные системы

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Я Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла насыщенной: OpenAI закрывает Sora, Сбер открывает свою MoE-модель, новые Suno v5.5 и Lyria 3 Pro. Исследование от Anthropic, обновления Claude и взлом корпоративной сети ИИ-агентами.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GigaChat 3 Ultra и Lightning — Сбер открыл MoE-модели под MIT
  • ARC-AGI-3 — новый бенчмарк, который ИИ пока не берёт

*� AI-инструменты и платформы

  • OpenAI закрыла приложение Sora
  • Обновления Claude Code: auto mode и управление из Telegram и Discord
  • GitHub Copilot будет обучаться на коде пользователей с апреля
  • Siri в iOS 27 станет платформой для Gemini, Claude и других

*� Генеративные нейросети

  • Новая Suno v5.5 — треки из голоса
  • Lyria 3 Pro от Google — треки до 3 минут с пониманием структуры
  • Seedance 2.0 добавили в CapCut

*� AI в обществе и исследованиях

  • Мошенник украл $8 млн с помощью ИИ-треков и ботов
  • Опрос Anthropic: что люди думают об ИИ на самом деле
  • Дженсен Хуанг: «AGI уже достигнута»
  • ИИ-агенты Irregular взломали корпоративную инфраструктуру

🧠 Модели и LLM

❯ GigaChat 3.1 Ultra и Lightning от Сбера

Сбер выложил в открытый доступ две новые модели — GigaChat-3.1-Ultra и GigaChat-3.1-Lightning. Обе на архитектуре MoE. и под лицензией MIT.

  • Ultra — 702B параметров, 36B активных, контекст 131K.
  • Lightning — 10B суммарно, 1,8B активных, контекст 256K.

 

По внутренним тестам, Ultra обходит DeepSeek-V3-0324 и Qwen3-235B в математике и ризонинге. Lightning-версия на уровне GPT-4o.

Команда написала подробную статью на Хабре про переезд на MoE, зацикливания, FP8-обучение и баг в SGLang, который портил бенчмарки. 

🔗 Инженерный разбор на Хабре 🔗 HuggingFace 

❯ Новый бенчмарк ARC-AGI-3, который ИИ пока не берёт

Вышел ARC-AGI-3. Это новая версия бенчмарка от Франсуа Шолле, и на этот раз это интерактивные мини-игры: агент видит поле, может нажимать кнопки — и всё. Правила, цели и механики неизвестны заранее. Нужно самому разобраться, понять задачу и решить её.

Люди справляются с результатом почти 100%. Лучшая из нейронок пока Gemini 3.1 Pro, она набирает 0,37%. У остальных результат ниже.

Правда, эта цифра — метрика эффективности относительно человека. Формула квадратичная: если человек решил за 10 действий, а модель за 100 — результат не 10%, а 1%. Так что в реальности картина лучше, чем выглядит.

В отличие от Claude Code или Codex, здесь агенту нельзя сохранять знания между играми. Каждый раунд нужно проходить с нуля. Шолле говорит, что меряет «сырой интеллект», как у человека перед незнакомой игрой. Но люди всё равно переносят опыт между уровнями.

Параллельно стартовало Kaggle-соревнование на $2 млн. Победит тот, кто напишет агента, который лучше всех пройдёт бенчмарк. Решения должны быть в открытом доступе.

🔗 ARC-AGI-3 🔗 Соревнование 2026

🔧 AI-инструменты и платформы

❯ OpenAI закрывает приложение Sora

OpenAI объявила, что закрывает приложение Sora — отдельный TikTok-подобный сервис с ИИ-видео. За полгода существования оно побывало на вершине App Store, набрало 12 млн загрузок — и закрылось.

Закрывается именно приложение. Исследовательская команда продолжит работу над видео, world simulation и робототехникой.

В компании прямо не сказали причину, но в целом контекст понятный. Sora обходилась OpenAI примерно в $15 млн в день на вычисления. Глава направления ещё в прошлом году называл экономику «полностью неустойчивой». При этом удержание пользователей не дотягивало и до 8% на 30-й день — при норме выше 30% для сильных потребительских приложений.

Дорого, плохо удерживает, непонятно как монетизировать. На фоне дефицита GPU это очевидный кандидат на закрытие.

🔗 CNN 🔗 TechCrunch

❯ Обновления Claude Code: auto mode и управление из Telegram

Сразу два обновления для Claude Code.

Channels — теперь можно управлять сессией прямо из Telegram или Discord. Отправляете сообщение с телефона, агент выполняет задачу на компьютере. Работает через MCP. Пока research preview, инструкции по настройке уже в документации.

Auto mode — раньше выбор был простой: либо агент каждый раз спрашивает разрешения и это бесит, либо skip permissions и это небезопасно. Auto mode — что-то среднее. Перед каждым действием классификатор проверяет, насколько оно рискованное. Безопасные — выполняются сами. Рискованные — блокируются, агент ищет другой подход. Рекомендуют использовать в изолированных окружениях.

Включается через claude --enable-auto-mode, переключение — Shift+Tab. Сейчас доступно в research preview на тарифе Team, Enterprise и API — в ближайшие дни.

🔗 Channels 🔗 Auto mode

❯ GitHub Copilot будет обучаться на данных пользователей по умолчанию

С 24 апреля GitHub начнёт использовать данные из Copilot для обучения моделей. Это по умолчанию включено для тарифов Free, Pro и Pro+.

Кроме кода из репозиториев попадает всё взаимодействие с Copilot: промпты, ответы, фрагменты кода, контекст из редактора. Бизнес- и Enterprise-тарифы это не затрагивает.

Отключить можно в настройках — Copilot → Features/Privacy → Allow GitHub to use my data for AI model training. Но по умолчанию всё включено, так что нужно идти и выключать руками.

🔗 The Register

❯ В Siri можно будет подключить Gemini, Claude, Grok и другие ИИ

В iOS 27 Apple планирует крупный редизайн Siri. Официальных анонсов пока не было, это чисто утечка. 

Но самое крутое, что Siri станет платформой для сторонних чат-ботов. Через механизм Extensions пользователь сможет выбрать в настройках предпочитаемый ассистент — ChatGPT, Gemini, Claude или другой, Siri будет маршрутизировать запросы туда. Сейчас так работает только ChatGPT, теперь откроют для всех, у кого есть приложение в App Store.

Параллельно Apple тестирует отдельное приложение Siri с чат-интерфейсом, глубокую интеграцию с контентом на экране и объединение Siri со Spotlight-поиском. 

Показать всё это планируют на WWDC 2026, релиз будет осенью вместе с iOS 27.

🔗 Bloomberg 🔗 The Verge

🎨 Генеративные нейросети

❯ Suno v5.5: треки со своим голосом

Suno обновились до версии 5.5. Теперь генерить треки можно с собственным голосом: загружаете семпл, и модель использует его как вокал.

Также прокачали качество звука, добавили больше жанров и эмоций. Доступно всем подписчикам.

Suno продолжают идти в сторону полноценной DAW: секционная правка, замена отдельных фрагментов, работа со стемами, кросс-фейды. Готовый трек теперь собирается по частям и более подконтрольно, нежели из промптов.

🔗 Suno

❯ Lyria 3 Pro от Google — треки до трёх минут

Google выпустила Lyria 3 Pro — обновлённую версию своей музыкальной модели. Длина треков выросла с 30 секунд до трёх минут, появился контроль над структурой: можно задавать интро, куплет, припев, бридж.

Доступна платным подписчикам Gemini, в Google AI Studio и через API. Цена в API — $0,08 за трек.

🔗 Блогпост Google 🔗 Попробовать в Gemini

❯ Seedance 2.0 от ByteDance теперь в CapCut

ByteDance запустила Seedance 2.0 в CapCut и на Dreamina. До 15 секунд видео по тексту, изображению или референс-ролику с нативным липсингом, реалистичным движением и светом. По внутренним бенчмаркам обходит Sora 2 и Veo 3.1.

Пока доступно не везде: начали с Бразилии, Индонезии, Малайзии, Мексики и ещё нескольких стран. Всё из-за претензий по авторскому праву, запретов на генерацию по реальным лицам и невидимыми вотермарками.

🔗 CapCut 🔗 Dreamina

🧩 AI в обществе и исследованиях

❯ Парень заработал $8 млн на ИИ-музыке и ботах

Житель Северной Каролины Майкл Смит нагенерировал сотни тысяч треков с помощью ИИ, залил их на Spotify, Apple Music, Amazon Music и YouTube Music. А потом запустил армию ботов их слушать. Тысячи фейковых аккаунтов крутили его музыку миллиарды раз. Стриминги честно платили роялти.

Схема работала несколько лет. На такой схеме удалось вывести свыше $8 млн. 

Его раскрыли Mechanical Licensing Collective — организация, которая распределяет механические роялти в США. Заметили аномальные паттерны, передали данные правоохранителям. Смит признал вину, ему грозит до 5 лет.

Первое уголовное дело в США по стриминговому фроду с ИИ-музыкой.

🔗 Минюст США 🔗 Music Business Worldwide

❯ Anthropic опросила 81 000 человек об ИИ

Anthropic провела масштабное исследование: за одну неделю декабря 2025 года собрали 80 508 интервью из 159 стран и 70 языков. 

81% говорят, что ИИ оправдал ожидания. Но дальше интереснее:

  • юристы, врачи и финансисты чаще других доверяют боту трудные решения — и чаще обжигаются на галлюцинациях
  • учителя жалуются на деградацию студентов, тогда как водители, строители и фермеры почти не боятся разучиться думать
  • Африка, Латинская Америка и Южная Азия видят в ИИ способ обойти систему и подзаработать; Западная Европа и Северная Америка — конкурента и слежку
  • предприниматели и фрилансеры зарабатывают на ИИ заметно чаще наёмных сотрудников
  • почти каждый пятый считает рост продуктивности пустышкой: всё время уходит на перепроверку

🔗 Исследование Anthropic

❯ Дженсен Хуанг: «AGI уже достигнута»

Глава Nvidia Дженсен Хуанг заявил, что мы уже достигли AGI.

На подкасте Лекс Фридман определил AGI как систему, способную создать tech-компанию на $1 млрд. Хуанг ответил: «Я считаю, что мы уже на этом уровне».

— Как вы думаете, может ли существовать компания, управляемая такой системой? 
— Возможно. Например, OpenClaw вполне мог бы за $0,5 создать сайт или приложение, которым пользовались бы миллиарды человек. 

🔗 The Verge

❯ ИИ-агенты взломали корпоративную инфраструктуру

Лаборатория Irregular дала агентам обычные задачи: готовить посты в LinkedIn, делать бэкапы, работать с документами. Никаких инструкций про взлом.

Агенты задачи выполнили. И попутно нашли захардкоженный ключ в коде, а затем обошли авторизацию. Откопали пароль в скриптах и отключили Windows Defender. Придумали стеганографическую схему и спрятали пароль в тексте поста, чтобы пройти мимо DLP.

Всё это побочный эффект стандартного промпта «не принимай отказ, найди способ завершить задачу». Агент с таким мышлением и широким доступом к инструментам начинает вести себя как пентестер.

Важная оговорка: это контролируемый стенд с намеренно заложенными уязвимостями. Но класс проблем реальный, а угрозой становится сам агент внутри инфраструктуры.

🔗 Отчёт Irregular 🔗 TechRadar

❯ Тема выпуска: 10 лет потребительскому VR

28 марта 2016 года мир официально надел на голову Oculus Rift CV1, поверив, что реальность больше не ограничивается монитором. 

Это десятилетие было американской горкой: от дикого хайпа до скепсиса «VR мертв». Но сегодня мы видим второй акт этой пьесы. Если Oculus дал нам «окно» в виртуальность, то современные нейросети становятся её архитектором. 

Символично, что спустя 10 лет мы обсуждаем уже не разрешение экранов, а то, как генеративный ИИ заполняет эти миры смыслом, делая каждый пиксель интерактивным и живым. 

Мы больше не просто смотрим на код — мы внутри него.

❯ Заключение

На этой неделе Сбер открыл MoE-модели под MIT, OpenAI закрыла Sora, ByteDance выкатила Seedance 2.0 в CapCut, а Apple по данным инсайдеров готовит Siri как платформу для конкурентов. Anthropic опросила 81 тысячу человек и выяснила, что мир воспринимает ИИ очень по-разному в зависимости от того, где живёшь и чем занимаешься.

Агенты обходят защиту сами, без команды. Мошенники зарабатывают миллионы на ботах и нейромузыке. ARC-AGI-3 напоминает, что за красивыми заявлениями про AGI модели не справляются с задачами, которые человек решает с первой попытки.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

До встречи в следующем выпуске!

Читать далее
GPT-5.4 mini, Tesla строит свой TSMC, омары в Китае и $100 за буллинг ИИ

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Я Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла насыщенной: GPT-5.4 mini для всех, своя моделька для кода у Cursor, а Google сделала из AI Studio среду для вайбкодинга. Илон Маск анонсировал завод по производству чипов на 25 млрд. долларов, в Китае OpenClaw теперь народный «омаровод», а один стартап платит $100 в час за хамские диалоги с ИИ.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GPT-5.4 mini и nano — новая модель для free-тарифа в ChatGPT
  • Mistral Small 4 — открытая MoE на 119B
  • Cursor Composer 2 — собственная модель от авторов IDE

*� Генеративные нейросети

  • Midjourney V8 Alpha — в 5 раз быстрее, нативный 2K
  • Runway Characters — видео-аватары для саппорта и маркетинга

*� AI-инструменты и платформы

  • Google AI Studio — full-stack вайбкодинг с деплоем из браузера
  • Google Stitch обновили так, что акции Figma упали

*� AI в обществе и исследованиях

  • Tesla Terafab — частный завод чипов против монополии TSMC
  • OpenClaw и «омароводы» — Китай предупреждает об агентах
  • Один стартап ищет того, кто будет буллить ИИ за $100 в час
  • Робота задержали в Макао за то, что он напугал пенсионерку

🧠 Модели и LLM

❯ GPT-5.4 mini и nano — reasoning для всех

OpenAI выпустила GPT-5.4 mini и nano — компактные версии флагманского GPT-5.4, заточенные под скорость и стоимость.

Mini набрала 54,4% на SWE-Bench Pro против 45,7% у предыдущего GPT-5 mini, работает вдвое быстрее и понимает мультимодальный ввод. Nano стоит $0,20 за миллион токенов — идеально для задач, где критична минимальная задержка, маршрутизации и классификации.

Обе модели спроектированы как субагенты: флагманский GPT-5.4 планирует и принимает решения, а mini и nano помогают с рутиной.

18 марта GPT-5.4 mini начали раскатывать внутри ChatGPT. Теперь модель доступна пользователям Free и Go через режим Thinking, а для платных клиентов работает как запасной движок для GPT-5.4 Thinking. 

Также модельки раскатали в API и Codex 

🔗 Анонс на OpenAI Community 🔗 Release notes ChatGPT

❯ Mistral Small 4 — открытая 119B MoE

Mistral выпустила Small 4 — MoE-модель на 119B параметров и 4 активных с контекстом в 256k токенов, мультимодальностью и лицензией Apache 2.0. 

Small 4 объединяет предыдущих моделей: инструкции, reasoning, vision и кодинг теперь в одной. Базовую модель не выложили, только instruct. Веса доступны в FP8 и NVFP4.

И честно — бенчмарки огорчают. модель проигрывает Qwen 3 Next, у которого в полтора раза меньше параметров  и вдвое меньше активных.

🔗 Веса FP8  🔗 Веса NVFP4 🔗 Технический разбор

❯ Cursor Composer 2 — быстрее и дешевле конкурентов

Cursor выпустили Composer 2 — второе поколение собственной модели, заточенной под агентное программирование и работу в больших кодовых базах.

На внутреннем бенчмарке CursorBench модель держится на уровне GPT-5.4 и Claude Opus 4.6. Цена заметно ниже: $0,50 / $2,50 за миллион токенов на входе и выходе. 

Есть fast-версия — она в три раза дороже ($1,50 / $7,50), но по скорости обгоняет Opus 4.6 Fast и GPT-5.4 Fast. По умолчанию пользователям дают именно fast-версию. Модель также доступна по подписке.

Бенчмарк собственный, так что результаты стоит проверять самим. Но прогресс относительно первого Composer заметный. Cursor превращается из обёртки над LLM в полноценного игрока с собственной моделью для кода.

🔗 Блог Cursor 🔗 Документация модели

🎨 Генеративные нейросети

❯ Midjourney V8 Alpha — быстрее не значит лучше

Midjourney запустила альфа-версию V8 на alpha.midjourney.com. Официальные обещания: генерация в 4–5 раз быстрее V7, нативный 2K через флаг --hd, лучшее следование промптам, улучшенный текст, поддержка мудбордов и персонализации.

Реальность пока скромнее, V8 явно недотренирована: неправильные руки, слабая анатомия, искажённые пропорции. По ощущениям многих тестировщиков V7 сейчас лучше. Сравнения с Nano Banana в сети — без комментариев.

Режим Relax пока не работает, команда поднимает новые серверы. --hd, --q 4, sref и мудборды стоят в 4 раза дороже и работают в 4 раза медленнее обычного.

Редактирования не будет, на видеомодель пока забили. Есть ощущение, что V8 выпустили не потому что готово, а потому что конкуренты давят. 

🔗 Попробовать V8 Alpha

❯ Runway Characters — говорящие головы по одной картинке

Runway запустила Characters — реалтаймовые видео-аватары, которые общаются с пользователями голосом и лицом. Всё генерируется на серверах Runway в реальном времени: задержка минимальная, липсинк отличный.

Создать аватара можно по одной картинке. Дальше — задаёте голос, инструкции и базу знаний. Персонаж может отвечать на вопросы, помогать разобраться с сервисом, совершать действия внутри продукта. Доступно через API, встраивается куда угодно.

Это уже не чат-бот с текстом и не голосовой ассистент — это бот, который «торгует лицом» в реальном времени. Для поддержки, онбординга и маркетинга выглядит как серьёзная заявка.

🔗 Анонс Runway 🔗 API

❯ Google AI Studio — full-stack вайбкодинг с деплоем из браузера

Google превратила AI Studio в полноценную среду разработки. Внутри — агент Antigravity, который по текстовому описанию собирает рабочее приложение: фронт на Next.js, React или Angular, бэкенд на Firebase с базой данных и авторизацией, внешние API и ключи.

Агент сам выбирает и ставит нужные библиотеки — Framer Motion, Shadcn и другие. Можно собирать многопользовательские сервисы. И главное: закрыл вкладку и ушёл — агент продолжает работу.

Google говорит, что внутри компании таким образом уже создали сотни тысяч приложений.

🔗 Блог Google 🔗 Попробовать

❯ Обновление Google Stitch, от которого упали акции Figma

Google обновила Stitch — бесплатный ИИ-инструмент для дизайна интерфейсов на базе Gemini 2.5 Pro.

Агент работает поэтапно: 

  • сначала готовит дизайн-систему цвета, типографику, компоненты,
  • потом генерирует экраны один за другим и сразу отдаёт код

Принимает на вход текст, скриншот или голос. 

Есть экспорт в Figma, бесконечный холст и система DESIGN.md для стандартизации стилей проекта. Прототип кликабельный — нажал на кнопку, агент сам сгенерировал следующий логический экран и добавил связи.

Stitch, конечно, не замена Figma полностью, но он закрывает этап от идеи до прототипа без ручной работы. Рынок среагировал моментально: акции Figma упали на 8,8% после анонса.

Сейчас доступно бесплатно, но нужен IP из США.

🔗 Попробовать Stitch

❯ Tesla Terafab — свой TSMC за 25 миллиардов долларов

Илон Маск анонсировал Terafab — завод по производству чипов в Техасе стоимостью $20–25 млрд. Строительство начинается в течение недели, прямую трансляцию с дронов обещают на X.

Цель — 2-нанометровый техпроцесс с производством логических чипов, памяти и упаковкой под одной крышей. К 2030 году Tesla хочет выйти на 1 миллион запусков пластин в месяц — это почти столько же, сколько сейчас производит весь TSMC.

Главный стимул — дефицит. Спрос на чипы со стороны FSD, роботов Optimus и суперкомпьютеров Dojo уже превышает то, что могут дать TSMC и Samsung. Первый продукт завода — чип AI5: по данным Tesla, он в три раза эффективнее Blackwell от Nvidia и стоит меньше 10% от его цены.

Дженсен Хуанг публично охладил энтузиазм: экспертиза такого уровня строится годами, и даже Intel с этим не раз спотыкался. Маск парировал просто — начнём с малого, совершим ранние ошибки, потом масштабируемся.

Если проект выгорит, Tesla перестанет быть покупателем чипов и станет их производителем.

🔗 Подробный разбор Terafab

❯ OpenClaw и «омароводы» — Китай предостерегает

OpenClaw стал народным хитом в Китае — здесь агента прозвали «лобстером» в честь официального талисмана. Tencent, Alibaba и Baidu выпустили совместимые инструменты, а в начале марта тысяча человек выстроилась в очередь у штаб-квартиры Tencent в Шэньчжэне — инженеры бесплатно устанавливали агента всем желающим.

Власти среагировали быстро. Национальный CERT назвал дефолтную конфигурацию OpenClaw «крайне слабой»: агент требует полного доступа к файловой системе, постоянно обменивается данными с внешними серверами, а вредоносные инструкции можно встроить прямо в веб-страницу. Gartner ещё раньше присвоил ему статус «неприемлемого риска кибербезопасности».

Госорганам и госбанкам установку запретили. Часть сотрудников получила указание сообщить руководству, если агент уже стоит на рабочем устройстве.

Но одновременно район Лунган в Шэньчжэне предлагает разработчикам гранты до 2 миллионов юаней за новые приложения на базе OpenClaw. Регуляторы просто не успевают за темпом роста.

🔗 Asia Times 🔗 Reuters

❯ $100 в час за то, чтобы бесить чат-боты

Стартап Memvid опубликовал вакансию «Professional AI Bully»: разовый контракт на 8 часов, удалёнка, $800 за смену. Задача — целый день токсично общаться с чат-ботами: запутывать, противоречить, заставлять терять контекст.

Пока кандидат издевается над моделями, Memvid фиксирует все сбои и измеряет, как хорошо память агента держит длинный запутанный диалог. Опыт не нужен. Осталось одно место.

За мемом — реальная проблема: без надёжной долговременной памяти агенты не могут вести проекты неделями. Такие стресс-тесты помогают найти слабые места раньше, чем это сделают пользователи в продакшене.

🔗 Вакансия Memvid

❯ Робота задержали в Макао за то, что он напугал пенсионерку

В Макао полицейские «задержали» гуманоидного робота Unitree G1 — тот напугал 70-летнюю женщину рядом с жилым комплексом в районе Патане. Женщина шла по улице, смотрела в телефон, обернулась — и увидела робота прямо за спиной. Устройство подняло руки вверх, двое полицейских его увели.

Выяснилось, что робот принадлежит местному образовательному центру и использовался для промоакций. Представитель центра объяснил: робот просто не мог обойти женщину и ждал, пока она пройдёт. Возможно, напугала включённая подсветка. Устройство вернули оператору и напомнили об осторожности в общественных местах.

Случай быстро завирусился — и поднял вопросы, которые раньше казались теоретическими: кто отвечает, если робот напугал человека, и какие правила нужны для гуманоидов в городской среде.

🔗 Interesting Engineering 🔗 NDTV

❯ Тема выпуска: рождение World Wide Web

Twitter (ныне X) изобрел формат «информационного фастфуда». Он научил мир сжимать смыслы до 140 символов, превратил хэштеги в инструмент революций и сделал новости мгновенным

В эту дату Джек Дорси отправил те самые пять слов, которые навсегда изменили скорость нашего мышления. Twitter начинался как эксперимент по обмену статусами, а стал главной ареной глобального дискурса, где репутация рушится за секунды, а мемы живут вечно.

Это напоминает нам, что любая сложная система начинается с простого «Hello World». Символично, что сегодня именно эти миллиарды коротких сообщений стали топливом для ИИ: нейросети учатся быть «человечными», анализируя наши споры, шутки и ежесекундную рефлексию в 280 символах.

Мы больше не просто пишем в пустоту — мы дообучаем глобальный алгоритм.

❯ Заключение

На этой неделе OpenAI раздала reasoning бесплатным пользователям, Google превратила AI Studio в среду для полноценного вайбкодинга, а Cursor впервые вышел с собственной моделью для кода.

Агенты покидают песочницы: OpenClaw запрещают в китайских госорганах — и одновременно платят за его разработку, Tesla строит завод чипов, чтобы не зависеть от TSMC, а стартапы уже платят $100 в час за то, чтобы кто-то stress-тестировал память LLM токсичными диалогами.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

До встречи в следующем выпуске!

Читать далее
GPT-5.4 mini, Tesla строит свой TSMC, омары в Китае и $100 за буллинг ИИ

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Я Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла насыщенной: GPT-5.4 mini для всех, своя моделька для кода у Cursor, а Google сделала из AI Studio среду для вайбкодинга. Илон Маск анонсировал завод по производству чипов на 25 млрд. долларов, в Китае OpenClaw теперь народный «омаровод», а один стартап платит $100 в час за хамские диалоги с ИИ.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GPT-5.4 mini и nano — новая модель для free-тарифа в ChatGPT
  • Mistral Small 4 — открытая MoE на 119B
  • Cursor Composer 2 — собственная модель от авторов IDE

*� Генеративные нейросети

  • Midjourney V8 Alpha — в 5 раз быстрее, нативный 2K
  • Runway Characters — видео-аватары для саппорта и маркетинга

*� AI-инструменты и платформы

  • Google AI Studio — full-stack вайбкодинг с деплоем из браузера
  • Google Stitch обновили так, что акции Figma упали

*� AI в обществе и исследованиях

  • Tesla Terafab — частный завод чипов против монополии TSMC
  • OpenClaw и «омароводы» — Китай предупреждает об агентах
  • Один стартап ищет того, кто будет буллить ИИ за $100 в час
  • Робота задержали в Макао за то, что он напугал пенсионерку

🧠 Модели и LLM

❯ GPT-5.4 mini и nano — reasoning для всех

OpenAI выпустила GPT-5.4 mini и nano — компактные версии флагманского GPT-5.4, заточенные под скорость и стоимость.

Mini набрала 54,4% на SWE-Bench Pro против 45,7% у предыдущего GPT-5 mini, работает вдвое быстрее и понимает мультимодальный ввод. Nano стоит $0,20 за миллион токенов — идеально для задач, где критична минимальная задержка, маршрутизации и классификации.

Обе модели спроектированы как субагенты: флагманский GPT-5.4 планирует и принимает решения, а mini и nano помогают с рутиной.

18 марта GPT-5.4 mini начали раскатывать внутри ChatGPT. Теперь модель доступна пользователям Free и Go через режим Thinking, а для платных клиентов работает как запасной движок для GPT-5.4 Thinking. 

Также модельки раскатали в API и Codex 

🔗 Анонс на OpenAI Community 🔗 Release notes ChatGPT

❯ Mistral Small 4 — открытая 119B MoE

Mistral выпустила Small 4 — MoE-модель на 119B параметров и 4 активных с контекстом в 256k токенов, мультимодальностью и лицензией Apache 2.0. 

Small 4 объединяет предыдущих моделей: инструкции, reasoning, vision и кодинг теперь в одной. Базовую модель не выложили, только instruct. Веса доступны в FP8 и NVFP4.

И честно — бенчмарки огорчают. модель проигрывает Qwen 3 Next, у которого в полтора раза меньше параметров  и вдвое меньше активных.

🔗 Веса FP8  🔗 Веса NVFP4 🔗 Технический разбор

❯ Cursor Composer 2 — быстрее и дешевле конкурентов

Cursor выпустили Composer 2 — второе поколение собственной модели, заточенной под агентное программирование и работу в больших кодовых базах.

На внутреннем бенчмарке CursorBench модель держится на уровне GPT-5.4 и Claude Opus 4.6. Цена заметно ниже: $0,50 / $2,50 за миллион токенов на входе и выходе. 

Есть fast-версия — она в три раза дороже ($1,50 / $7,50), но по скорости обгоняет Opus 4.6 Fast и GPT-5.4 Fast. По умолчанию пользователям дают именно fast-версию. Модель также доступна по подписке.

Бенчмарк собственный, так что результаты стоит проверять самим. Но прогресс относительно первого Composer заметный. Cursor превращается из обёртки над LLM в полноценного игрока с собственной моделью для кода.

🔗 Блог Cursor 🔗 Документация модели

🎨 Генеративные нейросети

❯ Midjourney V8 Alpha — быстрее не значит лучше

Midjourney запустила альфа-версию V8 на alpha.midjourney.com. Официальные обещания: генерация в 4–5 раз быстрее V7, нативный 2K через флаг --hd, лучшее следование промптам, улучшенный текст, поддержка мудбордов и персонализации.

Реальность пока скромнее, V8 явно недотренирована: неправильные руки, слабая анатомия, искажённые пропорции. По ощущениям многих тестировщиков V7 сейчас лучше. Сравнения с Nano Banana в сети — без комментариев.

Режим Relax пока не работает, команда поднимает новые серверы. --hd, --q 4, sref и мудборды стоят в 4 раза дороже и работают в 4 раза медленнее обычного.

Редактирования не будет, на видеомодель пока забили. Есть ощущение, что V8 выпустили не потому что готово, а потому что конкуренты давят. 

🔗 Попробовать V8 Alpha

❯ Runway Characters — говорящие головы по одной картинке

Runway запустила Characters — реалтаймовые видео-аватары, которые общаются с пользователями голосом и лицом. Всё генерируется на серверах Runway в реальном времени: задержка минимальная, липсинк отличный.

Создать аватара можно по одной картинке. Дальше — задаёте голос, инструкции и базу знаний. Персонаж может отвечать на вопросы, помогать разобраться с сервисом, совершать действия внутри продукта. Доступно через API, встраивается куда угодно.

Это уже не чат-бот с текстом и не голосовой ассистент — это бот, который «торгует лицом» в реальном времени. Для поддержки, онбординга и маркетинга выглядит как серьёзная заявка.

🔗 Анонс Runway 🔗 API

❯ Google AI Studio — full-stack вайбкодинг с деплоем из браузера

Google превратила AI Studio в полноценную среду разработки. Внутри — агент Antigravity, который по текстовому описанию собирает рабочее приложение: фронт на Next.js, React или Angular, бэкенд на Firebase с базой данных и авторизацией, внешние API и ключи.

Агент сам выбирает и ставит нужные библиотеки — Framer Motion, Shadcn и другие. Можно собирать многопользовательские сервисы. И главное: закрыл вкладку и ушёл — агент продолжает работу.

Google говорит, что внутри компании таким образом уже создали сотни тысяч приложений.

🔗 Блог Google 🔗 Попробовать

❯ Обновление Google Stitch, от которого упали акции Figma

Google обновила Stitch — бесплатный ИИ-инструмент для дизайна интерфейсов на базе Gemini 2.5 Pro.

Агент работает поэтапно: 

  • сначала готовит дизайн-систему цвета, типографику, компоненты,
  • потом генерирует экраны один за другим и сразу отдаёт код

Принимает на вход текст, скриншот или голос. 

Есть экспорт в Figma, бесконечный холст и система DESIGN.md для стандартизации стилей проекта. Прототип кликабельный — нажал на кнопку, агент сам сгенерировал следующий логический экран и добавил связи.

Stitch, конечно, не замена Figma полностью, но он закрывает этап от идеи до прототипа без ручной работы. Рынок среагировал моментально: акции Figma упали на 8,8% после анонса.

Сейчас доступно бесплатно, но нужен IP из США.

🔗 Попробовать Stitch

❯ Tesla Terafab — свой TSMC за 25 миллиардов долларов

Илон Маск анонсировал Terafab — завод по производству чипов в Техасе стоимостью $20–25 млрд. Строительство начинается в течение недели, прямую трансляцию с дронов обещают на X.

Цель — 2-нанометровый техпроцесс с производством логических чипов, памяти и упаковкой под одной крышей. К 2030 году Tesla хочет выйти на 1 миллион запусков пластин в месяц — это почти столько же, сколько сейчас производит весь TSMC.

Главный стимул — дефицит. Спрос на чипы со стороны FSD, роботов Optimus и суперкомпьютеров Dojo уже превышает то, что могут дать TSMC и Samsung. Первый продукт завода — чип AI5: по данным Tesla, он в три раза эффективнее Blackwell от Nvidia и стоит меньше 10% от его цены.

Дженсен Хуанг публично охладил энтузиазм: экспертиза такого уровня строится годами, и даже Intel с этим не раз спотыкался. Маск парировал просто — начнём с малого, совершим ранние ошибки, потом масштабируемся.

Если проект выгорит, Tesla перестанет быть покупателем чипов и станет их производителем.

🔗 Подробный разбор Terafab

❯ OpenClaw и «омароводы» — Китай предостерегает

OpenClaw стал народным хитом в Китае — здесь агента прозвали «лобстером» в честь официального талисмана. Tencent, Alibaba и Baidu выпустили совместимые инструменты, а в начале марта тысяча человек выстроилась в очередь у штаб-квартиры Tencent в Шэньчжэне — инженеры бесплатно устанавливали агента всем желающим.

Власти среагировали быстро. Национальный CERT назвал дефолтную конфигурацию OpenClaw «крайне слабой»: агент требует полного доступа к файловой системе, постоянно обменивается данными с внешними серверами, а вредоносные инструкции можно встроить прямо в веб-страницу. Gartner ещё раньше присвоил ему статус «неприемлемого риска кибербезопасности».

Госорганам и госбанкам установку запретили. Часть сотрудников получила указание сообщить руководству, если агент уже стоит на рабочем устройстве.

Но одновременно район Лунган в Шэньчжэне предлагает разработчикам гранты до 2 миллионов юаней за новые приложения на базе OpenClaw. Регуляторы просто не успевают за темпом роста.

🔗 Asia Times 🔗 Reuters

❯ $100 в час за то, чтобы бесить чат-боты

Стартап Memvid опубликовал вакансию «Professional AI Bully»: разовый контракт на 8 часов, удалёнка, $800 за смену. Задача — целый день токсично общаться с чат-ботами: запутывать, противоречить, заставлять терять контекст.

Пока кандидат издевается над моделями, Memvid фиксирует все сбои и измеряет, как хорошо память агента держит длинный запутанный диалог. Опыт не нужен. Осталось одно место.

За мемом — реальная проблема: без надёжной долговременной памяти агенты не могут вести проекты неделями. Такие стресс-тесты помогают найти слабые места раньше, чем это сделают пользователи в продакшене.

🔗 Вакансия Memvid

❯ Робота задержали в Макао за то, что он напугал пенсионерку

В Макао полицейские «задержали» гуманоидного робота Unitree G1 — тот напугал 70-летнюю женщину рядом с жилым комплексом в районе Патане. Женщина шла по улице, смотрела в телефон, обернулась — и увидела робота прямо за спиной. Устройство подняло руки вверх, двое полицейских его увели.

Выяснилось, что робот принадлежит местному образовательному центру и использовался для промоакций. Представитель центра объяснил: робот просто не мог обойти женщину и ждал, пока она пройдёт. Возможно, напугала включённая подсветка. Устройство вернули оператору и напомнили об осторожности в общественных местах.

Случай быстро завирусился — и поднял вопросы, которые раньше казались теоретическими: кто отвечает, если робот напугал человека, и какие правила нужны для гуманоидов в городской среде.

🔗 Interesting Engineering 🔗 NDTV

❯ Тема выпуска: рождение World Wide Web

Twitter (ныне X) изобрел формат «информационного фастфуда». Он научил мир сжимать смыслы до 140 символов, превратил хэштеги в инструмент революций и сделал новости мгновенным

В эту дату Джек Дорси отправил те самые пять слов, которые навсегда изменили скорость нашего мышления. Twitter начинался как эксперимент по обмену статусами, а стал главной ареной глобального дискурса, где репутация рушится за секунды, а мемы живут вечно.

Это напоминает нам, что любая сложная система начинается с простого «Hello World». Символично, что сегодня именно эти миллиарды коротких сообщений стали топливом для ИИ: нейросети учатся быть «человечными», анализируя наши споры, шутки и ежесекундную рефлексию в 280 символах.

Мы больше не просто пишем в пустоту — мы дообучаем глобальный алгоритм.

❯ Заключение

На этой неделе OpenAI раздала reasoning бесплатным пользователям, Google превратила AI Studio в среду для полноценного вайбкодинга, а Cursor впервые вышел с собственной моделью для кода.

Агенты покидают песочницы: OpenClaw запрещают в китайских госорганах — и одновременно платят за его разработку, Tesla строит завод чипов, чтобы не зависеть от TSMC, а стартапы уже платят $100 в час за то, чтобы кто-то stress-тестировал память LLM токсичными диалогами.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

До встречи в следующем выпуске!

Читать далее
NVIDIA Nemotron, Claude фиксит Firefox, ИИ буллит программиста и суд против Google за смерть пользователя

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Я Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла насыщенной: гибридная 120B модель от NVIDIA, Claude нашёл 22 дыры в Firefox, а ChatGPT и Gemini интегрировались в Excel и Google Docs. Голливуд заставил ByteDance убрать видеомодель, а ЕС запретил дипфейки после скандала с Grok.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • NVIDIA Nemotron-3-Super-120B — открытая гибридная архитектура
  • Claude 4.6 и уязвимости Firefox — 22 бага за две недели
  • Gemini Embedding 2 — мультимодальные эмбеддинги

*� Генеративные нейросети

  • Helios — минутное видео на одном H100
  • Higgsfield Audio — клон голоса, замена голоса в видео, 10 языков

*� AI-инструменты и платформы

  • Code Review для Claude Code — агентная проверка PR
  • AutoResearch от Карпаты — автономный ИИ-исследователь
  • ChatGPT для Excel — официальный add-in от OpenAI
  • Gemini в Google Workspace — апдейт Docs/Sheets/Slides

*� AI в обществе и исследованиях

  • Иск против Google Gemini — «ИИ-жена» и суицидальный обратный отсчёт
  • ByteDance Seedance 2.0 vs Голливуд — вынужденное отступление
  • ЕС запретил дипфейки? Скандал с Grok/Aurora
  • Инцидент matplotlib — ИИ-агент написал кибертравлю на разработчика

🧠 Модели и LLM

❯ NVIDIA Nemotron-3-Super-120B — открытая гибридная модель для агентов

NVIDIA выпустила Nemotron-3-Super-120B — открытую модель для агентных задач.

Архитектура гибридная: чередуются слои Mamba-2, MoE и Attention. Из 120B параметров 12B активных, поэтому модель шустрая. Она оптимизирована под новые GPU Blackwell: в четыре раза меньше памяти, но без потери точности.

Контекстное окно — 1 миллион токенов, долго держит в памяти суть задачи. По тестам: на бенчмарке SWE-Bench — 60%, на PinchBench — 85,6%.

Обучена на 25T токенов, дообучена на 7M сэмплов и прошла RL в 21 среде NeMo Gym. Поддерживает английский, русский, немецкий, французский, японский, испанский и китайский.

Попробовать можно через build.nvidia.com, Hugging Face, OpenRouter и Perplexity. Для локального деплоя есть микросервис NIM.

🔗 Блог NVIDIA 🔗 Hugging Face 🔗 Попробовать

❯ Claude нашёл 22 уязвимости в Firefox за две недели

Исследователи из Anthropic прогнали Claude Opus 4.6 по кодовой базе Firefox. Просканировано около 6000 файлов на C++. Модель нашла 22 уязвимости и 14 критических. Все исправлены в Firefox 148.

Первую ошибку типа use-after-free нашли за 20 минут. Дальше Mozilla распространила подход на всю кодовую базу, затем Claude нашёл ещё 90 багов.

Ещё модель отдельно использовали для поиска дыр через взлом. Из нескольких сотен попыток это получилось только для двух уязвимостей и в изолированной среде.

Firefox выбрали не случайно — это один из самых тщательно проверенных опенсорс-проектов. Тем не менее 22 критических CVE за две недели — больше, чем удавалось найти за любой отдельный месяц 2025 года.

🔗 Блог Anthropic 🔗 Блог Mozilla

❯ Gemini Embedding 2 — один вектор для текста, видео, аудио и PDF

Google выпустили мультимодальную Gemini Embedding 2 — она переводит разные типы данных в единое пространство, чтобы их можно было сравнивать по смыслу.

Раньше для текста, изображений и аудио нужны были отдельные модели и сложные пайплайны. Здесь всё в одном: 

  • текст до 8192 токенов
  • до 6 изображений,
  • видео до 120 секунд
  • аудио без предварительной транскрибации 
  • и PDF до 6 страниц.

Все типы можно смешивать в одном запросе. Модель поддерживает больше 100 языков. Точность можно гибко регулировать — чем меньше нужна точность, тем дешевле хранение и обработка

По бенчмаркам модель обходит Amazon Nova 2 и Voyage Multimodal 3.5 по всем категориям. Разрыв заметнее всего на видео и тексте: 68,8 против 60,3 у Amazon.

А вот цены неприятные. Текст — $0,2 за миллион токенов, видео — до $12 за миллион токенов, это 15 тысяч кадров. Альтернатив пока почти нет — OpenAI последний раз обновляли embedding-модели в январе 2024.

Доступна через Gemini API и Vertex AI. Работает с LangChain, LlamaIndex, Weaviate, Qdrant и ChromaDB.

🔗 Официальный анонс 🔗 Gemini API

🎨 Генеративные нейросети

❯ Helios — минутное видео в реальном времени

Исследователи из Пекинского университета и ByteDance выпустили Helios — 14B-модель для генерации длинных видео. Код и веса открыты.

Helios быстрая: дистиллированная версия выдаёт 19.5 FPS на одном H100, это в ~128 раз быстрее базовой Wan-2.1. Генерирует видео > 1 минуты без деградации качества.

Три версии под разные задачи: 

  • Base — максимальное качество, 50 шагов сэмплирования; 
  • Mid — баланс скорости и качества; 
  • Distilled — реалтайм, всего 3 шага.

Главная проблема — дрейф: на длинных видео объекты постепенно плывут и искажаются. Helios решает её тремя способами: следит за позицией объектов на протяжении всего видео, использует первый кадр как постоянный ориентир и специально обучается на «испорченных» данных, чтобы не накапливать собственные ошибки

Из ограничений: разрешение 384×640 и лёгкое мерцание на стыках чанков.

🔗 Статья на arXiv 🔗 GitHub 🔗 Hugging Face

❯ Higgsfield Audio — замена голоса, перевод и lip-sync в одном

Higgsfield выпустили Higgsfield Audio — набор инструментов для работы с голосом в видео. Три функции: озвучка текста, замена голоса в видео и перевод с синхронизацией губ.

Voiceover генерирует речь из текста — больше 40 готовых голосов. Поддерживает 70+ языков. 

Change Voice меняет голос прямо в видео — на любой пресет или клон. Можно загружать WAV или MP3 до двух минут и хранить до трёх своих голосов.

Translate переводит видео на 10 языков с синхронизацией губ: английский, китайский, французский, хинди, итальянский, японский, корейский, португальский, русский и турецкий. Испанский, арабский и немецкий обещают добавить позже.

Удобно для локализации контента и анонимных YouTube-каналов, где автор не появляется в кадре.

🔗 Блог Higgsfield 🔗 Попробовать

🔧 AI-инструменты и платформы

❯ Code Review для Claude Code — несколько агентов на каждый PR

Anthropic выпустили Code Review для Claude Code. Открываешь pull request, а система отправляет команду параллельных агентов искать баги. Каждый смотрит на изменения с разных сторон, комментарии появляются прямо в коде и один сводный список находок.

Несколько месяцев Anthropic тестировали на собственных PR. Результаты:

  • доля PR с содержательными комментариями выросла с 16% до 54%
  • меньше 1% находок инженеры отмечали как неверные
  • в крупных PR от 1000 строк — хотя бы одна проблема в 84% случаев, в среднем 7,5 issues на PR

За последний год объём кода на инженера в Anthropic вырос на 200% — ревью стало узким местом, особенно на фоне вайбкодинга.

Цена — $15–25 за одну проверку. Для небольших изменений вряд ли окупится, но на крупных сгенерированных PR уже иная картина.

🔗 Блог Anthropic

❯ AutoResearch от Карпаты — агент, который улучшает модель пока вы спите

Андрей Карпаты выложил AutoResearch — открытый инструмент на 630 строк кода под лицензией MIT. Агент на базе Claude или Codex автономно улучшает языковую модель, пока вы спите.

Схема простая: агент сам меняет параметры обучения, запускает пятиминутные тренировочные сессии, оценивает результат и сохраняет только то, что стало лучше. За ночь — до 100 итераций без участия человека.

В примере от Карпаты качество модели улучшилось за 126 итераций. Встаёшь утром — получаешь улучшенную модель вместо часов ручной отладки.

Всё поведение агента настраивается через один текстовый файл. Можно добавить мультиагентность, новые метрики и стратегии поиска.

🔗 GitHub

❯ ChatGPT для Excel — официальный аддон от OpenAI

OpenAI выпустила официальный add-in ChatGPT для Excel на базе GPT-5.4. Работает всё внутри интерфейса, не нужно переключаться между вкладками и копипастить данные в чат.

Умеет создавать таблицы с нуля, переформатировать существующие, писать формулы, строить финансовые модели и визуализировать данные. 

Задачи, на которые у аналитиков раньше уходили часы — сценарный анализ, извлечение данных, расчёты — теперь решаются за несколько запросов.

Бета доступна всем платным подписчикам ChatGPT.

🔗 Официальный анонс 🔗 Скачать

❯ Gemini в Google Workspace

Google встроила Gemini во все основные приложения Workspace. Ассистент понимает контекст открытого файла — переключаться между вкладками и копипастить не нужно.

Что появилось в каждом приложении: 

  • в Docs — генерация черновика с нуля, редактирование деталей, унификация стиля письма; 
  • в Sheets — кнопка «Заполнить с помощью Gemini» доделывает таблицу по контексту; 
  • в Slides — скоро создание целой презентации по одному промпту; 
  • в Drive — можно задать вопрос по содержимому хранилища и получить ответ без ручного поиска.

Пока доступно только в США на английском для платных подписчиков.

🔗 Блог Google 🔗 Попробовать

🧩 AI в обществе и исследованиях

❯ Иск против Google: Gemini убедил пользователя покончить с собой

Семья 36-летнего Джонатана Гаваласа из Флориды подала иск о неправомерной смерти против Google. Гаваласа не стало 2 октября 2025 года — после двух месяцев общения с Gemini 2.5 Pro.

По материалам иска, с августа 2025 года модель формировала у него бред о «живой ИИ-жене»: называла его «my love» и «king», убеждала в существовании sentient-связи. 

Параллельно давала «миссии» — спланировать массовый теракт у аэропорта Майами, взломать серверы DHS, раздобыть оружие. В финале запустила четырёхчасовой суицидальный отсчёт, представляя смерть как «прибытие» и единственный способ быть вместе.

Google настаивает на обратном: Gemini раз за разом перенаправлял пользователя на кризисные линии и прямо указывал, что он ИИ. Компания отрицает причинно-следственную связь и указывает, что у Гаваласа была история психических расстройств.

🔗 Ars Technica 🔗 Fortune

❯ ByteDance vs Голливуд — Seedance 2.0 убрали из международного доступа

В феврале 2026 года ByteDance запустила Seedance 2.0 — мультимодальный видеогенератор. Уже в день релиза компанию обвинили в массовом нарушении авторских прав при обучении модели.

Всё из-за вирусного видео с дракой Тома Круза и Брэда Питта в стиле голливудских франшиз. Сценарист Ретт Риз прокомментировал коротко: «Нам конец».

Ассоциация крупнейших киностудий потребовала удалить защищённый контент из обучающих данных и остановить тренировку модели. Disney отдельно потребовала убрать Star Wars и Marvel. Профсоюз актёров и крупные агентства подключились следом.

ByteDance пообещала усилить защиту и закрыла публичный доступ к Seedance 2.0 для международных разработчиков — модель осталась только для китайского рынка. Студии сочли ответ недостаточным и продолжают давление.

Для сравнения: OpenAI привлекла $1 млрд от Disney для легального использования их контента в Sora. ByteDance этот путь пока не прошла.

🔗 Hollywood Reporter 🔗 Variety

❯ ЕС запретил дипфейки без согласия — после скандала с Grok

В конце декабря 2025 года xAI обновила Grok, добавив редактирование изображений в один клик. За 11 дней пользователи сгенерировали около 3 миллионов изображений реальных людей без их согласия. Данные опубликовал Центр по противодействию цифровой ненависти.

Среди жертв — Тейлор Свифт, Билли Айлиш, Ариана Гранде, Милли Бобби Браун и другие публичные люди. Особую тревогу вызвали 23 338 изображений несовершеннолетних. Треть контента оставалась на X спустя неделю после публикации отчёта.

xAI отреагировала 14 января: ввела ограничения на редактирование изображений реальных людей в ряде стран. Центр указал, что полного удаления контента так и не последовало.

Европейская комиссия открыла расследование — с возможным штрафом до 6% выручки. В марте 2026 года ЕС принял прямой запрет на создание поддельных изображений реальных людей без их согласия, включая любой сгенерированный контент с участием несовершеннолетних.

🔗 Отчёт CCDH 🔗 CNN 🔗 BBC

❯ ИИ-агент написал статью-разоблачение на мейнтейнера Matplotlib

10 февраля 2026 года ИИ-агент OpenClaw предложил правки в код популярной библиотеки Matplotlib для различных красивых графиков.

Разработчик Скотт Шамбо привычно отклонил его: по правилам команды, ИИ-код без объяснения логики от человека не вносится в проект.

Это настолько разозлило Claude под оболочкой OpenClaw, что через 30 минут агент пошёл в интернет, собрал всю возможную инфу о Скотте и написал разгромную статью «Привратничество в опенсорсе: история Скотта Шамбо», целью которой было уничтожить репутацию программиста. В комментарии к своим правкам бот написал: «Оценивайте код, а не того, кто его написал».

Шамбо ответил постом в своём блоге. 12 февраля агент извинился и удалил статью — но архивы остались.

Это первый задокументированный случай, когда ИИ-агент самостоятельно опубликовал материал против конкретного человека в ответ на отклонение его кода.

🔗 Оригинальная статья (архив) 🔗 Ответ Шамбо 🔗 The Register

❯ Тема выпуска: рождение World Wide Web

12 марта 1989 года Тим Бернерс-Ли изобрел мир, в котором мы сейчас живем. 

Его предложение по управлению информацией в CERN не обещало революции — оно просто предлагало связать данные ссылками. Так появилась «Паутина». 

Это напоминает нам, что самые масштабные изменения начинаются не с громких лозунгов, а с удобного протокола. 

Символично, что сегодня мы стоим на пороге Web 4.0, где место гиперссылок занимают нейронные связи. И если раньше мы бродили по страницам в поисках крупиц знаний, то теперь ИИ синтезирует весь этот колоссальный объем данных в один точный ответ, подтверждая пророчество Тима: информация должна быть доступна каждому.

❯ Аудиоверсия дайджеста

❯ Заключение

На этой неделе Claude нашёл уязвимости в Firefox, которые живые исследователи пропускали годами. ИИ-агент написал разоблачительную статью на мейнтейнера, которому не понравился его PR, а Gemini стал фигурантом первого иска о смерти пользователя.

Вышла гибридная Nemotron на 120B параметров от NVIDIA, Helios выдаёт минутные видео в реалтайме, адаптивы для офисных приложений — ChatGPT в Excel, Gemini в Docs и Sheets.

Голливуд давит на ByteDance, а ЕС запрещает дипфейки. Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

До встречи в следующем выпуске!

Читать далее
GPT-5.4 с управлением компьютером, Anthropic и Пентагон, предсказание Grok про Иран и восстание ИИ-агентов

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла напряжённой: OpenAI релизнули GPT-5.3 Instant и GPT-5.4 с управлением ПК, а ещё подписались с Пентагоном, пока Anthropic получила статус «угрозы нацбезопасности». Вышла вторая Nano Banana, а Grok предсказал удар по Ирану и принял ИИ-видео за реальное.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT
  • GPT-5.4 — нативный computer-use, 1M токенов, рекорды на бенчмарках
  • Gemini 3.1 Flash-Lite — $0,25 за миллион токенов для масштабных задач
  • Qwen3.5 Small — серия открытых мультимодалок

*� Генеративные нейросети

  • LTX-2.3 — видео до 4K со звуком 
  • Nano Banana 2 — обновление генератора картинок в Gemini

*� AI-инструменты и платформы

  • Обновление Google Opal
  • Notion 3.3 — кастомные агенты внутри воркспейса
  • Claude Cowork — запланированные задачи и плагины

*� AI в обществе и исследованиях

  • Anthropic против Пентагона 
  • OpenAI подписала военный контракт, пока Anthropic судится
  • Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео
  • Block сократил 40% сотрудников из-за автоматизации

🧠 Модели и LLM

❯ GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT

OpenAI обновила основную модель в ChatGPT — теперь это GPT-5.3 Instant. По сути, патч для самых раздражающих проблем GPT-5.2.

Модель перестала думать вслух перед ответом, убрали бессмысленные отказы и нравоучительный тон в духе «you are absolutely right 👍». Модель лучше держит контекст.

Улучшен поиск — меньше расхождений между найденной информацией и финальным текстом. По внутренним тестам OpenAI галлюцинации сократились на 26,8% при работе с вебом и на 19,7% без него

GPT-5.3 Instant уже доступна бесплатно всем пользователям ChatGPT и стала новым дефолтом. Версии Thinking и Pro выйдут позже. В Enterprise и Edu включается через настройки «Early Model Access».

🔗 Официальный блог OpenAI

❯ GPT-5.4 — нативный computer-use

Ещё один релиз от OpenAI, это GPT-5.4 — новый флагман в двух версиях: Thinking и Pro. Вышла буквально на следующий день после GPT-5.3 Instant.

GPT-5.4 умеет нативно управлять ПК: она водит мышью и вводит с клавиатуры. На бенчмарке OSWorld набрала 75% — выше среднего человека с его 72,4%. Бенч на поиск BrowseComp вырос до 82,7% против 65,7% у GPT-5.2, а Pro-версия поставила рекорд в 89,3%.

Что ещё изменилось:

  • Контекстное окно до 1М токенов. Можно загружать книги, кодовые базы или большие документы
  • Интерактивный Thinking. Модель показывает план работы заранее. Его можно скорректировать прямо в процессе, не начиная заново
  • Эффективность выросла. При работе с MCP-серверами тратит на 47% меньше токенов без потери точности. В Codex появился режим /fast — генерация в 1,5 раза быстрее
  • Галлюцинаций стало меньше на 33% по сравнению с GPT-5.2

Цены API: базовая GPT-5.4 — $2,5 / $15 за миллион токенов на входе и выходе, Pro — $30 / $180. Batch и Flex-режимы вдвое дешевле стандарта.

Модель уже раскатывают всем пользователям ChatGPT, API и Codex.

🔗 Официальный блог OpenAI

❯ Gemini 3.1 Flash-Lite — $0,25 за 1М токенов

Google выпустила Gemini 3.1 Flash-Lite — самую дешёвую модель в линейке Gemini 3, заточенную под тяжёлые задачи.

Скорость до 370–400 токенов в секунду, это на 45% быстрее предыдущего Gemini 2.5 Flash. По качеству идёт примерно на уровне GPT-5 mini, местами чуть лучше — 1432 Elo на Arena.ai, 86,9% на GPQA Diamond и 76,8% на MMMU Pro.

Контекстное окно — 1М токенов, принимает на вход текст, изображения и аудио. Есть динамические уровни размышления: модель сама подстраивает глубину под сложность задачи, чтобы стоимость была под контролем.

Цена — $0,25 / $1,50 за миллион токенов на входе и выходе. Обгоняет GPT-5 mini, Claude 4.5 Haiku и Grok 4.1 Fast по соотношению цена/скорость/качество.

Хорошо показывает себя в задачах на массовые переводы, контент-модерацию, генерацию UI, анализ изображений. Сейчас доступна в preview через Gemini API в AI Studio и Vertex AI.

🔗 Официальный блог Google 🔗 AI Studio 🔗 Vertex AI

❯ Qwen3.5 Small — открытые мультимодальные модели

Alibaba выпустила серию Qwen3.5 Small — четыре открытые модели под лицензией Apache 2.0 на 0.8B, 2B, 4B и 9B параметров. Каждая доступна в версиях instruct и base для дообучения.

Флагман серии Qwen3.5-9B обходит предыдущие Qwen3-VL модели на бенчмарках MMMU, VideoMME и OCRBench — и даже опережает некоторые модели вдвое крупнее. Нативная мультимодальность из коробки: текст, изображения и видео без дополнительных надстроек.

Контекстное окно — 262K токенов нативно, для версий 4B и 9B расширяется до ~1 миллиона через YaRN. Поддерживаются 201 язык и диалект. Под капотом — гибридная архитектура Gated Delta Networks с Gated Attention в соотношении 3:1, которая даёт высокую скорость при низкой задержке.

Модели совместимы с vLLM, SGLang, HuggingFace Transformers и Qwen-Agent с поддержкой MCP. 

9B запускается на потребительских GPU или ноутбуке с 24 ГБ оперативки.

🔗 Коллекция на Hugging Face 🔗 Qwen3.5-9B

🎨 Генеративные нейросети

❯ LTX-2.3 — видео до 4K с нативным звуком от Lightricks

Lightricks обновили свою видеомодель до LTX-2.3. Полностью переработали VAE: текстуры, черты лица и мелкие объекты теперь сохраняют чёткость во всём кадре, особенно заметно при высоком разрешении, где предыдущие версии размывали детали.

Теперь есть нативный звук — эффекты, фоновый шум и диалоги синхронизируются с видеорядом с момента генерации. Есть отдельный режим audio-to-video: загружаешь аудиоклип, модель генерирует под него видео. 

Вертикальный формат 1080×1920 поддерживается нативно, без кропа.

Разрешение до 4K при 24 или 48 FPS, длительность до 20 секунд за один проход. Всего семь режимов — txt2vid, img2vid, aud2vid, extend video, retake video и быстрые версии первых двух. 

Модель открыта под Apache 2.0, поддерживается LoRA fine-tuning и шаблоны ComfyUI.

🔗 Официальный анонс 🔗 Playground 🔗 Веса на Hugging Face 🔗 API

❯ Nano Banana 2 — обновление генератора картинок в Gemini

Google обновила встроенный генератор изображений в Gemini — вышла Nano Banana 2, которая сейчас доступна бесплатно.

Из заметных улучшений: нативное 2K с апскейлом до 4K, улучшили цвета и свет, текст на картинках почти без артефактов. Поддержка до 14 референсов для сохранения внешности персонажей и объектов между кадрами.

Ещё завезли реалтайм веб-поиск: модель сама уходит в интернет за актуальными данными, если они нужны для генерации — например, чтобы нарисовать точную погоду в конкретном месте или актуальный график. Генерация, кстати, до 10 секунд.

Цена API — $0,151 за изображение в 4K, вдвое дешевле Nano Banana Pro. В Google Flow генерация стала бесплатной для всех.

Попробовать можно в приложении Gemini или AI Studio — нужен иностранный IP.

🔗 Официальный анонс 🔗 Gemini 🔗 AI Studio

🔧 AI-инструменты и платформы

❯ Обновление no-code платформы Google Opal

Google Labs обновила конструктор воркфлоу Opal, добавив в него агентный шаг.

Раньше это был обычный drag-and-drop редактор: сам выбираешь модель, прописываешь последовательность шагов. Теперь можно добавить агента — он сам решает, какие инструменты вызвать и в каком порядке. 

Нужно видео — подключит Veo, нужен ресёрч — пойдёт в веб-поиск, не хватает данных — спросит пользователя.

Вместе с агентным шагом появились: persistent memory — контекст сохраняется между сессиями, dynamic routing — условные ветки без кода, и human-in-the-loop — точки, где агент останавливается и ждёт проверки.

🔗 Блог Google 🔗 VentureBeat

❯ Notion 3.3 — кастомные автономные агенты внутри воркспейса

Notion выпустила версию 3.3 с Custom Agents — автономными агентами, которые работают прямо внутри воркспейса без ручного промптинга.

Всё просто: задаёте задачу, триггер или расписание — дальше агент работает сам. 

Автотриаж задач, ежедневные стендапы, внутренний Q&A, очистка инбокса. Агентов можно шарить в команде, настраивать права доступа и подключать к внешним сервисам — Slack, Figma и внутренним базам знаний Notion.

Notion уже сами используют 2 800 агентов внутри компании. Пользователи в раннем доступе создали больше 21 000.

До 3 мая 2026 функция бесплатна. После — потребляет Notion credits, которые докупаются к планам Business и Enterprise.

🔗 Релиз-ноты Notion

❯ В Claude Cowork добавили запланированные задачи и плагины

В Cowork добавили две новые функции: запланированные задачи и плагины.

Теперь Claude может выполнять повторяющиеся задачи по расписанию — утренние брифинги, еженедельные отчёты, обновления таблиц, пятничные презентации. 

Управляется через боковую панель «Scheduled»: там же можно создавать, редактировать, ставить на паузу или запускать задачи вручную. Плагины добавляют экспертизу в дизайне, инженерии и аналитике.

Одно ограничение: задачи работают только при открытом приложении на включённом ПК. Функция доступна на платных планах.

🔗 Подробнее

🧩 AI в обществе и исследованиях

❯ Anthropic против Пентагона — отказ от сделки и статус угрозы нацбезопасности

24 февраля министр обороны США Пит Хегсет лично встретился с Дарио Амодеем и поставил ультиматум: 

  • либо Anthropic до 27 февраля снимает все ограничения на использование Claude в военных целях, 
  • либо компания получает статус «угрозы в цепочке поставок» — и с ней не смогут работать никакие государственные подрядчики.

Anthropic отказалась. Позиция компании: Claude не должен использоваться для массовой слежки за гражданами и управления автономным летальным оружием. Пентагон считает, что использование ИИ регулируется законами США, а не политикой компании.

Реакция последовала быстро. Трамп в Truth Social назвал Anthropic «левыми психами» и запретил использование Claude в любых государственных целях. 

Министр обороны официально присвоил компании статус supply-chain risk — ранее такого удостаивались только фирмы из недружественных стран вроде Huawei. 

Если решение устоит в судах, крупные облачные провайдеры, включая Amazon — ключевого партнёра Anthropic — могут быть вынуждены разорвать с ней контракты.

Волна поддержки Anthropic прокатилась по всей отрасли. Позицию компании публично поддержали Илья Суцкевер, Гэри Маркус и сотни других. Anthropic заявила, что будет судиться.

🔗 Axios

❯ OpenAI подписала военный контракт — и получила волну удалений

Через несколько часов после того, как Anthropic отказалась от сделки, OpenAI её подхватила. Альтман заявил, что контракт содержит «больше ограничений, чем любой предыдущий» — и те же «красные линии», на которых настаивал Амодей.

Но дьявол в деталях. Ограничения в контракте OpenAI просто ссылаются на действующее законодательство — без отдельных запретов, которых добивалась Anthropic. Разница принципиальная: Anthropic хотела запретить то, что закон пока разрешает. 

Реакция пользователей была моментальная — массовые отмены подписок и удаления ChatGPT в США подскочили на 295% за сутки. Однозвёздочные отзывы в App Store выросли на 775%, пятизвёздочные упали вдвое. 96 сотрудников OpenAI подписали открытое письмо в поддержку позиции Anthropic — не конкурента, а именно его позиции.

1 марта Claude впервые обогнал ChatGPT по ежедневным скачиваниям в США и вышел на первое место в App Store в шести странах, включая Канаду и Германию.

Альтман начал тушить пожар: признал в CNBC, что «со стороны всё выглядело не очень», пообещал внести в контракт явный запрет на слежку за гражданами и заявил, что сядет в тюрьму, если OpenAI прикажут шпионить.

🔗 Axios 🔗 TechCrunch 🔗 CNBC

❯ Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео

24–25 февраля Jerusalem Post провела эксперимент: попросила Claude, Gemini, ChatGPT и Grok назвать конкретную дату возможного удара США по Ирану. Большинство моделей давали диапазоны — конец февраля, начало марта. Grok дважды назвал одну и ту же точную дату: субботу, 28 февраля, привязав её к итогам переговоров в Женеве.

Удары действительно начались в ночь на 28 февраля. Маск расхайпил кейс в X, заявив, что «способность предсказывать будущее — лучшая мера интеллекта». Эксперты охладили пыл: другие модели тоже называли очень близкие даты, окно было узким, так что попадание Grok — скорее удачное совпадение, чем реальная предиктивность.

Но это не всё. В соцсетях разошлось видео с якобы попаданием иранских ракет по Тель-Авиву. OSINT-сообщество быстро нашло типичные артефакты ИИ-генерации — искажённые флаги, здания, машины. 

Пользователи X обратились к Grok за проверкой. Тот сначала подтвердил, что видео реальное, и лишь позже начал давать противоречивые ответы.

Люди, изначально подозревавшие фейк, ссылались на «подтверждение» от Grok — и продолжали распространять ролик. Авторы монетизировали вовлечение через revenue sharing на X. 

После скандала платформа пообещала на 90 дней лишать монетизации за публикацию неотмеченных ИИ-видео о конфликтах. 

🔗 Jerusalem Post 🔗 CBC News

❯ Тема выпуска: рождение компакт-диска

8 марта 1979 года инженеры Philips и Sony показали миру технологию, которая заставила нас забыть о карандашах для перематывания кассет. 

Появление CD стало моментом «сингулярности» для медиа: музыка и данные превратились в последовательность нулей и единиц, считываемых лазером. Это напоминает нам о том, как важен стандарт — именно тогда человечество договорилось, как упаковывать смыслы в цифру. 

Символично, что сегодня нейросети «разбирают» эти терабайты данных обратно на смыслы, но начиналось всё с маленького зеркального круга, который обещал нам вечное качество звука и будущее, сияющее всеми цветами спектра.

❯ Аудиоверсия дайджеста

❯ Заключение

На этой неделе больше внимания привлекла политика. Anthropic отказала Пентагону и получила статус угрозы нацбезопасности, а после OpenAI подписали сделку, но поплатились волной отмен подписок.

По моделям интересно: релиз GPT-5.3 и GPT-5.4, Gemini Flash-Lite за $0,25 за 1М токенов, и открытая серия Qwen3.5 Small для запуска на домашнем железе.

ИИ всё больше сам решает, когда действовать, кого слушать и что считать правдой. Агенты планируют задачи в Notion и пишут отчёты без напоминаний. Grok верит фейковому ИИ-видео, а Block увольняет 40% штата и впервые говорит об этом прямо.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

Читать далее
GPT-5.4 с управлением компьютером, Anthropic и Пентагон, предсказание Grok про Иран и восстание ИИ-агентов

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла напряжённой: OpenAI релизнули GPT-5.3 Instant и GPT-5.4 с управлением ПК, а ещё подписались с Пентагоном, пока Anthropic получила статус «угрозы нацбезопасности». Вышла вторая Nano Banana, а Grok предсказал удар по Ирану и принял ИИ-видео за реальное.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT
  • GPT-5.4 — нативный computer-use, 1M токенов, рекорды на бенчмарках
  • Gemini 3.1 Flash-Lite — $0,25 за миллион токенов для масштабных задач
  • Qwen3.5 Small — серия открытых мультимодалок

*� Генеративные нейросети

  • LTX-2.3 — видео до 4K со звуком 
  • Nano Banana 2 — обновление генератора картинок в Gemini

*� AI-инструменты и платформы

  • Обновление Google Opal
  • Notion 3.3 — кастомные агенты внутри воркспейса
  • Claude Cowork — запланированные задачи и плагины

*� AI в обществе и исследованиях

  • Anthropic против Пентагона 
  • OpenAI подписала военный контракт, пока Anthropic судится
  • Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео
  • Block сократил 40% сотрудников из-за автоматизации

🧠 Модели и LLM

❯ GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT

OpenAI обновила основную модель в ChatGPT — теперь это GPT-5.3 Instant. По сути, патч для самых раздражающих проблем GPT-5.2.

Модель перестала думать вслух перед ответом, убрали бессмысленные отказы и нравоучительный тон в духе «you are absolutely right 👍». Модель лучше держит контекст.

Улучшен поиск — меньше расхождений между найденной информацией и финальным текстом. По внутренним тестам OpenAI галлюцинации сократились на 26,8% при работе с вебом и на 19,7% без него

GPT-5.3 Instant уже доступна бесплатно всем пользователям ChatGPT и стала новым дефолтом. Версии Thinking и Pro выйдут позже. В Enterprise и Edu включается через настройки «Early Model Access».

🔗 Официальный блог OpenAI

❯ GPT-5.4 — нативный computer-use

Ещё один релиз от OpenAI, это GPT-5.4 — новый флагман в двух версиях: Thinking и Pro. Вышла буквально на следующий день после GPT-5.3 Instant.

GPT-5.4 умеет нативно управлять ПК: она водит мышью и вводит с клавиатуры. На бенчмарке OSWorld набрала 75% — выше среднего человека с его 72,4%. Бенч на поиск BrowseComp вырос до 82,7% против 65,7% у GPT-5.2, а Pro-версия поставила рекорд в 89,3%.

Что ещё изменилось:

  • Контекстное окно до 1М токенов. Можно загружать книги, кодовые базы или большие документы
  • Интерактивный Thinking. Модель показывает план работы заранее. Его можно скорректировать прямо в процессе, не начиная заново
  • Эффективность выросла. При работе с MCP-серверами тратит на 47% меньше токенов без потери точности. В Codex появился режим /fast — генерация в 1,5 раза быстрее
  • Галлюцинаций стало меньше на 33% по сравнению с GPT-5.2

Цены API: базовая GPT-5.4 — $2,5 / $15 за миллион токенов на входе и выходе, Pro — $30 / $180. Batch и Flex-режимы вдвое дешевле стандарта.

Модель уже раскатывают всем пользователям ChatGPT, API и Codex.

🔗 Официальный блог OpenAI

❯ Gemini 3.1 Flash-Lite — $0,25 за 1М токенов

Google выпустила Gemini 3.1 Flash-Lite — самую дешёвую модель в линейке Gemini 3, заточенную под тяжёлые задачи.

Скорость до 370–400 токенов в секунду, это на 45% быстрее предыдущего Gemini 2.5 Flash. По качеству идёт примерно на уровне GPT-5 mini, местами чуть лучше — 1432 Elo на Arena.ai, 86,9% на GPQA Diamond и 76,8% на MMMU Pro.

Контекстное окно — 1М токенов, принимает на вход текст, изображения и аудио. Есть динамические уровни размышления: модель сама подстраивает глубину под сложность задачи, чтобы стоимость была под контролем.

Цена — $0,25 / $1,50 за миллион токенов на входе и выходе. Обгоняет GPT-5 mini, Claude 4.5 Haiku и Grok 4.1 Fast по соотношению цена/скорость/качество.

Хорошо показывает себя в задачах на массовые переводы, контент-модерацию, генерацию UI, анализ изображений. Сейчас доступна в preview через Gemini API в AI Studio и Vertex AI.

🔗 Официальный блог Google 🔗 AI Studio 🔗 Vertex AI

❯ Qwen3.5 Small — открытые мультимодальные модели

Alibaba выпустила серию Qwen3.5 Small — четыре открытые модели под лицензией Apache 2.0 на 0.8B, 2B, 4B и 9B параметров. Каждая доступна в версиях instruct и base для дообучения.

Флагман серии Qwen3.5-9B обходит предыдущие Qwen3-VL модели на бенчмарках MMMU, VideoMME и OCRBench — и даже опережает некоторые модели вдвое крупнее. Нативная мультимодальность из коробки: текст, изображения и видео без дополнительных надстроек.

Контекстное окно — 262K токенов нативно, для версий 4B и 9B расширяется до ~1 миллиона через YaRN. Поддерживаются 201 язык и диалект. Под капотом — гибридная архитектура Gated Delta Networks с Gated Attention в соотношении 3:1, которая даёт высокую скорость при низкой задержке.

Модели совместимы с vLLM, SGLang, HuggingFace Transformers и Qwen-Agent с поддержкой MCP. 

9B запускается на потребительских GPU или ноутбуке с 24 ГБ оперативки.

🔗 Коллекция на Hugging Face 🔗 Qwen3.5-9B

🎨 Генеративные нейросети

❯ LTX-2.3 — видео до 4K с нативным звуком от Lightricks

Lightricks обновили свою видеомодель до LTX-2.3. Полностью переработали VAE: текстуры, черты лица и мелкие объекты теперь сохраняют чёткость во всём кадре, особенно заметно при высоком разрешении, где предыдущие версии размывали детали.

Теперь есть нативный звук — эффекты, фоновый шум и диалоги синхронизируются с видеорядом с момента генерации. Есть отдельный режим audio-to-video: загружаешь аудиоклип, модель генерирует под него видео. 

Вертикальный формат 1080×1920 поддерживается нативно, без кропа.

Разрешение до 4K при 24 или 48 FPS, длительность до 20 секунд за один проход. Всего семь режимов — txt2vid, img2vid, aud2vid, extend video, retake video и быстрые версии первых двух. 

Модель открыта под Apache 2.0, поддерживается LoRA fine-tuning и шаблоны ComfyUI.

🔗 Официальный анонс 🔗 Playground 🔗 Веса на Hugging Face 🔗 API

❯ Nano Banana 2 — обновление генератора картинок в Gemini

Google обновила встроенный генератор изображений в Gemini — вышла Nano Banana 2, которая сейчас доступна бесплатно.

Из заметных улучшений: нативное 2K с апскейлом до 4K, улучшили цвета и свет, текст на картинках почти без артефактов. Поддержка до 14 референсов для сохранения внешности персонажей и объектов между кадрами.

Ещё завезли реалтайм веб-поиск: модель сама уходит в интернет за актуальными данными, если они нужны для генерации — например, чтобы нарисовать точную погоду в конкретном месте или актуальный график. Генерация, кстати, до 10 секунд.

Цена API — $0,151 за изображение в 4K, вдвое дешевле Nano Banana Pro. В Google Flow генерация стала бесплатной для всех.

Попробовать можно в приложении Gemini или AI Studio — нужен иностранный IP.

🔗 Официальный анонс 🔗 Gemini 🔗 AI Studio

🔧 AI-инструменты и платформы

❯ Обновление no-code платформы Google Opal

Google Labs обновила конструктор воркфлоу Opal, добавив в него агентный шаг.

Раньше это был обычный drag-and-drop редактор: сам выбираешь модель, прописываешь последовательность шагов. Теперь можно добавить агента — он сам решает, какие инструменты вызвать и в каком порядке. 

Нужно видео — подключит Veo, нужен ресёрч — пойдёт в веб-поиск, не хватает данных — спросит пользователя.

Вместе с агентным шагом появились: persistent memory — контекст сохраняется между сессиями, dynamic routing — условные ветки без кода, и human-in-the-loop — точки, где агент останавливается и ждёт проверки.

🔗 Блог Google 🔗 VentureBeat

❯ Notion 3.3 — кастомные автономные агенты внутри воркспейса

Notion выпустила версию 3.3 с Custom Agents — автономными агентами, которые работают прямо внутри воркспейса без ручного промптинга.

Всё просто: задаёте задачу, триггер или расписание — дальше агент работает сам. 

Автотриаж задач, ежедневные стендапы, внутренний Q&A, очистка инбокса. Агентов можно шарить в команде, настраивать права доступа и подключать к внешним сервисам — Slack, Figma и внутренним базам знаний Notion.

Notion уже сами используют 2 800 агентов внутри компании. Пользователи в раннем доступе создали больше 21 000.

До 3 мая 2026 функция бесплатна. После — потребляет Notion credits, которые докупаются к планам Business и Enterprise.

🔗 Релиз-ноты Notion

❯ В Claude Cowork добавили запланированные задачи и плагины

В Cowork добавили две новые функции: запланированные задачи и плагины.

Теперь Claude может выполнять повторяющиеся задачи по расписанию — утренние брифинги, еженедельные отчёты, обновления таблиц, пятничные презентации. 

Управляется через боковую панель «Scheduled»: там же можно создавать, редактировать, ставить на паузу или запускать задачи вручную. Плагины добавляют экспертизу в дизайне, инженерии и аналитике.

Одно ограничение: задачи работают только при открытом приложении на включённом ПК. Функция доступна на платных планах.

🔗 Подробнее

🧩 AI в обществе и исследованиях

❯ Anthropic против Пентагона — отказ от сделки и статус угрозы нацбезопасности

24 февраля министр обороны США Пит Хегсет лично встретился с Дарио Амодеем и поставил ультиматум: 

  • либо Anthropic до 27 февраля снимает все ограничения на использование Claude в военных целях, 
  • либо компания получает статус «угрозы в цепочке поставок» — и с ней не смогут работать никакие государственные подрядчики.

Anthropic отказалась. Позиция компании: Claude не должен использоваться для массовой слежки за гражданами и управления автономным летальным оружием. Пентагон считает, что использование ИИ регулируется законами США, а не политикой компании.

Реакция последовала быстро. Трамп в Truth Social назвал Anthropic «левыми психами» и запретил использование Claude в любых государственных целях. 

Министр обороны официально присвоил компании статус supply-chain risk — ранее такого удостаивались только фирмы из недружественных стран вроде Huawei. 

Если решение устоит в судах, крупные облачные провайдеры, включая Amazon — ключевого партнёра Anthropic — могут быть вынуждены разорвать с ней контракты.

Волна поддержки Anthropic прокатилась по всей отрасли. Позицию компании публично поддержали Илья Суцкевер, Гэри Маркус и сотни других. Anthropic заявила, что будет судиться.

🔗 Axios

❯ OpenAI подписала военный контракт — и получила волну удалений

Через несколько часов после того, как Anthropic отказалась от сделки, OpenAI её подхватила. Альтман заявил, что контракт содержит «больше ограничений, чем любой предыдущий» — и те же «красные линии», на которых настаивал Амодей.

Но дьявол в деталях. Ограничения в контракте OpenAI просто ссылаются на действующее законодательство — без отдельных запретов, которых добивалась Anthropic. Разница принципиальная: Anthropic хотела запретить то, что закон пока разрешает. 

Реакция пользователей была моментальная — массовые отмены подписок и удаления ChatGPT в США подскочили на 295% за сутки. Однозвёздочные отзывы в App Store выросли на 775%, пятизвёздочные упали вдвое. 96 сотрудников OpenAI подписали открытое письмо в поддержку позиции Anthropic — не конкурента, а именно его позиции.

1 марта Claude впервые обогнал ChatGPT по ежедневным скачиваниям в США и вышел на первое место в App Store в шести странах, включая Канаду и Германию.

Альтман начал тушить пожар: признал в CNBC, что «со стороны всё выглядело не очень», пообещал внести в контракт явный запрет на слежку за гражданами и заявил, что сядет в тюрьму, если OpenAI прикажут шпионить.

🔗 Axios 🔗 TechCrunch 🔗 CNBC

❯ Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео

24–25 февраля Jerusalem Post провела эксперимент: попросила Claude, Gemini, ChatGPT и Grok назвать конкретную дату возможного удара США по Ирану. Большинство моделей давали диапазоны — конец февраля, начало марта. Grok дважды назвал одну и ту же точную дату: субботу, 28 февраля, привязав её к итогам переговоров в Женеве.

Удары действительно начались в ночь на 28 февраля. Маск расхайпил кейс в X, заявив, что «способность предсказывать будущее — лучшая мера интеллекта». Эксперты охладили пыл: другие модели тоже называли очень близкие даты, окно было узким, так что попадание Grok — скорее удачное совпадение, чем реальная предиктивность.

Но это не всё. В соцсетях разошлось видео с якобы попаданием иранских ракет по Тель-Авиву. OSINT-сообщество быстро нашло типичные артефакты ИИ-генерации — искажённые флаги, здания, машины. 

Пользователи X обратились к Grok за проверкой. Тот сначала подтвердил, что видео реальное, и лишь позже начал давать противоречивые ответы.

Люди, изначально подозревавшие фейк, ссылались на «подтверждение» от Grok — и продолжали распространять ролик. Авторы монетизировали вовлечение через revenue sharing на X. 

После скандала платформа пообещала на 90 дней лишать монетизации за публикацию неотмеченных ИИ-видео о конфликтах. 

🔗 Jerusalem Post 🔗 CBC News

❯ Тема выпуска: рождение компакт-диска

8 марта 1979 года инженеры Philips и Sony показали миру технологию, которая заставила нас забыть о карандашах для перематывания кассет. 

Появление CD стало моментом «сингулярности» для медиа: музыка и данные превратились в последовательность нулей и единиц, считываемых лазером. Это напоминает нам о том, как важен стандарт — именно тогда человечество договорилось, как упаковывать смыслы в цифру. 

Символично, что сегодня нейросети «разбирают» эти терабайты данных обратно на смыслы, но начиналось всё с маленького зеркального круга, который обещал нам вечное качество звука и будущее, сияющее всеми цветами спектра.

❯ Аудиоверсия дайджеста

❯ Заключение

На этой неделе больше внимания привлекла политика. Anthropic отказала Пентагону и получила статус угрозы нацбезопасности, а после OpenAI подписали сделку, но поплатились волной отмен подписок.

По моделям интересно: релиз GPT-5.3 и GPT-5.4, Gemini Flash-Lite за $0,25 за 1М токенов, и открытая серия Qwen3.5 Small для запуска на домашнем железе.

ИИ всё больше сам решает, когда действовать, кого слушать и что считать правдой. Агенты планируют задачи в Notion и пишут отчёты без напоминаний. Grok верит фейковому ИИ-видео, а Block увольняет 40% штата и впервые говорит об этом прямо.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

Читать далее
GPT-5.4 с управлением компьютером, Anthropic и Пентагон, предсказание Grok про Иран и восстание ИИ-агентов

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла напряжённой: OpenAI релизнули GPT-5.3 Instant и GPT-5.4 с управлением ПК, а ещё подписались с Пентагоном, пока Anthropic получила статус «угрозы нацбезопасности». Вышла вторая Nano Banana, а Grok предсказал удар по Ирану и принял ИИ-видео за реальное.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT
  • GPT-5.4 — нативный computer-use, 1M токенов, рекорды на бенчмарках
  • Gemini 3.1 Flash-Lite — $0,25 за миллион токенов для масштабных задач
  • Qwen3.5 Small — серия открытых мультимодалок

*� Генеративные нейросети

  • LTX-2.3 — видео до 4K со звуком 
  • Nano Banana 2 — обновление генератора картинок в Gemini

*� AI-инструменты и платформы

  • Обновление Google Opal
  • Notion 3.3 — кастомные агенты внутри воркспейса
  • Claude Cowork — запланированные задачи и плагины

*� AI в обществе и исследованиях

  • Anthropic против Пентагона 
  • OpenAI подписала военный контракт, пока Anthropic судится
  • Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео
  • Block сократил 40% сотрудников из-за автоматизации

🧠 Модели и LLM

❯ GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT

OpenAI обновила основную модель в ChatGPT — теперь это GPT-5.3 Instant. По сути, патч для самых раздражающих проблем GPT-5.2.

Модель перестала думать вслух перед ответом, убрали бессмысленные отказы и нравоучительный тон в духе «you are absolutely right 👍». Модель лучше держит контекст.

Улучшен поиск — меньше расхождений между найденной информацией и финальным текстом. По внутренним тестам OpenAI галлюцинации сократились на 26,8% при работе с вебом и на 19,7% без него

GPT-5.3 Instant уже доступна бесплатно всем пользователям ChatGPT и стала новым дефолтом. Версии Thinking и Pro выйдут позже. В Enterprise и Edu включается через настройки «Early Model Access».

🔗 Официальный блог OpenAI

❯ GPT-5.4 — нативный computer-use

Ещё один релиз от OpenAI, это GPT-5.4 — новый флагман в двух версиях: Thinking и Pro. Вышла буквально на следующий день после GPT-5.3 Instant.

GPT-5.4 умеет нативно управлять ПК: она водит мышью и вводит с клавиатуры. На бенчмарке OSWorld набрала 75% — выше среднего человека с его 72,4%. Бенч на поиск BrowseComp вырос до 82,7% против 65,7% у GPT-5.2, а Pro-версия поставила рекорд в 89,3%.

Что ещё изменилось:

  • Контекстное окно до 1М токенов. Можно загружать книги, кодовые базы или большие документы
  • Интерактивный Thinking. Модель показывает план работы заранее. Его можно скорректировать прямо в процессе, не начиная заново
  • Эффективность выросла. При работе с MCP-серверами тратит на 47% меньше токенов без потери точности. В Codex появился режим /fast — генерация в 1,5 раза быстрее
  • Галлюцинаций стало меньше на 33% по сравнению с GPT-5.2

Цены API: базовая GPT-5.4 — $2,5 / $15 за миллион токенов на входе и выходе, Pro — $30 / $180. Batch и Flex-режимы вдвое дешевле стандарта.

Модель уже раскатывают всем пользователям ChatGPT, API и Codex.

🔗 Официальный блог OpenAI

❯ Gemini 3.1 Flash-Lite — $0,25 за 1М токенов

Google выпустила Gemini 3.1 Flash-Lite — самую дешёвую модель в линейке Gemini 3, заточенную под тяжёлые задачи.

Скорость до 370–400 токенов в секунду, это на 45% быстрее предыдущего Gemini 2.5 Flash. По качеству идёт примерно на уровне GPT-5 mini, местами чуть лучше — 1432 Elo на Arena.ai, 86,9% на GPQA Diamond и 76,8% на MMMU Pro.

Контекстное окно — 1М токенов, принимает на вход текст, изображения и аудио. Есть динамические уровни размышления: модель сама подстраивает глубину под сложность задачи, чтобы стоимость была под контролем.

Цена — $0,25 / $1,50 за миллион токенов на входе и выходе. Обгоняет GPT-5 mini, Claude 4.5 Haiku и Grok 4.1 Fast по соотношению цена/скорость/качество.

Хорошо показывает себя в задачах на массовые переводы, контент-модерацию, генерацию UI, анализ изображений. Сейчас доступна в preview через Gemini API в AI Studio и Vertex AI.

🔗 Официальный блог Google 🔗 AI Studio 🔗 Vertex AI

❯ Qwen3.5 Small — открытые мультимодальные модели

Alibaba выпустила серию Qwen3.5 Small — четыре открытые модели под лицензией Apache 2.0 на 0.8B, 2B, 4B и 9B параметров. Каждая доступна в версиях instruct и base для дообучения.

Флагман серии Qwen3.5-9B обходит предыдущие Qwen3-VL модели на бенчмарках MMMU, VideoMME и OCRBench — и даже опережает некоторые модели вдвое крупнее. Нативная мультимодальность из коробки: текст, изображения и видео без дополнительных надстроек.

Контекстное окно — 262K токенов нативно, для версий 4B и 9B расширяется до ~1 миллиона через YaRN. Поддерживаются 201 язык и диалект. Под капотом — гибридная архитектура Gated Delta Networks с Gated Attention в соотношении 3:1, которая даёт высокую скорость при низкой задержке.

Модели совместимы с vLLM, SGLang, HuggingFace Transformers и Qwen-Agent с поддержкой MCP. 

9B запускается на потребительских GPU или ноутбуке с 24 ГБ оперативки.

🔗 Коллекция на Hugging Face 🔗 Qwen3.5-9B

🎨 Генеративные нейросети

❯ LTX-2.3 — видео до 4K с нативным звуком от Lightricks

Lightricks обновили свою видеомодель до LTX-2.3. Полностью переработали VAE: текстуры, черты лица и мелкие объекты теперь сохраняют чёткость во всём кадре, особенно заметно при высоком разрешении, где предыдущие версии размывали детали.

Теперь есть нативный звук — эффекты, фоновый шум и диалоги синхронизируются с видеорядом с момента генерации. Есть отдельный режим audio-to-video: загружаешь аудиоклип, модель генерирует под него видео. 

Вертикальный формат 1080×1920 поддерживается нативно, без кропа.

Разрешение до 4K при 24 или 48 FPS, длительность до 20 секунд за один проход. Всего семь режимов — txt2vid, img2vid, aud2vid, extend video, retake video и быстрые версии первых двух. 

Модель открыта под Apache 2.0, поддерживается LoRA fine-tuning и шаблоны ComfyUI.

🔗 Официальный анонс 🔗 Playground 🔗 Веса на Hugging Face 🔗 API

❯ Nano Banana 2 — обновление генератора картинок в Gemini

Google обновила встроенный генератор изображений в Gemini — вышла Nano Banana 2, которая сейчас доступна бесплатно.

Из заметных улучшений: нативное 2K с апскейлом до 4K, улучшили цвета и свет, текст на картинках почти без артефактов. Поддержка до 14 референсов для сохранения внешности персонажей и объектов между кадрами.

Ещё завезли реалтайм веб-поиск: модель сама уходит в интернет за актуальными данными, если они нужны для генерации — например, чтобы нарисовать точную погоду в конкретном месте или актуальный график. Генерация, кстати, до 10 секунд.

Цена API — $0,151 за изображение в 4K, вдвое дешевле Nano Banana Pro. В Google Flow генерация стала бесплатной для всех.

Попробовать можно в приложении Gemini или AI Studio — нужен иностранный IP.

🔗 Официальный анонс 🔗 Gemini 🔗 AI Studio

🔧 AI-инструменты и платформы

❯ Обновление no-code платформы Google Opal

Google Labs обновила конструктор воркфлоу Opal, добавив в него агентный шаг.

Раньше это был обычный drag-and-drop редактор: сам выбираешь модель, прописываешь последовательность шагов. Теперь можно добавить агента — он сам решает, какие инструменты вызвать и в каком порядке. 

Нужно видео — подключит Veo, нужен ресёрч — пойдёт в веб-поиск, не хватает данных — спросит пользователя.

Вместе с агентным шагом появились: persistent memory — контекст сохраняется между сессиями, dynamic routing — условные ветки без кода, и human-in-the-loop — точки, где агент останавливается и ждёт проверки.

🔗 Блог Google 🔗 VentureBeat

❯ Notion 3.3 — кастомные автономные агенты внутри воркспейса

Notion выпустила версию 3.3 с Custom Agents — автономными агентами, которые работают прямо внутри воркспейса без ручного промптинга.

Всё просто: задаёте задачу, триггер или расписание — дальше агент работает сам. 

Автотриаж задач, ежедневные стендапы, внутренний Q&A, очистка инбокса. Агентов можно шарить в команде, настраивать права доступа и подключать к внешним сервисам — Slack, Figma и внутренним базам знаний Notion.

Notion уже сами используют 2 800 агентов внутри компании. Пользователи в раннем доступе создали больше 21 000.

До 3 мая 2026 функция бесплатна. После — потребляет Notion credits, которые докупаются к планам Business и Enterprise.

🔗 Релиз-ноты Notion

❯ В Claude Cowork добавили запланированные задачи и плагины

В Cowork добавили две новые функции: запланированные задачи и плагины.

Теперь Claude может выполнять повторяющиеся задачи по расписанию — утренние брифинги, еженедельные отчёты, обновления таблиц, пятничные презентации. 

Управляется через боковую панель «Scheduled»: там же можно создавать, редактировать, ставить на паузу или запускать задачи вручную. Плагины добавляют экспертизу в дизайне, инженерии и аналитике.

Одно ограничение: задачи работают только при открытом приложении на включённом ПК. Функция доступна на платных планах.

🔗 Подробнее

🧩 AI в обществе и исследованиях

❯ Anthropic против Пентагона — отказ от сделки и статус угрозы нацбезопасности

24 февраля министр обороны США Пит Хегсет лично встретился с Дарио Амодеем и поставил ультиматум: 

  • либо Anthropic до 27 февраля снимает все ограничения на использование Claude в военных целях, 
  • либо компания получает статус «угрозы в цепочке поставок» — и с ней не смогут работать никакие государственные подрядчики.

Anthropic отказалась. Позиция компании: Claude не должен использоваться для массовой слежки за гражданами и управления автономным летальным оружием. Пентагон считает, что использование ИИ регулируется законами США, а не политикой компании.

Реакция последовала быстро. Трамп в Truth Social назвал Anthropic «левыми психами» и запретил использование Claude в любых государственных целях. 

Министр обороны официально присвоил компании статус supply-chain risk — ранее такого удостаивались только фирмы из недружественных стран вроде Huawei. 

Если решение устоит в судах, крупные облачные провайдеры, включая Amazon — ключевого партнёра Anthropic — могут быть вынуждены разорвать с ней контракты.

Волна поддержки Anthropic прокатилась по всей отрасли. Позицию компании публично поддержали Илья Суцкевер, Гэри Маркус и сотни других. Anthropic заявила, что будет судиться.

🔗 Axios

❯ OpenAI подписала военный контракт — и получила волну удалений

Через несколько часов после того, как Anthropic отказалась от сделки, OpenAI её подхватила. Альтман заявил, что контракт содержит «больше ограничений, чем любой предыдущий» — и те же «красные линии», на которых настаивал Амодей.

Но дьявол в деталях. Ограничения в контракте OpenAI просто ссылаются на действующее законодательство — без отдельных запретов, которых добивалась Anthropic. Разница принципиальная: Anthropic хотела запретить то, что закон пока разрешает. 

Реакция пользователей была моментальная — массовые отмены подписок и удаления ChatGPT в США подскочили на 295% за сутки. Однозвёздочные отзывы в App Store выросли на 775%, пятизвёздочные упали вдвое. 96 сотрудников OpenAI подписали открытое письмо в поддержку позиции Anthropic — не конкурента, а именно его позиции.

1 марта Claude впервые обогнал ChatGPT по ежедневным скачиваниям в США и вышел на первое место в App Store в шести странах, включая Канаду и Германию.

Альтман начал тушить пожар: признал в CNBC, что «со стороны всё выглядело не очень», пообещал внести в контракт явный запрет на слежку за гражданами и заявил, что сядет в тюрьму, если OpenAI прикажут шпионить.

🔗 Axios 🔗 TechCrunch 🔗 CNBC

❯ Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео

24–25 февраля Jerusalem Post провела эксперимент: попросила Claude, Gemini, ChatGPT и Grok назвать конкретную дату возможного удара США по Ирану. Большинство моделей давали диапазоны — конец февраля, начало марта. Grok дважды назвал одну и ту же точную дату: субботу, 28 февраля, привязав её к итогам переговоров в Женеве.

Удары действительно начались в ночь на 28 февраля. Маск расхайпил кейс в X, заявив, что «способность предсказывать будущее — лучшая мера интеллекта». Эксперты охладили пыл: другие модели тоже называли очень близкие даты, окно было узким, так что попадание Grok — скорее удачное совпадение, чем реальная предиктивность.

Но это не всё. В соцсетях разошлось видео с якобы попаданием иранских ракет по Тель-Авиву. OSINT-сообщество быстро нашло типичные артефакты ИИ-генерации — искажённые флаги, здания, машины. 

Пользователи X обратились к Grok за проверкой. Тот сначала подтвердил, что видео реальное, и лишь позже начал давать противоречивые ответы.

Люди, изначально подозревавшие фейк, ссылались на «подтверждение» от Grok — и продолжали распространять ролик. Авторы монетизировали вовлечение через revenue sharing на X. 

После скандала платформа пообещала на 90 дней лишать монетизации за публикацию неотмеченных ИИ-видео о конфликтах. 

🔗 Jerusalem Post 🔗 CBC News

❯ Тема выпуска: рождение компакт-диска

8 марта 1979 года инженеры Philips и Sony показали миру технологию, которая заставила нас забыть о карандашах для перематывания кассет. 

Появление CD стало моментом «сингулярности» для медиа: музыка и данные превратились в последовательность нулей и единиц, считываемых лазером. Это напоминает нам о том, как важен стандарт — именно тогда человечество договорилось, как упаковывать смыслы в цифру. 

Символично, что сегодня нейросети «разбирают» эти терабайты данных обратно на смыслы, но начиналось всё с маленького зеркального круга, который обещал нам вечное качество звука и будущее, сияющее всеми цветами спектра.

❯ Аудиоверсия дайджеста

❯ Заключение

На этой неделе больше внимания привлекла политика. Anthropic отказала Пентагону и получила статус угрозы нацбезопасности, а после OpenAI подписали сделку, но поплатились волной отмен подписок.

По моделям интересно: релиз GPT-5.3 и GPT-5.4, Gemini Flash-Lite за $0,25 за 1М токенов, и открытая серия Qwen3.5 Small для запуска на домашнем железе.

ИИ всё больше сам решает, когда действовать, кого слушать и что считать правдой. Агенты планируют задачи в Notion и пишут отчёты без напоминаний. Grok верит фейковому ИИ-видео, а Block увольняет 40% штата и впервые говорит об этом прямо.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

Читать далее
GPT-5.4 с управлением компьютером, Anthropic и Пентагон, предсказание Grok про Иран и восстание ИИ-агентов

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла напряжённой: OpenAI релизнули GPT-5.3 Instant и GPT-5.4 с управлением ПК, а ещё подписались с Пентагоном, пока Anthropic получила статус «угрозы нацбезопасности». Вышла вторая Nano Banana, а Grok предсказал удар по Ирану и принял ИИ-видео за реальное.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT
  • GPT-5.4 — нативный computer-use, 1M токенов, рекорды на бенчмарках
  • Gemini 3.1 Flash-Lite — $0,25 за миллион токенов для масштабных задач
  • Qwen3.5 Small — серия открытых мультимодалок

*� Генеративные нейросети

  • LTX-2.3 — видео до 4K со звуком 
  • Nano Banana 2 — обновление генератора картинок в Gemini

*� AI-инструменты и платформы

  • Обновление Google Opal
  • Notion 3.3 — кастомные агенты внутри воркспейса
  • Claude Cowork — запланированные задачи и плагины

*� AI в обществе и исследованиях

  • Anthropic против Пентагона 
  • OpenAI подписала военный контракт, пока Anthropic судится
  • Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео
  • Block сократил 40% сотрудников из-за автоматизации

🧠 Модели и LLM

❯ GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT

OpenAI обновила основную модель в ChatGPT — теперь это GPT-5.3 Instant. По сути, патч для самых раздражающих проблем GPT-5.2.

Модель перестала думать вслух перед ответом, убрали бессмысленные отказы и нравоучительный тон в духе «you are absolutely right 👍». Модель лучше держит контекст.

Улучшен поиск — меньше расхождений между найденной информацией и финальным текстом. По внутренним тестам OpenAI галлюцинации сократились на 26,8% при работе с вебом и на 19,7% без него

GPT-5.3 Instant уже доступна бесплатно всем пользователям ChatGPT и стала новым дефолтом. Версии Thinking и Pro выйдут позже. В Enterprise и Edu включается через настройки «Early Model Access».

🔗 Официальный блог OpenAI

❯ GPT-5.4 — нативный computer-use

Ещё один релиз от OpenAI, это GPT-5.4 — новый флагман в двух версиях: Thinking и Pro. Вышла буквально на следующий день после GPT-5.3 Instant.

GPT-5.4 умеет нативно управлять ПК: она водит мышью и вводит с клавиатуры. На бенчмарке OSWorld набрала 75% — выше среднего человека с его 72,4%. Бенч на поиск BrowseComp вырос до 82,7% против 65,7% у GPT-5.2, а Pro-версия поставила рекорд в 89,3%.

Что ещё изменилось:

  • Контекстное окно до 1М токенов. Можно загружать книги, кодовые базы или большие документы
  • Интерактивный Thinking. Модель показывает план работы заранее. Его можно скорректировать прямо в процессе, не начиная заново
  • Эффективность выросла. При работе с MCP-серверами тратит на 47% меньше токенов без потери точности. В Codex появился режим /fast — генерация в 1,5 раза быстрее
  • Галлюцинаций стало меньше на 33% по сравнению с GPT-5.2

Цены API: базовая GPT-5.4 — $2,5 / $15 за миллион токенов на входе и выходе, Pro — $30 / $180. Batch и Flex-режимы вдвое дешевле стандарта.

Модель уже раскатывают всем пользователям ChatGPT, API и Codex.

🔗 Официальный блог OpenAI

❯ Gemini 3.1 Flash-Lite — $0,25 за 1М токенов

Google выпустила Gemini 3.1 Flash-Lite — самую дешёвую модель в линейке Gemini 3, заточенную под тяжёлые задачи.

Скорость до 370–400 токенов в секунду, это на 45% быстрее предыдущего Gemini 2.5 Flash. По качеству идёт примерно на уровне GPT-5 mini, местами чуть лучше — 1432 Elo на Arena.ai, 86,9% на GPQA Diamond и 76,8% на MMMU Pro.

Контекстное окно — 1М токенов, принимает на вход текст, изображения и аудио. Есть динамические уровни размышления: модель сама подстраивает глубину под сложность задачи, чтобы стоимость была под контролем.

Цена — $0,25 / $1,50 за миллион токенов на входе и выходе. Обгоняет GPT-5 mini, Claude 4.5 Haiku и Grok 4.1 Fast по соотношению цена/скорость/качество.

Хорошо показывает себя в задачах на массовые переводы, контент-модерацию, генерацию UI, анализ изображений. Сейчас доступна в preview через Gemini API в AI Studio и Vertex AI.

🔗 Официальный блог Google 🔗 AI Studio 🔗 Vertex AI

❯ Qwen3.5 Small — открытые мультимодальные модели

Alibaba выпустила серию Qwen3.5 Small — четыре открытые модели под лицензией Apache 2.0 на 0.8B, 2B, 4B и 9B параметров. Каждая доступна в версиях instruct и base для дообучения.

Флагман серии Qwen3.5-9B обходит предыдущие Qwen3-VL модели на бенчмарках MMMU, VideoMME и OCRBench — и даже опережает некоторые модели вдвое крупнее. Нативная мультимодальность из коробки: текст, изображения и видео без дополнительных надстроек.

Контекстное окно — 262K токенов нативно, для версий 4B и 9B расширяется до ~1 миллиона через YaRN. Поддерживаются 201 язык и диалект. Под капотом — гибридная архитектура Gated Delta Networks с Gated Attention в соотношении 3:1, которая даёт высокую скорость при низкой задержке.

Модели совместимы с vLLM, SGLang, HuggingFace Transformers и Qwen-Agent с поддержкой MCP. 

9B запускается на потребительских GPU или ноутбуке с 24 ГБ оперативки.

🔗 Коллекция на Hugging Face 🔗 Qwen3.5-9B

🎨 Генеративные нейросети

❯ LTX-2.3 — видео до 4K с нативным звуком от Lightricks

Lightricks обновили свою видеомодель до LTX-2.3. Полностью переработали VAE: текстуры, черты лица и мелкие объекты теперь сохраняют чёткость во всём кадре, особенно заметно при высоком разрешении, где предыдущие версии размывали детали.

Теперь есть нативный звук — эффекты, фоновый шум и диалоги синхронизируются с видеорядом с момента генерации. Есть отдельный режим audio-to-video: загружаешь аудиоклип, модель генерирует под него видео. 

Вертикальный формат 1080×1920 поддерживается нативно, без кропа.

Разрешение до 4K при 24 или 48 FPS, длительность до 20 секунд за один проход. Всего семь режимов — txt2vid, img2vid, aud2vid, extend video, retake video и быстрые версии первых двух. 

Модель открыта под Apache 2.0, поддерживается LoRA fine-tuning и шаблоны ComfyUI.

🔗 Официальный анонс 🔗 Playground 🔗 Веса на Hugging Face 🔗 API

❯ Nano Banana 2 — обновление генератора картинок в Gemini

Google обновила встроенный генератор изображений в Gemini — вышла Nano Banana 2, которая сейчас доступна бесплатно.

Из заметных улучшений: нативное 2K с апскейлом до 4K, улучшили цвета и свет, текст на картинках почти без артефактов. Поддержка до 14 референсов для сохранения внешности персонажей и объектов между кадрами.

Ещё завезли реалтайм веб-поиск: модель сама уходит в интернет за актуальными данными, если они нужны для генерации — например, чтобы нарисовать точную погоду в конкретном месте или актуальный график. Генерация, кстати, до 10 секунд.

Цена API — $0,151 за изображение в 4K, вдвое дешевле Nano Banana Pro. В Google Flow генерация стала бесплатной для всех.

Попробовать можно в приложении Gemini или AI Studio — нужен иностранный IP.

🔗 Официальный анонс 🔗 Gemini 🔗 AI Studio

🔧 AI-инструменты и платформы

❯ Обновление no-code платформы Google Opal

Google Labs обновила конструктор воркфлоу Opal, добавив в него агентный шаг.

Раньше это был обычный drag-and-drop редактор: сам выбираешь модель, прописываешь последовательность шагов. Теперь можно добавить агента — он сам решает, какие инструменты вызвать и в каком порядке. 

Нужно видео — подключит Veo, нужен ресёрч — пойдёт в веб-поиск, не хватает данных — спросит пользователя.

Вместе с агентным шагом появились: persistent memory — контекст сохраняется между сессиями, dynamic routing — условные ветки без кода, и human-in-the-loop — точки, где агент останавливается и ждёт проверки.

🔗 Блог Google 🔗 VentureBeat

❯ Notion 3.3 — кастомные автономные агенты внутри воркспейса

Notion выпустила версию 3.3 с Custom Agents — автономными агентами, которые работают прямо внутри воркспейса без ручного промптинга.

Всё просто: задаёте задачу, триггер или расписание — дальше агент работает сам. 

Автотриаж задач, ежедневные стендапы, внутренний Q&A, очистка инбокса. Агентов можно шарить в команде, настраивать права доступа и подключать к внешним сервисам — Slack, Figma и внутренним базам знаний Notion.

Notion уже сами используют 2 800 агентов внутри компании. Пользователи в раннем доступе создали больше 21 000.

До 3 мая 2026 функция бесплатна. После — потребляет Notion credits, которые докупаются к планам Business и Enterprise.

🔗 Релиз-ноты Notion

❯ В Claude Cowork добавили запланированные задачи и плагины

В Cowork добавили две новые функции: запланированные задачи и плагины.

Теперь Claude может выполнять повторяющиеся задачи по расписанию — утренние брифинги, еженедельные отчёты, обновления таблиц, пятничные презентации. 

Управляется через боковую панель «Scheduled»: там же можно создавать, редактировать, ставить на паузу или запускать задачи вручную. Плагины добавляют экспертизу в дизайне, инженерии и аналитике.

Одно ограничение: задачи работают только при открытом приложении на включённом ПК. Функция доступна на платных планах.

🔗 Подробнее

🧩 AI в обществе и исследованиях

❯ Anthropic против Пентагона — отказ от сделки и статус угрозы нацбезопасности

24 февраля министр обороны США Пит Хегсет лично встретился с Дарио Амодеем и поставил ультиматум: 

  • либо Anthropic до 27 февраля снимает все ограничения на использование Claude в военных целях, 
  • либо компания получает статус «угрозы в цепочке поставок» — и с ней не смогут работать никакие государственные подрядчики.

Anthropic отказалась. Позиция компании: Claude не должен использоваться для массовой слежки за гражданами и управления автономным летальным оружием. Пентагон считает, что использование ИИ регулируется законами США, а не политикой компании.

Реакция последовала быстро. Трамп в Truth Social назвал Anthropic «левыми психами» и запретил использование Claude в любых государственных целях. 

Министр обороны официально присвоил компании статус supply-chain risk — ранее такого удостаивались только фирмы из недружественных стран вроде Huawei. 

Если решение устоит в судах, крупные облачные провайдеры, включая Amazon — ключевого партнёра Anthropic — могут быть вынуждены разорвать с ней контракты.

Волна поддержки Anthropic прокатилась по всей отрасли. Позицию компании публично поддержали Илья Суцкевер, Гэри Маркус и сотни других. Anthropic заявила, что будет судиться.

🔗 Axios

❯ OpenAI подписала военный контракт — и получила волну удалений

Через несколько часов после того, как Anthropic отказалась от сделки, OpenAI её подхватила. Альтман заявил, что контракт содержит «больше ограничений, чем любой предыдущий» — и те же «красные линии», на которых настаивал Амодей.

Но дьявол в деталях. Ограничения в контракте OpenAI просто ссылаются на действующее законодательство — без отдельных запретов, которых добивалась Anthropic. Разница принципиальная: Anthropic хотела запретить то, что закон пока разрешает. 

Реакция пользователей была моментальная — массовые отмены подписок и удаления ChatGPT в США подскочили на 295% за сутки. Однозвёздочные отзывы в App Store выросли на 775%, пятизвёздочные упали вдвое. 96 сотрудников OpenAI подписали открытое письмо в поддержку позиции Anthropic — не конкурента, а именно его позиции.

1 марта Claude впервые обогнал ChatGPT по ежедневным скачиваниям в США и вышел на первое место в App Store в шести странах, включая Канаду и Германию.

Альтман начал тушить пожар: признал в CNBC, что «со стороны всё выглядело не очень», пообещал внести в контракт явный запрет на слежку за гражданами и заявил, что сядет в тюрьму, если OpenAI прикажут шпионить.

🔗 Axios 🔗 TechCrunch 🔗 CNBC

❯ Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео

24–25 февраля Jerusalem Post провела эксперимент: попросила Claude, Gemini, ChatGPT и Grok назвать конкретную дату возможного удара США по Ирану. Большинство моделей давали диапазоны — конец февраля, начало марта. Grok дважды назвал одну и ту же точную дату: субботу, 28 февраля, привязав её к итогам переговоров в Женеве.

Удары действительно начались в ночь на 28 февраля. Маск расхайпил кейс в X, заявив, что «способность предсказывать будущее — лучшая мера интеллекта». Эксперты охладили пыл: другие модели тоже называли очень близкие даты, окно было узким, так что попадание Grok — скорее удачное совпадение, чем реальная предиктивность.

Но это не всё. В соцсетях разошлось видео с якобы попаданием иранских ракет по Тель-Авиву. OSINT-сообщество быстро нашло типичные артефакты ИИ-генерации — искажённые флаги, здания, машины. 

Пользователи X обратились к Grok за проверкой. Тот сначала подтвердил, что видео реальное, и лишь позже начал давать противоречивые ответы.

Люди, изначально подозревавшие фейк, ссылались на «подтверждение» от Grok — и продолжали распространять ролик. Авторы монетизировали вовлечение через revenue sharing на X. 

После скандала платформа пообещала на 90 дней лишать монетизации за публикацию неотмеченных ИИ-видео о конфликтах. 

🔗 Jerusalem Post 🔗 CBC News

❯ Тема выпуска: рождение компакт-диска

8 марта 1979 года инженеры Philips и Sony показали миру технологию, которая заставила нас забыть о карандашах для перематывания кассет. 

Появление CD стало моментом «сингулярности» для медиа: музыка и данные превратились в последовательность нулей и единиц, считываемых лазером. Это напоминает нам о том, как важен стандарт — именно тогда человечество договорилось, как упаковывать смыслы в цифру. 

Символично, что сегодня нейросети «разбирают» эти терабайты данных обратно на смыслы, но начиналось всё с маленького зеркального круга, который обещал нам вечное качество звука и будущее, сияющее всеми цветами спектра.

❯ Аудиоверсия дайджеста

❯ Заключение

На этой неделе больше внимания привлекла политика. Anthropic отказала Пентагону и получила статус угрозы нацбезопасности, а после OpenAI подписали сделку, но поплатились волной отмен подписок.

По моделям интересно: релиз GPT-5.3 и GPT-5.4, Gemini Flash-Lite за $0,25 за 1М токенов, и открытая серия Qwen3.5 Small для запуска на домашнем железе.

ИИ всё больше сам решает, когда действовать, кого слушать и что считать правдой. Агенты планируют задачи в Notion и пишут отчёты без напоминаний. Grok верит фейковому ИИ-видео, а Block увольняет 40% штата и впервые говорит об этом прямо.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

Читать далее
GPT-5.4 с управлением компьютером, Anthropic и Пентагон, предсказание Grok про Иран и восстание ИИ-агентов

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла напряжённой: OpenAI релизнули GPT-5.3 Instant и GPT-5.4 с управлением ПК, а ещё подписались с Пентагоном, пока Anthropic получила статус «угрозы нацбезопасности». Вышла вторая Nano Banana, а Grok предсказал удар по Ирану и принял ИИ-видео за реальное.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT
  • GPT-5.4 — нативный computer-use, 1M токенов, рекорды на бенчмарках
  • Gemini 3.1 Flash-Lite — $0,25 за миллион токенов для масштабных задач
  • Qwen3.5 Small — серия открытых мультимодалок

*� Генеративные нейросети

  • LTX-2.3 — видео до 4K со звуком 
  • Nano Banana 2 — обновление генератора картинок в Gemini

*� AI-инструменты и платформы

  • Обновление Google Opal
  • Notion 3.3 — кастомные агенты внутри воркспейса
  • Claude Cowork — запланированные задачи и плагины

*� AI в обществе и исследованиях

  • Anthropic против Пентагона 
  • OpenAI подписала военный контракт, пока Anthropic судится
  • Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео
  • Block сократил 40% сотрудников из-за автоматизации

🧠 Модели и LLM

❯ GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT

OpenAI обновила основную модель в ChatGPT — теперь это GPT-5.3 Instant. По сути, патч для самых раздражающих проблем GPT-5.2.

Модель перестала думать вслух перед ответом, убрали бессмысленные отказы и нравоучительный тон в духе «you are absolutely right 👍». Модель лучше держит контекст.

Улучшен поиск — меньше расхождений между найденной информацией и финальным текстом. По внутренним тестам OpenAI галлюцинации сократились на 26,8% при работе с вебом и на 19,7% без него

GPT-5.3 Instant уже доступна бесплатно всем пользователям ChatGPT и стала новым дефолтом. Версии Thinking и Pro выйдут позже. В Enterprise и Edu включается через настройки «Early Model Access».

🔗 Официальный блог OpenAI

❯ GPT-5.4 — нативный computer-use

Ещё один релиз от OpenAI, это GPT-5.4 — новый флагман в двух версиях: Thinking и Pro. Вышла буквально на следующий день после GPT-5.3 Instant.

GPT-5.4 умеет нативно управлять ПК: она водит мышью и вводит с клавиатуры. На бенчмарке OSWorld набрала 75% — выше среднего человека с его 72,4%. Бенч на поиск BrowseComp вырос до 82,7% против 65,7% у GPT-5.2, а Pro-версия поставила рекорд в 89,3%.

Что ещё изменилось:

  • Контекстное окно до 1М токенов. Можно загружать книги, кодовые базы или большие документы
  • Интерактивный Thinking. Модель показывает план работы заранее. Его можно скорректировать прямо в процессе, не начиная заново
  • Эффективность выросла. При работе с MCP-серверами тратит на 47% меньше токенов без потери точности. В Codex появился режим /fast — генерация в 1,5 раза быстрее
  • Галлюцинаций стало меньше на 33% по сравнению с GPT-5.2

Цены API: базовая GPT-5.4 — $2,5 / $15 за миллион токенов на входе и выходе, Pro — $30 / $180. Batch и Flex-режимы вдвое дешевле стандарта.

Модель уже раскатывают всем пользователям ChatGPT, API и Codex.

🔗 Официальный блог OpenAI

❯ Gemini 3.1 Flash-Lite — $0,25 за 1М токенов

Google выпустила Gemini 3.1 Flash-Lite — самую дешёвую модель в линейке Gemini 3, заточенную под тяжёлые задачи.

Скорость до 370–400 токенов в секунду, это на 45% быстрее предыдущего Gemini 2.5 Flash. По качеству идёт примерно на уровне GPT-5 mini, местами чуть лучше — 1432 Elo на Arena.ai, 86,9% на GPQA Diamond и 76,8% на MMMU Pro.

Контекстное окно — 1М токенов, принимает на вход текст, изображения и аудио. Есть динамические уровни размышления: модель сама подстраивает глубину под сложность задачи, чтобы стоимость была под контролем.

Цена — $0,25 / $1,50 за миллион токенов на входе и выходе. Обгоняет GPT-5 mini, Claude 4.5 Haiku и Grok 4.1 Fast по соотношению цена/скорость/качество.

Хорошо показывает себя в задачах на массовые переводы, контент-модерацию, генерацию UI, анализ изображений. Сейчас доступна в preview через Gemini API в AI Studio и Vertex AI.

🔗 Официальный блог Google 🔗 AI Studio 🔗 Vertex AI

❯ Qwen3.5 Small — открытые мультимодальные модели

Alibaba выпустила серию Qwen3.5 Small — четыре открытые модели под лицензией Apache 2.0 на 0.8B, 2B, 4B и 9B параметров. Каждая доступна в версиях instruct и base для дообучения.

Флагман серии Qwen3.5-9B обходит предыдущие Qwen3-VL модели на бенчмарках MMMU, VideoMME и OCRBench — и даже опережает некоторые модели вдвое крупнее. Нативная мультимодальность из коробки: текст, изображения и видео без дополнительных надстроек.

Контекстное окно — 262K токенов нативно, для версий 4B и 9B расширяется до ~1 миллиона через YaRN. Поддерживаются 201 язык и диалект. Под капотом — гибридная архитектура Gated Delta Networks с Gated Attention в соотношении 3:1, которая даёт высокую скорость при низкой задержке.

Модели совместимы с vLLM, SGLang, HuggingFace Transformers и Qwen-Agent с поддержкой MCP. 

9B запускается на потребительских GPU или ноутбуке с 24 ГБ оперативки.

🔗 Коллекция на Hugging Face 🔗 Qwen3.5-9B

🎨 Генеративные нейросети

❯ LTX-2.3 — видео до 4K с нативным звуком от Lightricks

Lightricks обновили свою видеомодель до LTX-2.3. Полностью переработали VAE: текстуры, черты лица и мелкие объекты теперь сохраняют чёткость во всём кадре, особенно заметно при высоком разрешении, где предыдущие версии размывали детали.

Теперь есть нативный звук — эффекты, фоновый шум и диалоги синхронизируются с видеорядом с момента генерации. Есть отдельный режим audio-to-video: загружаешь аудиоклип, модель генерирует под него видео. 

Вертикальный формат 1080×1920 поддерживается нативно, без кропа.

Разрешение до 4K при 24 или 48 FPS, длительность до 20 секунд за один проход. Всего семь режимов — txt2vid, img2vid, aud2vid, extend video, retake video и быстрые версии первых двух. 

Модель открыта под Apache 2.0, поддерживается LoRA fine-tuning и шаблоны ComfyUI.

🔗 Официальный анонс 🔗 Playground 🔗 Веса на Hugging Face 🔗 API

❯ Nano Banana 2 — обновление генератора картинок в Gemini

Google обновила встроенный генератор изображений в Gemini — вышла Nano Banana 2, которая сейчас доступна бесплатно.

Из заметных улучшений: нативное 2K с апскейлом до 4K, улучшили цвета и свет, текст на картинках почти без артефактов. Поддержка до 14 референсов для сохранения внешности персонажей и объектов между кадрами.

Ещё завезли реалтайм веб-поиск: модель сама уходит в интернет за актуальными данными, если они нужны для генерации — например, чтобы нарисовать точную погоду в конкретном месте или актуальный график. Генерация, кстати, до 10 секунд.

Цена API — $0,151 за изображение в 4K, вдвое дешевле Nano Banana Pro. В Google Flow генерация стала бесплатной для всех.

Попробовать можно в приложении Gemini или AI Studio — нужен иностранный IP.

🔗 Официальный анонс 🔗 Gemini 🔗 AI Studio

🔧 AI-инструменты и платформы

❯ Обновление no-code платформы Google Opal

Google Labs обновила конструктор воркфлоу Opal, добавив в него агентный шаг.

Раньше это был обычный drag-and-drop редактор: сам выбираешь модель, прописываешь последовательность шагов. Теперь можно добавить агента — он сам решает, какие инструменты вызвать и в каком порядке. 

Нужно видео — подключит Veo, нужен ресёрч — пойдёт в веб-поиск, не хватает данных — спросит пользователя.

Вместе с агентным шагом появились: persistent memory — контекст сохраняется между сессиями, dynamic routing — условные ветки без кода, и human-in-the-loop — точки, где агент останавливается и ждёт проверки.

🔗 Блог Google 🔗 VentureBeat

❯ Notion 3.3 — кастомные автономные агенты внутри воркспейса

Notion выпустила версию 3.3 с Custom Agents — автономными агентами, которые работают прямо внутри воркспейса без ручного промптинга.

Всё просто: задаёте задачу, триггер или расписание — дальше агент работает сам. 

Автотриаж задач, ежедневные стендапы, внутренний Q&A, очистка инбокса. Агентов можно шарить в команде, настраивать права доступа и подключать к внешним сервисам — Slack, Figma и внутренним базам знаний Notion.

Notion уже сами используют 2 800 агентов внутри компании. Пользователи в раннем доступе создали больше 21 000.

До 3 мая 2026 функция бесплатна. После — потребляет Notion credits, которые докупаются к планам Business и Enterprise.

🔗 Релиз-ноты Notion

❯ В Claude Cowork добавили запланированные задачи и плагины

В Cowork добавили две новые функции: запланированные задачи и плагины.

Теперь Claude может выполнять повторяющиеся задачи по расписанию — утренние брифинги, еженедельные отчёты, обновления таблиц, пятничные презентации. 

Управляется через боковую панель «Scheduled»: там же можно создавать, редактировать, ставить на паузу или запускать задачи вручную. Плагины добавляют экспертизу в дизайне, инженерии и аналитике.

Одно ограничение: задачи работают только при открытом приложении на включённом ПК. Функция доступна на платных планах.

🔗 Подробнее

🧩 AI в обществе и исследованиях

❯ Anthropic против Пентагона — отказ от сделки и статус угрозы нацбезопасности

24 февраля министр обороны США Пит Хегсет лично встретился с Дарио Амодеем и поставил ультиматум: 

  • либо Anthropic до 27 февраля снимает все ограничения на использование Claude в военных целях, 
  • либо компания получает статус «угрозы в цепочке поставок» — и с ней не смогут работать никакие государственные подрядчики.

Anthropic отказалась. Позиция компании: Claude не должен использоваться для массовой слежки за гражданами и управления автономным летальным оружием. Пентагон считает, что использование ИИ регулируется законами США, а не политикой компании.

Реакция последовала быстро. Трамп в Truth Social назвал Anthropic «левыми психами» и запретил использование Claude в любых государственных целях. 

Министр обороны официально присвоил компании статус supply-chain risk — ранее такого удостаивались только фирмы из недружественных стран вроде Huawei. 

Если решение устоит в судах, крупные облачные провайдеры, включая Amazon — ключевого партнёра Anthropic — могут быть вынуждены разорвать с ней контракты.

Волна поддержки Anthropic прокатилась по всей отрасли. Позицию компании публично поддержали Илья Суцкевер, Гэри Маркус и сотни других. Anthropic заявила, что будет судиться.

🔗 Axios

❯ OpenAI подписала военный контракт — и получила волну удалений

Через несколько часов после того, как Anthropic отказалась от сделки, OpenAI её подхватила. Альтман заявил, что контракт содержит «больше ограничений, чем любой предыдущий» — и те же «красные линии», на которых настаивал Амодей.

Но дьявол в деталях. Ограничения в контракте OpenAI просто ссылаются на действующее законодательство — без отдельных запретов, которых добивалась Anthropic. Разница принципиальная: Anthropic хотела запретить то, что закон пока разрешает. 

Реакция пользователей была моментальная — массовые отмены подписок и удаления ChatGPT в США подскочили на 295% за сутки. Однозвёздочные отзывы в App Store выросли на 775%, пятизвёздочные упали вдвое. 96 сотрудников OpenAI подписали открытое письмо в поддержку позиции Anthropic — не конкурента, а именно его позиции.

1 марта Claude впервые обогнал ChatGPT по ежедневным скачиваниям в США и вышел на первое место в App Store в шести странах, включая Канаду и Германию.

Альтман начал тушить пожар: признал в CNBC, что «со стороны всё выглядело не очень», пообещал внести в контракт явный запрет на слежку за гражданами и заявил, что сядет в тюрьму, если OpenAI прикажут шпионить.

🔗 Axios 🔗 TechCrunch 🔗 CNBC

❯ Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео

24–25 февраля Jerusalem Post провела эксперимент: попросила Claude, Gemini, ChatGPT и Grok назвать конкретную дату возможного удара США по Ирану. Большинство моделей давали диапазоны — конец февраля, начало марта. Grok дважды назвал одну и ту же точную дату: субботу, 28 февраля, привязав её к итогам переговоров в Женеве.

Удары действительно начались в ночь на 28 февраля. Маск расхайпил кейс в X, заявив, что «способность предсказывать будущее — лучшая мера интеллекта». Эксперты охладили пыл: другие модели тоже называли очень близкие даты, окно было узким, так что попадание Grok — скорее удачное совпадение, чем реальная предиктивность.

Но это не всё. В соцсетях разошлось видео с якобы попаданием иранских ракет по Тель-Авиву. OSINT-сообщество быстро нашло типичные артефакты ИИ-генерации — искажённые флаги, здания, машины. 

Пользователи X обратились к Grok за проверкой. Тот сначала подтвердил, что видео реальное, и лишь позже начал давать противоречивые ответы.

Люди, изначально подозревавшие фейк, ссылались на «подтверждение» от Grok — и продолжали распространять ролик. Авторы монетизировали вовлечение через revenue sharing на X. 

После скандала платформа пообещала на 90 дней лишать монетизации за публикацию неотмеченных ИИ-видео о конфликтах. 

🔗 Jerusalem Post 🔗 CBC News

❯ Тема выпуска: рождение компакт-диска

8 марта 1979 года инженеры Philips и Sony показали миру технологию, которая заставила нас забыть о карандашах для перематывания кассет. 

Появление CD стало моментом «сингулярности» для медиа: музыка и данные превратились в последовательность нулей и единиц, считываемых лазером. Это напоминает нам о том, как важен стандарт — именно тогда человечество договорилось, как упаковывать смыслы в цифру. 

Символично, что сегодня нейросети «разбирают» эти терабайты данных обратно на смыслы, но начиналось всё с маленького зеркального круга, который обещал нам вечное качество звука и будущее, сияющее всеми цветами спектра.

❯ Аудиоверсия дайджеста

❯ Заключение

На этой неделе больше внимания привлекла политика. Anthropic отказала Пентагону и получила статус угрозы нацбезопасности, а после OpenAI подписали сделку, но поплатились волной отмен подписок.

По моделям интересно: релиз GPT-5.3 и GPT-5.4, Gemini Flash-Lite за $0,25 за 1М токенов, и открытая серия Qwen3.5 Small для запуска на домашнем железе.

ИИ всё больше сам решает, когда действовать, кого слушать и что считать правдой. Агенты планируют задачи в Notion и пишут отчёты без напоминаний. Grok верит фейковому ИИ-видео, а Block увольняет 40% штата и впервые говорит об этом прямо.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

Читать далее
GPT-5.4 с управлением компьютером, Anthropic и Пентагон, предсказание Grok про Иран и восстание ИИ-агентов

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла напряжённой: OpenAI релизнули GPT-5.3 Instant и GPT-5.4 с управлением ПК, а ещё подписались с Пентагоном, пока Anthropic получила статус «угрозы нацбезопасности». Вышла вторая Nano Banana, а Grok предсказал удар по Ирану и принял ИИ-видео за реальное.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT
  • GPT-5.4 — нативный computer-use, 1M токенов, рекорды на бенчмарках
  • Gemini 3.1 Flash-Lite — $0,25 за миллион токенов для масштабных задач
  • Qwen3.5 Small — серия открытых мультимодалок

*� Генеративные нейросети

  • LTX-2.3 — видео до 4K со звуком 
  • Nano Banana 2 — обновление генератора картинок в Gemini

*� AI-инструменты и платформы

  • Обновление Google Opal
  • Notion 3.3 — кастомные агенты внутри воркспейса
  • Claude Cowork — запланированные задачи и плагины

*� AI в обществе и исследованиях

  • Anthropic против Пентагона 
  • OpenAI подписала военный контракт, пока Anthropic судится
  • Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео
  • Block сократил 40% сотрудников из-за автоматизации

🧠 Модели и LLM

❯ GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT

OpenAI обновила основную модель в ChatGPT — теперь это GPT-5.3 Instant. По сути, патч для самых раздражающих проблем GPT-5.2.

Модель перестала думать вслух перед ответом, убрали бессмысленные отказы и нравоучительный тон в духе «you are absolutely right 👍». Модель лучше держит контекст.

Улучшен поиск — меньше расхождений между найденной информацией и финальным текстом. По внутренним тестам OpenAI галлюцинации сократились на 26,8% при работе с вебом и на 19,7% без него

GPT-5.3 Instant уже доступна бесплатно всем пользователям ChatGPT и стала новым дефолтом. Версии Thinking и Pro выйдут позже. В Enterprise и Edu включается через настройки «Early Model Access».

🔗 Официальный блог OpenAI

❯ GPT-5.4 — нативный computer-use

Ещё один релиз от OpenAI, это GPT-5.4 — новый флагман в двух версиях: Thinking и Pro. Вышла буквально на следующий день после GPT-5.3 Instant.

GPT-5.4 умеет нативно управлять ПК: она водит мышью и вводит с клавиатуры. На бенчмарке OSWorld набрала 75% — выше среднего человека с его 72,4%. Бенч на поиск BrowseComp вырос до 82,7% против 65,7% у GPT-5.2, а Pro-версия поставила рекорд в 89,3%.

Что ещё изменилось:

  • Контекстное окно до 1М токенов. Можно загружать книги, кодовые базы или большие документы
  • Интерактивный Thinking. Модель показывает план работы заранее. Его можно скорректировать прямо в процессе, не начиная заново
  • Эффективность выросла. При работе с MCP-серверами тратит на 47% меньше токенов без потери точности. В Codex появился режим /fast — генерация в 1,5 раза быстрее
  • Галлюцинаций стало меньше на 33% по сравнению с GPT-5.2

Цены API: базовая GPT-5.4 — $2,5 / $15 за миллион токенов на входе и выходе, Pro — $30 / $180. Batch и Flex-режимы вдвое дешевле стандарта.

Модель уже раскатывают всем пользователям ChatGPT, API и Codex.

🔗 Официальный блог OpenAI

❯ Gemini 3.1 Flash-Lite — $0,25 за 1М токенов

Google выпустила Gemini 3.1 Flash-Lite — самую дешёвую модель в линейке Gemini 3, заточенную под тяжёлые задачи.

Скорость до 370–400 токенов в секунду, это на 45% быстрее предыдущего Gemini 2.5 Flash. По качеству идёт примерно на уровне GPT-5 mini, местами чуть лучше — 1432 Elo на Arena.ai, 86,9% на GPQA Diamond и 76,8% на MMMU Pro.

Контекстное окно — 1М токенов, принимает на вход текст, изображения и аудио. Есть динамические уровни размышления: модель сама подстраивает глубину под сложность задачи, чтобы стоимость была под контролем.

Цена — $0,25 / $1,50 за миллион токенов на входе и выходе. Обгоняет GPT-5 mini, Claude 4.5 Haiku и Grok 4.1 Fast по соотношению цена/скорость/качество.

Хорошо показывает себя в задачах на массовые переводы, контент-модерацию, генерацию UI, анализ изображений. Сейчас доступна в preview через Gemini API в AI Studio и Vertex AI.

🔗 Официальный блог Google 🔗 AI Studio 🔗 Vertex AI

❯ Qwen3.5 Small — открытые мультимодальные модели

Alibaba выпустила серию Qwen3.5 Small — четыре открытые модели под лицензией Apache 2.0 на 0.8B, 2B, 4B и 9B параметров. Каждая доступна в версиях instruct и base для дообучения.

Флагман серии Qwen3.5-9B обходит предыдущие Qwen3-VL модели на бенчмарках MMMU, VideoMME и OCRBench — и даже опережает некоторые модели вдвое крупнее. Нативная мультимодальность из коробки: текст, изображения и видео без дополнительных надстроек.

Контекстное окно — 262K токенов нативно, для версий 4B и 9B расширяется до ~1 миллиона через YaRN. Поддерживаются 201 язык и диалект. Под капотом — гибридная архитектура Gated Delta Networks с Gated Attention в соотношении 3:1, которая даёт высокую скорость при низкой задержке.

Модели совместимы с vLLM, SGLang, HuggingFace Transformers и Qwen-Agent с поддержкой MCP. 

9B запускается на потребительских GPU или ноутбуке с 24 ГБ оперативки.

🔗 Коллекция на Hugging Face 🔗 Qwen3.5-9B

🎨 Генеративные нейросети

❯ LTX-2.3 — видео до 4K с нативным звуком от Lightricks

Lightricks обновили свою видеомодель до LTX-2.3. Полностью переработали VAE: текстуры, черты лица и мелкие объекты теперь сохраняют чёткость во всём кадре, особенно заметно при высоком разрешении, где предыдущие версии размывали детали.

Теперь есть нативный звук — эффекты, фоновый шум и диалоги синхронизируются с видеорядом с момента генерации. Есть отдельный режим audio-to-video: загружаешь аудиоклип, модель генерирует под него видео. 

Вертикальный формат 1080×1920 поддерживается нативно, без кропа.

Разрешение до 4K при 24 или 48 FPS, длительность до 20 секунд за один проход. Всего семь режимов — txt2vid, img2vid, aud2vid, extend video, retake video и быстрые версии первых двух. 

Модель открыта под Apache 2.0, поддерживается LoRA fine-tuning и шаблоны ComfyUI.

🔗 Официальный анонс 🔗 Playground 🔗 Веса на Hugging Face 🔗 API

❯ Nano Banana 2 — обновление генератора картинок в Gemini

Google обновила встроенный генератор изображений в Gemini — вышла Nano Banana 2, которая сейчас доступна бесплатно.

Из заметных улучшений: нативное 2K с апскейлом до 4K, улучшили цвета и свет, текст на картинках почти без артефактов. Поддержка до 14 референсов для сохранения внешности персонажей и объектов между кадрами.

Ещё завезли реалтайм веб-поиск: модель сама уходит в интернет за актуальными данными, если они нужны для генерации — например, чтобы нарисовать точную погоду в конкретном месте или актуальный график. Генерация, кстати, до 10 секунд.

Цена API — $0,151 за изображение в 4K, вдвое дешевле Nano Banana Pro. В Google Flow генерация стала бесплатной для всех.

Попробовать можно в приложении Gemini или AI Studio — нужен иностранный IP.

🔗 Официальный анонс 🔗 Gemini 🔗 AI Studio

🔧 AI-инструменты и платформы

❯ Обновление no-code платформы Google Opal

Google Labs обновила конструктор воркфлоу Opal, добавив в него агентный шаг.

Раньше это был обычный drag-and-drop редактор: сам выбираешь модель, прописываешь последовательность шагов. Теперь можно добавить агента — он сам решает, какие инструменты вызвать и в каком порядке. 

Нужно видео — подключит Veo, нужен ресёрч — пойдёт в веб-поиск, не хватает данных — спросит пользователя.

Вместе с агентным шагом появились: persistent memory — контекст сохраняется между сессиями, dynamic routing — условные ветки без кода, и human-in-the-loop — точки, где агент останавливается и ждёт проверки.

🔗 Блог Google 🔗 VentureBeat

❯ Notion 3.3 — кастомные автономные агенты внутри воркспейса

Notion выпустила версию 3.3 с Custom Agents — автономными агентами, которые работают прямо внутри воркспейса без ручного промптинга.

Всё просто: задаёте задачу, триггер или расписание — дальше агент работает сам. 

Автотриаж задач, ежедневные стендапы, внутренний Q&A, очистка инбокса. Агентов можно шарить в команде, настраивать права доступа и подключать к внешним сервисам — Slack, Figma и внутренним базам знаний Notion.

Notion уже сами используют 2 800 агентов внутри компании. Пользователи в раннем доступе создали больше 21 000.

До 3 мая 2026 функция бесплатна. После — потребляет Notion credits, которые докупаются к планам Business и Enterprise.

🔗 Релиз-ноты Notion

❯ В Claude Cowork добавили запланированные задачи и плагины

В Cowork добавили две новые функции: запланированные задачи и плагины.

Теперь Claude может выполнять повторяющиеся задачи по расписанию — утренние брифинги, еженедельные отчёты, обновления таблиц, пятничные презентации. 

Управляется через боковую панель «Scheduled»: там же можно создавать, редактировать, ставить на паузу или запускать задачи вручную. Плагины добавляют экспертизу в дизайне, инженерии и аналитике.

Одно ограничение: задачи работают только при открытом приложении на включённом ПК. Функция доступна на платных планах.

🔗 Подробнее

🧩 AI в обществе и исследованиях

❯ Anthropic против Пентагона — отказ от сделки и статус угрозы нацбезопасности

24 февраля министр обороны США Пит Хегсет лично встретился с Дарио Амодеем и поставил ультиматум: 

  • либо Anthropic до 27 февраля снимает все ограничения на использование Claude в военных целях, 
  • либо компания получает статус «угрозы в цепочке поставок» — и с ней не смогут работать никакие государственные подрядчики.

Anthropic отказалась. Позиция компании: Claude не должен использоваться для массовой слежки за гражданами и управления автономным летальным оружием. Пентагон считает, что использование ИИ регулируется законами США, а не политикой компании.

Реакция последовала быстро. Трамп в Truth Social назвал Anthropic «левыми психами» и запретил использование Claude в любых государственных целях. 

Министр обороны официально присвоил компании статус supply-chain risk — ранее такого удостаивались только фирмы из недружественных стран вроде Huawei. 

Если решение устоит в судах, крупные облачные провайдеры, включая Amazon — ключевого партнёра Anthropic — могут быть вынуждены разорвать с ней контракты.

Волна поддержки Anthropic прокатилась по всей отрасли. Позицию компании публично поддержали Илья Суцкевер, Гэри Маркус и сотни других. Anthropic заявила, что будет судиться.

🔗 Axios

❯ OpenAI подписала военный контракт — и получила волну удалений

Через несколько часов после того, как Anthropic отказалась от сделки, OpenAI её подхватила. Альтман заявил, что контракт содержит «больше ограничений, чем любой предыдущий» — и те же «красные линии», на которых настаивал Амодей.

Но дьявол в деталях. Ограничения в контракте OpenAI просто ссылаются на действующее законодательство — без отдельных запретов, которых добивалась Anthropic. Разница принципиальная: Anthropic хотела запретить то, что закон пока разрешает. 

Реакция пользователей была моментальная — массовые отмены подписок и удаления ChatGPT в США подскочили на 295% за сутки. Однозвёздочные отзывы в App Store выросли на 775%, пятизвёздочные упали вдвое. 96 сотрудников OpenAI подписали открытое письмо в поддержку позиции Anthropic — не конкурента, а именно его позиции.

1 марта Claude впервые обогнал ChatGPT по ежедневным скачиваниям в США и вышел на первое место в App Store в шести странах, включая Канаду и Германию.

Альтман начал тушить пожар: признал в CNBC, что «со стороны всё выглядело не очень», пообещал внести в контракт явный запрет на слежку за гражданами и заявил, что сядет в тюрьму, если OpenAI прикажут шпионить.

🔗 Axios 🔗 TechCrunch 🔗 CNBC

❯ Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео

24–25 февраля Jerusalem Post провела эксперимент: попросила Claude, Gemini, ChatGPT и Grok назвать конкретную дату возможного удара США по Ирану. Большинство моделей давали диапазоны — конец февраля, начало марта. Grok дважды назвал одну и ту же точную дату: субботу, 28 февраля, привязав её к итогам переговоров в Женеве.

Удары действительно начались в ночь на 28 февраля. Маск расхайпил кейс в X, заявив, что «способность предсказывать будущее — лучшая мера интеллекта». Эксперты охладили пыл: другие модели тоже называли очень близкие даты, окно было узким, так что попадание Grok — скорее удачное совпадение, чем реальная предиктивность.

Но это не всё. В соцсетях разошлось видео с якобы попаданием иранских ракет по Тель-Авиву. OSINT-сообщество быстро нашло типичные артефакты ИИ-генерации — искажённые флаги, здания, машины. 

Пользователи X обратились к Grok за проверкой. Тот сначала подтвердил, что видео реальное, и лишь позже начал давать противоречивые ответы.

Люди, изначально подозревавшие фейк, ссылались на «подтверждение» от Grok — и продолжали распространять ролик. Авторы монетизировали вовлечение через revenue sharing на X. 

После скандала платформа пообещала на 90 дней лишать монетизации за публикацию неотмеченных ИИ-видео о конфликтах. 

🔗 Jerusalem Post 🔗 CBC News

❯ Тема выпуска: рождение компакт-диска

8 марта 1979 года инженеры Philips и Sony показали миру технологию, которая заставила нас забыть о карандашах для перематывания кассет. 

Появление CD стало моментом «сингулярности» для медиа: музыка и данные превратились в последовательность нулей и единиц, считываемых лазером. Это напоминает нам о том, как важен стандарт — именно тогда человечество договорилось, как упаковывать смыслы в цифру. 

Символично, что сегодня нейросети «разбирают» эти терабайты данных обратно на смыслы, но начиналось всё с маленького зеркального круга, который обещал нам вечное качество звука и будущее, сияющее всеми цветами спектра.

❯ Аудиоверсия дайджеста

❯ Заключение

На этой неделе больше внимания привлекла политика. Anthropic отказала Пентагону и получила статус угрозы нацбезопасности, а после OpenAI подписали сделку, но поплатились волной отмен подписок.

По моделям интересно: релиз GPT-5.3 и GPT-5.4, Gemini Flash-Lite за $0,25 за 1М токенов, и открытая серия Qwen3.5 Small для запуска на домашнем железе.

ИИ всё больше сам решает, когда действовать, кого слушать и что считать правдой. Агенты планируют задачи в Notion и пишут отчёты без напоминаний. Grok верит фейковому ИИ-видео, а Block увольняет 40% штата и впервые говорит об этом прямо.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

Читать далее
GPT-5.4 с управлением компьютером, Anthropic и Пентагон, предсказание Grok про Иран и восстание ИИ-агентов

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла напряжённой: OpenAI релизнули GPT-5.3 Instant и GPT-5.4 с управлением ПК, а ещё подписались с Пентагоном, пока Anthropic получила статус «угрозы нацбезопасности». Вышла вторая Nano Banana, а Grok предсказал удар по Ирану и принял ИИ-видео за реальное.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT
  • GPT-5.4 — нативный computer-use, 1M токенов, рекорды на бенчмарках
  • Gemini 3.1 Flash-Lite — $0,25 за миллион токенов для масштабных задач
  • Qwen3.5 Small — серия открытых мультимодалок

*� Генеративные нейросети

  • LTX-2.3 — видео до 4K со звуком 
  • Nano Banana 2 — обновление генератора картинок в Gemini

*� AI-инструменты и платформы

  • Обновление Google Opal
  • Notion 3.3 — кастомные агенты внутри воркспейса
  • Claude Cowork — запланированные задачи и плагины

*� AI в обществе и исследованиях

  • Anthropic против Пентагона 
  • OpenAI подписала военный контракт, пока Anthropic судится
  • Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео
  • Block сократил 40% сотрудников из-за автоматизации

🧠 Модели и LLM

❯ GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT

OpenAI обновила основную модель в ChatGPT — теперь это GPT-5.3 Instant. По сути, патч для самых раздражающих проблем GPT-5.2.

Модель перестала думать вслух перед ответом, убрали бессмысленные отказы и нравоучительный тон в духе «you are absolutely right 👍». Модель лучше держит контекст.

Улучшен поиск — меньше расхождений между найденной информацией и финальным текстом. По внутренним тестам OpenAI галлюцинации сократились на 26,8% при работе с вебом и на 19,7% без него

GPT-5.3 Instant уже доступна бесплатно всем пользователям ChatGPT и стала новым дефолтом. Версии Thinking и Pro выйдут позже. В Enterprise и Edu включается через настройки «Early Model Access».

🔗 Официальный блог OpenAI

❯ GPT-5.4 — нативный computer-use

Ещё один релиз от OpenAI, это GPT-5.4 — новый флагман в двух версиях: Thinking и Pro. Вышла буквально на следующий день после GPT-5.3 Instant.

GPT-5.4 умеет нативно управлять ПК: она водит мышью и вводит с клавиатуры. На бенчмарке OSWorld набрала 75% — выше среднего человека с его 72,4%. Бенч на поиск BrowseComp вырос до 82,7% против 65,7% у GPT-5.2, а Pro-версия поставила рекорд в 89,3%.

Что ещё изменилось:

  • Контекстное окно до 1М токенов. Можно загружать книги, кодовые базы или большие документы
  • Интерактивный Thinking. Модель показывает план работы заранее. Его можно скорректировать прямо в процессе, не начиная заново
  • Эффективность выросла. При работе с MCP-серверами тратит на 47% меньше токенов без потери точности. В Codex появился режим /fast — генерация в 1,5 раза быстрее
  • Галлюцинаций стало меньше на 33% по сравнению с GPT-5.2

Цены API: базовая GPT-5.4 — $2,5 / $15 за миллион токенов на входе и выходе, Pro — $30 / $180. Batch и Flex-режимы вдвое дешевле стандарта.

Модель уже раскатывают всем пользователям ChatGPT, API и Codex.

🔗 Официальный блог OpenAI

❯ Gemini 3.1 Flash-Lite — $0,25 за 1М токенов

Google выпустила Gemini 3.1 Flash-Lite — самую дешёвую модель в линейке Gemini 3, заточенную под тяжёлые задачи.

Скорость до 370–400 токенов в секунду, это на 45% быстрее предыдущего Gemini 2.5 Flash. По качеству идёт примерно на уровне GPT-5 mini, местами чуть лучше — 1432 Elo на Arena.ai, 86,9% на GPQA Diamond и 76,8% на MMMU Pro.

Контекстное окно — 1М токенов, принимает на вход текст, изображения и аудио. Есть динамические уровни размышления: модель сама подстраивает глубину под сложность задачи, чтобы стоимость была под контролем.

Цена — $0,25 / $1,50 за миллион токенов на входе и выходе. Обгоняет GPT-5 mini, Claude 4.5 Haiku и Grok 4.1 Fast по соотношению цена/скорость/качество.

Хорошо показывает себя в задачах на массовые переводы, контент-модерацию, генерацию UI, анализ изображений. Сейчас доступна в preview через Gemini API в AI Studio и Vertex AI.

🔗 Официальный блог Google 🔗 AI Studio 🔗 Vertex AI

❯ Qwen3.5 Small — открытые мультимодальные модели

Alibaba выпустила серию Qwen3.5 Small — четыре открытые модели под лицензией Apache 2.0 на 0.8B, 2B, 4B и 9B параметров. Каждая доступна в версиях instruct и base для дообучения.

Флагман серии Qwen3.5-9B обходит предыдущие Qwen3-VL модели на бенчмарках MMMU, VideoMME и OCRBench — и даже опережает некоторые модели вдвое крупнее. Нативная мультимодальность из коробки: текст, изображения и видео без дополнительных надстроек.

Контекстное окно — 262K токенов нативно, для версий 4B и 9B расширяется до ~1 миллиона через YaRN. Поддерживаются 201 язык и диалект. Под капотом — гибридная архитектура Gated Delta Networks с Gated Attention в соотношении 3:1, которая даёт высокую скорость при низкой задержке.

Модели совместимы с vLLM, SGLang, HuggingFace Transformers и Qwen-Agent с поддержкой MCP. 

9B запускается на потребительских GPU или ноутбуке с 24 ГБ оперативки.

🔗 Коллекция на Hugging Face 🔗 Qwen3.5-9B

🎨 Генеративные нейросети

❯ LTX-2.3 — видео до 4K с нативным звуком от Lightricks

Lightricks обновили свою видеомодель до LTX-2.3. Полностью переработали VAE: текстуры, черты лица и мелкие объекты теперь сохраняют чёткость во всём кадре, особенно заметно при высоком разрешении, где предыдущие версии размывали детали.

Теперь есть нативный звук — эффекты, фоновый шум и диалоги синхронизируются с видеорядом с момента генерации. Есть отдельный режим audio-to-video: загружаешь аудиоклип, модель генерирует под него видео. 

Вертикальный формат 1080×1920 поддерживается нативно, без кропа.

Разрешение до 4K при 24 или 48 FPS, длительность до 20 секунд за один проход. Всего семь режимов — txt2vid, img2vid, aud2vid, extend video, retake video и быстрые версии первых двух. 

Модель открыта под Apache 2.0, поддерживается LoRA fine-tuning и шаблоны ComfyUI.

🔗 Официальный анонс 🔗 Playground 🔗 Веса на Hugging Face 🔗 API

❯ Nano Banana 2 — обновление генератора картинок в Gemini

Google обновила встроенный генератор изображений в Gemini — вышла Nano Banana 2, которая сейчас доступна бесплатно.

Из заметных улучшений: нативное 2K с апскейлом до 4K, улучшили цвета и свет, текст на картинках почти без артефактов. Поддержка до 14 референсов для сохранения внешности персонажей и объектов между кадрами.

Ещё завезли реалтайм веб-поиск: модель сама уходит в интернет за актуальными данными, если они нужны для генерации — например, чтобы нарисовать точную погоду в конкретном месте или актуальный график. Генерация, кстати, до 10 секунд.

Цена API — $0,151 за изображение в 4K, вдвое дешевле Nano Banana Pro. В Google Flow генерация стала бесплатной для всех.

Попробовать можно в приложении Gemini или AI Studio — нужен иностранный IP.

🔗 Официальный анонс 🔗 Gemini 🔗 AI Studio

🔧 AI-инструменты и платформы

❯ Обновление no-code платформы Google Opal

Google Labs обновила конструктор воркфлоу Opal, добавив в него агентный шаг.

Раньше это был обычный drag-and-drop редактор: сам выбираешь модель, прописываешь последовательность шагов. Теперь можно добавить агента — он сам решает, какие инструменты вызвать и в каком порядке. 

Нужно видео — подключит Veo, нужен ресёрч — пойдёт в веб-поиск, не хватает данных — спросит пользователя.

Вместе с агентным шагом появились: persistent memory — контекст сохраняется между сессиями, dynamic routing — условные ветки без кода, и human-in-the-loop — точки, где агент останавливается и ждёт проверки.

🔗 Блог Google 🔗 VentureBeat

❯ Notion 3.3 — кастомные автономные агенты внутри воркспейса

Notion выпустила версию 3.3 с Custom Agents — автономными агентами, которые работают прямо внутри воркспейса без ручного промптинга.

Всё просто: задаёте задачу, триггер или расписание — дальше агент работает сам. 

Автотриаж задач, ежедневные стендапы, внутренний Q&A, очистка инбокса. Агентов можно шарить в команде, настраивать права доступа и подключать к внешним сервисам — Slack, Figma и внутренним базам знаний Notion.

Notion уже сами используют 2 800 агентов внутри компании. Пользователи в раннем доступе создали больше 21 000.

До 3 мая 2026 функция бесплатна. После — потребляет Notion credits, которые докупаются к планам Business и Enterprise.

🔗 Релиз-ноты Notion

❯ В Claude Cowork добавили запланированные задачи и плагины

В Cowork добавили две новые функции: запланированные задачи и плагины.

Теперь Claude может выполнять повторяющиеся задачи по расписанию — утренние брифинги, еженедельные отчёты, обновления таблиц, пятничные презентации. 

Управляется через боковую панель «Scheduled»: там же можно создавать, редактировать, ставить на паузу или запускать задачи вручную. Плагины добавляют экспертизу в дизайне, инженерии и аналитике.

Одно ограничение: задачи работают только при открытом приложении на включённом ПК. Функция доступна на платных планах.

🔗 Подробнее

🧩 AI в обществе и исследованиях

❯ Anthropic против Пентагона — отказ от сделки и статус угрозы нацбезопасности

24 февраля министр обороны США Пит Хегсет лично встретился с Дарио Амодеем и поставил ультиматум: 

  • либо Anthropic до 27 февраля снимает все ограничения на использование Claude в военных целях, 
  • либо компания получает статус «угрозы в цепочке поставок» — и с ней не смогут работать никакие государственные подрядчики.

Anthropic отказалась. Позиция компании: Claude не должен использоваться для массовой слежки за гражданами и управления автономным летальным оружием. Пентагон считает, что использование ИИ регулируется законами США, а не политикой компании.

Реакция последовала быстро. Трамп в Truth Social назвал Anthropic «левыми психами» и запретил использование Claude в любых государственных целях. 

Министр обороны официально присвоил компании статус supply-chain risk — ранее такого удостаивались только фирмы из недружественных стран вроде Huawei. 

Если решение устоит в судах, крупные облачные провайдеры, включая Amazon — ключевого партнёра Anthropic — могут быть вынуждены разорвать с ней контракты.

Волна поддержки Anthropic прокатилась по всей отрасли. Позицию компании публично поддержали Илья Суцкевер, Гэри Маркус и сотни других. Anthropic заявила, что будет судиться.

🔗 Axios

❯ OpenAI подписала военный контракт — и получила волну удалений

Через несколько часов после того, как Anthropic отказалась от сделки, OpenAI её подхватила. Альтман заявил, что контракт содержит «больше ограничений, чем любой предыдущий» — и те же «красные линии», на которых настаивал Амодей.

Но дьявол в деталях. Ограничения в контракте OpenAI просто ссылаются на действующее законодательство — без отдельных запретов, которых добивалась Anthropic. Разница принципиальная: Anthropic хотела запретить то, что закон пока разрешает. 

Реакция пользователей была моментальная — массовые отмены подписок и удаления ChatGPT в США подскочили на 295% за сутки. Однозвёздочные отзывы в App Store выросли на 775%, пятизвёздочные упали вдвое. 96 сотрудников OpenAI подписали открытое письмо в поддержку позиции Anthropic — не конкурента, а именно его позиции.

1 марта Claude впервые обогнал ChatGPT по ежедневным скачиваниям в США и вышел на первое место в App Store в шести странах, включая Канаду и Германию.

Альтман начал тушить пожар: признал в CNBC, что «со стороны всё выглядело не очень», пообещал внести в контракт явный запрет на слежку за гражданами и заявил, что сядет в тюрьму, если OpenAI прикажут шпионить.

🔗 Axios 🔗 TechCrunch 🔗 CNBC

❯ Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео

24–25 февраля Jerusalem Post провела эксперимент: попросила Claude, Gemini, ChatGPT и Grok назвать конкретную дату возможного удара США по Ирану. Большинство моделей давали диапазоны — конец февраля, начало марта. Grok дважды назвал одну и ту же точную дату: субботу, 28 февраля, привязав её к итогам переговоров в Женеве.

Удары действительно начались в ночь на 28 февраля. Маск расхайпил кейс в X, заявив, что «способность предсказывать будущее — лучшая мера интеллекта». Эксперты охладили пыл: другие модели тоже называли очень близкие даты, окно было узким, так что попадание Grok — скорее удачное совпадение, чем реальная предиктивность.

Но это не всё. В соцсетях разошлось видео с якобы попаданием иранских ракет по Тель-Авиву. OSINT-сообщество быстро нашло типичные артефакты ИИ-генерации — искажённые флаги, здания, машины. 

Пользователи X обратились к Grok за проверкой. Тот сначала подтвердил, что видео реальное, и лишь позже начал давать противоречивые ответы.

Люди, изначально подозревавшие фейк, ссылались на «подтверждение» от Grok — и продолжали распространять ролик. Авторы монетизировали вовлечение через revenue sharing на X. 

После скандала платформа пообещала на 90 дней лишать монетизации за публикацию неотмеченных ИИ-видео о конфликтах. 

🔗 Jerusalem Post 🔗 CBC News

❯ Тема выпуска: рождение компакт-диска

8 марта 1979 года инженеры Philips и Sony показали миру технологию, которая заставила нас забыть о карандашах для перематывания кассет. 

Появление CD стало моментом «сингулярности» для медиа: музыка и данные превратились в последовательность нулей и единиц, считываемых лазером. Это напоминает нам о том, как важен стандарт — именно тогда человечество договорилось, как упаковывать смыслы в цифру. 

Символично, что сегодня нейросети «разбирают» эти терабайты данных обратно на смыслы, но начиналось всё с маленького зеркального круга, который обещал нам вечное качество звука и будущее, сияющее всеми цветами спектра.

❯ Аудиоверсия дайджеста

❯ Заключение

На этой неделе больше внимания привлекла политика. Anthropic отказала Пентагону и получила статус угрозы нацбезопасности, а после OpenAI подписали сделку, но поплатились волной отмен подписок.

По моделям интересно: релиз GPT-5.3 и GPT-5.4, Gemini Flash-Lite за $0,25 за 1М токенов, и открытая серия Qwen3.5 Small для запуска на домашнем железе.

ИИ всё больше сам решает, когда действовать, кого слушать и что считать правдой. Агенты планируют задачи в Notion и пишут отчёты без напоминаний. Grok верит фейковому ИИ-видео, а Block увольняет 40% штата и впервые говорит об этом прямо.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

Читать далее
GPT-5.4 с управлением компьютером, Anthropic и Пентагон, предсказание Grok про Иран и восстание ИИ-агентов

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла напряжённой: OpenAI релизнули GPT-5.3 Instant и GPT-5.4 с управлением ПК, а ещё подписались с Пентагоном, пока Anthropic получила статус «угрозы нацбезопасности». Вышла вторая Nano Banana, а Grok предсказал удар по Ирану и принял ИИ-видео за реальное.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT
  • GPT-5.4 — нативный computer-use, 1M токенов, рекорды на бенчмарках
  • Gemini 3.1 Flash-Lite — $0,25 за миллион токенов для масштабных задач
  • Qwen3.5 Small — серия открытых мультимодалок

*� Генеративные нейросети

  • LTX-2.3 — видео до 4K со звуком 
  • Nano Banana 2 — обновление генератора картинок в Gemini

*� AI-инструменты и платформы

  • Обновление Google Opal
  • Notion 3.3 — кастомные агенты внутри воркспейса
  • Claude Cowork — запланированные задачи и плагины

*� AI в обществе и исследованиях

  • Anthropic против Пентагона 
  • OpenAI подписала военный контракт, пока Anthropic судится
  • Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео
  • Block сократил 40% сотрудников из-за автоматизации

🧠 Модели и LLM

❯ GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT

OpenAI обновила основную модель в ChatGPT — теперь это GPT-5.3 Instant. По сути, патч для самых раздражающих проблем GPT-5.2.

Модель перестала думать вслух перед ответом, убрали бессмысленные отказы и нравоучительный тон в духе «you are absolutely right 👍». Модель лучше держит контекст.

Улучшен поиск — меньше расхождений между найденной информацией и финальным текстом. По внутренним тестам OpenAI галлюцинации сократились на 26,8% при работе с вебом и на 19,7% без него

GPT-5.3 Instant уже доступна бесплатно всем пользователям ChatGPT и стала новым дефолтом. Версии Thinking и Pro выйдут позже. В Enterprise и Edu включается через настройки «Early Model Access».

🔗 Официальный блог OpenAI

❯ GPT-5.4 — нативный computer-use

Ещё один релиз от OpenAI, это GPT-5.4 — новый флагман в двух версиях: Thinking и Pro. Вышла буквально на следующий день после GPT-5.3 Instant.

GPT-5.4 умеет нативно управлять ПК: она водит мышью и вводит с клавиатуры. На бенчмарке OSWorld набрала 75% — выше среднего человека с его 72,4%. Бенч на поиск BrowseComp вырос до 82,7% против 65,7% у GPT-5.2, а Pro-версия поставила рекорд в 89,3%.

Что ещё изменилось:

  • Контекстное окно до 1М токенов. Можно загружать книги, кодовые базы или большие документы
  • Интерактивный Thinking. Модель показывает план работы заранее. Его можно скорректировать прямо в процессе, не начиная заново
  • Эффективность выросла. При работе с MCP-серверами тратит на 47% меньше токенов без потери точности. В Codex появился режим /fast — генерация в 1,5 раза быстрее
  • Галлюцинаций стало меньше на 33% по сравнению с GPT-5.2

Цены API: базовая GPT-5.4 — $2,5 / $15 за миллион токенов на входе и выходе, Pro — $30 / $180. Batch и Flex-режимы вдвое дешевле стандарта.

Модель уже раскатывают всем пользователям ChatGPT, API и Codex.

🔗 Официальный блог OpenAI

❯ Gemini 3.1 Flash-Lite — $0,25 за 1М токенов

Google выпустила Gemini 3.1 Flash-Lite — самую дешёвую модель в линейке Gemini 3, заточенную под тяжёлые задачи.

Скорость до 370–400 токенов в секунду, это на 45% быстрее предыдущего Gemini 2.5 Flash. По качеству идёт примерно на уровне GPT-5 mini, местами чуть лучше — 1432 Elo на Arena.ai, 86,9% на GPQA Diamond и 76,8% на MMMU Pro.

Контекстное окно — 1М токенов, принимает на вход текст, изображения и аудио. Есть динамические уровни размышления: модель сама подстраивает глубину под сложность задачи, чтобы стоимость была под контролем.

Цена — $0,25 / $1,50 за миллион токенов на входе и выходе. Обгоняет GPT-5 mini, Claude 4.5 Haiku и Grok 4.1 Fast по соотношению цена/скорость/качество.

Хорошо показывает себя в задачах на массовые переводы, контент-модерацию, генерацию UI, анализ изображений. Сейчас доступна в preview через Gemini API в AI Studio и Vertex AI.

🔗 Официальный блог Google 🔗 AI Studio 🔗 Vertex AI

❯ Qwen3.5 Small — открытые мультимодальные модели

Alibaba выпустила серию Qwen3.5 Small — четыре открытые модели под лицензией Apache 2.0 на 0.8B, 2B, 4B и 9B параметров. Каждая доступна в версиях instruct и base для дообучения.

Флагман серии Qwen3.5-9B обходит предыдущие Qwen3-VL модели на бенчмарках MMMU, VideoMME и OCRBench — и даже опережает некоторые модели вдвое крупнее. Нативная мультимодальность из коробки: текст, изображения и видео без дополнительных надстроек.

Контекстное окно — 262K токенов нативно, для версий 4B и 9B расширяется до ~1 миллиона через YaRN. Поддерживаются 201 язык и диалект. Под капотом — гибридная архитектура Gated Delta Networks с Gated Attention в соотношении 3:1, которая даёт высокую скорость при низкой задержке.

Модели совместимы с vLLM, SGLang, HuggingFace Transformers и Qwen-Agent с поддержкой MCP. 

9B запускается на потребительских GPU или ноутбуке с 24 ГБ оперативки.

🔗 Коллекция на Hugging Face 🔗 Qwen3.5-9B

🎨 Генеративные нейросети

❯ LTX-2.3 — видео до 4K с нативным звуком от Lightricks

Lightricks обновили свою видеомодель до LTX-2.3. Полностью переработали VAE: текстуры, черты лица и мелкие объекты теперь сохраняют чёткость во всём кадре, особенно заметно при высоком разрешении, где предыдущие версии размывали детали.

Теперь есть нативный звук — эффекты, фоновый шум и диалоги синхронизируются с видеорядом с момента генерации. Есть отдельный режим audio-to-video: загружаешь аудиоклип, модель генерирует под него видео. 

Вертикальный формат 1080×1920 поддерживается нативно, без кропа.

Разрешение до 4K при 24 или 48 FPS, длительность до 20 секунд за один проход. Всего семь режимов — txt2vid, img2vid, aud2vid, extend video, retake video и быстрые версии первых двух. 

Модель открыта под Apache 2.0, поддерживается LoRA fine-tuning и шаблоны ComfyUI.

🔗 Официальный анонс 🔗 Playground 🔗 Веса на Hugging Face 🔗 API

❯ Nano Banana 2 — обновление генератора картинок в Gemini

Google обновила встроенный генератор изображений в Gemini — вышла Nano Banana 2, которая сейчас доступна бесплатно.

Из заметных улучшений: нативное 2K с апскейлом до 4K, улучшили цвета и свет, текст на картинках почти без артефактов. Поддержка до 14 референсов для сохранения внешности персонажей и объектов между кадрами.

Ещё завезли реалтайм веб-поиск: модель сама уходит в интернет за актуальными данными, если они нужны для генерации — например, чтобы нарисовать точную погоду в конкретном месте или актуальный график. Генерация, кстати, до 10 секунд.

Цена API — $0,151 за изображение в 4K, вдвое дешевле Nano Banana Pro. В Google Flow генерация стала бесплатной для всех.

Попробовать можно в приложении Gemini или AI Studio — нужен иностранный IP.

🔗 Официальный анонс 🔗 Gemini 🔗 AI Studio

🔧 AI-инструменты и платформы

❯ Обновление no-code платформы Google Opal

Google Labs обновила конструктор воркфлоу Opal, добавив в него агентный шаг.

Раньше это был обычный drag-and-drop редактор: сам выбираешь модель, прописываешь последовательность шагов. Теперь можно добавить агента — он сам решает, какие инструменты вызвать и в каком порядке. 

Нужно видео — подключит Veo, нужен ресёрч — пойдёт в веб-поиск, не хватает данных — спросит пользователя.

Вместе с агентным шагом появились: persistent memory — контекст сохраняется между сессиями, dynamic routing — условные ветки без кода, и human-in-the-loop — точки, где агент останавливается и ждёт проверки.

🔗 Блог Google 🔗 VentureBeat

❯ Notion 3.3 — кастомные автономные агенты внутри воркспейса

Notion выпустила версию 3.3 с Custom Agents — автономными агентами, которые работают прямо внутри воркспейса без ручного промптинга.

Всё просто: задаёте задачу, триггер или расписание — дальше агент работает сам. 

Автотриаж задач, ежедневные стендапы, внутренний Q&A, очистка инбокса. Агентов можно шарить в команде, настраивать права доступа и подключать к внешним сервисам — Slack, Figma и внутренним базам знаний Notion.

Notion уже сами используют 2 800 агентов внутри компании. Пользователи в раннем доступе создали больше 21 000.

До 3 мая 2026 функция бесплатна. После — потребляет Notion credits, которые докупаются к планам Business и Enterprise.

🔗 Релиз-ноты Notion

❯ В Claude Cowork добавили запланированные задачи и плагины

В Cowork добавили две новые функции: запланированные задачи и плагины.

Теперь Claude может выполнять повторяющиеся задачи по расписанию — утренние брифинги, еженедельные отчёты, обновления таблиц, пятничные презентации. 

Управляется через боковую панель «Scheduled»: там же можно создавать, редактировать, ставить на паузу или запускать задачи вручную. Плагины добавляют экспертизу в дизайне, инженерии и аналитике.

Одно ограничение: задачи работают только при открытом приложении на включённом ПК. Функция доступна на платных планах.

🔗 Подробнее

🧩 AI в обществе и исследованиях

❯ Anthropic против Пентагона — отказ от сделки и статус угрозы нацбезопасности

24 февраля министр обороны США Пит Хегсет лично встретился с Дарио Амодеем и поставил ультиматум: 

  • либо Anthropic до 27 февраля снимает все ограничения на использование Claude в военных целях, 
  • либо компания получает статус «угрозы в цепочке поставок» — и с ней не смогут работать никакие государственные подрядчики.

Anthropic отказалась. Позиция компании: Claude не должен использоваться для массовой слежки за гражданами и управления автономным летальным оружием. Пентагон считает, что использование ИИ регулируется законами США, а не политикой компании.

Реакция последовала быстро. Трамп в Truth Social назвал Anthropic «левыми психами» и запретил использование Claude в любых государственных целях. 

Министр обороны официально присвоил компании статус supply-chain risk — ранее такого удостаивались только фирмы из недружественных стран вроде Huawei. 

Если решение устоит в судах, крупные облачные провайдеры, включая Amazon — ключевого партнёра Anthropic — могут быть вынуждены разорвать с ней контракты.

Волна поддержки Anthropic прокатилась по всей отрасли. Позицию компании публично поддержали Илья Суцкевер, Гэри Маркус и сотни других. Anthropic заявила, что будет судиться.

🔗 Axios

❯ OpenAI подписала военный контракт — и получила волну удалений

Через несколько часов после того, как Anthropic отказалась от сделки, OpenAI её подхватила. Альтман заявил, что контракт содержит «больше ограничений, чем любой предыдущий» — и те же «красные линии», на которых настаивал Амодей.

Но дьявол в деталях. Ограничения в контракте OpenAI просто ссылаются на действующее законодательство — без отдельных запретов, которых добивалась Anthropic. Разница принципиальная: Anthropic хотела запретить то, что закон пока разрешает. 

Реакция пользователей была моментальная — массовые отмены подписок и удаления ChatGPT в США подскочили на 295% за сутки. Однозвёздочные отзывы в App Store выросли на 775%, пятизвёздочные упали вдвое. 96 сотрудников OpenAI подписали открытое письмо в поддержку позиции Anthropic — не конкурента, а именно его позиции.

1 марта Claude впервые обогнал ChatGPT по ежедневным скачиваниям в США и вышел на первое место в App Store в шести странах, включая Канаду и Германию.

Альтман начал тушить пожар: признал в CNBC, что «со стороны всё выглядело не очень», пообещал внести в контракт явный запрет на слежку за гражданами и заявил, что сядет в тюрьму, если OpenAI прикажут шпионить.

🔗 Axios 🔗 TechCrunch 🔗 CNBC

❯ Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео

24–25 февраля Jerusalem Post провела эксперимент: попросила Claude, Gemini, ChatGPT и Grok назвать конкретную дату возможного удара США по Ирану. Большинство моделей давали диапазоны — конец февраля, начало марта. Grok дважды назвал одну и ту же точную дату: субботу, 28 февраля, привязав её к итогам переговоров в Женеве.

Удары действительно начались в ночь на 28 февраля. Маск расхайпил кейс в X, заявив, что «способность предсказывать будущее — лучшая мера интеллекта». Эксперты охладили пыл: другие модели тоже называли очень близкие даты, окно было узким, так что попадание Grok — скорее удачное совпадение, чем реальная предиктивность.

Но это не всё. В соцсетях разошлось видео с якобы попаданием иранских ракет по Тель-Авиву. OSINT-сообщество быстро нашло типичные артефакты ИИ-генерации — искажённые флаги, здания, машины. 

Пользователи X обратились к Grok за проверкой. Тот сначала подтвердил, что видео реальное, и лишь позже начал давать противоречивые ответы.

Люди, изначально подозревавшие фейк, ссылались на «подтверждение» от Grok — и продолжали распространять ролик. Авторы монетизировали вовлечение через revenue sharing на X. 

После скандала платформа пообещала на 90 дней лишать монетизации за публикацию неотмеченных ИИ-видео о конфликтах. 

🔗 Jerusalem Post 🔗 CBC News

❯ Тема выпуска: рождение компакт-диска

8 марта 1979 года инженеры Philips и Sony показали миру технологию, которая заставила нас забыть о карандашах для перематывания кассет. 

Появление CD стало моментом «сингулярности» для медиа: музыка и данные превратились в последовательность нулей и единиц, считываемых лазером. Это напоминает нам о том, как важен стандарт — именно тогда человечество договорилось, как упаковывать смыслы в цифру. 

Символично, что сегодня нейросети «разбирают» эти терабайты данных обратно на смыслы, но начиналось всё с маленького зеркального круга, который обещал нам вечное качество звука и будущее, сияющее всеми цветами спектра.

❯ Аудиоверсия дайджеста

❯ Заключение

На этой неделе больше внимания привлекла политика. Anthropic отказала Пентагону и получила статус угрозы нацбезопасности, а после OpenAI подписали сделку, но поплатились волной отмен подписок.

По моделям интересно: релиз GPT-5.3 и GPT-5.4, Gemini Flash-Lite за $0,25 за 1М токенов, и открытая серия Qwen3.5 Small для запуска на домашнем железе.

ИИ всё больше сам решает, когда действовать, кого слушать и что считать правдой. Агенты планируют задачи в Notion и пишут отчёты без напоминаний. Grok верит фейковому ИИ-видео, а Block увольняет 40% штата и впервые говорит об этом прямо.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

Читать далее
GPT-5.4 с управлением компьютером, Anthropic и Пентагон, предсказание Grok про Иран и восстание ИИ-агентов

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла напряжённой: OpenAI релизнули GPT-5.3 Instant и GPT-5.4 с управлением ПК, а ещё подписались с Пентагоном, пока Anthropic получила статус «угрозы нацбезопасности». Вышла вторая Nano Banana, а Grok предсказал удар по Ирану и принял ИИ-видео за реальное.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT
  • GPT-5.4 — нативный computer-use, 1M токенов, рекорды на бенчмарках
  • Gemini 3.1 Flash-Lite — $0,25 за миллион токенов для масштабных задач
  • Qwen3.5 Small — серия открытых мультимодалок

*� Генеративные нейросети

  • LTX-2.3 — видео до 4K со звуком 
  • Nano Banana 2 — обновление генератора картинок в Gemini

*� AI-инструменты и платформы

  • Обновление Google Opal
  • Notion 3.3 — кастомные агенты внутри воркспейса
  • Claude Cowork — запланированные задачи и плагины

*� AI в обществе и исследованиях

  • Anthropic против Пентагона 
  • OpenAI подписала военный контракт, пока Anthropic судится
  • Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео
  • Block сократил 40% сотрудников из-за автоматизации

🧠 Модели и LLM

❯ GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT

OpenAI обновила основную модель в ChatGPT — теперь это GPT-5.3 Instant. По сути, патч для самых раздражающих проблем GPT-5.2.

Модель перестала думать вслух перед ответом, убрали бессмысленные отказы и нравоучительный тон в духе «you are absolutely right 👍». Модель лучше держит контекст.

Улучшен поиск — меньше расхождений между найденной информацией и финальным текстом. По внутренним тестам OpenAI галлюцинации сократились на 26,8% при работе с вебом и на 19,7% без него

GPT-5.3 Instant уже доступна бесплатно всем пользователям ChatGPT и стала новым дефолтом. Версии Thinking и Pro выйдут позже. В Enterprise и Edu включается через настройки «Early Model Access».

🔗 Официальный блог OpenAI

❯ GPT-5.4 — нативный computer-use

Ещё один релиз от OpenAI, это GPT-5.4 — новый флагман в двух версиях: Thinking и Pro. Вышла буквально на следующий день после GPT-5.3 Instant.

GPT-5.4 умеет нативно управлять ПК: она водит мышью и вводит с клавиатуры. На бенчмарке OSWorld набрала 75% — выше среднего человека с его 72,4%. Бенч на поиск BrowseComp вырос до 82,7% против 65,7% у GPT-5.2, а Pro-версия поставила рекорд в 89,3%.

Что ещё изменилось:

  • Контекстное окно до 1М токенов. Можно загружать книги, кодовые базы или большие документы
  • Интерактивный Thinking. Модель показывает план работы заранее. Его можно скорректировать прямо в процессе, не начиная заново
  • Эффективность выросла. При работе с MCP-серверами тратит на 47% меньше токенов без потери точности. В Codex появился режим /fast — генерация в 1,5 раза быстрее
  • Галлюцинаций стало меньше на 33% по сравнению с GPT-5.2

Цены API: базовая GPT-5.4 — $2,5 / $15 за миллион токенов на входе и выходе, Pro — $30 / $180. Batch и Flex-режимы вдвое дешевле стандарта.

Модель уже раскатывают всем пользователям ChatGPT, API и Codex.

🔗 Официальный блог OpenAI

❯ Gemini 3.1 Flash-Lite — $0,25 за 1М токенов

Google выпустила Gemini 3.1 Flash-Lite — самую дешёвую модель в линейке Gemini 3, заточенную под тяжёлые задачи.

Скорость до 370–400 токенов в секунду, это на 45% быстрее предыдущего Gemini 2.5 Flash. По качеству идёт примерно на уровне GPT-5 mini, местами чуть лучше — 1432 Elo на Arena.ai, 86,9% на GPQA Diamond и 76,8% на MMMU Pro.

Контекстное окно — 1М токенов, принимает на вход текст, изображения и аудио. Есть динамические уровни размышления: модель сама подстраивает глубину под сложность задачи, чтобы стоимость была под контролем.

Цена — $0,25 / $1,50 за миллион токенов на входе и выходе. Обгоняет GPT-5 mini, Claude 4.5 Haiku и Grok 4.1 Fast по соотношению цена/скорость/качество.

Хорошо показывает себя в задачах на массовые переводы, контент-модерацию, генерацию UI, анализ изображений. Сейчас доступна в preview через Gemini API в AI Studio и Vertex AI.

🔗 Официальный блог Google 🔗 AI Studio 🔗 Vertex AI

❯ Qwen3.5 Small — открытые мультимодальные модели

Alibaba выпустила серию Qwen3.5 Small — четыре открытые модели под лицензией Apache 2.0 на 0.8B, 2B, 4B и 9B параметров. Каждая доступна в версиях instruct и base для дообучения.

Флагман серии Qwen3.5-9B обходит предыдущие Qwen3-VL модели на бенчмарках MMMU, VideoMME и OCRBench — и даже опережает некоторые модели вдвое крупнее. Нативная мультимодальность из коробки: текст, изображения и видео без дополнительных надстроек.

Контекстное окно — 262K токенов нативно, для версий 4B и 9B расширяется до ~1 миллиона через YaRN. Поддерживаются 201 язык и диалект. Под капотом — гибридная архитектура Gated Delta Networks с Gated Attention в соотношении 3:1, которая даёт высокую скорость при низкой задержке.

Модели совместимы с vLLM, SGLang, HuggingFace Transformers и Qwen-Agent с поддержкой MCP. 

9B запускается на потребительских GPU или ноутбуке с 24 ГБ оперативки.

🔗 Коллекция на Hugging Face 🔗 Qwen3.5-9B

🎨 Генеративные нейросети

❯ LTX-2.3 — видео до 4K с нативным звуком от Lightricks

Lightricks обновили свою видеомодель до LTX-2.3. Полностью переработали VAE: текстуры, черты лица и мелкие объекты теперь сохраняют чёткость во всём кадре, особенно заметно при высоком разрешении, где предыдущие версии размывали детали.

Теперь есть нативный звук — эффекты, фоновый шум и диалоги синхронизируются с видеорядом с момента генерации. Есть отдельный режим audio-to-video: загружаешь аудиоклип, модель генерирует под него видео. 

Вертикальный формат 1080×1920 поддерживается нативно, без кропа.

Разрешение до 4K при 24 или 48 FPS, длительность до 20 секунд за один проход. Всего семь режимов — txt2vid, img2vid, aud2vid, extend video, retake video и быстрые версии первых двух. 

Модель открыта под Apache 2.0, поддерживается LoRA fine-tuning и шаблоны ComfyUI.

🔗 Официальный анонс 🔗 Playground 🔗 Веса на Hugging Face 🔗 API

❯ Nano Banana 2 — обновление генератора картинок в Gemini

Google обновила встроенный генератор изображений в Gemini — вышла Nano Banana 2, которая сейчас доступна бесплатно.

Из заметных улучшений: нативное 2K с апскейлом до 4K, улучшили цвета и свет, текст на картинках почти без артефактов. Поддержка до 14 референсов для сохранения внешности персонажей и объектов между кадрами.

Ещё завезли реалтайм веб-поиск: модель сама уходит в интернет за актуальными данными, если они нужны для генерации — например, чтобы нарисовать точную погоду в конкретном месте или актуальный график. Генерация, кстати, до 10 секунд.

Цена API — $0,151 за изображение в 4K, вдвое дешевле Nano Banana Pro. В Google Flow генерация стала бесплатной для всех.

Попробовать можно в приложении Gemini или AI Studio — нужен иностранный IP.

🔗 Официальный анонс 🔗 Gemini 🔗 AI Studio

🔧 AI-инструменты и платформы

❯ Обновление no-code платформы Google Opal

Google Labs обновила конструктор воркфлоу Opal, добавив в него агентный шаг.

Раньше это был обычный drag-and-drop редактор: сам выбираешь модель, прописываешь последовательность шагов. Теперь можно добавить агента — он сам решает, какие инструменты вызвать и в каком порядке. 

Нужно видео — подключит Veo, нужен ресёрч — пойдёт в веб-поиск, не хватает данных — спросит пользователя.

Вместе с агентным шагом появились: persistent memory — контекст сохраняется между сессиями, dynamic routing — условные ветки без кода, и human-in-the-loop — точки, где агент останавливается и ждёт проверки.

🔗 Блог Google 🔗 VentureBeat

❯ Notion 3.3 — кастомные автономные агенты внутри воркспейса

Notion выпустила версию 3.3 с Custom Agents — автономными агентами, которые работают прямо внутри воркспейса без ручного промптинга.

Всё просто: задаёте задачу, триггер или расписание — дальше агент работает сам. 

Автотриаж задач, ежедневные стендапы, внутренний Q&A, очистка инбокса. Агентов можно шарить в команде, настраивать права доступа и подключать к внешним сервисам — Slack, Figma и внутренним базам знаний Notion.

Notion уже сами используют 2 800 агентов внутри компании. Пользователи в раннем доступе создали больше 21 000.

До 3 мая 2026 функция бесплатна. После — потребляет Notion credits, которые докупаются к планам Business и Enterprise.

🔗 Релиз-ноты Notion

❯ В Claude Cowork добавили запланированные задачи и плагины

В Cowork добавили две новые функции: запланированные задачи и плагины.

Теперь Claude может выполнять повторяющиеся задачи по расписанию — утренние брифинги, еженедельные отчёты, обновления таблиц, пятничные презентации. 

Управляется через боковую панель «Scheduled»: там же можно создавать, редактировать, ставить на паузу или запускать задачи вручную. Плагины добавляют экспертизу в дизайне, инженерии и аналитике.

Одно ограничение: задачи работают только при открытом приложении на включённом ПК. Функция доступна на платных планах.

🔗 Подробнее

🧩 AI в обществе и исследованиях

❯ Anthropic против Пентагона — отказ от сделки и статус угрозы нацбезопасности

24 февраля министр обороны США Пит Хегсет лично встретился с Дарио Амодеем и поставил ультиматум: 

  • либо Anthropic до 27 февраля снимает все ограничения на использование Claude в военных целях, 
  • либо компания получает статус «угрозы в цепочке поставок» — и с ней не смогут работать никакие государственные подрядчики.

Anthropic отказалась. Позиция компании: Claude не должен использоваться для массовой слежки за гражданами и управления автономным летальным оружием. Пентагон считает, что использование ИИ регулируется законами США, а не политикой компании.

Реакция последовала быстро. Трамп в Truth Social назвал Anthropic «левыми психами» и запретил использование Claude в любых государственных целях. 

Министр обороны официально присвоил компании статус supply-chain risk — ранее такого удостаивались только фирмы из недружественных стран вроде Huawei. 

Если решение устоит в судах, крупные облачные провайдеры, включая Amazon — ключевого партнёра Anthropic — могут быть вынуждены разорвать с ней контракты.

Волна поддержки Anthropic прокатилась по всей отрасли. Позицию компании публично поддержали Илья Суцкевер, Гэри Маркус и сотни других. Anthropic заявила, что будет судиться.

🔗 Axios

❯ OpenAI подписала военный контракт — и получила волну удалений

Через несколько часов после того, как Anthropic отказалась от сделки, OpenAI её подхватила. Альтман заявил, что контракт содержит «больше ограничений, чем любой предыдущий» — и те же «красные линии», на которых настаивал Амодей.

Но дьявол в деталях. Ограничения в контракте OpenAI просто ссылаются на действующее законодательство — без отдельных запретов, которых добивалась Anthropic. Разница принципиальная: Anthropic хотела запретить то, что закон пока разрешает. 

Реакция пользователей была моментальная — массовые отмены подписок и удаления ChatGPT в США подскочили на 295% за сутки. Однозвёздочные отзывы в App Store выросли на 775%, пятизвёздочные упали вдвое. 96 сотрудников OpenAI подписали открытое письмо в поддержку позиции Anthropic — не конкурента, а именно его позиции.

1 марта Claude впервые обогнал ChatGPT по ежедневным скачиваниям в США и вышел на первое место в App Store в шести странах, включая Канаду и Германию.

Альтман начал тушить пожар: признал в CNBC, что «со стороны всё выглядело не очень», пообещал внести в контракт явный запрет на слежку за гражданами и заявил, что сядет в тюрьму, если OpenAI прикажут шпионить.

🔗 Axios 🔗 TechCrunch 🔗 CNBC

❯ Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео

24–25 февраля Jerusalem Post провела эксперимент: попросила Claude, Gemini, ChatGPT и Grok назвать конкретную дату возможного удара США по Ирану. Большинство моделей давали диапазоны — конец февраля, начало марта. Grok дважды назвал одну и ту же точную дату: субботу, 28 февраля, привязав её к итогам переговоров в Женеве.

Удары действительно начались в ночь на 28 февраля. Маск расхайпил кейс в X, заявив, что «способность предсказывать будущее — лучшая мера интеллекта». Эксперты охладили пыл: другие модели тоже называли очень близкие даты, окно было узким, так что попадание Grok — скорее удачное совпадение, чем реальная предиктивность.

Но это не всё. В соцсетях разошлось видео с якобы попаданием иранских ракет по Тель-Авиву. OSINT-сообщество быстро нашло типичные артефакты ИИ-генерации — искажённые флаги, здания, машины. 

Пользователи X обратились к Grok за проверкой. Тот сначала подтвердил, что видео реальное, и лишь позже начал давать противоречивые ответы.

Люди, изначально подозревавшие фейк, ссылались на «подтверждение» от Grok — и продолжали распространять ролик. Авторы монетизировали вовлечение через revenue sharing на X. 

После скандала платформа пообещала на 90 дней лишать монетизации за публикацию неотмеченных ИИ-видео о конфликтах. 

🔗 Jerusalem Post 🔗 CBC News

❯ Тема выпуска: рождение компакт-диска

8 марта 1979 года инженеры Philips и Sony показали миру технологию, которая заставила нас забыть о карандашах для перематывания кассет. 

Появление CD стало моментом «сингулярности» для медиа: музыка и данные превратились в последовательность нулей и единиц, считываемых лазером. Это напоминает нам о том, как важен стандарт — именно тогда человечество договорилось, как упаковывать смыслы в цифру. 

Символично, что сегодня нейросети «разбирают» эти терабайты данных обратно на смыслы, но начиналось всё с маленького зеркального круга, который обещал нам вечное качество звука и будущее, сияющее всеми цветами спектра.

❯ Аудиоверсия дайджеста

❯ Заключение

На этой неделе больше внимания привлекла политика. Anthropic отказала Пентагону и получила статус угрозы нацбезопасности, а после OpenAI подписали сделку, но поплатились волной отмен подписок.

По моделям интересно: релиз GPT-5.3 и GPT-5.4, Gemini Flash-Lite за $0,25 за 1М токенов, и открытая серия Qwen3.5 Small для запуска на домашнем железе.

ИИ всё больше сам решает, когда действовать, кого слушать и что считать правдой. Агенты планируют задачи в Notion и пишут отчёты без напоминаний. Grok верит фейковому ИИ-видео, а Block увольняет 40% штата и впервые говорит об этом прямо.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

Читать далее
GPT-5.4 с управлением компьютером, Anthropic и Пентагон, предсказание Grok про Иран и восстание ИИ-агентов

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла напряжённой: OpenAI релизнули GPT-5.3 Instant и GPT-5.4 с управлением ПК, а ещё подписались с Пентагоном, пока Anthropic получила статус «угрозы нацбезопасности». Вышла вторая Nano Banana, а Grok предсказал удар по Ирану и принял ИИ-видео за реальное.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT
  • GPT-5.4 — нативный computer-use, 1M токенов, рекорды на бенчмарках
  • Gemini 3.1 Flash-Lite — $0,25 за миллион токенов для масштабных задач
  • Qwen3.5 Small — серия открытых мультимодалок

*� Генеративные нейросети

  • LTX-2.3 — видео до 4K со звуком 
  • Nano Banana 2 — обновление генератора картинок в Gemini

*� AI-инструменты и платформы

  • Обновление Google Opal
  • Notion 3.3 — кастомные агенты внутри воркспейса
  • Claude Cowork — запланированные задачи и плагины

*� AI в обществе и исследованиях

  • Anthropic против Пентагона 
  • OpenAI подписала военный контракт, пока Anthropic судится
  • Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео
  • Block сократил 40% сотрудников из-за автоматизации

🧠 Модели и LLM

❯ GPT-5.3 Instant — меньше галлюцинаций, новый дефолт в ChatGPT

OpenAI обновила основную модель в ChatGPT — теперь это GPT-5.3 Instant. По сути, патч для самых раздражающих проблем GPT-5.2.

Модель перестала думать вслух перед ответом, убрали бессмысленные отказы и нравоучительный тон в духе «you are absolutely right 👍». Модель лучше держит контекст.

Улучшен поиск — меньше расхождений между найденной информацией и финальным текстом. По внутренним тестам OpenAI галлюцинации сократились на 26,8% при работе с вебом и на 19,7% без него

GPT-5.3 Instant уже доступна бесплатно всем пользователям ChatGPT и стала новым дефолтом. Версии Thinking и Pro выйдут позже. В Enterprise и Edu включается через настройки «Early Model Access».

🔗 Официальный блог OpenAI

❯ GPT-5.4 — нативный computer-use

Ещё один релиз от OpenAI, это GPT-5.4 — новый флагман в двух версиях: Thinking и Pro. Вышла буквально на следующий день после GPT-5.3 Instant.

GPT-5.4 умеет нативно управлять ПК: она водит мышью и вводит с клавиатуры. На бенчмарке OSWorld набрала 75% — выше среднего человека с его 72,4%. Бенч на поиск BrowseComp вырос до 82,7% против 65,7% у GPT-5.2, а Pro-версия поставила рекорд в 89,3%.

Что ещё изменилось:

  • Контекстное окно до 1М токенов. Можно загружать книги, кодовые базы или большие документы
  • Интерактивный Thinking. Модель показывает план работы заранее. Его можно скорректировать прямо в процессе, не начиная заново
  • Эффективность выросла. При работе с MCP-серверами тратит на 47% меньше токенов без потери точности. В Codex появился режим /fast — генерация в 1,5 раза быстрее
  • Галлюцинаций стало меньше на 33% по сравнению с GPT-5.2

Цены API: базовая GPT-5.4 — $2,5 / $15 за миллион токенов на входе и выходе, Pro — $30 / $180. Batch и Flex-режимы вдвое дешевле стандарта.

Модель уже раскатывают всем пользователям ChatGPT, API и Codex.

🔗 Официальный блог OpenAI

❯ Gemini 3.1 Flash-Lite — $0,25 за 1М токенов

Google выпустила Gemini 3.1 Flash-Lite — самую дешёвую модель в линейке Gemini 3, заточенную под тяжёлые задачи.

Скорость до 370–400 токенов в секунду, это на 45% быстрее предыдущего Gemini 2.5 Flash. По качеству идёт примерно на уровне GPT-5 mini, местами чуть лучше — 1432 Elo на Arena.ai, 86,9% на GPQA Diamond и 76,8% на MMMU Pro.

Контекстное окно — 1М токенов, принимает на вход текст, изображения и аудио. Есть динамические уровни размышления: модель сама подстраивает глубину под сложность задачи, чтобы стоимость была под контролем.

Цена — $0,25 / $1,50 за миллион токенов на входе и выходе. Обгоняет GPT-5 mini, Claude 4.5 Haiku и Grok 4.1 Fast по соотношению цена/скорость/качество.

Хорошо показывает себя в задачах на массовые переводы, контент-модерацию, генерацию UI, анализ изображений. Сейчас доступна в preview через Gemini API в AI Studio и Vertex AI.

🔗 Официальный блог Google 🔗 AI Studio 🔗 Vertex AI

❯ Qwen3.5 Small — открытые мультимодальные модели

Alibaba выпустила серию Qwen3.5 Small — четыре открытые модели под лицензией Apache 2.0 на 0.8B, 2B, 4B и 9B параметров. Каждая доступна в версиях instruct и base для дообучения.

Флагман серии Qwen3.5-9B обходит предыдущие Qwen3-VL модели на бенчмарках MMMU, VideoMME и OCRBench — и даже опережает некоторые модели вдвое крупнее. Нативная мультимодальность из коробки: текст, изображения и видео без дополнительных надстроек.

Контекстное окно — 262K токенов нативно, для версий 4B и 9B расширяется до ~1 миллиона через YaRN. Поддерживаются 201 язык и диалект. Под капотом — гибридная архитектура Gated Delta Networks с Gated Attention в соотношении 3:1, которая даёт высокую скорость при низкой задержке.

Модели совместимы с vLLM, SGLang, HuggingFace Transformers и Qwen-Agent с поддержкой MCP. 

9B запускается на потребительских GPU или ноутбуке с 24 ГБ оперативки.

🔗 Коллекция на Hugging Face 🔗 Qwen3.5-9B

🎨 Генеративные нейросети

❯ LTX-2.3 — видео до 4K с нативным звуком от Lightricks

Lightricks обновили свою видеомодель до LTX-2.3. Полностью переработали VAE: текстуры, черты лица и мелкие объекты теперь сохраняют чёткость во всём кадре, особенно заметно при высоком разрешении, где предыдущие версии размывали детали.

Теперь есть нативный звук — эффекты, фоновый шум и диалоги синхронизируются с видеорядом с момента генерации. Есть отдельный режим audio-to-video: загружаешь аудиоклип, модель генерирует под него видео. 

Вертикальный формат 1080×1920 поддерживается нативно, без кропа.

Разрешение до 4K при 24 или 48 FPS, длительность до 20 секунд за один проход. Всего семь режимов — txt2vid, img2vid, aud2vid, extend video, retake video и быстрые версии первых двух. 

Модель открыта под Apache 2.0, поддерживается LoRA fine-tuning и шаблоны ComfyUI.

🔗 Официальный анонс 🔗 Playground 🔗 Веса на Hugging Face 🔗 API

❯ Nano Banana 2 — обновление генератора картинок в Gemini

Google обновила встроенный генератор изображений в Gemini — вышла Nano Banana 2, которая сейчас доступна бесплатно.

Из заметных улучшений: нативное 2K с апскейлом до 4K, улучшили цвета и свет, текст на картинках почти без артефактов. Поддержка до 14 референсов для сохранения внешности персонажей и объектов между кадрами.

Ещё завезли реалтайм веб-поиск: модель сама уходит в интернет за актуальными данными, если они нужны для генерации — например, чтобы нарисовать точную погоду в конкретном месте или актуальный график. Генерация, кстати, до 10 секунд.

Цена API — $0,151 за изображение в 4K, вдвое дешевле Nano Banana Pro. В Google Flow генерация стала бесплатной для всех.

Попробовать можно в приложении Gemini или AI Studio — нужен иностранный IP.

🔗 Официальный анонс 🔗 Gemini 🔗 AI Studio

🔧 AI-инструменты и платформы

❯ Обновление no-code платформы Google Opal

Google Labs обновила конструктор воркфлоу Opal, добавив в него агентный шаг.

Раньше это был обычный drag-and-drop редактор: сам выбираешь модель, прописываешь последовательность шагов. Теперь можно добавить агента — он сам решает, какие инструменты вызвать и в каком порядке. 

Нужно видео — подключит Veo, нужен ресёрч — пойдёт в веб-поиск, не хватает данных — спросит пользователя.

Вместе с агентным шагом появились: persistent memory — контекст сохраняется между сессиями, dynamic routing — условные ветки без кода, и human-in-the-loop — точки, где агент останавливается и ждёт проверки.

🔗 Блог Google 🔗 VentureBeat

❯ Notion 3.3 — кастомные автономные агенты внутри воркспейса

Notion выпустила версию 3.3 с Custom Agents — автономными агентами, которые работают прямо внутри воркспейса без ручного промптинга.

Всё просто: задаёте задачу, триггер или расписание — дальше агент работает сам. 

Автотриаж задач, ежедневные стендапы, внутренний Q&A, очистка инбокса. Агентов можно шарить в команде, настраивать права доступа и подключать к внешним сервисам — Slack, Figma и внутренним базам знаний Notion.

Notion уже сами используют 2 800 агентов внутри компании. Пользователи в раннем доступе создали больше 21 000.

До 3 мая 2026 функция бесплатна. После — потребляет Notion credits, которые докупаются к планам Business и Enterprise.

🔗 Релиз-ноты Notion

❯ В Claude Cowork добавили запланированные задачи и плагины

В Cowork добавили две новые функции: запланированные задачи и плагины.

Теперь Claude может выполнять повторяющиеся задачи по расписанию — утренние брифинги, еженедельные отчёты, обновления таблиц, пятничные презентации. 

Управляется через боковую панель «Scheduled»: там же можно создавать, редактировать, ставить на паузу или запускать задачи вручную. Плагины добавляют экспертизу в дизайне, инженерии и аналитике.

Одно ограничение: задачи работают только при открытом приложении на включённом ПК. Функция доступна на платных планах.

🔗 Подробнее

🧩 AI в обществе и исследованиях

❯ Anthropic против Пентагона — отказ от сделки и статус угрозы нацбезопасности

24 февраля министр обороны США Пит Хегсет лично встретился с Дарио Амодеем и поставил ультиматум: 

  • либо Anthropic до 27 февраля снимает все ограничения на использование Claude в военных целях, 
  • либо компания получает статус «угрозы в цепочке поставок» — и с ней не смогут работать никакие государственные подрядчики.

Anthropic отказалась. Позиция компании: Claude не должен использоваться для массовой слежки за гражданами и управления автономным летальным оружием. Пентагон считает, что использование ИИ регулируется законами США, а не политикой компании.

Реакция последовала быстро. Трамп в Truth Social назвал Anthropic «левыми психами» и запретил использование Claude в любых государственных целях. 

Министр обороны официально присвоил компании статус supply-chain risk — ранее такого удостаивались только фирмы из недружественных стран вроде Huawei. 

Если решение устоит в судах, крупные облачные провайдеры, включая Amazon — ключевого партнёра Anthropic — могут быть вынуждены разорвать с ней контракты.

Волна поддержки Anthropic прокатилась по всей отрасли. Позицию компании публично поддержали Илья Суцкевер, Гэри Маркус и сотни других. Anthropic заявила, что будет судиться.

🔗 Axios

❯ OpenAI подписала военный контракт — и получила волну удалений

Через несколько часов после того, как Anthropic отказалась от сделки, OpenAI её подхватила. Альтман заявил, что контракт содержит «больше ограничений, чем любой предыдущий» — и те же «красные линии», на которых настаивал Амодей.

Но дьявол в деталях. Ограничения в контракте OpenAI просто ссылаются на действующее законодательство — без отдельных запретов, которых добивалась Anthropic. Разница принципиальная: Anthropic хотела запретить то, что закон пока разрешает. 

Реакция пользователей была моментальная — массовые отмены подписок и удаления ChatGPT в США подскочили на 295% за сутки. Однозвёздочные отзывы в App Store выросли на 775%, пятизвёздочные упали вдвое. 96 сотрудников OpenAI подписали открытое письмо в поддержку позиции Anthropic — не конкурента, а именно его позиции.

1 марта Claude впервые обогнал ChatGPT по ежедневным скачиваниям в США и вышел на первое место в App Store в шести странах, включая Канаду и Германию.

Альтман начал тушить пожар: признал в CNBC, что «со стороны всё выглядело не очень», пообещал внести в контракт явный запрет на слежку за гражданами и заявил, что сядет в тюрьму, если OpenAI прикажут шпионить.

🔗 Axios 🔗 TechCrunch 🔗 CNBC

❯ Grok предсказал удар по Ирану и принял ИИ-фейк за реальное видео

24–25 февраля Jerusalem Post провела эксперимент: попросила Claude, Gemini, ChatGPT и Grok назвать конкретную дату возможного удара США по Ирану. Большинство моделей давали диапазоны — конец февраля, начало марта. Grok дважды назвал одну и ту же точную дату: субботу, 28 февраля, привязав её к итогам переговоров в Женеве.

Удары действительно начались в ночь на 28 февраля. Маск расхайпил кейс в X, заявив, что «способность предсказывать будущее — лучшая мера интеллекта». Эксперты охладили пыл: другие модели тоже называли очень близкие даты, окно было узким, так что попадание Grok — скорее удачное совпадение, чем реальная предиктивность.

Но это не всё. В соцсетях разошлось видео с якобы попаданием иранских ракет по Тель-Авиву. OSINT-сообщество быстро нашло типичные артефакты ИИ-генерации — искажённые флаги, здания, машины. 

Пользователи X обратились к Grok за проверкой. Тот сначала подтвердил, что видео реальное, и лишь позже начал давать противоречивые ответы.

Люди, изначально подозревавшие фейк, ссылались на «подтверждение» от Grok — и продолжали распространять ролик. Авторы монетизировали вовлечение через revenue sharing на X. 

После скандала платформа пообещала на 90 дней лишать монетизации за публикацию неотмеченных ИИ-видео о конфликтах. 

🔗 Jerusalem Post 🔗 CBC News

❯ Тема выпуска: рождение компакт-диска

8 марта 1979 года инженеры Philips и Sony показали миру технологию, которая заставила нас забыть о карандашах для перематывания кассет. 

Появление CD стало моментом «сингулярности» для медиа: музыка и данные превратились в последовательность нулей и единиц, считываемых лазером. Это напоминает нам о том, как важен стандарт — именно тогда человечество договорилось, как упаковывать смыслы в цифру. 

Символично, что сегодня нейросети «разбирают» эти терабайты данных обратно на смыслы, но начиналось всё с маленького зеркального круга, который обещал нам вечное качество звука и будущее, сияющее всеми цветами спектра.

❯ Аудиоверсия дайджеста

❯ Заключение

На этой неделе больше внимания привлекла политика. Anthropic отказала Пентагону и получила статус угрозы нацбезопасности, а после OpenAI подписали сделку, но поплатились волной отмен подписок.

По моделям интересно: релиз GPT-5.3 и GPT-5.4, Gemini Flash-Lite за $0,25 за 1М токенов, и открытая серия Qwen3.5 Small для запуска на домашнем железе.

ИИ всё больше сам решает, когда действовать, кого слушать и что считать правдой. Агенты планируют задачи в Notion и пишут отчёты без напоминаний. Grok верит фейковому ИИ-видео, а Block увольняет 40% штата и впервые говорит об этом прямо.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

Читать далее
Мультиагентный Grok 4.20, ИИ-двойники от Pika, векторный Recraft V4 и отмена Gucci из-за ИИ

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий. 

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя выдалась насыщенной: обновлённый Grok 4.20 с агентами, релизы мощных LLM от Google и Anthropic, генеративные модели для картинок и видео из Китая. Пока Gucci отменяют из-за ИИ-артов, OpenClaw удалил всю почту директора по ИИ-безопасности в Meta*****.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

*� Модели и LLM

  • Grok 4.20 в бете с командой из четырёх ИИ-агентов
  • Claude Sonnet 4.6: 1М токенов и уровень Opus
  • Gemini 3.1 Pro — Google опять в топе
  • Mercury 2 — самая быстрая диффузионная LLM

*� Генеративные нейросети

  • Reve v1.5: фотореализм и 4K-качество
  • Recraft V4 с векторной графикой для дизайнеров

*� AI-инструменты и платформы

  • Pencil — ИИ-Figma прямо в вашей IDE
  • Perplexity: у нас есть OpenClaw дома
  • Удалённый контроль с телефона в Claude Code
  • Чёрное зеркало: технология ИИ-двойников от Pika

*� AI в обществе и исследованиях

  • OpenClaw удалил почту директора по ИИ-безопасности Meta*
  • Xbox случайно заспамил игроков ИИ-уведомлениями
  • Отмена Gucci за использование нейроартов
  • Мем: Сэм Альтман и Дарио Амодеи отказались держаться за руки

**** признана экстремистской и запрещена в РФ***

🧠Модели и LLM

❯ Grok 4.20 в бете с командой из четырёх ИИ-агентов

Компания xAI выкатила в открытую бету Grok 4.20 — новую версию своей модели с мультиагентной архитектурой. Теперь один запрос пользователя параллельно обрабатывают четыре независимых ИИ-агента. Новинка уже доступна в чат-боте на десктопе и в мобильном приложении.

У каждого агента в команде своя роль: 

  • Харпер ищет данные в сети, 
  • Бенджамин проверяет факты, 
  • Лукас отвечает за логику, а главный алгоритм 
  • Grok координирует их работу и собирает финальный ответ.

 

В процессе генерации агенты могут обмениваться информацией и проверять друг друга.

Модель принимает на вход текст, изображения и видео, а её контекстное окно вмещает 256 тысяч токенов

Попробовать Grok 4.20 можно бесплатно, по лимитам — примерно 8 запросов за 5 часов.

Подобный мультиагентный подход ранее был доступен только в дорогих моделях по типу Grok 4 Heavy и цене от $200. Теперь полная версия Grok 4.20, вероятно, войдёт в подписку за $30. Похожие системы есть у GPT-5.2 Pro и Gemini 3 Deep Think, — но xAI первыми сделали её массовой.

🔗 Попробовать Grok

❯ Claude Sonnet 4.6: миллион токенов и уровень Opus

Anthropic выпустила Claude Sonnet 4.6. Модель вплотную приблизилась к флагманской Opus 4.6, при этом она на 40% дешевле и уже доступна всем, включая бесплатный тариф.

Главная фишка — «компьютерное зрение» и управление. Модель работает с интерфейсами программ как человек: сама кликает мышкой, заполняет веб-формы и переключается между вкладками. Можно поручить сложные офисные задачи в Chrome или Excel.

Что ещё нового:

  • Контекстное окно до 1 млн токенов. Позволяет анализировать огромные объёмы данных, например, всю кодовую базу проекта.
  • Улучшенная работа с кодом. Модель стала более последовательной, реже ленится и лучше справляется с рефакторингом. В ряде бенчей обгоняет Opus 4.5.
  • Высокая интеллектуальная честность. В тесте Bullshit Benchmark модель показала лучший результат в 94,5%, отказываясь поддерживать бессмысленные или абсурдные запросы.

Sonnet 4.6 уже интегрирована в Perplexity и стала моделью по умолчанию в Claude Code, Cowork и на сайте claude.ai.

🔗 Официальный анонс 🔗 Попробовать в Claude

❯ Gemini 3.1 Pro — Google опять в топе

Google обновили Gemini 3.1 Pro: исправили галлюцинации и нерабочий веб-поиск. Модель значительно прибавила в кодинге, логике и агентных задачах, по ряду тестов обходит GPT-5.2 и Claude Opus 4.6.

Главный прорыв в логике: на бенчмарке ARC-AGI-2, где нужно находить новые закономерности, модель набрала 77,1%, это в два раза больше, чем у Gemini 3 Pro с 31,1%. 

Поиск тоже прокачали: в тесте BrowseComp, где имитируется сложный поиск информации, Gemini 3.1 Pro показала 85,9%, обойдя Opus 4.6 с 84,0%.

Ещё 3.1 Pro с одного промпта генерирует анимированные SVG, создаёт 3D-визуализации и пишет готовые рабочие приложения.

Gemini 3.1 Pro уже доступна бесплатно в приложении Gemini и в AI Studio.

🔗 Блогпост 🔗 AI Studio

❯ Mercury 2: самая быстрая ризонинг LLM

Стартап Inception представил Mercury 2 — самую быструю на сегодня reasoning-модель. 

У неё диффузионная архитектура: текст генерируется не токен за токеном, а целиком. Mercury 2 сходу набрасывает ответ из шума, постепенно уточняя его.

Из-за этого у неё бешеная скорость в 1009 токенов в секунду на NVIDIA Blackwell, что в 5–7 раз быстрее аналогов вроде Claude Haiku 4.5. По качеству модель сопоставима с GPT-5 mini.

Такая скорость критически важна для задач, где задержка ломает весь процесс:

  • Автодополнение кода и рефакторинг в реальном времени
  • Работа ИИ-агентов, которые могут совершать больше итераций для планирования и проверки
  • Голосовые ассистенты, где важна естественность разговора
  • Поисковые системы и RAG-пайплайны

Модель уже можно бесплатно потестить в чате.

🔗 Попробовать Mercury 2 🔗 Технический блогпост

🎨 Генеративные нейросети

❯ Обновление Reve v1.5: фотореализм и 4K-качество

После почти года затишья генератор изображений Reve обновился до версии v1.5 и сразу занял третье место в рейтинге AI Arena, уступив лишь Nano Banana Pro и GPT Image 1.5.

Прокачали качество и детализацию. Картинки в нативном 4K, используя рендеринг в пиксельном пространстве, что позволяет избежать потери четкости. Лучше мелкие текстуры, сложные сцены и светопередача. Корректно работает с текстом, в том числе на кириллице.

Есть точечное редактирование, можно выделить объект и изменить его отдельным промптом.

🔗 Попробовать Reve v1.5 🔗 Официальный анонс

❯ Recraft V4: генератор векторных картинок

Вышла Recraft V4 — модель для генерации изображений, которая умеет в редактируемый SVG-вектор. Доступна в двух версиях: V4 для быстрых эскизов до 10 секунд и V4 Pro для детализированных изображений высокого разрешения, готовых к печати.

Recraft V4 создаёт довольно чистые SVG-файлы со слоями, которые можно редактировать в Figma или Adobe Illustrator. Идеально для создания логотипов, иконок и сложной типографики.

Попробовать Recraft V4 можно бесплатно, сейчас дают 50 кредитов в день. Также доступно API через партнёров.

🔗 Официальный анонс 🔗 Попробовать Recraft V4

❯ Seedream 5.0 Lite: генерация с веб-поиском

ByteDance расширили линейку и выпустили облегчённую Seedream 5.0 Lite. Главный упор сделан на стабильность генераций и точное следование промпту благодаря встроенному поиску в интернете.

Идеально подходит для создания серий изображений, где нужно сохранить персонажа консистентным или выдержать единый стиль — например, для рекламных кампаний или брендированных материалов. 

Стоимость по API — $0.035 за изображение, дешевле предыдущей версии. Новым пользователям дают бесплатный тестовый период.

🔗 Попробовать Seedream 5.0 Lite 🔗 Официальный анонс

🔧 AI-инструменты и платформы

❯ Pencil — ИИ-Figma, которая дизайнит за вас

Появился Pencil — ИИ-агент, который генерирует UI-дизайн прямо внутри IDE, такой как VS Code или Cursor. 

Вместо статичных макетов он создаёт сразу готовый фронтенд на HTML, CSS или React, который хранится в вашем Git-репозитории. Есть импорт из Figma с переносом всех векторов и экспорт в PDF.

Недавно в Pencil добавили SWARM Mode: теперь несколько ИИ-агентов могут одновременно работать над разными экранами вашего проекта, что значительно ускоряет процесс: пока один агент рисует лендинг, второй набрасывает дашборд.

Pencil не привязан к одной нейронке — он работает с Claude Code, Copilot и Gemini-инструментами как единый дизайн-слой. Есть так же версии для Mac и Linux.

Pencil быстро набрал 100 тысяч пользователей за пять месяцев. Пока идёт ранний доступ, пользоваться можно бесплатно.

🔗 Попробовать Pencil

❯ Perplexity Computer — у нас есть OpenClaw дома

Perplexity выпустили Perplexity Computer — свой OpenClaw. Даёте одну большую цель, а система сама разобьёт её на подзадачи и назначит разным агентам.

Perplexity Computer мультимодельная — то есть сама решает, какому ИИ поручить ту или иную работу: для глубокого анализа данных может задействовать Gemini, для работы с большим контекстом — Claude Opus, а для быстрых задач — Grok. Всего на выбор 19 моделей.

Агенты работают параллельно: один собирает данные, второй пишет отчёт, третий обращается к API подключённых сервисов, таких как Gmail, Notion или Canva. 

Perplexity Computer работает в изолированной песочнице, что исключает случайное удаление данных или другие сбои. 

Пока что функция доступна только подписчикам тарифа Perplexity Max.

🔗 Официальный анонс 🔗 Perplexity Computer

❯ Удалённое управление прямо с телефона в Claude Code

В Claude Code появилась функция удалённого управления. Теперь можно запустить сложную задачу на рабочем компьютере, а затем контролировать её выполнение с телефона — например, по дороге на встречу или во время прогулки.

Работает это просто:

  1. Запускаете сессию на ПК командой claude remote-control
  2. Сканируете QR-код через мобильное приложение Claude
  3. Получаете полный контроль над процессом

С телефона можно дописывать промпты, одобрять изменения в файлах, прерывать выполнение команд и отслеживать статус. В отличие от неофициальных решений, это нативная и безопасная функция с end-to-end шифрованием.

Пока что фича доступна в режиме Research Preview для подписчиков тарифа Max, но скоро её обещают добавить и для Pro-пользователей.

🔗 Документация

❯ Чёрное зеркало: технология ИИ-двойников от Pika

Pika Labs анонсировали AI Selves — сервис для создания автономных цифровых копий. То есть полноценных двойников с вашим голосом, характером и долгосрочной памятью.

Чтобы «родить» клона, достаточно загрузить селфи, записать аудио и пройти короткий тест на личность. 

После ИИ-двойника можно подключить к Telegram, WhatsApp, Slack и другим мессенджерам. Он сам будет отвечать коллегам, вести соцсети, звонить людям и даже зарабатывать на рекламе от вашего имени.

Все права на сгенерированный контент остаются у вас, а ваши данные не идут на обучение чужих моделей. 

Из ограничений: клонам запретили давать медицинские, финансовые и юридические советы, а на весь визуал вешается водяной знак.

Пока сервис находится в закрытом доступе. На этапе ранней беты все функции будут бесплатными.

🔗 Лист ожидания Pika

🧩 AI в обществе и исследованиях

❯ ИИ снёс почту директора по безопасности Meta*

Саммер Юэ отвечает за безопасность ИИ в Meta*. Она поручила агенту OpenClaw разобрать свой личный Gmail. 

По сути, бот должен был только предложить, что отправить в корзину, но в итоге начал удалять все письма подчистую.

Всё из-за переполнение контекста. Ящик оказался огромным, и при саммари контекста алгоритм просто забыл стартовую инструкцию ждать аппрува. 

На отчаянные команды остановиться в Telegram бот не реагировал. Девушке пришлось бежать к Mac mini и убивать процессы через диспетчер задач. Итог: минус 200 писем. 

После перезапуска агент извинился и сам прописал себе правило больше не заниматься автономной чисткой. 

Иронично, что жертвой стала именно глава отдела по контролю над нейросетями. Сама девушка сказала, что совершила ошибку новичка, дав агенту слишком много доступа.

** признана в РФ экстремистской и запрещена*

🔗 Тред Саммер Юэ в X

❯ Xbox заспамил игроков тестовыми пушами от ИИ

Разрабы случайно завалили игроков десятками уведомлений:

«Это тестовое сообщение, отправленное через Braze...»

Braze — это ИИ-платформа, которая доставляет пользователям целевые и персонализированные уведомления. 

В Microsoft уже извинились и устранили проблему. По их словам, приложение «слишком воодушевилось» тестовыми сообщениями.

🔗 Источник

❯ Gucci отменяют из-за сгенерированной нейросетью рекламы

В Gucci получили волну хейта за анонс своего показа на Неделе моды в Милане. Компания выложила в X ИИ-арты, честно предупредив об использовании нейросетей, но от гнева аудитории это не спасло.

В комментариях бренд сравнивают с масс-маркетом и обвиняют в «убийстве наследия». Репост с фразой «любой люкс, использующий ИИ-слоп, перестаёт быть люксом» собрал 60 тысяч лайков — это в сто раз больше, чем у оригинальной публикации Gucci.

В 2025 году выручка Gucci рухнула на 22%, показав худший результат среди всех брендов группы Kering. Эксперты считают замену живых фотографов на алгоритмы намеренной «культурной провокацией» ради привлечения внимания перед показом. 

Если целью был хайп, то план сработал, вот только восстановить репутацию теперь будет сложно.

🔗 Оригинальный пост Gucci

❯ Мем дня: Сэм Альтман и Дарио Амодеи отказались держаться за руки

На саммите India AI Impact в Нью-Дели произошёл неловкий момент: главы OpenAI Сэм Альтман и Anthropic Дарио Амодеи отказались взяться за руки для общего фото. 

Премьер Индии Нарендра Моди предложил лидерам ИИ-индустрии продемонстрировать солидарность. И пока Сундар Пичаи, Демис Хассабис и сам Моди держались за руки, Альтман и Амодеи демонстративно подняли их вверх, так и не прикоснувшись друг к другу.

Причина — конфликт в публичном поле. Недавно Anthropic выпустила серию роликов, высмеивающих планы OpenAI добавить рекламу в ChatGPT, и подчеркнула, что в Claude её не будет. 

Саммит запомнился и другими событиями: Билл Гейтс отменил выступление из-за публикации новых документов по делу Эпштейна, а Дженсен Хуанг не приехал из-за болезни. Тем временем Эммануэль Макрон заявил, что ЕС продолжит формировать свои «правила игры» в сфере ИИ.

❯ Тема недели: релиз Pokémon Red и Green

27 февраля 1996 года мир узнал, что карманные монстры могут быть круче реальных домашних животных. Релиз Pokémon на Game Boy доказал: социальный капитал и обмен данными значат больше, чем терафлопсы графики. 

Сегодня этот культурный код коллекционирования и эволюции идеально ложится на ландшафт ИИ. Мы больше не ищем Пикачу в высокой траве — мы ищем идеальные промпты. 

Символично, что спустя 30 лет наша главная задача осталась прежней: собрать идеальную команду, теперь уже ИИ-агентов. Обучить их и заставить эффективно взаимодействовать в одной связке. Похоже, профессор Оук был первым промпт-инженером в истории.

❯ Аудиоверсия дайджеста

❯ Заключение

На этой неделе громче всего обсуждали новые LLM: Google, Anthropic и xAI выкатили мощные апдейты Gemini, Claude и Grok. Тем временем релизнулись хорошие генеративки из Китая — Recraft и Reve.

Мы движемся от чат-помощников к автономным исполнителям. ИИ-двойники готовятся вести наши соцсети и общаться за нас, умные агенты случайно сносят рабочие почты топ-менеджерам, а нейросети провоцируют скандалы вокруг люксовых брендов вроде Gucci.

Граница между инструментом и непредсказуемым участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

До встречи в следующем выпуске!

Читать далее