Skip Navigation
admin llm
LLM 11.11.2025

MoE-малышка ERNIE-4.5-VL от Baidu, которая обходит топов

Китайцы из Baidu выпустили ERNIE-4.5-VL — открытую MoE-модель.

По заявлениям, с документами и диаграммами она справляется лучше Gemini 2.5 Pro и GPT-5 High. Всего у модели 28 млрд параметров.

В чём фишка: это размышляющая Visual Language модель.

ERNIE-4.5-VL мыслит образами, буквально: не просто один раз смотрит на изображение и сразу генерит ответ, а:

  • глубоко анализирует
  • приближает и поворачивает картинку
  • использует OCR

Практически имитация человеческих размышлений.

Параллельно Baidu уже тестирует ERNIE 5.0. В рейтинге LMArena она заняла второе место в мире по текстовым возможностям, особенно выделяясь в креативном письме.

🔗 Hugging Face  🔗 ModelScope 🔗 Baidu AI Studio

No comments

Start the conversation!


Читайте также
Top This Month