secretmag.ru
Новости2 мин.

Мощнее DeepSeek: в Китае выпустили ещё одну ИИ-модель. Что известно о Qwen 2.5-Max

Alibaba Cloud выпустила ИИ-модель Qwen 2.5-Max по цене $30 за миллион токенов. Китайский технологический гигант Alibaba Cloud представил новую версию своей языковой модели — Qwen 2.5-Max. Как заявили разработчики, она превосходит конкурентов, включая взорвавший рынок китайский чат-бот DeepSeek. Однако в отличие от него она совсем не бесплатна. Что ещё известно о возможностях новой модели?

Что известно о новой модели

Qwen 2.5-Max построена на архитектуре Mixture of Experts. Её обучили на массиве данных объёмом более 20 трлн токенов.

Доступность: модель закрытая. Бесплатно попробовать можно только в их чате.

Цена: использование Qwen 2.5-Max стоит в 30 раз дороже, чем DeepSeek V3: 1 млн на вход (например, вопрос к ИИ) стоят $10, а 1 млн токенов на выход (ответ ИИ) — $30.

Для сравнения: у DeepSeek аналогичные запросы обойдутся в $0.1–1 за 1 млн токенов.

Что она умеет

  • генерирует фото и видео;
  • пишет тексты (имеет доступ к интернету);
  • умеет писать код, в ней можно создавать даже игры;
  • понимает русский язык.

Сравнение с другими ИИ

Alibaba утверждает, что Qwen 2.5-Max превосходит китайский чат-бот DeepSeek V3 и чат-бот Llama-3.1-405B (принадлежит Meta, признанной в России экстремистской и запрещённой) почти по всем показателям.

Чем она лучше

  • Производительность: Qwen 2.5-Max модель лучше справляется с задачами в тестах Arena-Hard (сложные вопросы), LiveBench (работа с динамичными данными) и GPQA-Diamond (понимание текста) и других.

  • Обучение: её «тренировали» на 20 трлн единиц данных (токенов) и дорабатывали с помощью людей.

  • Большое контекстное окно: модель запоминает очень много контекста, может анализировать длинные тексты — как Gemini от Google.

Но есть нюанс: результаты пока опубликовала только сама Alibaba. Независимые эксперты ещё не проверили.

Мнение эксперта

По мнению эксперта в области ИИ, автора телеграм-канала «Эйай ньюз» Артёма Санакоева, цена Qwen 2.5-Max позиционируется как модель для сложных задач (reasoner), но цена завышена.

«Причём Qwen тут не предлагает никаких фич (возможностей) для оптимизации цен, даже тех, что уже стали стандартом», — отметил эксперт.

Он добавил, что основное достоинство модели при такой цене — перегрузка её главного конкурента в Китае, DeepSeek. Модель «под жуткой нагрузкой» уже второй день и не может выдержать всех желающих, отметил Санакоев.

О DeepSeek

DeepSeek на днях представила новую ИИ-модель — DeepSeek R1. Оказалось, что практически бесплатный ИИ с открытым кодом от малоизвестной компании не уступает, а в чём-то и превосходит самые умные модели западных нейронок. Причём разработчики утверждают, что обучение модели обошлось им не более чем в $6 млн.

Выход такой модели моментально обрушил акции технологических компаний. Про DeepSeek высказались уже Илон Маск, Дональд Трамп, Сэм Альтаман (глава OpenAI — разработчика ChatGPT) и другие эксперты. Что они сказали — читайте здесь.

Источник:Qwenlm