Мощнее DeepSeek: в Китае выпустили ещё одну ИИ-модель. Что известно о Qwen 2.5-Max
Что известно о новой модели
Qwen 2.5-Max построена на архитектуре Mixture of Experts. Её обучили на массиве данных объёмом более 20 трлн токенов.
Доступность: модель закрытая. Бесплатно попробовать можно только в их чате.
Цена: использование Qwen 2.5-Max стоит в 30 раз дороже, чем DeepSeek V3: 1 млн на вход (например, вопрос к ИИ) стоят $10, а 1 млн токенов на выход (ответ ИИ) — $30.
Для сравнения: у DeepSeek аналогичные запросы обойдутся в $0.1–1 за 1 млн токенов.
Что она умеет
- генерирует фото и видео;
- пишет тексты (имеет доступ к интернету);
- умеет писать код, в ней можно создавать даже игры;
- понимает русский язык.
Сравнение с другими ИИ
Alibaba утверждает, что Qwen 2.5-Max превосходит китайский чат-бот DeepSeek V3 и чат-бот Llama-3.1-405B (принадлежит Meta, признанной в России экстремистской и запрещённой) почти по всем показателям.
Чем она лучше
-
Производительность: Qwen 2.5-Max модель лучше справляется с задачами в тестах Arena-Hard (сложные вопросы), LiveBench (работа с динамичными данными) и GPQA-Diamond (понимание текста) и других.
-
Обучение: её «тренировали» на 20 трлн единиц данных (токенов) и дорабатывали с помощью людей.
-
Большое контекстное окно: модель запоминает очень много контекста, может анализировать длинные тексты — как Gemini от Google.
Но есть нюанс: результаты пока опубликовала только сама Alibaba. Независимые эксперты ещё не проверили.
Мнение эксперта
По мнению эксперта в области ИИ, автора телеграм-канала «Эйай ньюз» Артёма Санакоева, цена Qwen 2.5-Max позиционируется как модель для сложных задач (reasoner), но цена завышена.
«Причём Qwen тут не предлагает никаких фич (возможностей) для оптимизации цен, даже тех, что уже стали стандартом», — отметил эксперт.
Он добавил, что основное достоинство модели при такой цене — перегрузка её главного конкурента в Китае, DeepSeek. Модель «под жуткой нагрузкой» уже второй день и не может выдержать всех желающих, отметил Санакоев.
О DeepSeek
DeepSeek на днях представила новую ИИ-модель — DeepSeek R1. Оказалось, что практически бесплатный ИИ с открытым кодом от малоизвестной компании не уступает, а в чём-то и превосходит самые умные модели западных нейронок. Причём разработчики утверждают, что обучение модели обошлось им не более чем в $6 млн.
Выход такой модели моментально обрушил акции технологических компаний. Про DeepSeek высказались уже Илон Маск, Дональд Трамп, Сэм Альтаман (глава OpenAI — разработчика ChatGPT) и другие эксперты. Что они сказали — читайте здесь.