Alibaba бросила вызов DeepSeek, выпустив новую модель ИИ
Фото: Pexels
Китайская технологическая компания Alibaba выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max, которая, по ее заявлению, превосходит разработку DeepSeek-V3.
Интересно, что релиз состоялся в первый день празднования Китайского Нового года, когда большинство жителей страны отдыхают. Это может свидетельствовать о давлении, которое вызвал стремительный успех DeepSeek за последние три недели, заставляя Alibaba и других китайских разработчиков ускорять обновление своих моделей, передает Reuters.
По данным облачного подразделения Alibaba, модель Qwen 2.5-Max "почти по всем показателям" превосходит GPT-4o, DeepSeek-V3 и Llama-3.1-405B — самые современные модели от OpenAI и Meta.
В последнее время китайский стартап DeepSeek вызвал ажиотаж в мире технологий. Его модель DeepSeek-V3, представленная 10 января, а также выпущенная 20 января R1, всколыхнули рынок и вызвали беспокойство в Кремниевой долине. Инвесторы начали сомневаться в необходимости многомиллиардных вложений в разработку искусственного интеллекта, поскольку DeepSeek предлагает значительно более дешевые решения.
На фоне успеха DeepSeek конкуренты пытаются улучшить собственные модели. ByteDance, владелец TikTok, всего через два дня после запуска DeepSeek-R1 выпустила обновление к своей флагманской модели искусственного интеллекта. По словам компании, ее модель превзошла OpenAI o1 в тесте AIME, который оценивает способность ИИ выполнять сложные задачи.
Ранее, в мае 2023 года, DeepSeek выпустила DeepSeek-V2, что стало причиной ценовой войны в Китае. Благодаря открытому коду и беспрецедентно низкой стоимости — всего 1 юань ($0,14) за 1 млн токенов — другие китайские компании, включая Alibaba, Baidu и Tencent, были вынуждены значительно снизить цены на свои модели.
Основатель DeepSeek Лян Вэньфэн в редком интервью китайскому медиа Waves в июле заявил, что компания не занимается ценовыми войнами, поскольку ее основная цель — достижение AGI (искусственного общего интеллекта). В отличие от технологических гигантов с их сложными управленческими структурами, DeepSeek работает как исследовательская лаборатория с небольшой командой молодых выпускников и докторантов.
Лян также отметил, что крупные корпорации могут быть не лучшими игроками в будущем развитии искусственного интеллекта, ведь их расходы высоки, а инновации имеют ограничения.
Подготовил: Сергей Дага





Происшествия «У Польщі чоловіка засудили за напад на українських підлітків через українську мову»
Общество «Попри атаку РФ усі об'єкти ЧАЕС заживлені від енергосистеми України у штатному режимі»
Происшествия ««Підтримка військових та медиків — наш пріоритет» — Валерій Дубіль про гуманітарну місію фонду «Надія» на Сумщину»
Происшествия «Великобритания хочет запретить использование соцсетей для детей до 16 лет»
Политика «Зеленський пропонував європейським лідерам створити Об'єднані збройні сили»
Происшествия «Окупантит просунулась у Покровську і на північ від Мирнограда, - DeepState»