DeepSeek відкладає V4 для інтеграції з чіпами Huawei

Китайський стартап DeepSeek відклав повноцінний реліз своєї нової моделі V4, зосередившись на більш глибокій інтеграції з локальною інфраструктурою, перш за все чіпами Huawei Ascend. Про це повідомляє пов'язаний з державним телебаченням акаунт Yuyuantantian, пише Bloomberg.
Замість швидкого запуску компанія витратила місяці на оптимізацію програмного стека під конкретне залізо, що відображає курс Китаю на технологічну автономію на тлі обмеженого доступу до західних чіпів.
Аналітики зазначають, що така стратегія разом із державною підтримкою дозволяє запускати великі мовні моделі повністю на локальній інфраструктурі. Це формує стійкішу екосистему ІІ, навіть незважаючи на відставання від глобальних лідерів.
DeepSeek представила прев'ю флагманської моделі V4 (серії V4 Flash та V4 Pro), позиціонуючи її як «найпотужнішу open-source платформу» у конкуренції з OpenAI та Anthropic.
Ключові характеристики:
- нова архітектура Hybrid Attention для найкращої роботи з довгими діалогами;
- контекстне вікно до 1 млн. токенів;
- використання Mixture-of-Experts з активацією лише частини параметрів (до 37 млрд на завдання);
- значно нижча вартість:
- $1,74 за 1 млн вхідних токенів;
- $3,48 за 1 млн вихідних токенів (проти $3 і $15 у Claude Sonnet 4).
Модель стала продовженням торішнього прориву R1, який спровокував розпродаж на трильйони доларів та змусив ринок переглянути витрати на ІІ.
У той же час, DeepSeek визнає, що V4 відстає від передових моделей приблизно на 3-6 місяців.
Аналітик Bloomberg Intelligence Роберт Лі зазначив:
«Нова модель V4 підтверджує репутацію Китаю як виробника ефективного за витратами ІІ, але навряд чи викличе новий момент DeepSeek, який сколихне ринок. Ми очікуємо, що США збережуть близько шестимісячного технологічного лідерства».
Розвиток DeepSeek супроводжується зростаючим тиском США:
- OpenAI та Anthropic звинувачують компанію у використанні дистиляції – навчанні моделей на основі їх відповідей;
- американські чиновники підозрюють використання заборонених чіпів Nvidia Blackwell;
- Конгрес США вже розпочав розслідування щодо ролі Nvidia у можливій підтримці DeepSeek;
- сенатори заявляють про ризики для нацбезпеки, включаючи витік даних та потенційне військове використання технологій.
Паралельно США консолідують зусилля: OpenAI, Google та Anthropic координують дії проти витоку технологій до Китаю.
Незважаючи на суперечки, ринок позитивно відреагував на нову модель:
- китайські виробники чіпів виросли на новинах;
- DeepSeek веде переговори з Tencent та Alibaba про залучення інвестицій;
- очікується зниження цін після запуску кластерів на базі Huawei Ascend 950 у другій половині року.
При цьому сам стартап визнає дефіцит обчислювальних потужностей – доступ до V4 Pro поки що обмежений.
Експерти зазначають, що головна ставка DeepSeek – не лише продуктивність, а радикальне зниження вартості ІІ. Це може створити тиск навіть на китайських конкурентів, зокрема MiniMax та Zhipu.
