Китайський стартап DeepSeek випустив нову велику мовну модель, яка вже сколихнула індустрію штучного інтелекту. 641-гігабайтна модель, що отримала назву DeepSeek-V3-0324, з'явилася в репозиторії штучного інтелекту Hugging Face практично без жодних анонсів, продовжуючи практику стриманих, але потужних релізів компанії, зазначає VentureBeat. Що робить цей запуск особливо примітним, так це ліцензія MIT, яка робить модель вільно доступною для комерційного використання, а також попередні повідомлення про те, що вона може працювати безпосередньо на комп’ютерах споживчого класу, зокрема, на Mac Studio від Apple з чіпом M3 Ultra.
Хоча Mac Studio вартістю 9499 дол. не зовсім підходить під визначення «споживчого обладнання», та все ж таки можливість запускати таку масивну модель локально − це значний відхід від вимог до центрів обробки даних, які зазвичай асоціюються з найсучаснішим ШІ і покладаються на кілька графічних процесорів Nvidia зі споживанням кількох кіловат енергії. Це потенційно значний зсув у розгортанні ШІ.
Якщо DeepSeek-R2 піде тим же шляхом, що і R1, він може стати прямим конкурентом GPT-5, наступній флагманській моделі OpenAI, яка, за чутками, вийде в найближчі місяці. Контраст між закритим, добре фінансованим підходом OpenAI і відкритою, ресурсоефективною стратегією DeepSeek представляє два конкуруючих бачення майбутнього ШІ.