Компания Baidu, китайская поисковая система, и Samsung Electronics объявили о создании первого ускорителя искусственного интеллекта от Baidu — процессора Baidu KUNLUN, который предназначен для работы в самых различных платформах, от облака до периферии. Компании готовы запустить его в массовое производство уже в начале следующего года.

В основе чипа Baidu KUNLUN лежит передовая разработка Baidu XPU — собственная архитектура нейронных процессоров для облачных и граничных вычислений, в нем используется 14-нм техпроцесс и технология пакетирования I-Cube от Samsung.

Новый процессор обеспечивает пропускную способность памяти на уровне 512 Гб/с и позволяет осуществлять до 260 TOPS при энергопотреблении 150 Вт. Кроме того, в чипе поддерживается Ernie, предварительно обученная нейронная модель для обработки данных на естественном языке, которая осуществляет построение логических выводов втрое быстрее, чем традиционная модель ускорения GPU/FPGA.

Благодаря большой вычислительной мощности и низкому энергопотреблению новый процессор позволит Baidu с высокой эффективностью выполнять самые различные задачи, в том числе запускать масштабные рабочие нагрузки с использованием искусственного интеллекта, например, ранжировать поисковые результаты, распознавать речь, изображения и естественные языки, а также разрабатывать системы автономного вождения и реализовывать платформы глубокого обучения, такие как PaddlePaddle.

В рамках пилотного сотрудничества Baidu предоставит свои передовые платформы искусственного интеллекта для обеспечения максимальной производительности, а Samsung запустит производство на своих полупроводниковых фабриках процессоров для высокопроизводительных вычислений (HPC), предназначенных для работы в облаке и на периферии.

Поскольку в различных приложениях, таких как рабочие нагрузки искусственного интеллекта или HPC-вычисления, постоянно требуется более высокая производительность, все большую актуальность сегодня приобретают технологии пакетирования (chip integration technology). Представленная Samsung технология интеграции I-Cube, соединяющая логический чип и память с высокой пропускной способностью (HBM2) с подложкой (interposer), позволяет добиться еще более высокой плотности и пропускной способности при минимальном размере за счет использования дифференцированных решений Samsung.

По сравнению с предыдущими разработками новые решения позволяют значительно увеличить производительность процессора и обеспечивают прирост вычислительной мощности / целостности сигнала более чем на 50%. Считается, что внедрение I-CubeTM ознаменует начало новой эпохи на рынке гетерогенных вычислений. Кроме того, Samsung разрабатывает еще более совершенные технологии пакетирования, такие как технологию RDL-подложки (redistribution layers), а также интегрированные корпуса с 4x и 8x HBM памяти.