Компания Baidu, китайская поисковая система, и Samsung Electronics объявили о создании первого ускорителя искусственного интеллекта от Baidu — процессора Baidu KUNLUN, который предназначен для работы в самых различных платформах, от облака до периферии. Компании готовы запустить его в массовое производство уже в начале следующего года.
В основе чипа Baidu KUNLUN лежит передовая разработка Baidu XPU — собственная архитектура нейронных процессоров для облачных и граничных вычислений, в нем используется
Новый процессор обеспечивает пропускную способность памяти на уровне 512 Гб/с и позволяет осуществлять до 260 TOPS при энергопотреблении 150 Вт. Кроме того, в чипе поддерживается Ernie, предварительно обученная нейронная модель для обработки данных на естественном языке, которая осуществляет построение логических выводов втрое быстрее, чем традиционная модель ускорения GPU/FPGA.
Благодаря большой вычислительной мощности и низкому энергопотреблению новый процессор позволит Baidu с высокой эффективностью выполнять самые различные задачи, в том числе запускать масштабные рабочие нагрузки с использованием искусственного интеллекта, например, ранжировать поисковые результаты, распознавать речь, изображения и естественные языки, а также разрабатывать системы автономного вождения и реализовывать платформы глубокого обучения, такие как PaddlePaddle.
В рамках пилотного сотрудничества Baidu предоставит свои передовые платформы искусственного интеллекта для обеспечения максимальной производительности, а Samsung запустит производство на своих полупроводниковых фабриках процессоров для высокопроизводительных вычислений (HPC), предназначенных для работы в облаке и на периферии.
Поскольку в различных приложениях, таких как рабочие нагрузки искусственного интеллекта или HPC-вычисления, постоянно требуется более высокая производительность, все большую актуальность сегодня приобретают технологии пакетирования (chip integration technology). Представленная Samsung технология интеграции
По сравнению с предыдущими разработками новые решения позволяют значительно увеличить производительность процессора и обеспечивают прирост вычислительной мощности / целостности сигнала более чем на 50%. Считается, что внедрение