НомериТемиСлайдшоуПодіїРішенняФорум
пошук  
Mirohost - найбільший хостинг в Україні
 >  >  > 
https://www.imena.ua/ua

Новости ИТ-бизнеса

Современные решения
 

Пакет Impala компании Cloudera: SQL-запросы и бизнес-аналитика на Hadoop-кластерах

Автор: Эндрю Браст
07.11.2012

Ориентированная на большие данные система Impala компании Cloudera продвигает выполнение SQL-запросов на уровень, где раньше использовался механизм MapReduce.

Компания Cloudera, которая выпускает коммерческую версию широко известной системы Hadoop, подготовила сюрприз для пользователей, который был анонсирован в конце октября 2012 г. на конференции Strata + Hadoop World в г. Нью-Йорке (США). Вместо того, чтобы пытаться уговорить профессионалов в области классических баз данных и бизнес-аналитики (т. е. фактически подавляющую часть разработчиков и администраторов в промышленных компаниях) перейти на Hadoop, она объявила о выходе бета-версии продукта Impala, который переносит Hadoop-подход на уровень классических задач. Система Impala, входящая в состав пакета CDH 4.1 (Cloudera Distribution Including Apache Hadoop), есть автономный механизм выполнения SQL-запросов, который работает на Hadoop-кластерах, и который обеспечивает простой доступ к данным, хранящимся либо в файловой системе HDFS (Hadoop Distributed File System), либо в базе данных HBase на основе Hadoop.

Компания Cloudera, которая продвигает Hadoop-подход, пытается бороться против устоявшегося мнения, что для запросов к большим данным может использоваться только пакетная обработка с применением механизма MapReduce. Благодаря ее разработке и в области больших данных появляются такие понятия как SQL-запросы, бизнес-аналитика и создание отчетов.

Дежавю?

Возможно, система, предложенная компанией Cloudera, вызовет определенный скептицизм у специалистов, поскольку некоторое время назад в рамках проекта Hive уже был разработан механизм исполнения SQL-запросов (совместимый со стандартными средствами бизнес-аналитики) к данным, хранящимся под управлением Hadoop.

О месте системы Impala и о ее технических деталях рассказал Майк Олсон — глава компании Cloudera. “Хотя Impala имеет программный интерфейс (API) к системе Hive, а также к ее ODBC-драйверу, это совершенно отличный от Hive продукт. Суть системы Hive заключается в том, что она просто преобразует/компилирует SQL-запросы в программу на языке Java с использованием MapReduce-функций, которая затем исполняется в пакетном режиме аналогично другим Hadoop-задачам. Таким образом, Hive добавляет дополнительный шаг перед использованием MapReduce, тогда как система Impala полностью заменяет MapReduce”, — подчеркнул Майк Олсон.

Чистый SQL — основа системы Impala

По определению, система Impala есть автономное средство выполнения SQL-запросов в распределенном режиме, которое работает на Hadoop-кластерах и заменяет собой MapReduce-механизм системы Hadoop. Соответственно, система Impala работает с HDFS — распределенной файловой системой, принятой в Hadoop. Это означает, что Impala работает на физически распределенной архитектуре. При этом, при выполнении запросов, по-прежнему, используется свойство локальности данных, поскольку распределение данных по узлам кластера не изменяется.

Совместимость со средствами бизнес-аналитики

Несмотря на инновационный подход, реализованный в системе Impala, она удачно вписывается в экосистему соответствующих программных продуктов. Один из основателей компании Pentaho Рич Дэйли, а также ее исполнительный вице-президент по развитию бизнеса Эдди Уайт отметили, что их компания активно работает с Cloudera по интеграции средств бизнес-аналитики, разработанных в Pentaho, в систему Impala.

Компания Pentaho подготовила демонстрационное приложение, в котором сопоставляется работа ее средств совместно с Impala с решением аналогичной задачи средствами Hive. В этом приложении запускается некоторый SQL-запрос для выполнения средствами Impalа из системы создания отчетов от Pentaho. Исполнение этого запроса сравнивается с исполнением аналогичного запроса, запущенного из командной строки в системе Hive. После получения результатов запроса от системы Impala над ними выполняется ряд задач отчетного вида, а также происходит визуализация данных, что заканчивается построением полного отчета. Исполнение того же запроса в системе Hive — с теми же самыми данными, на том же самом кластере — занимает значительно больше времени.

Доступность бета-версии

В настоящий момент, компания Cloudera обеспечила возможность свободного скачивания со своего сайта копии виртуальной машины (в форматах VMware, Virtual Box и KVM), в которой преинсталлирована система Impala. Также на ее сайте размещена документация на бета-версию системы.

Тема совместного существования SQL- и MapReduce-подходов в мире больших данных неоднократно поднималась на конференции Strata + Hadoop World. И система Impala — это только один из примеров такого сосуществования.


Поместить в блог
Комментарии к статье
Ваше имя*


Ваш комментарий*


Защита от автоматических сообщений*



Введите символы на картинке
* - Поля, обязательные для заполнения.
CERT-UA фіксує зростання обсягів ворожих атак на 37%
CERT-UA фіксує зростання обсягів ворожих атак на 37%
Зростання загальної кількості кіберінцидентів пов’язано не лише зі зростанням інтенсивності атак, а й зі збільшенням можливостей кіберзахисників до їх виявлення та підвищення кіберобізнаності населення.

В Україні затверджено новий порядок оцінювання стану кіберзахисту
В Україні затверджено новий порядок оцінювання стану кіберзахисту
Важливою особливістю є запровадження регулярного циклу перевірок: власники систем мають проводити планове самооцінювання щороку, тоді як оператори критичної інфраструктури зобов’язані проходити зовнішнє оцінювання не рідше одного разу на два роки.

Кіберполіція припинила діяльність міжнародної мережі фінансових шахраїв
Кіберполіція припинила діяльність міжнародної мережі фінансових шахраїв
Слідством встановлено, що злочинна група діяла за схемою refund fraud — незаконного отримання або вимагання повернення коштів на інтернет-торговельних платформах шляхом подання неправдивої інформації або зловживання...

Українська хакерська спільнота оголосила про підсумки 2025 року
Українська хакерська спільнота оголосила про підсумки 2025 року
Українська спільнота IT-army of Ukraine підвела підсумки року, що минає. Зокрема, в спільноті наголосили, що це був рік еволюції, коли учасники спільноти відійшли від хаотичних атак і перейшли до системного знищення «нервової системи» ворога...

Уряд запровадив двокомпонентну систему державного контролю у сфері кіберзахисту
Уряд запровадив двокомпонентну систему державного контролю у сфері кіберзахисту
Кабмін ухвалив Постанову від 17 грудня 2025 р. № 1668, якою затвердив Порядок здійснення державного контролю за додержанням вимог законодавства у сфері кіберзахисту. Документ вже доступний на сайті Кабміну.

 



Форум
Газета PC Week Ukrainian Edition печатается по лицензионному соглашению с компанией Ziff Davis Publishing Inc. Перепечатка материалов допускается только c разрешения редакции. За содержание рекламных объявлений редакция ответственности не несет. Editorial items appearing in PC Week/UE that were originally published in the U.S. edition of PC Week are the copyright property of Ziff Davis Publishing Inc. Copyright 2015 Ziff Davis Inc. All rights reserved. PC Week is trademark of Ziff Davis Publishing Holding Inc.
© 2026 ООО “ПИСИВИК УКРАИНА”. Информация об авторских правах и порядке использования материалов сайта

//
//