Технология больших данных продолжает оставаться одной из самых динамично развивающихся в ИТ-отрасли.
Неослабевающий поток продуктов
Продажи приложений, инструментария и услуг обработки больших данных и бизнес-аналитики в прошлом году достигли почти 122 млрд. долл. и к 2019 году вырастут более чем на 50% до 187 млрд. долл., согласно прогнозу IDC.
Так что неудивительно, что этот конвейер, поставляющий на рынок новые решения для Big Data, как от известных вендоров, так и стартапов, продолжает работать, не ослабевая.
CRN/США представляет десять продуктов в этом сегменте, которые привлекли внимание редакции за первые шесть месяцев года. Некоторые из них (но не все) дебютировали на конференции Strata + Hadoop World в марте и на Hadoop Summit в июне.
AtScale Intelligence Platform 4.0
Компания AtScale разрабатывает ПО, которое позволяет бизнес-пользователям работать с данными в кластерах Hadoop, используя уже имеющиеся у них приложения и инструменты бизнес-аналитики, с которыми они хорошо знакомы, — Microsoft Excel, Tableau, QlikView и т. п.
Платформа AtScale Intelligence 4.0, стартовавшая в марте, предлагает «сервис гибридных запросов», как называет его компания, позволяющий делать запросы непосредственно в Hadoop из любого инструмента BI, используя MDX или SQL — два основных синтаксиса запросов к данным, хранящимся в СУБД.
В версии 4.0 улучшены также аспекты безопасности и руководства данными благодаря технологии «подлинного делегирования», гарантирующей, что запросы к Hadoop отвечают политикам управления данными и аудита доступа к данным.
BlueData EPIC для внедрения в облаке
Проекты Big Data часто не идут дальше пилотной стадии из-за сложности и стоимости. Платформа EPIC компании BlueData Software помогает упростить внедрение инфраструктуры Hadoop и Spark и приложений для целей разработки и анализа.
До последнего времени корпоративная версия BlueData EPIC могла использоваться только для локального внедрения на местах, но в июне стартовала версия для внедрения в облаке, которую компания называет Big-Data-как-услуга.
Корпоративная версия BlueData EPIC доступна сейчас на Amazon Web Services ограниченному кругу заказчиков (компания называет эту политику «направленными поставками»). Открытое предложение на AWS, а также для Microsoft Azure, Google Cloud и других платформ общедоступного облака, ожидается в ближайшие месяцы.
Confluent Platform 3.0
Возможность работать с «живыми», потоковыми данными — одна из самых больших трудностей на арене Big Data. Эту задачу берется решить open-source проект Apache Kafka, в рамках которого разрабатывается брокер сообщений для обработки данных в реальном времени с высокой пропускной способностью и малой задержкой.
Компания Confluent была учреждена в сентябре 2014 г. создателями Kafka. Ими двигала идея опереться на свободное ПО, чтобы помочь организациям извлечь ценную информацию из потоковых данных. Платформа Confluent, построенная на базе Kafka, представляет собой систему обработки данных реального времени, функционирующую как отказоустойчивая, высокомасштабируемая система обмена сообщениями. Она может вести сбор данных из таких источников, как журналы регистрации действий пользователя, сигналы контрольно-измерительного оборудования, биржевые тикеры и т. п.
В мае стартовала версия Confluent Platform 3.0, крупное обновление, включающее Kafka Streams — Java-библиотеку для построения приложений распределенной потоковой обработки. Версия 3.0 включает также Confluent Control Center, первый коммерческий продукт компании для администрирования в среде Kafka.
Datameer 6.0 и Datameer Cloud
Компания Datameer разрабатывает платформу аналитики больших данных с функциями самообслуживания для интеграции данных, их подготовки, анализирования и визуализации результатов.
Версия Datameer 6.0 была предложена в мае; она включает новый пользовательский интерфейс и комплекс функций следующего поколения, который выстраивает этапы интеграции, подготовки данных, анализирования и визуализации в единый, плавный интерактивный процесс, повышая при этом эффективность обнаружения данных.
Компания предложила также облачный сервис подготовки данных и аналитики Datameer Cloud, работающий на базе Azure HDInsight и полностью управляемый самой Datameer.
DataStax Enterprise 5.0, OpsCenter 6.0 и Enterprise Graph
Компания DataStax — ведущий игрок на арене баз данных NoSQL-типа. Она предлагает СУБД на основе Apache Cassandra для облачных приложений, способную работать с громадными объемами данных.
2016 год был насыщен событиями для компании. Версия DataStax Enterprise (DSE) 5.0, стартовавшая в июне, включает расширенные функции тиражирования (которые особенно востребованы в приложениях для Интернета вещей и ритейла) и обновленную версию Apache Spark для расширенного поиска и аналитики.
DSE Graph — это масштабируемая графовая база данных реального времени для множества применений, требующих управления массивами сложных данных. Она была представлена в апреле и предложена как опция для DSE.
Также в июне была предложена DataStax OpsCenter 6.0, новая версия системы визуального администрирования и мониторинга для DSE, которая обеспечивает функции мониторинга, тонкую настройку базы данных, предоставление ресурсов, функции резервного копирования и безопасности.
DGSecure 6.0
Компания Dataguise разрабатывает системы безопасности данных, используемые для выявления и защиты наиболее критичных структурированных и неструктурированных данных заказчиков, где бы они ни находились — от привычных реляционных баз данных до хранилищ больших данных, таких как Hadoop.
Версия DGSecure 6.0, представленная в июне, включает новые функции руководства данными, соблюдения требований прайвеси и снижения рисков, в том числе разработку политик управления безопасностью данных. Версия 6.0 включает также новую информационную панель («дашборд») для визуального надзора за рисками уязвимости данных и соблюдением политик прайвеси.
WebFocus BUE от Information Builders
ПО бизнес-анализа WebFocus давно является флагманским продуктом компании Information Builders (IBI). Но корпоративная версия этого ПО традиционно была ориентирована на ИТ-подразделения и разработчиков, готовящих отчеты бизнес-анализа для менеджеров и сотрудников.
Сегодня девизом в бизнес-аналитике стало «самообслуживание»: пользователи получают инструменты, позволяющие им взять на себя обнаружение, подготовку и анализирование больших данных. В июне компания объявила о выпуске новой версии WebFocus Business User Edition (BUE), которая позволяет людям, далеким от ИТ, легко генерировать отчеты, дашборды и визуализации данных без содействия ИТ-отдела или разработчиков BI и делиться своими результатами.
WebFocus BUE включает авторский инструмент аналитики InfoAssist+ с самообслуживанием, предназначенный для пользователей без специальных знаний, BUE Portal для управления контентом и сборки страниц с аналитикой, и столбцовое хранилище, обеспечивающее высокую скорость обнаружения данных.
Это ПО на базе браузера, впервые предложенное ограниченному кругу клиентов в начале этого года, предназначено для групп, насчитывающих до 100 пользователей.
Koverse 2.0
Стартап Koverse предлагает готовое «озеро-данных-в-коробке», позволяющее осуществлять сбор больших данных и вводить их а рабочие процессы гораздо быстрее и при меньших затратах, чем с помощью текущих технологий и методов.
Эта компания из Сиэтла была основана в 2012 году, и ранняя версия ее ПО дебютировала более двух лет назад. Новая Koverse Platform 2.0, которая стартовала 21 июня, задействует технологию «распределенного хранилища ключей/значений» Apache Accumulo и собственный «универсальный механизм индексирования» компании.
Koverse заявляет, что может ввести большие данные в рабочие процессы заказчиков за месяц, а то и меньше — гораздо быстрее, чем занимало построение хранилищ данных в прошлом.
SAS Viya
Viya — это новая платформа аналитики и визуализации, которая может работать в среде общедоступного или частного облака. Это ПО следующего поколения, которое дебютировало в апреле, являет собой первый реальный выход SAS в облако и закладывает фундамент для ее будущего ПО бизнес-аналитики.
Для работы с этой платформой можно использовать не только собственный язык программирования SAS, но и другие, включая Python, Luya и Java, а также поддерживаемые общедоступные REST API.
ПО доступно сейчас ограниченному кругу пользователей и будет предложено рынку уже в этом квартале. Приложения, которые SAS планирует предоставить в этом году для платформы Viya, включают: SAS Visual Analytics, SAS Visual Statistics, SAS Visual Investigator и SAS Visual Data Mining & Machine Learning.
Реляционная СУБД Splice Machine стала свободной
Компания Splice Machine предлагает СУБД, которая сочетает в себе аспекты традиционной технологии реляционных баз данных с масштабируемостью новых баз данных NoSQL-типа и производительностью систем-в-памяти. Эта СУБД, объединяющая в себе технологии HBase, Hadoop и Spark, пригодна и для обработки транзакций, и для задач бизнес-анализа.
В июне Splice Machine совершила смелый шаг, сделав свою СУБД свободным ПО. Соучредитель и главный управляющий Монт Цвебен (Monte Zweben) пояснил: цель состоит в том, чтобы привлечь больше разработчиков на платформу Splice Machine, которые будут строить больше новых приложений для этой СУБД.
Компания предложит версию для сообщества open-source, а также корпоративную версию с более обширной функциональностью и платной лицензией.