|
|
Обзор подготовлен
Возможность быстрого построения сложной аналитики простыми средствами позволяет экономить самый ценный и невосполнимый ресурс – время. Поэтому OLAP для бизнес-пользователей – не просто инструмент, а необходимая часть финансовой и управленческой культуры компании, ее конкурентное преимущество. Эксперты прогнозируют технологическую эволюцию в сегменте OLAP, делая при этом ставку на ключевые тренды развития всего ИТ-рынка: мобильность, персонификацию, социализацию.
Хорошо структурированные базы данных – это первое, но не единственное условие успешной работы современного аналитика. Для надежной визуализации и оперативного сравнения при изучении различных «срезов» хранящихся массивов информации специалисту нужен гибкий инструмент. В качестве такого инструмента давно и хорошо зарекомендовал себя OLAP – (online analytical processing, аналитическая обработка в реальном времени) — технология обработки информации, включающая составление и динамическую публикацию отчетов и документов.
Главный мотив использования OLAP – его скорость. Он позволяет сделать «снимок» реляционной базы данных и структурирует ее в пространственную модель. Обработка запросов в OLAP происходит примерно в тысячу раз быстрее, чем при запросах в реляционную БД. В настоящее время на рынке представлен достаточно широкий выбор инструментов. Наиболее известные OLAP-продукты выпускают SAP, Microsoft, IBM, Oracle, SAS. Среди пользователей распространены два подхода к выбору BI-инструментария: предпочтение на основе подхода best of breeds и использование интегрированной платформы. Кроме того, OLAP со временем превратился в некую концепцию, объединяющую методологию, инструментарий и ставшую относительно независимой от вендоров.
Значение OLAP для пользователей состоит в возможности обеспечить высокую скорость создания отчетов в рамках специализированного хранилища данных, получить данные для выполнения различных видов анализа, разграничить возможности работы для разных групп пользователей в соответствии с политиками безопасности, реализовать многомерные модели данных, то есть строить отчеты в различных разрезах, но на едином источнике информации.
Основная группа пользователей OLAP - акционеры, руководители предприятий и владельцы бизнес-процессов, руководители подразделений, бизнес-аналитики. «Ключевое преимущество использования OLAP, в идеале трансформирующееся в прямую выгоду, - это оперативный доступ к информации, представленной в том объеме и в той аналитической «нарезке», которая нужна управленцу для принятия решения, а исполнителю – для выполнения поставленной задачи», - отмечает заместитель руководителя практики ВРМ-решений NaviCon Group Алексей Куницын.
Впрочем, некоторые специалисты советуют не переоценивать значения OLAP - для бизнеса это всего лишь один из способов получения данных для анализа. Директор департамента аналитических систем компании «Микротест» Сергей Борисов признает, что у OLAP-технологии есть свои преимущества перед OLTP (Online Transaction Processing, обработка транзакций в реальном времени. При таком способе организации БД система работает с транзакциями, небольшими по размерам, но идущими большим потоком). Однако, по его мнению, хорошо спроектированное хранилище данных для аналитической отчетности может легко свести на нет все преимущества OLAP.
По способу хранения данных OLAP можно разделить на три основных типа.
ROLAP (реляционный OLAP) – классический тип. К его несомненным достоинствам относится интуитивно-понятный интерфейс, простота в реализации. В ряде случаев он позволяет обходиться без прослойки в виде хранилища данных, обращаясь непосредственно к данным исходных систем. Существует масса программных продуктов ROLAP на любой вкус и бюджет, в том числе - open source. «Наиболее серьезным недостатком этого типа является невысокая скорость формирования отчетов, - предупреждает г-н Куницын. - А увеличение быстродействия обойдется дорого. Или очень дорого».
«ROLAP не несет никаких агрегированных значений, при получении данных все расчеты проводятся «на лету», здесь маленькие размеры кубов, он очень хорошо подходит для мер, рассчитываемых по агрегатной функции distinct count, - считает г-н Борисов. - Однако при недостаточных вычислительных мощностях сервера период отклика при первичном обращении к кубу будет очень длительным. Ведь на эффективность использования кубов, построенных по ROLAP технологии, очень большое влияние оказывает кэш OLAP-сервера».
MOLAP (многомерный OLAP) был придуман для того, чтобы победить недостатки ROLAP. В отличие от «ближайшего родственника» он работает быстро, предоставляет массу возможностей оптимизации для разработчика модели. Но и он не лишен недостатков. «Главный минус – низкая оперативность обновления данных, - считает г-н Куницын. - С этим можно бороться, но необходимы дополнительные трудозатраты и, следовательно, финансы». Г-н Борисов отмечает, что MOLAP, безусловно, является технологией, позволяющей ощутить все преимущества использования OLAP: время отклика от полностью рассчитанного куба MOLAP будет минимальным. Однако при использовании MOLAP есть существенный риск, что куб превысит все разумные размеры. Особенно это относится к хранению предрассчитанных агрегатов по полуаддитивным мерам.
Эксперты по-разному оценивают преимущества и недостатки двух перечисленных типов систем. Но, если резюмировать, то «плюсы» и «минусы» буду выглядеть так. MOLAP, наиболее «быстрый» тип систем, ценен возможностями для расчета и хранения всех необходимых наборов данных, в том числе - агрегатов. Его недостатки заключаются в ограничениях на количество измерений из-за производительности и в высокой потребности в объемах мест для хранения. ROLAP, проигрывая с точки зрения быстродействия за счет работы с агрегатами и другой специфики, выигрывает в покрытии данных и экономии места.
HOLAP(гибридный OLAP) занимает промежуточную позицию между ROLAP и MOLAP. По словам г-на Борисова, гибридная технология HOLAP наиболее интересна с практической точки зрения. «При наличии на OLAP-сервере возможностей для ручного управления агрегатами эта технология предоставляет разработчику возможность найти баланс между преимуществами и недостатками первых двух», - объясняет он.
Существует еще один современный быстроразвивающийся метод - In-memory OLAP («аналитика в оперативной памяти»). Он очень быстро позволяет не только читать данные из куба, но и добавлять свои данные (например, фактические к плановым) и производить быстрое моделирование «что - если». К недостаткам можно отнести тот факт, что размер куба ограничен размером доступной RAM. В корпоративных системах эта проблема решается разделением кубов на разделы, хранящиеся на разных серверах. Как правило, в In-memory закрытая архитектура. В некоторых системах производительность напрямую зависит от того, какого производителя CPU используется на сервере.
OLAP также можно классифицировать «по локализации». Персональный или настольный OLAP (локальные кубы Excel, PowerPivot, ряд других систем) – характеризуется удобством, быстротой, яркой и наглядной итоговой диаграммой. Персональный OLAP позволяет решить многие проблемы конкретного пользователя благодаря возможности задействовать все доступные ему источники информации и аналитические разрезы. «Но при этом велик риск возникновения «множественных версий правды» в масштабах предприятия, поскольку каждый формирует отчет на основании собственных данных, хранящихся, к примеру, в Excel, - высказывает опасения г-н Куницын. - Поэтому зачастую у каждого в результате получается своя «версия истины». Соответственно, сколько сотрудников формируют отчет – столько версий на выходе и получаем».
Корпоративный OLAP (централизованный), как правило, характеризуется использованием очень мощных инструментов. Кроме собственно средств анализа он предоставляет массу дополнительной функциональности. «Версионность правды» здесь побеждена или сведена к минимуму. Главный его недостаток: если какого-либо аналитического справочника или показателя нет в корпоративном хранилище данных – то можно считать, что его нет в природе, и, следовательно, он не будет учитываться в отчетах. По крайней мере, до тех пор, пока до просьб пользователя не снизойдут ИТ-специалисты.
Пожалуй, самой яркой современной тенденцией развития OLAP с точки зрения бизнес-пользователей стало обеспечение доступа к OLAP-отчетам с мобильных устройств. «Появляются новые интересные технологические возможности для интеграции с различными внешними источниками, расширяются возможности для анализа данных, поступающих из потоковых источников с выполнением основных вычислений "на лету"», - перечисляет наиболее значимые тренды руководитель практики Microsoft BI компании «Микротест» Альберт Хайдаров.
Г-н Куницын, в свою очередь, выделяет в числе основных такую тенденцию, как персонализация: в корпоративные системы OLAP добавляются возможности работы одновременно с локальными данными пользователя и информацией из корпоративного хранилища данных. Еще одним ярким трендом стал оффлайн-анализ: в корпоративные системы добавляется функциональность, позволяющая пользователю извлекать определенный набор данных из централизованного хранилища в виде интерактивного отчета для работы без подключения к сети. Эксперты также обращают внимание на все более тесную интеграцию OLAP и социальных сетей. Это неудивительно: бизнес получает все больше полезной информации посредством web 2.0, поэтому ему необходим гибкий инструмент для анализа.
В ближайшей перспективе, по прогнозам г-на Хайдарова, основными направлениями развития технологий OLAP станут гибкость по отношению к набору данных, скорость добавления новых наборов данных, скорость добавления новых источников исходной информации, расширение ad-hoc возможностей, удешевление стоимости продуктов и поддержки. «В функциональном плане OLAP, скорее всего, будет развиваться исходя из вышеописанных трендов – в сторону «мобильно-персонализированного-социально-ориентированного» real-time анализа», - добавляет г-н Куницын.
Наиболее интересным с технологической точки зрения трендом обещает стать развитие In-memory OLAP и ее схватка с технологией In-memory DataBase. В техническом плане, по мнению BI-экспертов, наиболее вероятной выглядит эволюция OLAP в сторону расширения применения высокопроизводительных in-memory OLAP и ROLAP на базе параллельных и/или column-oriented СУБД.
Андрей Арсентьев