Обзор подготовлен

версия для печати

Большие данные: от объема к многовариантности

Большие данные: от объема к многовариантности

"Большие данные" (Big Data) сегодня становятся новым активом для бизнеса, от эффективной работы с которым зависят его будущие прорывы. В новом цифровом мире выигрывает не тот, кто накопит больше информации, а тот, кто быстрее и корректнее сумеет ее обработать и использовать.



"Большие данные" (Big Data) - новое громкое определение, которое кажется очередным (хорошо если не пустозвонным) маркетинговым изобретением. Действительно, маркетологи здесь выгодополучатели в первую очередь - именно на них приходится более 45% проектов использования больших данных. Это закономерно - в погоне за новым "цифровым" потребителем сам маркетинг вынужден становиться все более информатизированным. Аналитики Gartner уже прогнозируют, что к 2017 году главный "маркетер" (СМО) будет тратить на ИТ даже больше, чем CIO. Это нужно, чтобы бизнес мог лучше контролировать и использовать новые каналы взаимодействия с клиентами, становиться проактивными, повышая свою конкурентоспособность.

Что означает эта проактивность для конечного потребителя? В ситуации "больших данных" он явно никогда не будет одинок и предоставлен сам себе. Например, по пути в магазин, чтобы забрать там спецпредложение - именно тот продукт, информацию по которому вы искали накануне в интернете - по выгодной цене, вы получаете пригласительное смс из близ лежащего кафе. Обещают скидку, если зайти за напитком в ближайшие 15-20 минут. А пока пьете кофе, получаете еще смс или email - с извинениями от поставщика услуги, на которого недавно жаловались в соцсети. И так - постоянно, во всем. Мизантропам в мире больших данных в эпоху царствования маркетологов, похоже, придется нелегко.

Данные не во вред

В принципе умение компаний аккуратно и эффективно работать с данными может (и должно) быть не навязчивым, а способствовать, например, восстановлению справедливости. Предположим, в пятницу вечером, в самый час пик, три пассажира хотят улететь в Прагу, -  приводит пример Ян Шимек, вице-президент компании Teradata в Восточной Европе. - У каждого - золотая карта авиакомпании, а место осталось одно. Кого из них и по какому критерию выберет девушка на регистрации? Скорее всего, выбор будет интуитивно-эмоциональным, и самое вероятное - что улетит первым тот, кто громче всех кричит и ругается. При использовании же аналитического инструментария решение в такой ситуации было бы более рациональным, учитывающим ценность пассажира для компании и другие факторы - на основании мгновенно доступной информации.

Другой пример выгодного для конечного потребителя использования активного хранилища данных - когда по пути из одного города в другой несколько раз теряется сотовая связь, а от оператора тут же приходит извинение и расчет компенсации, добавляет Ян Шимек. По его классификации это уже 5-ый, самый продвинутый, уровень работы с данными.

К активному хранилищу компании движутся эволюционно, поясняет он: от отчетов, представляющих картину событий как есть, где априори известны все возможные запросы аналитиков, до расширения аналитических возможностей применительно к прошлому и моделирования будущего, а затем - к новым возможностям получения всей необходимой информации "на лету". Просто в хранении информации самом по себе нет ценности для бизнеса - ценность появляется тогда, когда начинается ее анализ.

Необходимая бизнесу информация поступает из все большего количества источников. Собственно, оно и является ключевым в понятии "больших данных". Отнюдь не просто констатация большого их объема, но акцент на многообразии источников, а также новых типов самих данных и скорости их появления.  

Традиционные данные, поступающие в хранилище - это данные из транзакционных систем (например, ERP, CRM и пр.), - комментирует Донал Дэли, директор Aster Data EMEA. К ним добавляются теперь интерактивные данные - те, что берутся из социальных сетей, блогов и пр. Первые обычно относят к структурированным и ассоциируют с реляционными базами - со строками и колонками. Однако и последние не совсем корректно называть неструктурированными, считает Донал Дэли. Просто здесь структуру сложнее выявить, с ней сложнее работать. Так же как и с изображениями, видео и другими видами данных (например, поступающими с М2М устройств) которые скорее нужно определять как мультиструктурные.

В любом случае компаниям нужно учиться работать с этим данными - например, внимательнее анализировать поведение своих потребителей в интернете в целом, в социальных сетях и т.д. Это позволит лучше понять их мотивацию и потребности, с тем чтобы корректнее строить и поддерживать взаимоотношения с ними. "Аналитика больших данных позволяет приблизиться к клиенту", - резюмирует Донал Дэли. Первопроходцами здесь были интернет-гиганты - Google и Yahoo. Затем к "адопторам" технологии присоединились Ebay, Linkedin. Сейчас время пионеров постепенно заканчивается, и число стремящихся использовать большие данные расширяется по всем отраслям. Уже не интернет-, а традиционные бизнесы размышляют, как дополнить свои хранилища и в целом подходы к работе с данными технологиями big data. Что принципиально нового в жизни с "большими данными" - не нужно делать выборки, можно смотреть на все в целом, - комментирует Донал Дэли.

Большие данные для больших аналитиков

Майк Келер, глава Teradata, поясняет, что сегодня большие данные - это важный аспект новых реалий ведения бизнеса. Причем уже не только для тех компаний, которые привыкли анализировать и понимают всю ценность информации для обеспечения новых возможностей роста доходов. Teradata - безусловно, компания, где в данных знают толк. У нее харизматичная история1, сверхдинамичный для своего сегмента рост и подтекст, отличающий узконишевых профи. BI-шники шутливо называют сами себя data junkies ("данно-зависимыми").  

Что такое data junkie или, официальнее - data scientist: это специалист, который сочетает профессиональные навыки, необходимые для работы с данными, с определенным набором личных качеств - например, любопытством, открытостью всему новому. У которого развита интуиция, а также хорошие коммуникативные навыки. Аналитики должны уметь взаимодействовать не только с теми, кто является для них источниками данных, но и с конечными потребителями информации.

Увлеченные аналитики называют большие данные "новой нефтью" - в том смысле, что именно их использование в бизнесе станет важнейшим драйвером роста. И приводят пример Facebook - оценили бы его в 100 млрд долл. без накопленных этой соцсетью данных?

В любом случае данные и аналитика - это составляющие, безусловно, полезные для бизнеса, но расцветающие особенно ярко в исследовательской экспериментаторской среде. При этом большие данные - это и большая проблема для сегодняшних аналитиков, считает Стивен Бробст, технический директор (CTO) компании Teradata. Предпринимателю здесь проще - он видит во всем не проблемы, а возможности. Аналитикам же придется столкнуться с тем, что сама природа данных серьезно меняется.

Что такое привычные, традиционные данные - это хранимые записи в колонках и строках, которые являются непосредственным результатом работы предприятия. Новые большие данные - это данные, которые относятся в той или иной мере к его работе, во-первых, и сами по себе позволяют создавать новые бизнесы, во-вторых. Волна новых разнообразных источников данных неизбежно приведет к новой волне аналитических инноваций - в бизнесе, госсекторе и академической среде. Новая аналитика позволит принимать решения на основе большей информированности, в некоторых случаях это будут принципиально другие решения, чем сейчас.

Впрочем, это будущее, похоже, уже наступило. По данным опроса TDWI (The Data Warehousing Institute), 74% респондентов (из более 300 ИТ-специалистов, бизнес-спонсоров, консультантов и пользователей) уже используют продвинутую аналитику, а 34% - аналитику больших данных. Организации все больше стремятся исследовать данные, которые раньше выпадали за рамки традиционного BI-инструментария, обрабатывая детали, которые не попадали в хранилище или стандартные отчеты. Это позволит им лучше понимать состояние бизнеса, тщательнее отслеживать критичные аспекты и выявлять проблемы. Чем больше обзор - тем выше гибкость, комментируют аналитики Teradata.

Ближайшее будущее больших данных - за их визуализацией. Например, некоторые казино уже сегодня начинают применять технологии, позволяющие отслеживать движение денег между игровыми залами - т.е.в динамике, а не в статичных диаграммах. Среди других трендов - дашборды в режиме реального времени, in-memory базы данных и облачные технологии. Все, что позволит еще глубже проанализировать "мелочи" жизни и бизнеса - чтобы получить дополнительные преимущества и обеспечить новые стимулы роста.

Teradata - американская компания, которая специализируется на хранении и анализе данных. Входит в ТОП 10 разработчиков ПО в США. В 2011 году консолидировала компании Aster Data и Aprimo. Капитализация - более 10 млрд долл. Более 1300 клиентов в 70 странах. Рост в регионе ЕМЕА в 2011 г. +24%, выручка в 2011 г. - 2,4 млрд долл.

Мария Попова

Техноблог | Форумы | ТВ | Архив
Toolbar | КПК-версия | Подписка на новости  | RSS