Продолжается подписка на наши издания! Вы не забыли подписаться?

Технология OLAP в системах исследования бизнеса

Введение

Эксплуатация информационных систем (ИС) в крупных организациях привела к осознанию принципиальных различий между системами оперативной обработки данных (СООД) и аналитическими системами (АС). Оперативные системы служат для обеспечения эффективной повседневной работы организации, например, системы обработки заказов и выписывания счетов, бухгалтерские системы, системы складского учета и пр. Они часто приобретаются у внешних поставщиков. Эти системы примерно одинаковы у разных фирм и в разных отраслях. Они не требуют глубокого понимания бизнеса данной конкретной фирмы. Поэтому заказать их у поставщика довольно просто.

С другой стороны, аналитические системы позволяют развить стратегические преимущества в конкурентной борьбе, являются мощным инструментом для управления бизнес-процессами. Они требуют большого объема информации о конкретной фирме. Эти системы имеют инфраструктуру, обеспечивающую основу для правильного решения, принимаемого компетентными людьми в отделах-пользователях, а в конечном итоге и руководителями компании.

Использование информации в аналитических системах предполагает несколько этапов: предварительное изучение данных с целью отыскания наиболее значимых элементов; более глубокое изучение этих элементов с целью получения оценки данных, выявления закономерностей или выработки гипотез; и наконец принятие решений или представление выводов заинтересованным сторонам.

Для каждого из этих этапов требуются соответствующие средства, поскольку необходимо рассматривать данные под разными углами зрения, изучать их в разных аспектах, отражающих индивидуальные интересы конечного пользователя.

Технология OLAP (диалоговая аналитическая обработка) позволяет на основании данных моделировать реальные структуры и связи, что особенно важно для аналитических систем. Главное ее отличие от других средств аналитической обработки данных заключается в том, что она предназначена для создания многомерных (многопараметрических) моделей с целью более адекватного представления реальных процессов. Технология OLAP дает возможность быстро менять взгляд на данные в зависимости от выбранных параметров и обеспечивает лицу, принимающему решения, полный обзор ситуации в бизнесе с его собственной стратегической точки зрения.

 1. Системы исследования бизнеса

Сегодняшний деловой мир сталкивается с необходимостью принимать множество решений, опираясь при этом на громадные объемы данных, которые необходимо обрабатывать в более сжатые сроки, чем когда-либо ранее. Достижение конкурентных преимуществ во многом зависит от того, как построена информационная система предприятия. Аналитики, работающие в области информационных технологий, предлагают четко разграничивать аналитические и оперативные системы:

Системы автоматизации, специально предназначенные для анализа и изучения данных, часто называют “системами исследования бизнеса” (business intelligence systems).

Первые аналитические системы, предназначенные для поддержки управления бизнесом, предлагали высокий уровень функциональных возможностей, часто содержали весьма сложный инструментарий обработки данных. Эти системы образуют класс так называемых систем поддержки принятия решений (decision support systems, DSS).Овладеть такими системами было не так-то легко, а их стоимость была достаточно высокой, что ограничивало область их применения.

Простота освоения персональных средств повышения производительности труда, несмотря на весьма скромные функциональные возможности, снискала им невиданную популярность. Эволюция этих средств, включающих электронные таблицы, desktop СУБД и др., шла параллельно с развитием средств вычислительной техники для бизнес-пользователей, и на сегодняшний день подобные системы имеют вполне определенный вес и занимают свою нишу в классе систем автоматизации бизнеса.

Развитие технологий управления востребовало к жизни определенный класс ИС - появились информационные системы, ориентированные на обеспечение потребностей руководителей организаций и подразделений фирм, т.е. лиц, принимающих решения на различных уровнях. Информационные системы для руководителей (executive information systems, EIS) разрабатывались с учетом возможности их быстрого освоения, но обратной сторной простоты использования, как правило, становилось ограничение функциональных возможностей. Эти системы формировали заранее определенный взгляд на данные и не содержали средств, позволявших адаптировать алгоритмы обработки данных, отвечающих потребностями бизнеса и переменам в реальном мире.

Каковы современные концепции построения систем исследования бизнеса, предлагающие решение указанных проблем? Как сформировать гибкие проекции реального мира для обычного пользователя компьютера, обеспечивая его всей требуемой информацией для принятия правильного решения в нужный момент?

Управление бизнесом и хранилища данных

Архитектура ИС, в которой сведено к минимуму влияние сложных запросов аналитической системы на производительность систем оперативной обработки данных, предусматривает разделение ИС на подсистемы. Если компания ставит перед собой задачу всестороннего исследования собственной деятельности с целью оптимизации бизнеса, то при построении ИС непременно возникнет необходимость создать отдельный репозитарий информации, который используется только для целей управления бизнесом. Такой репозитарий называется системой хранения аналитических данных (СХАД) и строится, как правило, по технологии datawarehouse.

Однако создание СХАД означает нечто большее, чем просто перенос информации из оперативных баз данных в некий архив. Прикладные системы управления бизнесом имеют дело с данными, носящими совершенно иной характер, чем в оперативных системах. Поэтому, прежде чем попасть в репозитарий СХАД, данные должны пройти некоторую обработку для того, чтобы соответствовать новым требованиям. Например, в системах исследования бизнеса интересы пользователей сосредоточены на тенденциях и закономерностях данных, а не на отдельных транзакциях, поэтому СХАД должна предлагать соответствующие уровни обобщения данных. Данные должны поддерживать области интересов конечных пользователей (например, такие области, как клиенты, продукты, регионы); иными словами, данные должны быть предметно-ориентированы. Они должны также предоставлять возможность исследования тенденций за какие-то периоды времени, поэтому, в отличие от оперативных данных. которые непрерывно обновляются, данные в СХАД должны представлять собой “моментальные снимки”, сделанные через определенные промежутки времени.

СХАД, по всей вероятности, содержат очень большие объемы данных, не все из которых необходимы всем пользователям. Поэтому широкое признание получила концепция местных “витрин данных” (data marts). Такая витрина данных представляет собой некоторые подмножества данных предприятия, которые необходимы для конкретных подразделений, либо для выполнения конкретных бизнес-функций, либо для конкретных случаев применения.

 2. Три фазы принятия решений

Бизнес-аналитики обычно делят процесс принятия решений на три основных подпроцесса:

поиск и отбор данных, ориентированный на обнаружение основных проблемных областей

анализ и подтверждение, включающее проверку полученных результатов поиска и более детальное их описание

представление результатов, заключающееся в передаче результатов поиска в соответствующей форме потребителям, принимающим решения.

Каждый из этих трех подпроцессов требует различных инструментальных средств или инструментария с широким диапазоном возможностей и способностью сосредоточивать эти возможности на конкретном участке.

Поиск

Средствами поиска могут являться многомерные программы проецирования данных по технологии OLAP, а также средства формирования запросов (например, генераторы запросов на языке SQL). Все они помогают раскрыть интересующие связи.

Основным требованием к средствам поиска и отбора является возможность рассматривать данные во многих разных аспектах или измерениях. Часто при отборе данных требуется такое их представление, которое позволяет легко определить отклонения и аномалии. Например, аналитик может обнаружить, что какое-то конкретное сочетание факторов (например, сбыт продукта в конкретном диапазоне показателей или же за конкретный период времени) не соответствует поставленным целям или ожиданиям, что может содействовать формированию специального представления данных для последующего принятия решения.

Важной характеристикой средств поиска и отбора является время отклика системы на запрос пользователя. Во многом это зависит от методов и алгоритмов, реализующих логику отбора. Применение оптимизированных алгоритмов может сократить продолжительность подпроцесса поиска в десятки и сотни раз.

Анализ и подтверждение

Когда тенденция или аномалия выявлены (например, обнаружено такое сочетание параметров, которое лежит за пределами ожидаемого диапазона), специалисты нуждаются в подтверждении и объяснении обнаруженных областей интереса.

Анализ заключается в проверке существования замеченной тенденции, определении причин ее возникновения, прогнозировании ее развития во времени и составлении уверенного предсказания последствий этой тенденции. Возможность установления отношений (связей) информации по ряду параметров помогает выявлению областей интереса. При этом важна точная оценка прочности этих связей, поскольку обнаружение закономерностей на ранних этапах позволит уловить небольшие изменения скрытых факторов раньше, чем они станут столь очевидными, что проявятся в заметных отклонениях и приведут к негативным последствиям для деятельности фирмы. Подобный подход требует стандартных программ, которые способны комбинировать данные, взятые из многих последовательностей данных.Эти средства могут быть простыми (например, базовый дисперсионный анализ), но могут представлять собой и более сложные регрессионные модели. Такие приложения. как системы анализа финансов и управления рисками, системы моделирования портфеля заказов (ценных бумаг), системы исследования рынка являются типичными примерами аналитических приложений.

Архитектура ИС должна предоставлять пользователю возможность заново вступить в подпроцесс поиска после выполнения некоторого анализа данных. Пользователи могут, например, пожелать выполнить анализ наборов данных для различных выборок (анализ) для того, чтобы сравнить выборки друг с другом (поиск).

И на этом этапе время для специалистов является фактором первостепенной важности. Поэтому средства анализа и подтверждения должны быть надежными и дружественными к пользователю.

Представление результатов

Получившие подтверждение результаты должны быть переданы потребителям, действующим на уровне управления бизнесом. Эффективное представление результатов полностью определяет ценность двух предшествующих подпроцессов. Без мощных средств, способных сделать результаты легкими для восприятия и принятия адекватных мер, усилия специалистов рискуют остаться недооцененными и недоиспользованными.

Представление результатов заключается в формировании отчетов, которые наилучшим образом соответствуют выполнению данной работы. Это могут быть любые средства. начиная от стандартных таблиц, графиков и карт, кончая прогрессивными системами формирования многомерной отчетности. Могут оказаться полезными и средства визуального представления данных, и системы географического анализа (геоинформационные системы).

Имеется целый набор поддерживающих эту функцию средств, в число которых входят диалоговые системы визуального просмотра отчетов, графические инструменты, средства мультимедиа и технология OLAP.

Эти инструменты должны отличаться простотой использования с точки зрения проектировщиков (например, они должны иметь блоки раскраски изображения на экране и функцию “буксировки” с помощью мыши), а также они должны управляться данными. Управляемые данными графики и средства формирования отчетов, с мультимедиа-дополнениями, динамически меняются с изменением данных, причем встроенной частью этого процесса является логика обобщения. Другими словами, конечному пользователю не нужно делать никакой предварительной подготовки данных (например, не надо размещать данные в электронной таблице, чтобы затем экспортировать их в графический пакет). В отличие от таблиц и графиков, формируемых приложениями электронных таблиц, управляемые данными графики помогают представлять результаты исследования работы бизнеса в формате, облегчающем уяснение скрытых последствий обнаруженных тенденций.

3. Многомерные проекции

Размеры и параметры

Что собой представляют параметры в многомерном (многопараметрическом) взгляде на реальные объекты? Важно понимать, что не существует определенного или “правильного” списка параметров. Они должны быть определены в рамках каждого предприятия, должны отражать взгляд этого предприятия на себя и на внешнее окружение.

Параметры обычно распадаются на две категории: фактические и описательные. Фактические отражают некоторый измеряемый аспект наблюдаемого объекта или события. Этот аспект обычно представляется в форме числовых значений (например, в денежных величинах или абсолютных единицах).

Описательные параметры имеют более узкий диапазон значений (например, цвет) и используются для упорядочения, разбиения на группы и обобщения значений фактических параметров. Каждый параметр имеет имя и набор значений, которые может принимать этот параметр.

Так. например, объем продаж в долларах — это “фактический” параметр, а название продукта, регион или период времени — это параметры “описательные”.

Технология OLAP

Диалоговая аналитическая обработка (OLAP) представляет собой просто быстрый способ рассмотрения и анализа графической информации (рисунков, схем. чертежей) в любом аспекте, без необходимости заранее указывать требуемый угол зрения и точный уровень детализации. Другими словами, OLAP—это технология, которая предлагает быстрый доступ к многомерной информации для использования в широком контексте управления бизнесом.

“Многомерность” может показаться весьма отвлеченной концепцией, но это слово просто выражает образ мыслей обычного человека. Наилучший способ проиллюстрировать многомерные проекции — вообразить трехмерный куб (см. рис. 2). Например. пользователи в какой-то организации могут интересоваться характером изменения объема продаж продуктов (изделий) этой организации. Все три измерения куба, т.е. три параметра (сбыт продуктов, регион, время) могут интересовать ряд пользователей. но каждый из них может захотеть взглянуть на данные со своей точки зрения, в зависимости от того, каковы (функции этого человека в организации.

Менеджер по продуктам может интересоваться поведением одной конкретной категории продуктов, во всех регионах, с течением времени (рис. 2.1: с точки зрения категории продуктов).

Финансовый аналитик часто интересуется общими результатами продаж (все продукты. во всех регионах) за конкретный период времени, например, за календарный месяц или календарный год (рис. 2.2: финансовый аспект).

Региональный менеджер, например, управляющий отделением фирмы в какой-то стране. интересуется результатами сбыта в своем географическом регионе (рис. 2.3: региональный аспект).

И наконец, некоторых людей, например, аналитиков рынка, может интересовать одна ячейка в этом кубе (пересечение всех размеров в одной точке), которая в данном случае показывает характеристики отдельных продуктов в конкретное время и в конкретном месте. Обычно такой запрос предпринимается в целях сравнения (рис. 2.4: сравнительный аспект).

Все эти люди рассматривают одни и те же данные, но каждый из них имеет свою точку зрения, которая отражает реальный мир. Это часто именуют “препарированием данных” с помощью трехмерного куба. Конечно, в действительности отдельные люди хотят рассматривать данные с нескольких различных точек зрения, поэтому так важно иметь возможность перейти от одного аспекта к другому, пользуясь только мышью.

В то время как реальный мир имеет всего три измерения, мы зачастую хотим рассмотреть этот мир с гораздо большего числа точек зрения. В нашем примере с объемами продаж можно было бы добавить такие параметры, как планируемый сбыт в сравнении с фактическим, отклонения и т.п., саму же организацию можно было бы разбить по отделам, а также по географическим регионам, и коммерческий отдел можно разделить на группы учета и профит-центры (структурные подразделения, результаты деятельности которых измеряются полученной прибылью). В этом состоит одно из главных преимуществ технологии OLAP перед другими формами отчетности: она использует всю мощь компьютерной технологии для того, чтобы получить полное представление о реальном объекте, глядя на цифры, другими словами, пользователи не ограничены одной категорией информации. Поскольку в реальном мире все факты каким-либо образом связаны друг с другом, этот подход дает гораздо более реалистичное восприятие мира. чем менее сложные инструменты, например, электронные таблицы.

Разновидности технологии OLAP

Существуют различные варианты обеспечения возможностей многомерного анализа. и нет ни одного варианта, который был бы абсолютно правильным во всех ситуациях. По сути дела. есть два основных направления: первое — это многомерная технология OLAP (MOLAP = multidemesional OLAP,), основанная на построении специальной многомерной структуры для хранения тех данных, которые загружаются из СХАД: и второе — это реляционная технология OLAP (ROLAP = relational OLAP), в которой данные только представляются в многомерной форме, а физическое хранение их остается в реляционной форме.

Добавив многомерную технологию OLAP к существующему решению ROLAP, сожно получить средства анализа, сочетающее оба подхода, каждый из которых имеет свои преимущества. При этом интегрированная технология под обозначением HOLAP (hybrid OLAP) может оказаться подходящей для многих организации-пользователей. Технология ROLAP отличается особой гибкостью: пользователи могут определять нужные им многомерные проекции без каких-либо ограничений. Технология MOLAP дает высокую производительность: поскольку данные уже хранятся в предварительно обобщенной форме в многомерном “кубе”, то информация может быть выведена на экран пользователя очень быстро. Как правило, технология MOLAP подходит для случаев. когда данные целиком или почти целиком являются цифровыми и в высокой степени обобщенными (например, консолидированные финансовые данные). Технология ROLAP больше подходит для случая, когда объем данных чрезвычайно велик, или когда они не могут быть обобщены, или же когда между ними нет прочной взаимосвязи (например, некоторые виды данных о персонале).

Детализация данных

Кроме параметров, существующая информация, которую желают исследовать специалисты. различается по степени детализации. Обычно специалист начинает с рассмотрения широкой картины (например, с мирового объема продаж по линейкам продуктов). а затем хочет больше узнать о точках интереса, например, об аномалиях. Поэтому весьма ценной является возможность “просверлить” обобщенные данные до нужного уровня детализации. При “сверлении” по одному параметру (например, страна) пользователь может по желанию развернуть другие параметры (например, категории продуктов).

Сквозной доступ к данным СХАД

Для обеспечения высокой производительности в большинстве задач многомерного анализа, как правило, приложение OLAP используется в качестве “витрины данных”. Это значит, что в меньшинстве случаев может возникнуть необходимость обратиться к хранящимся вне витрины данных СХАД: либо потому, что там нужных данных нет, либо потому, что они там хранятся в недостаточно подробном виде.

Фирма SAS Institute - один из немногих поставщиков, которые поддерживают эту возможность вообще, и единственный поставщик, который поддерживает ее в обеих моделях — как MOLAP, так и ROLAP. В большинстве случаев средства технологии OLAP ограничиваются предоставлением доступа лишь к определенным фирменным базам данных.

Технология OLAP и WWW

СХАД какой-либо организации предоставляет в распоряжение пользователя внутреннюю информацию, требуемую приложениями OLAP. Но возникает вопрос: как обеспечить простой и своевременный доступ к многочисленным внешним источникам данных, имеющимся в сети Internet?

По всей вероятности, подсистема, обеспечивающая доступ к данным WWW из приложений OLAP, не должна ограничиваться одним лишь доступом. Идеальным вариантом было бы предоставление специалисту функциональных возможностей исследования данных WWW в интерактивном (диалоговом) режиме, позволяя формировать нестандартные запросы и создавать статистические модели буквально “на лету”. Шаг в этом направлении сделела фирма Sybase, предложив использовать свой сервер промежуточного уровня Jaguar CTS пока в качестве основы для построения WebOLTP-приложений. Поскольку этот сервер создан в рамках концепции Адаптивной Компонентной Архитектуры Sybase, то независимые рарзработчики компонентов могут реализовать необходимую для OLAP-приложений логику на компонентах, работающих на сервере middleware. Вопрос времени отклика системы в данном случае остается дискуссионным в силу скромного “возраста” программных средств.

Что касается совместного использования результатов анализа, выполненною с помощью технологии OLAP, то они. по всей вероятности, имеют стратегическое значение для конкретной организации, поэтому вряд ли пользователи захотят поставлять свою информацию во внешнюю сеть Internet. Однако Intranet-приложения могут стать удобным способом совместного использования данных OLAP в рамках этой организации.

Динамические запросы

Ход опроса, проводимого каким-либо специалистом, редко бывает предсказуемым; такова природа человеческого творчества. Опрос носит динамический характер (один вопрос следует за другим, часто формулируется буквально “на лету”). Поэтому очень важно, чтобы любое решение OLAP обладало гибкостью, адаптируемостью к новым запросам. Не должно быть ограничений в отношении того, какие вопросы можно задавать (и немедленно получать ответы). Сюда же относится возможность наглядно увидеть, как взаимосвязаны различные количественные параметры и каковы результаты изменения одного конкретного значения, с тем чтобы пользователь мог оценить и сравнить последствия разных мер воздействия на ситуацию.

Ограничения технологии OLAP

Как мы могли видеть, многомерный анализ является частью общей картины исследования и управления бизнесом. Технологию OLAP следует рассматривать главным образом как средство поиска и формирования запросов, используемое для раскрытия информации путем формулирования серии конкретных вопросов и обеспечивающее поддержку аналитиков (в ходе этапа анализа и подтверждения) на уровне обзора. Визуальные - и не только! - формы представления информации (например, средства формирования сложных экранных образов с учетом потребностей пользователя, использование цветовых и звуковых интерпретаций параметров) могут существенно облегчить пользователю восприятие данных.

Однако технология OLAP может оказаться не самым подходящим средством в тех случаях, когда требуется более детальный анализ.

Например, в случае исследований рынка специалист может, изучая круг клиентов организации, использовать многомерный анализ для выявления широко сегментированных параметров (таких, например, как возрастные диапазоны, географическое положение и уровень дохода). Это могло бы помочь другим сотрудникам организации в поддержке решений, касающихся позиционирования продуктов, рекламирования их через средства массовой информации и т.д.

С другой стороны, если компания для привлечения клиентов придерживается четко выверенной стратегии прямого маркетинга, и если критически важно с максимальной точностью нацеливать маркетинговые контакты, то, может быть, понадобится более подробный анализ. Во многих случаях такая деятельность требует “просеивания" данных в поисках закономерностей (patterns), без малейшего представления о том. что собой представляют соответствующие параметры.

В первом случае специалист хорошо представляет себе. какие вопросы следует задавать. Выбранные средства исследования и управления бизнесом, например, технология OLAP, должны отвечать потребностям этого исследования и обеспечивать поддержку представления результатов в такой форме, чтобы они произвели наибольшее впечатление на лиц, принимающих решения.

Во втором случае деятельность в гораздо большей степени нацелена на правильное определение вопросов, которые надлежит задавать. Поэтому весьма вероятно, что специалист или исследователь рассмотрит несколько прогрессивных средств “добычи” данных, например, нейронные сети или древовидные или генетические модели, для того чтобы найти наилучшее решение, учитывающее все выявленные на этапе поиска факторы, которые были признаны потенциально значимыми.

Совместное использование результатов

Одно из главных требований, предъявляемых к средствам OLAP, касается совместного использования и представления результатов. Возможность передачи во все стандартные приложения, которыми пользуются другие подразделения, или публикация в WWW (Internet/Intranet) количественной информации, анализов и отчетов без участия отдела автоматизации в значительной степени повышает ценность аналитической системы, использующей средства OLAP.

Заключение

Технология OLAP предлагает быстрый способ рассмотрения и анализа данных в любом аспекте, с любой точки зрения, не требующий предварительного указания этой точки зрения и нужного уровня детализации. Следовательно, она представляет собой значительный шаг вперед в сравнении с множеством инструментальных средств и методов, которые были разработаны на предыдущих стадиях эволюции систем управления бизнесом.

Технология OLAP особенно хорошо подходит для обслуживания общих нужд опросной системы специалистов. Однако необходимый им уровень анализа может потребовать применения более мощных средств моделирования для исследования значимости и вероятных причин связей между данными. В этом случае огромным преимуществом явилась бы интеграция средств OLAP с другими системами исследования и управления бизнесом, а также с аналитическими и научно-исследовательскими инструментами.

Чтобы приложения OLAP принесли наилучшие результаты, они должны базироваться на прочном фундаменте, который им обеспечит система хранения аналитических данных (СХАД). Когда объем данных велик, целесообразно создать локальные “витрины данных” для самых распространенных приложений, предусмотрев также сквозной доступ к данным СХАД.


Copyright © 1994-2016 ООО "К-Пресс"