|

Аббревиатура OLAP, (On-Line Analytical Processing) - «аналитическая обработка данных на лету» мало что может сказать о сущности систем этого типа. Это, безусловно, не дает никакого представления о том, что такое OLAP система, почему бы Вы захотели бы использовать этот инструмент, и что он фактически делает. Чтобы лучше понять это, создано простое, легко запоминающееся и не зависящее от конкретного продукта определение. Такое определение носит название теста FASMI (Fast Analysis of Shared Multidimensional Information) – «Быстрый анализ многомерной разделяемой информации». Это определение было впервые использовано в начале 1995 года, и до сих пор является актуальным. Рассмотрим подробно каждую из составляющих этой аббревиатуры. Fast (быстрый). Данное свойство означает, что система должна обеспечивать ответ на запрос пользователя в среднем за 5 секунд. При этом большинство запросов обрабатываются в пределах 1 секунды, а самые сложные – в пределах 20 секунд. Недавние независимые исследования в Нидерландах показали, что пользователь начинает сомневаться в успешности запроса, если он занимает более 30 секунд и интуитивно тянется к заветной комбинации «Ctrl+Alt+ Del» в случае, если система не информировала о том, сколько времени потребуется для вычислений. Analysis (аналитический). Система должна справляться с любым логическим и статистическим анализом, характерным для бизнес-приложений, и обеспечивает сохранение результатов в легком и понятном для конечного пользователя виде. Средства анализа могут включать процедуры анализа временных рядов, распределения затрат, конверсии валют, моделирования изменений организационных структур, поиска целей, извлечения данных (data mining) и других функций в зависимости от приложения и целевого рынка.
Shared (разделяемый). Система должна: - предоставлять широкие возможности разграничения доступа к данным и одновременной работы многих пользователей;
- выполнять все требования безопасности для сохранения конфиденциальности;
- быть способной обработать несколько обновлений в установленные сроки безопасным образом.
Multidimensional (многомерный). Многомерность - это определяющее требование OLAP систем. Если бы пришлось выбрать одно слово для описания OLAP систем, то это было бы слово «многомерность». Система должна обеспечить многомерное представление данных, включая полную поддержку для иерархий и множественных иерархий. Иерархическая модель, несомненно, является наиболее логичным путем для анализа деятельности предприятий. При этом не указывается, какая именно технология баз данных должна применяться для обеспечение концептуально многомерной модели. Information (информация). Информация - это все исходные данные и полученные из них производные данные, касающиеся предмета анализа. Емкость различных продуктов принято оценивать с точки зрения того, сколько входных данных они могут обрабатывать, а не сколько гигабайт они занимают для хранения данных. При выборе OLAP-инструмента следует учитывать целый ряд факторов, включая возможность и необходимость дублирования данных, объем необходимой оперативной памяти, использование дискового пространства, эксплуатационные показатели, интеграцию с информационными хранилищами и др. В опубликованной в 1993 году статье Е. Ф. Кодда (E. F. Codd), впервые было дано формальное определение OLAP-технологии. Эта статья фактически привлекла всеобщее внимание к возможностям многомерного анализа и способствовала значительному распространению этой технологии. В статье были описаны двенадцать правил OLAP, которые впоследствии (в 1995 году) были расширены до восемнадцати. Все эти правила были разделены на четыре группы и названы «характеристиками» OLAP систем, а именно: - основные характеристики – многомерность модели данных, интуитивные механизмы манипулирования данными, доступность данных, пакетное извлечение данных, архитектура «клиент-сервер», прозрачность, многопользовательская работа;
- специальные характеристики – обработка ненормализованных данных, хранение результатов отдельно от исходных данных, выделение отсутствующих данных, обработка отсутствующих значений;
- характеристики построения отчетов – гибкое построение отчетов, стабильная производительность при построении отчетов, автоматическое регулирование физического уровня;
- управление размерностью – общая функциональность, неограниченное число измерений и уровней агрегирования, неограниченные операции между данными различных измерений.
|