В 1993 году Э. Коддом была предложена концепция OLAP-систем (Online Analytical Processing), включающая в себя 12 правил представления данных пользователю. Подобные системы, как следует из названия, предназначены для анализа данных в интерактивном режиме. В связи с этим основной задачей OLAP-средств является представление больших объемов данных в виде, удобном для анализа конечными пользователями. Представление данных в виде многомерных кубов на сегодняшний день является de facto стандартом пользовательской работы с большими массивами данных.
В данной статье вводятся основные понятия OLAP-систем, которые затем формализуются с использованием математического аппарата теории решеток. В рамках введенной формализации доказывается оптимальность (с точки зрения объема хранимых элементов) представления OLAP-кубов замкнутыми решетками или эквивалентными им Quotient-решетками.
Статья содержит следующие разделы:
- OLAP. Базовые понятия и терминология. Вводятся определения OLAP-кубов, отмечаются их основные требования и свойства.
- Некоторые определения теории решеток. В данном разделе приводятся необходимые в дальнейшем определения теории решеток.
- Математическая модель OLAP-данных. Вводится формальная модель OLAP-кубов, доказывается, что подобное представление является решеткой, и оптимальное с точки зрения хранения представление OLAP-кубов - замкнутые решетки.
- Выводы и направления дальнейших исследований.