Методы бикластеризации для анализа интернет-данных


Основные определения и свойства


Дадим определение частого множества признаков в терминах ФАП.

Определение 2.25   Пусть дан формальный контекст

. Множество признаков

называется частым множеством признаков, если

, где

— заданный числовой порог

.

Здесь контекст

представляет собой объектно-признаковую таблицу, которую можно интерпретировать как базу данных покупок,

— множество транзакций, а

— множество товаров.

Ключевым понятием для данной задачи является поддержка.

Определение 2.26   Пусть дан формальный контекст

. Поддержкой множества признаков

называется величина

.

Значение

показывает, какая доля объектов

содержит

. Часто поддержку выражают в
.

Если задано значение минимальной поддержки

, то Определение 2.25 можно переписать следующим образом.

Определение 2.27   Пусть дан формальный контекст

. Множество признаков

называется частым множеством признаков, если

.

Дадим определения частых замкнутых множеств признаков и максимальных частых множеств признаков.

Определение 2.28   Пусть дан формальный контекст

. Множество признаков

называется частым замкнутым множеством признаков, если

и не существует

, такого что

и

.

Используя оператор замыкания, можно дать следующее определение, эквивалентное 2.28.

Определение 2.29   Пусть дан формальный контекст

. Множество признаков

называется частым замкнутым множеством признаков, если

и

.

Определение 2.30   Пусть дан формальный контекст

. Множество признаков

называется максимальным частым множеством признаков, если

и не существует

, такого что

и

.

Пусть

— множество всех частых множеств признаков,

— множество всех частых замкнутых множеств признаков,

— множество всех максимальных частых множеств признаков. Тогда, очевидно, выполнено следующее соотношение

.

Как уже было отмечено выше, частые замкнутые множества позволяют компактно представлять все множество частых признаков без потерь информации об их частоте. Максимальные множества признаков, хотя и являются компактным представлением даже меньшего размера, не позволяют вычислить поддержку всех частых множеств признаков.




Начало  Назад  Вперед



Книжный магазин