Методы бикластеризации для анализа интернет-данных


         

с целью исследования были поставлены


В соответствии с целью исследования были поставлены следующие задачи:
  • Выявить и описать методы бикластеризации, использующиеся в различных областях анализа данных, но не вошедшие в современные научные обзоры других исследователей;

  • Построить таксономию алгоритмов и моделей бикластеризации на основе хорошо структурированных критериев;

  • Привести обзор областей применения методов бикластеризации;

  • Составить перечень программных средств бикластеризации по областям применения;

  • Выбрать и реализовать некоторые из алгоритмов для проведения экспериментов на массивах Интернет-данных;

  • Показать пригодность методов бикластеризации для анализа Интернет-данных на экспериментальном материале;

  • В ряде случаев провести сравнительный анализ особенностей методов и установить связь между используемыми вычислительными моделями.

  • В рамках работы не оставлены без внимания системы поиска бикластеров, приводится их обзор. В частности, это системы
  • BicAT — область применения биоинформатика,

  • Concept Explorer, ToscanaJ, Galicia — сообщество ФАП,

  • Coron — Data Mining (ассоциативные правила и частые множества признаков),

  • Cluto, Metis — графовая кластеризация,

  • и Chaco — спектральная кластеризация.

  • Обзор состоит из введения, пяти разделов, заключения и списка литературы.
    В разделе  — "Бикластеризация" описана одноименная задача, указано на ее ключевую роль в анализе данных генетической экспрессии. Приводятся основания для классификации методов и моделей бикластеризации. Определяются типы бикластеров, их структура, стратегии поиска алгоритмов и области значений исходных данных. Построена решеточная таксономия методов бикластеризации.
    В разделе  — "Методы и модели бикластеризации" приводится обзор различных подходов анализа данных, учитывающих их объектно-признаковый характер. Даны основные определения теории решеток и ФАП. Показана связь ассоциативных правил с бикластерами определенного типа.
    Раздел  — "Программные средства бикластеризации" содержит краткий обзор программного обеспечения, которое призвано решать задачи бикластеризации в различных предметных областях.
    Раздел  — "Прикладные задачи" представляет собой краткий обзор основных областей применения алгоритмов бикластеризации с указанием библиографии и пригодных для решения соответсвующих задач методов.
    Раздел  — "Эксперименты на массивах Интернет-данных" описывает результаты применения изучаемых подходов к решению задач поиска документов-дубликатов в Интернете, выявления Интернет-сообществ пользователей на основе статистики посещаемости сайтов и рекомендаций в системах контекстной рекламы.

    Содержание  Назад  Вперед