ИСПОЛЬЗОВАНИЕ
АССОЦИАТИВНЫХ ПРАВИЛ КАК ИНСТРУМЕНТА DATA MINING
Баширова Ю. С. (МГТУ, БИ3б-221, ИЭУиМО)
Ковальчук В. В. (МГТУ, кафедра ИСиПМ)
С
возрастанием количества накапливаемых данных, становится все сложнее обрабатывать
и интерпретировать полученные результаты. А, как известно, одно из положений
Data Mining – поиск практически полезных закономерностей [1]. Именно поэтому
сегодня актуальны алгоритмы анализа данных и эта актуальность, несомненно,
растет.
Данная
исследовательская работа посвящена поиску ассоциативных правил. К сожалению,
задача поиска ассоциативных
правил используется только для нахождения типичных
покупок, совершаемых в супермаркетах, поэтому ее еще называют анализом рыночной корзины. Но, на
самом деле, это не только мощнейший инструмент маркетинга. Проведем
эксперимент, и попробуем применить анализ ассоциативных правил для создания
медицинской экспертной системы.
Использование
механизма поиска ассоциативных правил на примере данных о заболеваниях человека
и их симптомах позволит спрогнозировать возможные осложнения течения болезни и
предотвратить ее дальнейшее развитие. В данной научной работе реализован
принцип поиска ассоциативных правил на аналитической платформе Deductor Studio
Academic [2].
Заранее
подготовленную базу данных мы импортируем в аналитическую платформу Deductor (рис. 1).
Для создания медицинской экспертной системы нам понадобятся два типа данных – транзакция
и ее элементы[3]. Транзакцией для нашей системы будет наименование болезни, а
ее элементами – симптомы данной болезни.
Основными
характеристиками ассоциативных правил являются поддержка и достоверность [1]. В
ходе проведения нескольких экспериментов оказалось, что именно при значениях
поддержки от 20 до 60, и достоверности от 40 до 90 формируется требуемый набор
правил.
Для
просмотра полученных результатов предлагается выбрать визуализаторы из списка;
мы выберем такие: «Популярные наборы», «Правила», «Дерево правил», «Что-если».
Для
понимания рассмотрим подробнее визуализатор «Что-если». Он удобен, если нам
необходимо ответить на вопрос, какие следствия могут получиться из данного
условия. Например, выбрав условие «Головокружение», в левой части экрана
получаем следствие «Слабость», для которого указан уровень поддержки (в
абсолютном и процентном выражении) и уровень достоверности (рис. 2).
Рассмотренный
пример поиска ассоциативных правил является иллюстрацией задачи анализа
болезней и их симптомов. В результате ее решения определяются часто
встречающиеся наборы симптомов, а также можно с некоторой достоверностью
определить какие еще симптомы, помимо данного, больной может почувствовать в
скором времени. Следовательно, это поможет своевременно поставить диагноз.
Найденные правила могут быть использованы для решения различных задач, в
частности для создания медицинских экспертных систем.
Рис. 1. Исходная база данных
Рис. 2. Визуализатор «Что-если»
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
1.
ИНТУИТ/ Data mining// Методы
поиска ассоциативных правил. – Режим доступа: http://www.intuit.ru/studies/courses/6/6/lecture/186?page=1. – Загл. с экрана
2.
Basegroup/ Deductor. – Режим доступа:
http://www.basegroup.ru/deductor. – Загл. с
экрана
3.
Basegroup/ Введение в анализ ассоциативных правил.
– Режим доступа: http://www.basegroup.ru/library/analysis/association_rules/intro. – Загл. с экрана
Оставьте свой комментарий
Авторизуйтесь, чтобы задавать вопросы.