Написание контрольных, курсовых, дипломных работ, выполнение задач, тестов, бизнес-планов
  • Не нашли подходящий заказ?
    Заказать в 1 клик:  /contactus
  •  
Главная \ Методичні вказівки \ Методи та засоби інтелектуального аналізу даних

Методи та засоби інтелектуального аналізу даних

« Назад

Методи та засоби інтелектуального аналізу даних  23.07.2014 09:52

Тема 1. Вступ до курсу, концепція і сфери застосування ІАД

Мета, задачі і структура дисципліни. Поняття про інтелектуальні інформаційні системи. Специфіка сучасних вимог до інтелектуального аналізу даних. Концепція шаблонів – як основа технології інтелектуального аналізу даних. Рівні вилучаємих знань із даних та відповідні категорії програмних засобів аналізу даних. Характеристика літературних джерел і періодичних  видань, в яких висвітлюються проблеми створення та використання засобів інтелектуального аналізу даних.

Концепція і визначення дейтамайнінгу.

Сфери застосування дейтамайнінгу: в торгівлі та маркетингу (аналіз купівельного кошика, дослідження часових шаблонів, генерування прогностичних моделей покупців), в банківській справі (виявлення шахрайства з кредитними картками, сегментація клієнтів, прогнозування змін клієнтури), в телекомунікаціях (аналіз про докладні характеристики дзвінків, виявлення лояльності клієнтів), в страховій справі (виявлення шахрайств, аналіз ризику), в електронній комерції (для побудови рекомендаційних систем інтернет-магазинів, для вирішення проблеми персоналізації відвідувачів), в промисловості (прогнозування якості виробів в залежності від вимірюваних параметрів технологічного процесу) та в інших галузях. Співвідношення OLAP та сховищ даних з ІАД.

 

Тема 2. Характеристика процесів, активностей та методів ІАД. Стандартизація ІАД

Етапи процесу дейтамайнінгу. Підтверджуючий (дескриптивний) та дослідницький (предикативний) дейтамайнінг. Класи процесів дейтамайнінгу: виявлення закономірностей, прогностичне моделювання, аналіз аномалій. Основні види закономірностей дейтамайнінгу: асоціація, послідовність, класифікація, кластеризація, прогнозування (регресійний аналіз та прогнозування часових рядів). Користувачі дейтамайнінгу: аналітики, менеджери, кінцеві користувачі. Часові активності дейтамайнінгу: епізодичний, стратегічний, безперервний.

Дерево методів дейтамайнінгу: класи методів: «збереження даних» (Data retention) та «виділення шаблонів». Аналіз переваг та недоліків груп методів дейтамайнінгу.

Необхідність уніфікації та стандартизації в сфері ІАД. Рівні стандартів ІАД. Стандарт опису процесів CRISP-DM. Стандартизація обміну моделей та алгоритмів з використанням PMML. Стандартизація взаємодії інтерфейсів для об'єктних мов програмування (CWM, JDM). Стандартизація взаємодії зі сховищами даних на базі  SQL (Microsoft OLE DB for Data Mining, SQL/MM, DMQL, MSQL, MINE RULE). Проблеми та перспективи ефективного застосування ІАД в умовах економіки України.

 

Тема 3. Методи, засновані на збережених даних

Ідея та механізм кластерного аналізу. Вимоги до кластеризації. Таксономія алгоритмів кластерного аналізу. Міри та матриця схожості як основні прийоми кластеризації. Ієрархічна кластеризація (агломеративні та дивізивні алгоритми). Неієрархічна класифікація (однопрохідні методи та методи перерозподілу).

 Методика «найближчого сусіда». Області використання методу «найближчого сусіда». Відмінності «найближчого сусіда» від кластеризації. Інструментальні засоби, що використовують метод «найближчого сусіда».

Суть методу міркування за прецедентами. Процес міркування за прецедентами. Переваги та недоліки методу міркування за прецедентами. Інструментальні засоби, що використовують міркування за прецедентами.

 

Тема 4. Пошук асоціативних правил та логічних закономірностей в бізнесових даних

Формальна постановка задачі пошуку асоціативних правил. Секвенціальний аналіз. Різновиди задачі пошуку асоціативних правил. Подання результатів пошуку асоціативних правил. Алгоритм Apriori і його різновиди.

Парадигма використання логічних правил та області застосування. Точність і повнота логічних правил. Традиційні методи пошуку логічних правил (алгоритм «Кора», Випадковий пошук з адаптацією).  Інструментальні засоби пошуку правил в базах даних.

 

Тема 5. Дерева рішень в ІАД

Сутність дерев рішень та сфери їх використання. Особливості побудови і використання дерев рішень. Дерева рішень для дослідження альтернатив (загальна схема методу аналізу дерева рішень для аналізу альтернатив, приклади застосування). Дерева рішень для класифікації (сутність класифікації і її методи, загальний опис дерев класифікації, способи побудови дерев класифікації). Алгоритми СART, CHAID, C4.5, ID3, See5, Sipina. Переваги та недоліки дерев рішень. Інструментальні середовища побудови дерев рішень.

 

Тема 6. Штучні нейронні мережі в ІАД

Визначення штучних нейронних мереж та їх історія. Основні задачі, які вирішують штучні нейромережі: класифікація образів, кластеризація, асоціація образів, рекурентні мережі, нейромережі на базі статистичного підходу. прогнозування. Біологічний нейрон та нейромережа як ідейна основа штучної нейронної мережі. Структура та властивості штучного нейрону. Класифікація нейромереж та їх властивості. Архітектура нейромереж: елементарний персептрон Розенблатта, багатошаровий персептрон, нейромережі Хопфілда, нейромережі Хеммінга, порогово-поліноміальні нейромережі тощо. Основи побудови алгоритмів навчання нейромереж. Навчання нейромережі: концепція, навчання з „вчителем” та без, посилене навчання. Попередня обробка даних для нейромережі. Налагодження нейромережі: алгоритми скорочення та конструктивні алгоритми. Практичні питання навчання нейромереж. Особливості використання нейромереж в ІАД. Готове програмне забезпечення нейронних мереж: пакет BrainMaker, NeuroShell, NeuroPro. Приклади вдалого використання нейромереж в економіці: виявлення фальсифікацій, аналіз споживчого ринка, прогнозування зміни біржових індексів, управління цінами та виробництвом, дослідження факторів попиту, оцінка нерухомості, аналіз страхових ризиків. Зв’язок штучних нейромереж з штучним інтелектом, символьні зв’язки штучних нейромереж.

Архітектура та типи нейроконтролерів. Процес навчання нейроконтроллерів. Типовий програмний код нейроконтроллерів.

 

Тема 7. Еволюційні алгоритми в ІАД

Природній відбір  - як ідейна основа генетичних алгоритмів. Визначення генетичного алгоритму та його структура. Історія генетичних алгоритмів. Поняття про: хромосому та її якість, популяцію, покоління, репродукцію. Основні характеристики генетичного алгоритму: розмір популяції, оператор схрещування та його ймовірність, оператор селекції та стратегія елітизму, оператор мутації та її ймовірність, кросовер (інверсія), правило зупинки роботи генетичного алгоритму. Кодування в генетичних алгоритмах. Методи підвищення ефективності генетичних алгоритмів. Особливості генетичних алгоритмів – як спосіб вирішення задач оптимізації, переваги та недоліки. Готове програмне забезпечення генетичних алгоритмів: пакет Evolver компанії Palisade Corp., пакет GeneHunter компанії Ward System Group, пакет  GTO компанії California Scientific Software. Приклади вдалого використання генетичних алгоритмів: пошук максимуму одновимірної функції,  вирішення задачі комівояжера, навчання нейромережі.

Методи групового обліку аргументів: історія, варіанти МГУА, комбінаторні варіанти МГУА, прикладне програмне забезпечення МГУА.

Парадигма еволюційного програмування: історія та перспективи. Спільні схеми локального та генетичного пошуку (модифіковані генетичні оператори, архітектури і стратегії генетичного пошуку). Оптимізаційні задачі на графах.

 

Тема 8. Нечітка логіка в ІАД

Передумови появи нечіткої логіки, використання нечіткої інформації. Історія нечіткої логіки. Основи нечіткої логіки: поняття нечіткої множини, функція приналежності нечіткої множини, методи побудови функцій приналежності, операції над нечіткими множинами, принцип розширення, нечіткі числа, нечіткі відношення, лінгвістична змінна та її параметри.

Нечіткий логічний висновок: поняття  та його етапи; алгоритми нечіткого логічного висновку: Mamdani, Tsukamoto, Sugeno, Larsen, спрощений алгоритм; методи дефазифікації: центроідний, перший максимум, середній максимум, критерій максимуму, висотна дефазифікація. Особливості апарату нечіткої логіки: переваги та недоліки. Готове програмне забезпечення застосування нечіткої логіки: пакет Fuzzy Logic Toolbox системи MATLAB, пакет CubiCalc компанії HyperLogic. Сфери застосування апарату нечіткої логіки.

Проектування бази нечітких правил на основі чисельних даних. Ефективність нечітких систем прийняття рішень. Нечіткий класифікатор.

 

Тема 9. Програмне забезпечення ІАД

Загальна  характеристика систем дейтамайнінгу. Оцінка та стратегія вибору програмної системи дейтамайнінгу. Класифікація програмних систем дейтамайнінгу: за предметною спрямованістю системи; за ступенем інтеграції з базами даних; за ступенем автономності; за типами використовуємих баз даних; за реалізуємими методами. Критичні точки на шляху реалізації проекту ІАД.  Data mining-консалтинг.

Програмні системи web-, text- та мультимедіа-mining в ІАД. Програмні системи візуалізації – як базового методу розвідувального ІАД

Огляд універсальних програмних систем дейтамайнінгу (загальна характеристика, архітектура та інструментарій): 

- компонент Oracle9i Data Mining;

- компонент DB2 Intelligent Miner (компанії IBM);

- служба Analysis Services в Microsoft SQL Server 2000;

- Knowledge Studio (компанії Angoss Software);

- SAS Enterprise Miner;

- Clementine (Integral Solutions).

- Polyanalyst (компанії Megaputer Intelligence) (клієнтська частина - PolyAnalyst Workplace, серверна частина - PolyAnalyst Knowledge Server; математичні модулі).

See5 – як представник систем, що використовують дерева рішень в процесі ІАД. Стисла характеристика інших систем, заснованих на викоританні дерев рішень: SIPINA (University of Lyon, France), IDIS (Information Discovery, USA).

WizWhy – як представник класу програмних систем ІАД, що використовує алгоритми обмеженого перебору для генерування правил.

Огляд систем, які використовують метод CBR: Kaidara (Advisor, Domain Architect, Text2Data) та Affinium Model (компанії Unica, США).

MineSet  - провідна програмна система візуального дейтамайнінгу (компанії Silicon Graphics). Стислий огляд інших систем візуалізації: Miner3D.

 


Комментарии


Комментариев пока нет

Пожалуйста, авторизуйтесь, чтобы оставить комментарий.

Авторизация
Введите Ваш логин или e-mail:

Пароль :
запомнить