Короткий опис (реферат):
Магістерська робота присвячена дослідженню методів виявлення аномалій у великих наборах даних. У роботі виконано детальний огляд існуючих підходів до виявлення аномалій, включаючи класичні статистичні методи, алгоритми машинного навчання, методи глибинного навчання та гібридні підходи. Проведено аналіз їхніх переваг і обмежень залежно від характеристик наборів даних та специфіки поставлених завдань. Досліджено основні типи аномалій, такі як локальні та глобальні, а також одновимірні та багатовимірні, і розглянуто специфіку їхнього виявлення у часових рядах, багатовимірних наборах і потокових даних.
Практичну частину роботи присвячено реалізації кількох алгоритмів виявлення аномалій та порівнянню їхньої ефективності на реальних наборах даних. Особлива увага приділена проблемам масштабованості методів для великих обсягів інформації, впливу шуму та неповних даних, а також критеріям оцінки якості результатів. Запропоновано рекомендації щодо вибору методів для вирішення конкретних задач у різних галузях, враховуючи їхню адаптивність і швидкість обробки.
Наукова новизна роботи полягає у проведенні комплексного порівняння сучасних підходів до виявлення аномалій та розробці рекомендацій щодо інтеграції різних методів для підвищення ефективності аналізу.