Abstract:
У роботі виконано розробку програмного забезпечення для реалізації кластеризаційних алгоритмів та проведення експериментального порівняння їхньої ефективності на реальних текстових наборах. Проведено оцінку якості кластеризації з використанням відповідних метрик, таких як силуетні бали та внутрішньокластерні відстані, а також візуалізацію результатів для глибшого розуміння структури даних. Результати дослідження демонструють, що правильний вибір алгоритму кластеризації, метрики подібності та методу векторизації тексту є ключовими аспектами для досягнення високої точності групування текстових даних.