Короткий опис (реферат):
У кваліфікаційній роботі розглянуто проблему автоматизації класифікації текстових повідомлень шляхом створення моделі машинного навчання. Завдання класифікації текстів передбачає автоматичне розподілення повідомлень на категорії, що дозволяє значно знизити навантаження на людські ресурси, підвищити точність обробки даних та скоротити час, необхідний для прийняття рішень.
У роботі проведено аналіз сучасних підходів до класифікації текстів, включаючи такі методи, як наївний баєсів класифікатор, метод опорних векторів (SVM), дерева рішень та глибинні нейронні мережі. Кожен із цих підходів оцінено з точки зору їх ефективності, точності, швидкості обробки та можливостей до адаптації у різних умовах.
Для забезпечення якості класифікації було впроваджено алгоритми попередньої обробки тексту, такі як видалення стоп-слів, стемінг, лематизація та векторизація тексту з використанням методів TF-IDF і Word2Vec. Ці етапи дозволили знизити шум у даних, зменшити розмірність задачі та забезпечити підготовку текстів до подальшого аналізу. Практична частина роботи включає розробку програмної моделі, яка забезпечує високу точність класифікації повідомлень на основі експериментально визначених параметрів.