Архітектура напівавтоматизованої системи анотації багатомовних архівних рукописних текстів

Івасечко, А. В.; Ліп’яніна-Гончаренко, Х. В.

Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://biblio.umsf.dp.ua/xmlui/handle/123456789/7870

Назва:	Архітектура напівавтоматизованої системи анотації багатомовних архівних рукописних текстів
Автори:	Івасечко, А. В. Ліп’яніна-Гончаренко, Х. В.
Ключові слова:	розпізнавання рукописного тексту створення датасету вебдодаток
Дата публікації:	21-лип-2025
Видавництво:	Університет митної справи та фінансів
Бібліографічний опис:	Івасечко А. В., Ліп’яніна-Гончаренко Х. В. Архітектура напівавтоматизованої системи анотації багатомовних архівних рукописних текстів. Системи та технології. № 1 (69). 2025. С. 71-76.
Короткий огляд (реферат):	У статті розглянуто актуальну науково-прикладну проблему, пов’язану з автоматизованим розпізнаванням історичних рукописних документів, що зберігаються в архівних установах України. Особливу складність становить те, що значна частина цих документів – зокрема періоду XIV–XIX століть – має гетерогенну мовну структуру, включаючи тексти українською, польською, латинською, російською та османсько-турецькою мовами. Окрім багатомовності, історичні тексти відзначаються використанням кількох алфавітів у межах одного документа, що значно ускладнює застосування класичних методів оптичного розпізнавання символів (OCR), які зазвичай орієнтовані на сучасні одномовні друковані документи. Для подолання вказаних викликів у роботі запропоновано архітектуру інтелектуальної системи, здатної до напівавтоматизованого маркування символів у складних текстових фрагментах. Передбачено механізм колективної участі користувачів у процесі лейблінгу та подальшої валідації міток, що дозволяє зменшити ймовірність людських помилок і підвищити якість анотованих даних. Такий підхід сприяє формуванню високоякісних корпусів даних, необхідних для навчання моделей глибинного навчання, адаптованих до розпізнавання рукописних текстів зі змішаною мовною структурою. Ключовими функціональними особливостями запропонованої системи є підтримка мультимовності, мультиалфавітності, а також можливість масштабування процесів розмітки даних відповідно до специфіки історичних джерел. Інструмент орієнтований на створення гнучкого середовища для інтерактивної взаємодії між дослідниками гуманітарної сфери та фахівцями з обробки даних, що, у свою чергу, дозволяє розширити можливості міждисциплінарних досліджень. Запропоноване рішення має як теоретичне, так і практичне значення. З одного боку, воно сприяє розробці нових підходів до автоматизованої обробки історичних джерел у контексті цифрової гуманітаристики. З іншого – забезпечує інструментарій для збереження, вивчення та популяризації національної історико-культурної спадщини шляхом її якісної цифрової трансформації.
URI (Уніфікований ідентифікатор ресурсу):	http://biblio.umsf.dp.ua/xmlui/handle/123456789/7870
ISSN:	2521-6643
Розташовується у зібраннях:	2025/1(69)

Файли цього матеріалу:

Файл	Опис	Розмір	Формат
184-Article Text-348-1-10-20250704.pdf		425,94 kB	Adobe PDF	Переглянути/Відкрити

Показати повний опис матеріалу Перегляд статистики

Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

DSpace JSPUI

DSpace зберігає і дозволяє легкий і відкритий доступ до всіх видів цифрового контенту, включаючи текст, зображення, анімовані зображення, MPEG і набори даних