Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://212.1.86.13:8080/xmlui/handle/123456789/7872
Повний запис метаданих
Поле DCЗначенняМова
dc.contributor.authorБезверхий, О. І.-
dc.contributor.authorЛуц, В. Є.-
dc.date.accessioned2025-07-21T07:30:16Z-
dc.date.available2025-07-21T07:30:16Z-
dc.date.issued2025-07-21-
dc.identifier.citationБезверхий О. І., Луц, В. Є. Порівняльний аналіз API для розпізнавання мовлення за допомогою Python.uk_UA
dc.identifier.issn2521-6643-
dc.identifier.urihttp://212.1.86.13:8080/xmlui/handle/123456789/7872-
dc.description.abstractЗ розвитком комп’ютерних систем стає все більш очевидним, що використання систем розпізнавання мови набагато розшириться, якщо стане можливим використання людської мови при роботі безпосередньо з комп’ютером, і зокрема стане можливим управління машиною звичайним голосом в реальному часі, а також введення і виведення інформації у вигляді звичайної людської мови. Голосовий інтерфейс є необхідним компонентом, коли мова йде про створення комфортних умов життя. Такі системи входять в повсякденний побут, крім того, можливо їх застосування і на виробництві в складі комплексів управління виконавчими механізмами. При створенні системи голосового розпізнавання команд розробник стикається з певними проблемами: відсутність математичної моделі семантики мовного сигналу; що виражається в тому, що для визначення семантики мовного сигналу індивідуальні характеристики мовця: специфіка вимови, акценти, наголоси тощо; робота із спонтанною мовою та необхідність виділення наявності ключового слова; відмінності в акустичній обстановці, шуми, тощо. Параметризація аналогового сигналу мови є першим кроком в процесі розпізнавання мови. Алгоритми призначені для виконання параметричного представлення мовного сигналу: параметри, що описують поведінку людської слухової системи. Природно, ці алгоритми спеціально розроблені для збільшення продуктивності системи розпізнавання мови. Переважні параметри, які є списами спектральних енергій звуку, а не деталями голосу певного диктора У статті розглядається порівняння провідних API розпізнавання мовлення шляхом вивчення їхніх функцій, варіантів використання та показників продуктивності. Аналіз має на меті надати розробникам повне розуміння цих технологій, підкреслюючи їхні переваги та обмеження. Python використовувався для тестування цих API із мікрофонним введенням, пропонуючи розуміння їхньої затримки, точності та практичних застосувань. Це дослідження слугує посібником для вибору найкращого API для конкретних вимог проекту з візуальним представленням результатів для ясності.uk_UA
dc.language.isoukuk_UA
dc.publisherУніверситет митної справи та фінансівuk_UA
dc.subjectрозпізнавання мовленняuk_UA
dc.subjectAPIuk_UA
dc.subjectSpeech-to-Textuk_UA
dc.subjectSpeech Serviceuk_UA
dc.subjectмовні моделіuk_UA
dc.titleПорівняльний аналіз API для розпізнавання мовлення за допомогою Pythonuk_UA
dc.typeArticleuk_UA
Розташовується у зібраннях:2025/1(69)

Файли цього матеріалу:
Файл Опис РозмірФормат 
182-Article Text-344-1-10-20250704.pdf540,8 kBAdobe PDFПереглянути/Відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.