Особливості створення системи, що використовує глибоке навчання для розпізнавання слів або фраз з аудіозаписів
Loading...
Files
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Львівський національний університет ветеринарної медицини та біотехнологій імені С.З. Ґжицького
Abstract
У роботі розглянуто процеси побудови системи розпізнавання мовлення з
використанням сервісу Google Speech-to-Text API, розроблено алгоритми
обробки аудіосигналу, здійснено аналіз шумового середовища та особливостей
української мови при розпізнаванні.
Показано етапи реалізації графічного інтерфейсу користувача (на базі
Tkinter), створення скриптів для захоплення голосу, збереження результатів у
локальних файлах та автоматичне завантаження транскриптів у Google Drive.
Представлено діаграму послідовності обробки аудіофайлів та результати
тестування.
Реалізовано функції асинхронного запису та багатопотокової взаємодії з
API сервісами для забезпечення стабільної роботи інтерфейсу. Сформовано
рекомендації щодо безпечної роботи з обліковими даними та конфігурацією
(через.env).
Надано приклади форматів вхідних/вихідних файлів, обґрунтовано вибір
технологій та засобів реалізації системи.
Ключові слова: розпізнавання мовлення, аудіоаналіз, хмарні сервіси,
Google Speech API, Google Drive, Python, Tkinter
Keywords: speech recognition, audio analysis, cloud services, Google Speech API,
Google Drive, Python, Tkinter
Description
Спеціальність 122 «Комп’ютерні науки»
Keywords
розпізнавання мовлення, аудіоаналіз, хмарні сервіси, Google Speech API, Google Drive, Python, Tkinter, speech recognition, audio analysis, cloud services
Citation
Особливості створення системи, що використовує глибоке навчання для розпізнавання слів або фраз з аудіозаписів. Левицький О.Л. Кафедра інформаційних технологій. - Дубляни, Львівський НУВМБ, 2025. Кваліфікаційна робота: 54 с.