Особливості створення системи, що використовує глибоке навчання для розпізнавання слів або фраз з аудіозаписів

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Львівський національний університет ветеринарної медицини та біотехнологій імені С.З. Ґжицького

Abstract

У роботі розглянуто процеси побудови системи розпізнавання мовлення з використанням сервісу Google Speech-to-Text API, розроблено алгоритми обробки аудіосигналу, здійснено аналіз шумового середовища та особливостей української мови при розпізнаванні. Показано етапи реалізації графічного інтерфейсу користувача (на базі Tkinter), створення скриптів для захоплення голосу, збереження результатів у локальних файлах та автоматичне завантаження транскриптів у Google Drive. Представлено діаграму послідовності обробки аудіофайлів та результати тестування. Реалізовано функції асинхронного запису та багатопотокової взаємодії з API сервісами для забезпечення стабільної роботи інтерфейсу. Сформовано рекомендації щодо безпечної роботи з обліковими даними та конфігурацією (через.env). Надано приклади форматів вхідних/вихідних файлів, обґрунтовано вибір технологій та засобів реалізації системи. Ключові слова: розпізнавання мовлення, аудіоаналіз, хмарні сервіси, Google Speech API, Google Drive, Python, Tkinter Keywords: speech recognition, audio analysis, cloud services, Google Speech API, Google Drive, Python, Tkinter

Description

Спеціальність 122 «Комп’ютерні науки»

Keywords

розпізнавання мовлення, аудіоаналіз, хмарні сервіси, Google Speech API, Google Drive, Python, Tkinter, speech recognition, audio analysis, cloud services

Citation

Особливості створення системи, що використовує глибоке навчання для розпізнавання слів або фраз з аудіозаписів. Левицький О.Л. Кафедра інформаційних технологій. - Дубляни, Львівський НУВМБ, 2025. Кваліфікаційна робота: 54 с.

Endorsement

Review

Supplemented By

Referenced By