Освіта у Львівській політехніці

Розроблення віртуального голосового помічника для виконання запитів користувача з використанням штучного інтелекту

Автор: Денис Андрій Романович

Кваліфікаційний рівень: магістр

Спеціальність: Інформаційні технології проектування

Інститут: Інститут комп'ютерних наук та інформаційних технологій

Форма навчання: денна

Навчальний рік: 2024-2025 н.р.

Мова захисту: англійська

Анотація: Денис А.Р., Денисюк П.Ю. (керівник). Розроблення віртуального голосового помічника для виконання запитів користувача з використанням штучного інтелекту. Магістерська кваліфікаційна робота. Національний університет “Львівська політехніка”, Львів, 2024. Розширена анотація В даній пояснювальній записці цілком обширно описано графічно та текстовою інформацію, про весь необхідний процес ознайомлення з тематикою та проведенням її практичної частини. Загалом, структура записки вийшла на 100+ сторінок, де описані чотири розділи, вступ, висновки, тощо, в яких присутні графічні елементи. Найбільше використано кількості ілюстрацій у третьому та четвертому розділі, де описується практична частина, проілюстровано 28 рисунків. В першому розділі присутня таблиця, де відбувається порівняння наявних голосових помічників. У другому розділі, також присутні ілюстрації та один графік. Використано понад 25 джерел, що в свою чергу допомогло краще розібратись з обраною темою, з практичною складовою, та загалом для особистого розуміння. В записці також присутній додаток, в якому зберігається частина коду, що відповідає за функціонал виконання запитів даного програмного застосунку, також присутні 7 аркушів з графічним матеріалом, в якому розміщені різноманітні блок-схеми, UML-діаграми, і не тільки. Використання голосового помічника завжди було є і буде актуальним у використанні навколишнього суспільства. Дана тематика вивчалась не один, і навіть не десятки років професіоналами, щоб була змога провести певні удосконалення всіх необхідних компонентів. Звичайно, що в подальшому майбутньому ця функціональність полегшить життя простим користувачам набагато, так як ця технологія стрімко розвивається [3]. Так як, поступово виростає динаміка життя, звичайні користувачі ґаджетів не мають час читати довгі пости в інтернеті, писати текст, переглядати довгі відео, тощо. Саме тому, на допомогу тут приходить голосовий помічник, за прогнозами провідних медіа ресурсів, в найближчому майбутньому близько половина запитів в мережі інтернет будуть використовуватись через голосового помічника, що вже свідчить про неабиякий результат використання штучного інтелекту [2]. Голосові асистенти надають можливість мінімізувати, в деяких моментах взагалі усунути необхідність використання периферійних пристроїв, а навіть рук чи очей для перегляду контенту в інтернеті. В даній роботі, проведено детальне ознайомлення та аналіз цієї тематики, проте, не варто забувати і про негативну сторону. Найголовніша проблема є – конфіденційність, оскільки не у всіх програмах встановлений хороший захист. Якщо взяти для прикладу світового лідера по використанням голосових помічників – Alexa, то вона могла відправляти повідомлення не тим адресатам, і це добре, що це тільки повідомлення, а не якась важлива інформація. Саме тому, варто вносити якісь покращені корективи, чи ідеї, як краще оптимізувати роботу, або ж навпаки мінімізувати її для початку, використовуючи перевірені базові команди [1]. В дипломній роботі описано створення застосунку для оброблення та виконання голосових команд та запитів від користувача. В першу чергу, продукт має задовольняти своїм набором команд потенційного користувача, бути зрозумілим під час використання, та мати простий графічний інтерфейс, в свою чергу, планується подальше оновлення програмного застосунку, з метою розвивати продукт для приваблення потенційних користувачів, тощо. Під час виконання практичної частини у дипломній роботі, для створення продукту використовувалась мова програмування Python, з усіма необхідними та додатково завантаженими бібліотеками, основною складовою в цій роботі є окремо завантажена бібліотека – Speech Recognition. Завдяки цій бібліотеці, власне і виконується практично вся частина роботи з програмного коду, оскільки, використовуючи певні модулі, користувач підключає свої звукові пристрої і має змогу комунікувати з штучним інтелектом, тощо. Детальніше про практичну частину можна ознайомитись в третьому розділі даної магістерської роботи. Усі наявні та майбутні запити зберігаються в базі даних MySQL, яку також, через певні сторонні бібліотеки можна підключити до Python коду. Щодо графічного представлення для кінцевого користувача, то в теорії оброблялись декілька варіантів, щодо майбутньої реалізації, тощо. Однак, одним з найоптимальніших варіантів видався – створення простої WEB сторінки, через яку будуть посилатись запити на нашу серверну частину, таким чином, сайт не буде навантажений достатньо графічно, коротко і чітко все буде представлено, кнопка запуску, ознайомчий текст, інструкція. Відповідно, було прийнято рішення використовувати фреймворк Django, для підключення фронтенду для нашого застосунку, ну і в свою чергу задіяні мінімальні навички веб інструментів – HTML, CSS, JS. В ході виконання використовувались також такі середовища розробки – PyCharm та Visual Studio Code. Ключові слова: голосовий помічник, штучний інтелект, Python, Django, Siri, графічний інтерфейс, кінцевий користувач, голос, запит, фронтенд, бекенд. Перелік використаних джерел: Методи та системи штучного інтелекту: теорія та практика // Булгакова О.С., Зосімов В.В., Поздєєв В.О. // Інформаційні технології – 2020 // [Навчальний посібник] Research on the Development of Voice Assistants in the Era of Artificial Intelligence [Електронний ресурс] / Yuqi Huang // Syntaxxx. – 2022. – Режим доступу до ресурсу: https://www.shs-conferences.org/articles/shsconf/pdf/2023/04/shsconf_sdmc2022_03019.pd Humanizing voice assistant: The impact of voice assistant personality on consumers’ attitudes and behaviors // Atieh Poushneh // Journal of Retailing and Consumer Services – 2021. [Електронний ресурс] – Режим доступу до ресурсу: https://www.sciencedirect.com/science/article/pii/S0969698920312911