Інтелектуальна інформаційна система для аналізу наборів даних
Автор: Коростинський Богдан Степанович
Кваліфікаційний рівень: магістр (ОНП)
Спеціальність: Системний аналіз (освітньо-наукова програма)
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2025-2026 н.р.
Мова захисту: українська
Анотація: Актуальність. Аналітика даних є однією з ключових сфер сучасних інформаційних технологій, що визначає ефективність прийняття рішень у науці, бізнесі та державному управлінні. Незважаючи на стрімкий розвиток методів машинного навчання, глибинних нейронних мереж і появу численних інструментів для роботи з великими даними, процеси підготовки, очищення та структуризації наборів даних досі залишаються одним із найскладніших і найресурсомісткіших етапів у побудові аналітичних та інтелектуальних систем. Ці завдання потребують не лише технічної обробки даних, а й ретельного аналізу їх якості, усунення пропусків, дублювань та аномалій, що часто вимагає глибокого розуміння предметної області та значних людських зусиль. Саме ці етапи займають найбільшу частку часу під час реалізації аналітичних проєктів, а відсутність автоматизованих інструментів призводить до зниження якості отриманих результатів [1]. Сучасні тенденції розвитку систем обробки даних спрямовані на інтеграцію інтелектуальних підходів із хмарними обчисленнями, що забезпечують масштабованість і відтворюваність аналітичних процесів. Поєднання машинного навчання та хмарних сервісів дозволяє досягти гнучкої організації даних, зменшити обчислювальні витрати та спростити розгортання аналітичних систем [2]. Об’єктом дослідження є процес створення та застосування LLM-моделі та функціональних можливостей AI-агента з використанням сучасних інструментів для розробки інтелектуального віртуального чатбота-асистента, здатного здійснювати аналіз наборів даних, автоматизувати обробку інформації та надавати аналітичну підтримку користувачеві в інтерактивному режимі. Предметом дослідження є методи інтеграції та застосування зовнішніх інструментів у контексті використання великої мовної моделі як інтелектуального чатбота-асистента, а також підходи до ефективної взаємодії та обробки даних між користувачем, чатботом і зовнішніми джерелами чи наборами даних. Метою дослідження є розробка та реалізація інтелектуальної інформаційної системи, здатної функціонувати як чатбот-асистент з підтримкою обробки, аналізу та взаємодії з різними типами даних за допомогою вбудованих і зовнішніх інструментів. Досягнення поставленої мети передбачає виконання таких задач: • Виконати огляд існуючих методів та інструментів для вирішення задач, аналогічних проекту, та оцінити їхні переваги та обмеження. • Провести системний аналіз предметної області проекту та розробити концептуальну модель інтелектуальної інформаційної системи для аналізу наборів даних. • Розробити та обґрунтувати архітектуру моделі чатбот-асистента для аналізу даних, включаючи структуру обробки та взаємодії даних. • Вибрати та аргументовано обґрунтувати набір програмних засобів для реалізації інформаційної системи, що забезпечують ефективну інтеграцію всіх компонентів. Наукова новизна даного проекту та розробленої інформаційної моделі полягає у створенні ключового блоку інтелектуального агента для обробки та аналізу даних. Розроблена структура забезпечує широкі можливості для подальшого розвитку як цього проекту, так і інших подібних систем у майбутньому. Проект має потенціал інтегрувати всі компоненти технічної екосистеми будь-якого проекту, у якому він використовується, шляхом автоматизованої міжфайлової конвертації та уніфікації наявних даних для ефективної взаємодії між різними модулями та джерелами інформації. Практичне значення отриманих результатів полягає у створенні центрального блоку архітектури чатбота-асистента для обробки даних та реалізації програмного забезпечення, яке демонструє робочий процес взаємодії користувача з системою, обробку вхідних та вихідних даних, а також функціонування великої мовної моделі (LLM) у реальному часі. Опис реалізації завдання: Реалізація системи полягала у розробці та впровадженні моделі, навчанні її для ефективного використання зовнішніх інструментів, створенні власних інструментів та інтеграції їх у єдину екосистему взаємодії користувача з системою. Окрім того, було розроблено зручний графічний інтерфейс, який забезпечує інтуїтивну роботу користувача із системою, включно з можливістю приймання, обробки та виведення файлів і результатів аналізу. Ключові слова – AI-агент, інструменти штучного інтелекту, аналіз даних, мовні моделі. Перелік використаних літературних джерел: 1. Goyle, K., Xie, Q., Goyle, V. (2023). DataAssist: A Machine Learning Approach to Data Cleaning and Preparation. https://arxiv.org/abs/2307.07119 2. Wang, X., Guo, P., Li, X., Gangopadhyay, A., Busart, C.E., Freeman, J., Wang, J. (2021). Reproducible and Portable Big Data Analytics in the Cloud. https://arxiv.org/abs/2112.09762