Інтелектуальна система виявлення шахрайських повідомлень на основі нейронних мереж із використанням довгої короткочасної пам’яті
Автор: Степанчук Андрій Петрович
Кваліфікаційний рівень: магістр
Спеціальність: Інформаційні управляючі системи та технології
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2025-2026 н.р.
Мова захисту: українська
Анотація: Актуальність. Зростання кількості цифрових комунікацій супроводжується значним збільшенням випадків шахрайства у вигляді фішингових повідомлень, спам-розсилок та інших форм онлайн-обману. За даними досліджень, щорічні збитки від кіберзлочинів сягають мільярдів доларів, а традиційні методи фільтрації виявляються недостатньо ефективними проти нових форм шахрайства. У контексті побудови Internet of Trust - екосистеми, де цифрові взаємодії базуються на повній перевірці та достовірності інформації, автоматичне виявлення шахрайських повідомлень стає критично важливим компонентом. Ефективні системи виявлення шахрайства є необхідними для забезпечення довіри користувачів до цифрових комунікацій, захисту від фінансових втрат та підтримки кібербезпеки як приватних осіб, так і організацій. Об’єкт дослідження - процес виявлення шахрайських повідомлень у текстових комунікаціях. Предмет дослідження - моделі та програмні засоби класифікації текстових повідомлень на основі рекурентних нейронних мереж LSTM. Мета дослідження - удосконалення засобів виявлення шахрайських повідомлень шляхом розроблення інтелектуальної системи автоматичного виявлення загроз на основі двонаправленої LSTM мережі. Структура роботи. Дана магістерська робота складається зі вступу, чотирьох розділів, висновків, списку використаних джерел та додатків. У першому розділі проведено аналіз сучасних підходів до виявлення шахрайства, досліджено існуючі методи класифікації текстів, виконано системний аналіз задачі та сформульовано вимоги до системи. Другий розділ присвячено постановці задачі, обґрунтуванню вибору архітектури нейронної мережі, проектуванню системи. У третьому розділі описано реалізацію програмного забезпечення, архітектуру системи, процеси передобробки даних та інтеграційні механізми. Експериментальна частина роботи наведена у четвертому розділі, де представлено результати навчання моделі, аналіз метрик якості, порівняння з базовими методами та практична оцінка системи. Методи та інструменти дослідження. У роботі використано методи обробки природної мови (токенізація, лематизація, векторизація тексту), двонаправлені рекурентні нейронні мережі LSTM. Для реалізації застосовано фреймворки TensorFlow/Keras, бібліотеки NLTK для NLP, Flask для створення REST API, а також Java з JDA для розробки Discord-інтеграції. Результати та практичне значення. Розроблено архітектуру двонаправленої LSTM-мережі для бінарної класифікації текстових повідомлень, що забезпечує точність 95.4% на тестовому наборі даних. Реалізовано повний потік обробки тексту з підтримкою автоматичного перекладу для багатомовності. Створено REST API для інтеграції з зовнішніми системами та Discord-бота для практичного застосування в режимі реального часу. Експериментально підтверджено ефективність використання токенізації важливих елементів (URL, email, номери телефонів) для покращення якості класифікації. Отримані результати можуть бути використані для захисту користувачів у месенджерах, email-системах, соціальних мережах та інших платформах цифрових комунікацій. Повний обсяг роботи складає 130 сторінок, в тому числі 93 сторінок основного тексту, 28 рисунків і 3 таблиць. Список використаних джерел налічує 34 найменувань. Ключові слова: виявлення шахрайств, LSTM, глибоке навчання, обробка природної мови, класифікація тексту, нейронні мережі, REST API, Python, Java.