• К. М. Гурєєва Запорізький національний університет
  • О. В. Кудін Запорізький національний університет
  • А. О. Лісняк Запорізький національний університет
Ключові слова: фінансовий часовий ряд, машинне навчання, класифікація, прогнозування


Часові ряди, які відображають динаміку деякого процесу, є досить складними за своєю структурою та можуть включати тренд, сезонну складову, випадковий шум. Такі часові ряди містять характеристики, що описують зміни стану системи протягом її еволюції. Наприклад, фінансові часові ряди відображають поточний економічний стан, і тому перспективними є дослідження в цій сфері для моделювання подальшого розвитку економіки. У літературі запропоновано велику кількість різноманітних моделей для вирішення проблем прогнозування, це класичні методи математичної статистики, а також методи машинного навчання. Актуальною є задача аналізу сучасних методів і моделей прогнозування фінансових часових рядів та класифікації досить великого обсягу існуючих публікацій за певними ознаками. Метою даної роботи є огляд останніх публікацій з прогнозування фінансових часових рядів, що використовують машинне навчання, статистичні підходи та гібридні моделі. На основі аналізу підходів, що використовуються в різних публікаціях, можна їх класифікувати за двома категоріями. До першої категорії належать роботи, у яких прогнозування здійснюється на основі попередніх значень часових рядів. У публікаціях цього класу використовуються класичні статистичні підходи, такі як ARIMA, GARCH та інші варіанти цих алгоритмів. Також застосовуються прогностичні моделі на основі методів машинного навчання: методу опорних векторів, k-найближчих сусідів, дерев рішень, нейронних мереж різних типів. У багатьох статтях для обробки даних використовуються перетворення Фур’є або вейвлет-перетворення. До другої категорії належать публікації, в яких автори намагаються об’єднати інформацію про конкретні події (фінансові або політичні новини, пошукові запити користувачів) та історію попередніх значень часових рядів. Такі моделі більш складні за рахунок великої кількості параметрів. На підставі аналізу публікацій та методів, що використовуються в них, можна зробити висновок, що найбільш перспективним напрямком дослідження є розробка гібридних систем, що поєднують прогнозування майбутніх значень часових рядів на основі історичних даних і використання додаткових даних з новин, статистики пошукових систем і т.д. Одним з методів розробки таких гібридних систем може бути метод побудови ансамблю різних моделей машинного навчання, які використовували б різні дані для навчання. Перевагою такого підходу є його адаптивність з точки зору використання обчислювальних ресурсів.


