Жасанды интеллекттің (ЖИ) гибридті модельдерін қолдана отырып уақыттық қатарларды болжау
Қазеке Нұрболат Жасланұлы
Сералиев Даурен Талгатович
М.Өтемісұлы атындағы БҚУ, Ақпараттық жүйелер мамандығының 4 курс студенттері
E-mail: nurbolatkazeke61@gmail.com
Бұл жұмыста экономика, метеорология, энергетика және медицина сияқты салаларда маңызды рөл атқаратын уақыттық қатарларды болжау мәселесі қарастырылады. Уақыттық қатарларды талдаудың дәстүрлі әдістері көбінесе деректердің сызықтық емес және күрделілігіне байланысты шектеулерге тап болады. Осы мәселелерді шешу үшін машиналық оқыту, нейрондық желілер және статистикалық әдістерді біріктіретін жасанды интеллекттің (ЖИ) гибридтік модельдерін пайдалану ұсынылады.
Зерттеу аясында деректерді алдын ала өңдеу, жасырын заңдылықтарды анықтау және дәл болжам жасау процесін біріктіретін тәсіл әзірленді. ARIMA мен LSTM нейрондық желілері немесе SVM және ансамбльдік оқыту әдістерінің комбинациялары сияқты гибридтік модельдерді қолданудың мысалдары келтірілген. Жүргізілген талдау гибридтік модельдердің дәстүрлі әдістермен салыстырғанда болжамның жоғары дәлдігін қамтамасыз ететінін көрсетті.
Зерттеу нәтижелері күрделі уақыттық қатарларды талдауда ЖИ гибридтік модельдерінің әлеуетін растайды және олардың көпөлшемді әрі сызықтық емес деректермен жұмыс істегенде тиімді екенін көрсетеді. Алынған қорытындылар түрлі қолданбалы салалардағы шешімдерді оңтайландыру үшін пайдаланылуы мүмкін.
Кілт сөздер: уақыттық қатарлар, гибридтік модельдер, жасанды интеллект, машиналық оқыту, нейрондық желілер, ARIMA, LSTM, SVM, болжау, деректерді талдау.
Уақыттық қатарларды талдау және болжау экономика, климатология, энергетика және денсаулық сақтау сияқты маңызды салаларда шешуші рөл атқарады. Уақыттық қатарларды талдаудың дәстүрлі әдістері, мысалы, ARIMA және экспоненциалды тегістеу, сызықтық деректермен жұмыс істегенде тиімділігін көрсетеді. Алайда, нақты өмірдегі уақыттық қатарлар көбінесе сызықтық емес және күрделі құрылымға ие, бұл стандартты әдістерді қолданғанда болжамның дәлдігіне кері әсер етеді.
Соңғы жылдары жасанды интеллект (ЖИ) және машиналық оқыту әдістерін уақыттық қатарларды талдауда қолдануға деген қызығушылық артуда. LSTM және GRU сияқты нейрондық желілер уақыттық тәуелділіктер мен сызықтық емес заңдылықтарды тиімді модельдеуде өз тиімділігін дәлелдеді. Дегенмен, бұл әдістерді қолдану параметрлерді баптаудың күрделілігі және деректердегі шудың әсеріне сезімталдық сияқты бірқатар шектеулермен байланысты.
Бұл қиындықтарды жеңу үшін дәстүрлі статистикалық әдістер мен ЖИ алгоритмдерінің артықшылықтарын біріктіретін гибридтік модельдер әзірленді. Мысалы, ARIMA сызықтық компоненттерді, ал LSTM сызықтық емес компоненттерді өңдеу үшін қолданылғанда, болжамның жоғары дәлдігіне қол жеткізуге болады. Алайда әдістерді таңдау және олардың тиімді комбинациясын анықтау әлі де зерттеуді қажет етеді [1].
Осы зерттеудің мақсаты — уақыттық қатарларды болжау үшін ЖИ гибридтік модельдерінің әлеуетін зерттеу және олардың дәстүрлі тәсілдермен салыстырмалы талдауын жүргізу. Міндеттерге гибридтік әдістерді әзірлеу және тестілеу, олардың дәлдігін бағалау және ең тиімді комбинацияларды анықтау кіреді.
Әдебиеттерді шолу бұл мәселенің өзектілігін растайды. Нейрондық желілер мен гибридтік тәсілдерді қолдануға арналған зерттеулер олардың артықшылықтарын көрсетеді, бірақ көбінесе шектеулі сценарийлерге немесе деректердің белгілі бір түрлеріне назар аударады. Бұл зерттеу осы нәтижелерді кеңейтуге және уақыттық қатарлардың кең ауқымына қолдануға бағытталған.
Бұл зерттеуде уақыттық қатарларды болжау үшін гибридтік модельдерді әзірлеу және бағалау әдістері қолданылды. Зерттеу келесі кезеңдерден тұрды:
- Деректерді жинау және алдын ала өңдеу. Зерттеу үшін уақыттық қатарлар деректері әртүрлі ашық деректер жиынтығынан (экономикалық көрсеткіштер, климаттық деректер, энергетикалық тұтыну) алынған. Алдын ала өңдеу барысында деректердің ақаулары мен кемшіліктері түзетілді, жетіспейтін мәндер интерполяция арқылы толтырылды, ал деректерді масштабтау арқылы біркелкілікті қамтамасыз ету үшін барлық мәндер [0, 1] диапазонына келтірілді [5].
- Гибридтік модельдерді құру. Уақыттық қатарлардың сызықтық компоненттерін модельдеу үшін ARIMA қолданылады, ал қалған сызықтық емес компоненттерді болжау үшін LSTM нейрондық желісі пайдаланылады. Қолдаушы векторлық машина (SVM) трендті модельдеу үшін қолданылады, ал GRU нейрондық желісі мәліметтердің маусымдық компоненттерін болжау үшін қолданылады. Әртүрлі модельдердің нәтижелерін біріктіру арқылы соңғы болжамдарды жақсарту үшін ансамбльдік тәсілдер қолданылды [3].
- Модельдерді оқыту және баптау. Әрбір модель үшін гиперпараметрлерді оңтайландыру Grid Search әдісі арқылы жүзеге асырылды. Деректерді оқыту мен тестілеуге бөлу үшін 70% оқытуға, 30% тестілеуге арналған. Оқыту кезінде кері таратудың стандартты алгоритмі қолданылды, ал шығын функциясы ретінде орташа квадраттық қате (MSE) пайдаланылды [2].
- Эксперименттер жүргізу. Әрбір модель бірнеше уақыттық қатарлар үшін сынақтан өткізілді, олардың ішінде сызықтық және сызықтық емес үлгілері бар. Модельдер болжамның дәлдігін бағалау үшін орташа абсолюттік қате (MAE) және орташа квадраттық қате (MSE) сияқты метрикалар қолданылды [8].
- Нәтижелерді талдау. Гибридтік модельдер дәстүрлі әдістермен (мысалы, таза ARIMA немесе тек LSTM) салыстырылды. Әрбір тәсілдің артықшылықтары мен кемшіліктері анықталды [6].
Берілген әдістердің толық сипаттамасы зерттеуді қайталауға және алынған нәтижелерді тәуелсіз тексеруге мүмкіндік береді.
Зерттеу барысында алынған деректер мен модельдер нәтижелері төмендегідей ұсынылған (1-кесте):
Модель |
MAE (Орташа абсолюттік қате) |
|
||||
ARIMA | 0.056 | 0.004 | ||||
LSTM |
|
|
||||
ARIMA-LSTM | 0.032 |
|
||||
SVM-GRU | 0.038 | 0.0022 | ||||
Ансамбльдік модельдер | 0.029 |
|
1-кесте. Модельдердің салыстырмалы дәлдігі
Диаграммада әртүрлі модельдердің орташа абсолюттік қатесі (MAE) мен орташа квадраттық қатесі (MSE) көрсетілген (1-сурет).
1-сурет. Модельдер арасындағы болжам дәлдігі
Барлық алынған нәтижелер көрсеткендей, гибридтік модельдер дәстүрлі әдістерден жоғары дәлдікпен болжам жасайды (2-кесте).
Модель | Қате деңгейі (%) |
ARIMA | 5,6% |
LSTM | 4,2% |
ARIMA-LSTM | 3,2% |
SVM-GRU | 3,8% |
Ансамбльдік модельдер | 2,9% |
2-кесте. Модельдердің болжамдар бойынша қатесі
Зерттеу нәтижелері көрсеткендей, ARIMA, LSTM және олардың гибридті модельдері уақытша қатарларды болжауда айтарлықтай жоғары дәлдікке ие. ARIMA моделі тек сызықты паттерндерді және трендтерді тиімді болжайды, бірақ ол маусымдық өзгерістер мен флуктуацияларды ескермейді. Ал LSTM моделі, керісінше, уақытша қатарлардағы кешенді, сызықты емес қатынастарды жақсы түсінеді және болжамдарды дәлірек жасайды. Гибридті модельдер, әсіресе ARIMA-LSTM, екі модельдің күшті жақтарын біріктіреді, сондықтан олар жалпы нәтижеде жоғары тиімділікті көрсетеді [9].
Зерттеу барысында алынған нәтижелер көрсеткендей, гибридті модельдер арасындағы ARIMA-LSTM үлгісі ең жақсы нәтиже көрсетті. Бұл модель ARIMA-ның сызықты трендтерді тану мүмкіндіктерін және LSTM-нің уақытша қатарлардағы кешенді үлгілерді анықтауға қабілетін біріктіреді, нәтижесінде ол айтарлықтай төмен қателікпен болжам жасады. Сонымен қатар, ансамбльдік модельдер де жоғары дәлдікке қол жеткізді, бірақ олар қосымша есептеу қуатын талап етеді.
Бұл нәтижелер уақытша қатарларды болжаудағы дәстүрлі және заманауи әдістердің тиімділігін салыстыруда маңызды қадам болып табылады. Гибридті модельдер көптеген қолданбаларда, мысалы, экономикада, қаржы нарықтарында, энергетикада және басқа да салаларда пайдалы болуы мүмкін. Сонымен қатар, гибридті тәсілдер дәстүрлі модельдерге қарағанда үлкен деректер мен күрделі паттерндерді өңдеу үшін жақсырақ құрал ұсынады.
Бұрынғы зерттеулерде де уақытша қатарларды болжауда ARIMA және LSTM әдістерінің тиімділігі қарастырылған. Мысалы, Смит пен Чжоу (2018) зерттеулерінде LSTM модельдері дәстүрлі ARIMA-дан жоғары нәтиже көрсеткен. Бұл зерттеуде де ARIMA мен LSTM үйлесімі жақсы нәтиже берді, бұл біздегі нәтижелермен ұқсас болып келеді. Дегенмен, кейбір зерттеулерде ARIMA мен LSTM-нің комбинациясының тиімділігі әлі де толық зерттелмеген, сондықтан біздің жұмысымыз осы бағытта жаңа қадам болып табылады [4].
Зерттеу көрсеткендей, гибридті модельдер уақытша қатарларды болжау саласында тиімді шешімдер ұсынады. Бұл әдістердің жоғары дәлдігі, әсіресе экономикалық болжамдар мен қаржылық тәуекелдерді бағалауда маңызды болмақ. Алдағы уақытта осы модельдердің басқа салалардағы тиімділігі мен кең қолданылуын зерттеу қажет.
Зерттеу нәтижелері уақытша қатарларды болжауда ARIMA, LSTM және олардың гибридті модельдерінің тиімділігін салыстыра отырып, әрбір әдістің артықшылықтары мен шектеулерін анықтады. ARIMA моделі сызықты трендтерді болжауда жақсы нәтиже көрсетсе де, маусымдық өзгерістер мен флуктуацияларды ескермейді. Ал LSTM моделі күрделі, сызықты емес қатынастарды тиімді өңдейді және болжауда жоғары дәлдікке қол жеткізеді. Гибридті модельдер, әсіресе ARIMA-LSTM, екі әдістің күшті жақтарын біріктіру арқылы ең жақсы нәтижелерді ұсынды.
Бұл зерттеу уақытша қатарларды болжаудағы дәстүрлі және заманауи әдістердің тиімділігін көрсетіп қана қоймай, гибридті тәсілдердің жоғары дәлдігін пайдалану мүмкіндігін де ұсынады. Бұл модельдер әртүрлі салаларда, мысалы, экономика, қаржы, энергетика және басқа да салаларда үлкен ықтималдылыққа ие.
Практикалық маңызы: Зерттеу нәтижелері экономикалық, қаржылық және басқа да салаларда уақытша қатарларды болжауда ARIMA, LSTM және олардың гибридті модельдерін тиімді қолдануға мүмкіндік береді. Бұл әсіресе бағаларды болжау, нарықтық талдау және басқа да шешім қабылдау процестерінде маңызды болады. Әсіресе, гибридті модельдер дәстүрлі әдістермен салыстырғанда жоғары дәлдікпен жұмыс істейді, бұл деректерді дұрыс талдау және болжау үшін маңызды артықшылық ұсынады.
Болашақ зерттеулер: Болашақ зерттеулерде гибридті модельдердің тиімділігін кеңінен зерттеу және олардың басқа салалардағы қолданылуын анықтау қажет. Сонымен қатар, осы модельдердің басқа алгоритмдермен біріктірілуін зерттеу, олардың жұмыс істеу принциптерін жетілдіру және есептеу қуатын азайту бағытында жұмыстар жүргізу маңызды болады.
Әдебиеттер тізімі
- Алжеев А.В., Кочкаров Р.А. Сравнительный анализ прогнозных моделей ARIMA и LSTM на примере, Финансы: теория и практика, 2020. 24(1), С.14-23.
- Ковалев М.Я., Лукашевич M.Н., Модели и методы машинного обучения для решения задач оптимизации и прогнозирования работы морских портов, Информатика, Т.19 (4), 2022. С.94-110
- Кугаевских А.В., Муромцев Д.И., Кирсанова О.В., Классические методы машинного обучения, Учебное пособие, Санкт-Петербург, 2022
- Морозова В. И., Логунова Д. И., Прогнозирование методом машинного обучения, Молодой ученый. 2022. № 21 (416), С. 202-204.
- Оханян, Х. Прогнозирование цен акций с использованием глубокого обучения LSTM и эконометрических моделей ARIMA: диссертация. – 2018.
- Рао, Дж. Н. К. Анализ временных рядов, прогнозирование и управление. – 1972.
- Раофи, А., Зарра-Нежад, М., Байани, О. Оценка и сравнение линейных и нелинейных методов для прогнозирования доходности на фондовом рынке // International Journal of Scientific Management and Development. – 2015. – Т. 3, № 10. – С. 595-603.
- Шах, Д., Иса, Х., Зулкернине, Ф. Анализ фондового рынка: обзор и таксономия методов прогнозирования // International Journal of Financial Studies. – 2019. – Т. 7. – № 2. – С. 26.
- Шуй-Линг, Ю., Ли, З. Прогнозирование цен акций на основе комбинированной модели ARIMA-RNN // 4-я международная конференция по социальным наукам (ICSS 2017). – 2017.