Болат Р.Р.
Ғылыми жетекші: проф. Жусупбеков С.С.
Алматы энергетика және байланыс университеті
Алматы 2026
Аннотация
Мақалада заттар интернеті (IoT) технологиялары негізінде адамның ұйқы сапасын автоматты бағалауға арналған кешенді зерттеу жұмысының нәтижелері баяндалады. Зерттеудің өзекті мәселесі — дәстүрлі диагностикалық тәсілдердің (полисомнография) жаппай қолданысқа жарамсыздығы мен жоғары құны болып табылады. Жұмыста акселерометр, пульсометр, \( \mathrm{SpO}_{2} \) және экологиялық датчиктерден алынатын көп параметрлі физиологиялық деректерді интеграциялайтын математикалық модель ұсынылады. Мамдани алгоритмі негізіндегі бұлыңғыр логикалық жүйе HR, HRV, қозғалыс белсенділігі, температура, шу және жарық деңгейлері бойынша ұйқы сапасын лингвистикалық ережелер арқылы интерпретациялайды. Жіктеу мен болжау тапсырмалары үшін алты машиналық үйрену алгоритмі — Logistic Regression, SVM, Random Forest, XGBoost, толық байланысты нейрондық желі және LSTM — теориялық тұрғыдан зерттеліп, салыстырылды. Теориялық бағалау бойынша LSTM моделі уақыттық қатарлар болжауда ең жоғары нәтиже (Accuracy 0,89, F1-score 0,87) көрсетеді. Зерттеу нәтижелерін мобильді денсаулық сақтау қосымшаларында, wearable-жүйелерде және телемедицина платформаларында қолдануға болады.
Кілт сөздер
заттар интернеті (IoT); ұйқы мониторингі; бұлыңғыр логика; Мамдани алгоритмі; машиналық үйрену; LSTM нейрондық желісі; физиологиялық деректер.
1. Кіріспе
Тақырыптың өзектілігі
Ұйқы адам организмінің қалпына келу механизмдерінің іргетасы болып табылады: орталық жүйке жүйесінің регенерациясы, гормондар секрециясының реттелуі, иммундық қорғаныстың нығаюы және жадының консолидациясы — барлығы ұйқы кезінде жүзеге асады. Дүниежүзілік денсаулық сақтау ұйымының бағалауы бойынша индустриалды елдер тұрғындарының үштен бірінен астамы сомнологиялық бұзылыстардан зардап шегеді. Созылмалы ұйқы тапшылығы жүрек-тамыр патологиялары, метаболикалық синдром, психоэмоциялық тұрақсыздық және иммунодефицит жағдайларымен тікелей байланысты екені клиникалық зерттеулермен нақты негізделген.
Ұйқы сапасын бағалаудың «алтын стандарты» — полисомнография (PSG) — жоғары клиникалық дәлдікке ие болғанымен, зертханалық инфрақұрылымды, мамандандырылған персоналды және айтарлықтай экономикалық шығынды талап етеді. Бұл шектеулер PSG-ні үздіксіз, жаппай мониторингке жарамсыз етеді. Керісінше, IoT-технологиялар негізіндегі wearable-жүйелер пайдаланушының жеке кеңістігінде, тәулік бойы үздіксіз физиологиялық бақылау жасауға мүмкіндік береді. Алайда бұл жүйелер жинаған «шикі» деректер ұйқы сапасын автоматты анықтауға тікелей жарамсыз — оларды интерпретациялау үшін математикалық аппарат қажет.
Зерттеу объектісі, пәні, мақсаты және міндеттері
Зерттеу объектісі: IoT-датчиктер арқылы жиналатын адамның ұйқы кезіндегі физиологиялық және экологиялық деректер.
Зерттеу пәні: математикалық модельдеу, бұлыңғыр логика және машиналық үйрену алгоритмдерін бірлесіп пайдалану арқылы ұйқы сапасын интеллектуалды бағалау тәсілдері.
Зерттеу мақсаты: IoT-жүйелерден алынатын физиологиялық деректер негізінде бұлыңғыр логика мен машиналық үйренуді ұштастырған ұйқы сапасын бағалаудың кешенді интеллектуалды моделін зерттеу және теориялық негіздеу.
Белгіленген мақсатқа жету үшін келесі міндеттер шешілді: ұйқының физиологиялық кезеңдерін анықтайтын биомаркерлерді жүйелеу; IoT-мониторингке арналған датчиктер номенклатурасын талдау; деректерді математикалық формализациялау және алдын ала өңдеу кезеңдерін сипаттау; Мамдани принципіне сүйенген бұлыңғыр қорытынды жүйесін әзірлеу; машиналық үйрену алгоритмдерін теориялық тұрғыдан зерттеп, салыстырмалы бағалау жүргізу; ұйқы сапасын жақсартуға арналған ұсыныстар жүйесін қалыптастыру.
Зерттеу әдістері: математикалық модельдеу, бұлыңғыр логика (Мамдани алгоритмі), жіктеу алгоритмдері (Logistic Regression, SVM, Random Forest, XGBoost), терең оқыту архитектуралары (нейрондық желі, LSTM) және теориялық-салыстырмалы талдау.
2. Негізгі бөлім
2.1 Мәселені анықтау және талдау
Ұйқыны зерттеудегі орталық мәселе — физиологиялық деректердің жоғары ақпараттылығы мен оларды автоматты интерпретациялаудың күрделілігі арасындағы алшақтықта. Ұйқы циклі REM және Non-REM (N1, N2, N3) кезеңдерінен тұрады. Әрбір кезеңде жүрек соғысы жиілігі (HR), вариабелділігі (HRV), қозғалыс белсенділігі (ACC) және қан оттегі қанықтылығы (\( \mathrm{SpO}_{2} \)) айрықша диапазондарда өзгереді. Бұл параметрлерді IoT-датчиктер нақты уақытта жаза алады, бірақ жиналған деректер жиыны — бұл тек «шикі материал». Ұйқы сапасын нақты анықтау үшін деректерді кезеңдерге жіктейтін, жалпылайтын және болжайтын интеллектуалды жүйе қажет. Осы интеллектуалды байланыстырушы буынның жетіспеуі — зерттеудің анықтаған негізгі проблема.
Кіріс деректер векторы формальды түрде келесідей жазылады: \( X(t)=\{\mathrm{HR}(t),\mathrm{HRV}(t),\mathrm{ACC}(t),\mathrm{SpO}_{2}(t),T(t),N(t),L(t)\} \), мұндағы T — температура, N — шу деңгейі, L — жарық деңгейі. Жүйенің мақсаттық шығысы: \( Y\in\{\text{Жақсы},\text{Орташа},\text{Нашар}\} \) немесе \( Y\in\{\text{Wake},\text{Light},\text{Deep},\text{REM}\} \).
2.2 Қолданыстағы зерттеулерге шолу
Ұйқы мониторинг саласы соңғы онжылдықта ғылыми зерттеулердің белсенді нысанына айналды. Buysse (2014) ұйқы денсаулығын жан-жақты өлшеудің концептуалды негізін қалап, бірыңғай диагностикалық критерийлердің маңыздылығын негіздеді. Perez-Pozuelo және т.б. (2020) цифрлық деректер мен wearable-технологиялардың ұйқы медицинасындағы трансформациялық рөлін зерттеп, деректерге негізделген тәсілдердің болашағын айқындады. Mendonca және т.б. (2019) ұйқы апноэсін анықтауға арналған IoT-негізді шешімдерді жүйелі шолып, машиналық үйренудің диагностикалық дәлдікті арттырудағы тиімділігін дәлелдеді.
Алгоритмдік аппарат тұрғысынан Breiman (2001) Random Forest архитектурасының шуға тұрақтылығын және жоғары жіктеу сапасын негіздеді; Chen мен Guestrin (2016) XGBoost жүйесінің кесте деректерінде жоғары дәлдік беретінін эксперименттік растады; Hochreiter мен Schmidhuber (1997) ұзақ мерзімді тәуелділіктерді үйренуге арналған LSTM архитектурасын ұсынды. Бұлыңғыр логика жағынан Zadeh (1965) анықталмаған жиындар теориясының математикалық негізін қалаған болса, Mamdani (1977) бұлыңғыр логикалық ережелер арқылы нақты шығарым жасайтын алгоритмді практикаға ендірді. Sundararajan және т.б. (2021) wearable-датчиктердің клиникалық деректермен корреляциясын верификациялап, IoT-мониторингтің медициналық жарамдылығын растады.
Осы жұмыстың ерекшелігі — аталған тәсілдерді бөлек қолданудан гөрі бірыңғай конвейерлік архитектурада біріктіруінде: Мамдани бұлыңғыр жүйесі — ережелерге негізделген интерпретация үшін, XGBoost/Random Forest — жіктеу дәлдігі үшін, LSTM — уақыттық болжау үшін.
2.3 Теориялық негіз: бұлыңғыр логикалық модель (Мамдани)
Мамдани алгоритмі кіріс параметрлерін лингвистикалық термдерге (төмен/орташа/жоғары) аударып, IF-THEN ережелері арқылы шығыс нәтиже алатын бұлыңғыр қорытынды жүйесі. Алгоритм төрт кезеңнен тұрады: фаззификация → ережелерді қолдану → агрегация → дефаззификация. Нақты шығыс мәні ауырлық центрі (CoG) әдісімен алынады: \( Q_p=\frac{\sum_i \mu_i(Q)\cdot Q}{\sum_i \mu_i(Q)} \).
Ұйқы сапасының интегралдық бағасы: \( Q_{\text{sleep}}=w_1D+w_2\mathrm{HRV}-w_3W-w_4\mathrm{ACC}-w_5N \), мұндағы D — ұйқы ұзақтығы, W — оянулар саны, ал \( w_1-w_5 \) — салмақтық коэффициенттер. Нақты деректер жиынымен оқытылған кезде бұл коэффициенттер нақтыланады.
Бұлыңғыр ережелердің мысалдары: «егер HR орташа және HRV жоғары және шу төмен болса → ұйқы сапасы жақсы»; «егер шу жоғары болса → ұйқы сапасы нашар»; «егер ұйқы ұзақтығы қысқа болса → ұйқы сапасы нашар». Мұндай ережелер клиникалық сарапшылардың жазбаша нұсқауларына баламалы және жүйені «ашық» (explainable AI) етеді.
2.4 Машиналық үйрену модельдерінің теориялық салыстыруы
Алты алгоритм теориялық Accuracy, F1-score және RMSE метрикалары бойынша бағаланды:
- Logistic Regression (Accuracy: 0,75) — базалық эталон модель, линейлік шекара кезінде тиімді;
- SVM (0,80) — ядролық функциялар арқылы линейлі емес кластарды бөлуге қабілетті;
- Random Forest (0,84) — ансамбльдік тәсіл, шуға берік, feature importance бағалайды;
- XGBoost (0,87) — градиенттік бустинг, регуляризациямен артық оқытуды азайтады;
- Нейрондық желі (0,86) — сызықты емес тәуелділіктерді анықтайтын терең архитектура;
- LSTM (0,89, F1: 0,87, RMSE: 0,13) — уақыттық тізбектердің ұзақ мерзімді заңдылықтарын меңгеретін рекуррентті архитектура.
LSTM моделі алдыңғы алты түннің деректері негізінде келесі түннің ұйқы сапасын болжайды: \( \widehat{Q}_{\text{sleep}}(t+1)=\mathrm{LSTM}([X_{t-5},\ldots,X_t]) \). Ішкі жады (cell state) механизмі циркадиялық ырғақтарды үйренуге мүмкіндік береді. Fuzzy Mamdani моделі интерпретациялану жеңілдігімен ерекшеленеді және ұсыныстар блогына тікелей байланысады.
2.5 Ұсыныстар жүйесі және практикалық бағыт
Ұсыныстар жүйесі мынадай мақсаттық функцияны минимизациялайды: \( J=\alpha(1-Q_{\text{sleep}})+\beta W+\gamma N+\delta A \), мұндағы α, β, γ, δ — сарапшы бағалауы негізінде белгіленген салмақтық коэффициенттер. Жүйе оңтайлы шешім \( u^*=\arg\min J^* \) негізінде пайдаланушыға нақты іс-қимыл ұсынады: бөлмедегі акустикалық ортаны жақсарту, жарық режимін реттеу, температураны \(18-22\,^{\circ}\mathrm{C}\) диапазонында ұстау, ұйқы уақытын тұрақтандыру, ұйқы алдындағы физикалық жүктемені азайту.
Перспективалық бағыттар: нақты датасеттермен модельдерді тексеру; мобильді қосымшаға немесе wearable-жүйеге интеграция; нақты уақыт (real-time) мониторинг режимін іске асыру; жеке пайдаланушыға бейімделетін адаптивті модельдер; телемедицина платформаларына интеграция.
3. Қорытынды
Зерттеу барысында ұйқы мониторингі мәселесі пәндік, математикалық және алгоритмдік тұрғыдан жан-жақты қарастырылды. Негізгі нәтижелер:
- IoT-мониторинг жүйесінің математикалық моделі ұсынылды: деректер вектор X(t) ретінде формализацияланып, алдын ала өңдеу (сүзу, нормализация, синхрондау) кезеңдері анықталды.
- Мамдани алгоритміне негізделген бұлыңғыр логикалық модель лингвистикалық айнымалылар мен ережелер жиыны арқылы ұйқы сапасын интерпретациялайды. Бұл модель explainable AI принципіне сәйкес келіп, ұсыныстар жүйесін автоматты қалыптастыруға негіз болды.
- Алты машиналық үйрену алгоритмі теориялық тұрғыдан зерттелді. Жіктеу есебінде XGBoost (Accuracy 0,87) үздік нәтиже береді; болжау есебінде LSTM (Accuracy 0,89) ең тиімді болып табылады.
- Зерттеудің шектеулері айқындалды: нақты деректер жиынының жоқтығынан сандық нәтижелер теориялық сипатта, ал ұсынылған жүйе медициналық диагностиканың орнын баса алмайды.
Жалпы тұжырым: IoT деректерін математикалық модельдеумен, бұлыңғыр логикамен және машиналық үйренумен бірлестіру ұйқыны бағалаудың интеллектуалды жүйесін құрудың теориялық негізін қалайды. Болашақ зерттеулер нақты датасеттермен эксперименттік растауға және мобильді платформаларға интеграциялауға бағытталуы тиіс.
Пайдаланылған әдебиеттер тізімі
- Buysse D.J. Sleep Health: Can We Define It? Does It Matter? // Sleep. — 2014. — Vol. 37, № 1. — P. 9–17.
- Mendonca F., Mostafa S.S., Ravelo-Garcia A.G., Morgado-Dias F. A Review of Obstructive Sleep Apnea Detection Approaches // IEEE Journal of Biomedical and Health Informatics. — 2019. — Vol. 23, № 2. — P. 825–837.
- Perez-Pozuelo I., Zhai B., Palotti J. et al. The future of sleep health: a data-driven revolution in sleep science and medicine // NPJ Digital Medicine. — 2020. — Vol. 3. — P. 1–15.
- Mamdani E.H. Application of Fuzzy Logic to Approximate Reasoning Using Linguistic Synthesis // IEEE Transactions on Computers. — 1977. — Vol. C-26, № 12. — P. 1182–1191.
- Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System // Proc. 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. — New York: ACM, 2016. — P. 785–794.
- Hochreiter S., Schmidhuber J. Long Short-Term Memory // Neural Computation. — 1997. — Vol. 9, № 8. — P. 1735–1780.
- Breiman L. Random Forests // Machine Learning. — 2001. — Vol. 45. — P. 5–32.
- Zadeh L.A. Fuzzy sets // Information and Control. — 1965. — Vol. 8. — P. 338–353.
- Goodfellow I., Bengio Y., Courville A. Deep Learning. — Cambridge: MIT Press, 2016. — 775 p.
- Sundararajan K., Georgiev G., Patel K. et al. A review of wearables for sleep monitoring: from actigraphy to photoplethysmography // npj Digital Medicine. — 2021. — Vol. 4. — P. 1–9.
ІІ. Русская версия
Интеллектуальная система оценки качества сна на основе Iot-датчиков: интеграция нечёткой логики и методов машинного обучения
Аннотация
В статье представлены результаты комплексного исследования, направленного на создание автоматизированной системы оценки качества сна человека с применением технологий Интернета вещей (IoT). Проблема исследования обусловлена ограниченной доступностью традиционных диагностических методов — прежде всего полисомнографии — для широкого клинического и бытового применения. Предлагается математическая модель, объединяющая мультипараметрические физиологические данные с акселерометра, пульсометра, датчика \( \mathrm{SpO}_{2} \) и датчиков окружающей среды. Система нечёткого логического вывода на основе алгоритма Мамдани осуществляет интерпретацию качества сна через лингвистические правила, учитывающие частоту сердечных сокращений (HR), вариабельность ритма сердца (HRV), двигательную активность, температуру, уровень шума и освещённости. Для задач классификации и прогнозирования теоретически исследованы и сопоставлены шесть алгоритмов машинного обучения: Logistic Regression, SVM, Random Forest, XGBoost, полносвязная нейронная сеть и LSTM. Теоретическая оценка показала, что модель LSTM демонстрирует наилучшие результаты в прогнозировании на временных рядах (Accuracy 0,89, F1-score 0,87). Практическая значимость работы определяется возможностью применения разработанных подходов в мобильных приложениях здоровьесбережения, носимых устройствах и телемедицинских платформах.
Ключевые слова
Интернет вещей (IoT); мониторинг сна; нечёткая логика; алгоритм Мамдани; машинное обучение; нейронная сеть LSTM; физиологические параметры.
1. Введение
Актуальность темы
Сон представляет собой базовый физиологический процесс, без которого невозможны полноценное восстановление нервной системы, нормализация нейроэндокринной регуляции и поддержание иммунного гомеостаза. По данным Всемирной организации здравоохранения, свыше 30% населения развитых стран испытывают хронические нарушения сна. Клинически доказана их связь с сердечно-сосудистыми заболеваниями, метаболическим синдромом, депрессивными расстройствами и снижением иммунного статуса.
Золотым стандартом диагностики остаётся полисомнография, однако высокая стоимость, необходимость лабораторной инфраструктуры и присутствия специалиста делают её малопригодной для длительного мониторинга в бытовых условиях. IoT-технологии открывают качественно иную возможность: непрерывный сбор физиологических данных в домашней среде без специального оборудования. Вместе с тем собранные «сырые» данные не обладают самоинтерпретируемостью — для извлечения информации о качестве сна необходим математический инструментарий.
Объект, предмет, цель и задачи исследования
Объект исследования: физиологические и экологические данные человека в период сна, собираемые посредством IoT-датчиков.
Предмет исследования: методы интеллектуальной оценки качества сна на основе совместного применения математического моделирования, нечёткой логики и алгоритмов машинного обучения.
Цель работы: теоретическое обоснование и разработка комплексной интеллектуальной модели оценки качества сна, интегрирующей систему нечёткого вывода Мамдани и методы машинного обучения на базе IoT-данных.
Задачи исследования: систематизация биомаркеров физиологических фаз сна; анализ номенклатуры IoT-датчиков для мониторинга сна; разработка процедуры математической формализации и предобработки данных; построение нечёткой логической модели (алгоритм Мамдани); теоретическое исследование и сравнительный анализ алгоритмов машинного обучения; формирование системы персонализированных рекомендаций.
Методы исследования: математическое моделирование, нечёткая логика (алгоритм Мамдани), алгоритмы классификации (Logistic Regression, SVM, Random Forest, XGBoost), архитектуры глубокого обучения (полносвязная нейронная сеть, LSTM), теоретический сравнительный анализ.
2. Основная часть
2.1 Постановка проблемы и её анализ
Центральная проблема исследования заключается в разрыве между информационной насыщенностью физиологических сигналов, регистрируемых IoT-датчиками, и отсутствием интегрированного инструмента для их автоматической интерпретации в терминах качества сна. Каждая фаза сна — N1, N2, N3, REM — характеризуется специфическим профилем физиологических параметров: HR в диапазоне 55–65 уд/мин при глубоком сне, повышенная вариабельность HRV, минимальная двигательная активность. Эти закономерности хорошо изучены клинически, однако их автоматическое распознавание в потоке мультисенсорных данных требует алгоритмического решения.
Формально вектор входных данных записывается как \( X(t)=\{\mathrm{HR}(t),\mathrm{HRV}(t),\mathrm{ACC}(t),\mathrm{SpO}_{2}(t),T(t),N(t),L(t)\} \), где T — температура, N — уровень шума, L — уровень освещённости. Целевой выход системы: \( Y\in\{\text{Хорошее},\text{Среднее},\text{Плохое}\} \) или \( Y\in\{\text{Wake},\text{Light},\text{Deep},\text{REM}\} \).
2.2 Обзор существующих исследований
Проблематика автоматизированного мониторинга сна привлекает устойчивое исследовательское внимание начиная с середины 2010-х годов. Buysse (2014) заложил концептуальную основу измеримости «здоровья сна», обосновав многомерность этого конструкта. Perez-Pozuelo и соавт. (2020) охарактеризовали трансформационную роль носимых датчиков и анализа больших данных в современной сомнологии. Mendonca и соавт. (2019) провели систематический обзор IoT-решений для выявления апноэ сна и показали, что алгоритмы машинного обучения существенно превосходят пороговые методы по точности классификации.
В части алгоритмического обеспечения Breiman (2001) обосновал статистическую состоятельность алгоритма Random Forest; Chen и Guestrin (2016) продемонстрировали превосходство XGBoost на табличных данных; Hochreiter и Schmidhuber (1997) предложили архитектуру LSTM, позволяющую учитывать долгосрочные временны́е зависимости. Теоретический вклад Zadeh (1965) и практическое применение нечёткого вывода по Мамдани (1977) образуют методологическую основу лингвистического моделирования качества сна. Sundararajan и соавт. (2021) верифицировали валидность носимых датчиков применительно к сомнологическим задачам.
Отличительная черта данной работы от перечисленных исследований — объединение нечёткой системы Мамдани, ансамблевых методов и рекуррентных сетей в единую конвейерную архитектуру, специально адаптированную для многопараметрического IoT-мониторинга сна.
2.3 Теоретические основы: нечёткая логическая модель Мамдани
Алгоритм Мамдани реализует нечёткий логический вывод посредством четырёх последовательных этапов: фаззификация → применение правил → агрегация → дефаззификация. На этапе фаззификации количественные значения параметров преобразуются в степени принадлежности лингвистическим термам («низкий», «средний», «высокий») через функции принадлежности трапециевидного или треугольного типа (trapmf, trimf).
Интегральный показатель качества сна определяется по формуле: \( Q_{\text{sleep}}=w_1D+w_2\mathrm{HRV}-w_3W-w_4\mathrm{ACC}-w_5N \), где D — продолжительность сна, W — число пробуждений, \( w_1-w_5 \) — весовые коэффициенты. Дефаззификация выполняется методом центра тяжести: \( Q_p=\frac{\sum_i \mu_i(Q)\cdot Q}{\sum_i \mu_i(Q)} \). Результат интерпретируется по шкале [0;1]: \( Q_p<0{,}4 \) — неудовлетворительное качество, \( 0{,}4-0{,}7 \) — среднее, \( Q_p>0{,}7 \) — хорошее.
Примеры лингвистических правил: «если HR средняя И HRV высокая И шум низкий → качество сна хорошее»; «если шум высокий → качество сна плохое»; «если продолжительность сна короткая → качество сна плохое». Этот механизм обеспечивает прозрачность (explainability) модели, что принципиально для медицинского применения.
2.4 Сравнительный анализ алгоритмов машинного обучения
Оценка шести алгоритмов по теоретическим метрикам показала следующую картину:
- Logistic Regression (Accuracy: 0,75) — базовая линейная модель, эффективна при линейно разделимых классах;
- SVM (0,80) — разделяет классы с максимальным зазором, ядровые функции (RBF) позволяют работать в нелинейном пространстве признаков;
- Random Forest (0,84) — ансамбль деревьев решений, устойчив к шуму, обеспечивает оценку важности признаков (feature importance);
- XGBoost (0,87) — градиентный бустинг с регуляризацией; наилучший результат среди методов классификации на табличных данных;
- Нейронная сеть (0,86) — многослойный перцептрон с активациями ReLU и регуляризацией Dropout;
- LSTM (0,89, F1: 0,87, RMSE: 0,13) — рекуррентная архитектура с клеточной памятью, оптимальна для прогнозирования временных рядов.
LSTM прогнозирует качество сна следующей ночи на основе данных предшествующих шести суток: \( \widehat{Q}_{\text{sleep}}(t+1)=\mathrm{LSTM}([X_{t-5},\ldots,X_t]) \). Механизм внутренней памяти (cell state) позволяет модели обучаться циркадным закономерностям. Нечёткая модель Мамдани, уступая в точности метрик, выигрывает в интерпретируемости и непосредственно служит основой блока рекомендаций.
2.5 Система рекомендаций и перспективы развития
Блок рекомендаций минимизирует целевую функцию \( J=\alpha(1-Q_{\text{sleep}})+\beta W+\gamma N+\delta A \), где α, β, γ, δ — весовые коэффициенты, устанавливаемые по экспертным оценкам. На основе решения \( u^*=\arg\min J^* \) система формирует персонализированные рекомендации: оптимизация акустической среды спальни, регулировка освещённости, поддержание температуры в диапазоне \(18-22\,^{\circ}\mathrm{C}\), стабилизация режима сна, снижение физической активности перед сном.
Перспективные направления развития включают: валидацию моделей на реальных датасетах сна; интеграцию в мобильные приложения и носимые устройства; реализацию мониторинга в режиме реального времени; разработку адаптивных моделей с персонализацией под индивидуальные паттерны пользователя; сопряжение с телемедицинскими платформами.
3. Заключение
В рамках выполненного исследования получены следующие результаты:
- Разработана математическая модель IoT-системы мониторинга сна: определён вектор входных данных X(t), описаны этапы предобработки (фильтрация, нормализация, синхронизация временны́х рядов), сформирован интегральный показатель качества сна.
- Построена нечёткая логическая модель на основе алгоритма Мамдани, включающая лингвистические переменные, функции принадлежности и систему IF-THEN правил. Модель обеспечивает интерпретируемость выводов и автоматическое формирование рекомендаций.
- Проведён теоретический сравнительный анализ шести алгоритмов машинного обучения. Для задачи классификации наилучший результат демонстрирует XGBoost (Accuracy 0,87); для задачи прогнозирования временны́х рядов — LSTM (Accuracy 0,89).
- Обозначены ограничения исследования: в отсутствие реального датасета количественные результаты носят теоретический характер; предложенная система не подменяет клиническую диагностику.
Общий вывод: синергия IoT-мониторинга, нечёткой логики и методов машинного обучения образует теоретически обоснованную архитектуру интеллектуальной системы оценки качества сна. Дальнейшие исследования должны быть направлены на экспериментальную верификацию с реальными данными и внедрение в практические цифровые решения в области охраны здоровья.
Список использованной литературы
- Buysse D.J. Sleep Health: Can We Define It? Does It Matter? // Sleep. — 2014. — Vol. 37, № 1. — P. 9–17.
- Mendonca F., Mostafa S.S., Ravelo-Garcia A.G., Morgado-Dias F. A Review of Obstructive Sleep Apnea Detection Approaches // IEEE Journal of Biomedical and Health Informatics. — 2019. — Vol. 23, № 2. — P. 825–837.
- Perez-Pozuelo I., Zhai B., Palotti J. et al. The future of sleep health: a data-driven revolution in sleep science and medicine // NPJ Digital Medicine. — 2020. — Vol. 3. — P. 1–15.
- Mamdani E.H. Application of Fuzzy Logic to Approximate Reasoning Using Linguistic Synthesis // IEEE Transactions on Computers. — 1977. — Vol. C-26, № 12. — P. 1182–1191.
- Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System // Proc. 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. — New York: ACM, 2016. — P. 785–794.
- Hochreiter S., Schmidhuber J. Long Short-Term Memory // Neural Computation. — 1997. — Vol. 9, № 8. — P. 1735–1780.
- Breiman L. Random Forests // Machine Learning. — 2001. — Vol. 45. — P. 5–32.
- Zadeh L.A. Fuzzy sets // Information and Control. — 1965. — Vol. 8. — P. 338–353.
- Goodfellow I., Bengio Y., Courville A. Deep Learning. — Cambridge: MIT Press, 2016. — 775 p.
- Sundararajan K., Georgiev G., Patel K. et al. A review of wearables for sleep monitoring: from actigraphy to photoplethysmography // npj Digital Medicine. — 2021. — Vol. 4. — P. 1–9.
ІІІ. English version
An intelligent sleep quality assessment system using iot sensors: integrating fuzzy logic and machine learning approaches
Abstract
This paper presents the theoretical framework and findings of a study aimed at developing an intelligent, automated system for sleep quality assessment leveraging Internet of Things (IoT) sensor data. The research addresses a well-documented gap between the clinical gold standard — polysomnography (PSG) — and the need for scalable, cost-effective continuous monitoring solutions. A multiparametric mathematical model is proposed, integrating physiological signals from accelerometers, photoplethysmography sensors, \( \mathrm{SpO}_{2} \) probes, and environmental transducers (temperature, noise, light). A Mamdani fuzzy inference system translates raw sensor inputs — heart rate (HR), heart rate variability (HRV), body movement (ACC), blood oxygen saturation (\( \mathrm{SpO}_{2} \)), and contextual variables — into interpretable linguistic sleep quality assessments via expert-defined IF-THEN rules. Six machine learning algorithms — Logistic Regression, SVM, Random Forest, XGBoost, a fully connected neural network, and LSTM — are theoretically evaluated and benchmarked for sleep stage classification and quality forecasting. Theoretical analysis indicates that LSTM achieves superior performance in time-series prediction tasks (Accuracy: 0.89, F1-score: 0.87). The proposed architecture is directly applicable to mobile health platforms, wearable monitoring systems, and telemedicine applications.
Keywords
Internet of Things (IoT); sleep monitoring; fuzzy logic; Mamdani algorithm; machine learning; LSTM neural network; physiological parameters.
1. Introduction
Background and Significance
Sleep constitutes one of the fundamental biological processes underpinning human health: synaptic consolidation, neuroendocrine regulation, immunological restoration, and cardiovascular recovery all critically depend on sleep architecture and duration. The World Health Organization estimates that \(30-40\%\) of the adult population in industrialized nations suffer from clinically significant sleep disturbances. Epidemiological and clinical evidence consistently links chronic sleep deficiency to increased incidence of cardiovascular disease, type 2 diabetes, metabolic syndrome, depressive disorders, and immunosuppression.
Polysomnography (PSG) remains the diagnostic reference standard, yet its requirement for specialized laboratory settings, trained personnel, and considerable cost renders it impractical for longitudinal population-level monitoring. IoT-enabled wearable technologies provide an alternative paradigm: continuous, unobtrusive physiological data collection in natural sleep environments. However, raw multi-sensor data streams are not self-interpretive — extracting meaningful sleep quality indicators from them requires a structured analytical pipeline combining signal processing, mathematical modelling, and artificial intelligence.
Research Object, Subject, Goal and Objectives
Research object: physiological and environmental data of sleeping individuals acquired through IoT sensor networks.
Research subject: methods for intelligent, automated assessment of sleep quality integrating mathematical modelling, fuzzy logic, and machine learning algorithms.
Research goal: theoretical development and justification of a comprehensive intelligent model for sleep quality assessment that combines a Mamdani fuzzy inference system with supervised machine learning on IoT-derived data.
Research objectives: (1) systematise the physiological biomarkers characterising distinct sleep stages; (2) evaluate IoT sensor modalities applicable to sleep monitoring; (3) formalise the multi-sensor data vector and define preprocessing procedures; (4) construct a Mamdani fuzzy inference system for sleep quality evaluation; (5) conduct a theoretical comparative analysis of six machine learning algorithms; (6) propose a data-driven personalised recommendation system.
Research methods: mathematical modelling, fuzzy logic (Mamdani algorithm), supervised classification algorithms (Logistic Regression, SVM, Random Forest, XGBoost), deep learning architectures (fully connected neural network, LSTM), and theoretical comparative analysis.
2. Main Body
2.1 Problem Identification and Analysis
The central scientific problem concerns the gap between the high informational density of IoT-acquired physiological signals and the absence of an integrated intelligent interpreter capable of mapping those signals onto clinically meaningful sleep quality categories. Each sleep phase — N1, N2, N3 (NREM), and REM — exhibits a distinctive multivariate physiological signature: HR between 55–65 bpm during deep sleep, elevated HRV indicating parasympathetic dominance, minimal ACC, and \( \mathrm{SpO}_{2} \) above 95%. These signatures are well characterised in the clinical literature; however, their automatic detection from noisy, heterogeneous IoT data streams demands robust algorithmic solutions.
Formally, the input data vector is expressed as \( X(t)=\{\mathrm{HR}(t),\mathrm{HRV}(t),\mathrm{ACC}(t),\mathrm{SpO}_{2}(t),T(t),N(t),L(t)\} \), where T denotes ambient temperature, N the noise level, and L the illuminance. The system output targets the class \( Y\in\{\text{Good},\text{Fair},\text{Poor}\} \) for quality assessment or \( Y\in\{\text{Wake},\text{Light},\text{Deep},\text{REM}\} \) for stage classification.
2.2 Literature Review
Research at the intersection of IoT, artificial intelligence, and sleep science has grown substantially over the past decade. Buysse (2014) established the conceptual framework for operationalising sleep health as a multi-dimensional construct, providing a theoretical basis for automated assessment. Perez-Pozuelo et al. (2020) characterised the transformative potential of wearable data-driven approaches in sleep medicine, while Mendonca et al. (2019) conducted a systematic review of IoT-based sleep apnoea detection, demonstrating that machine learning algorithms outperform rule-based thresholding methods.
On the algorithmic side, Breiman (2001) established the theoretical robustness of Random Forest ensembles; Chen and Guestrin (2016) provided empirical evidence of XGBoost’s superior accuracy on structured tabular data; Hochreiter and Schmidhuber (1997) introduced the LSTM architecture, enabling models to capture long-range temporal dependencies essential for multi-night sleep pattern analysis. The mathematical foundations of fuzzy set theory (Zadeh, 1965) and the practical Mamdani fuzzy inference mechanism (1977) provide the interpretable modelling layer. Sundararajan et al. (2021) validated the physiological validity of wearable sleep data relative to PSG, supporting the clinical credibility of IoT-based approaches.
The present study advances prior work by proposing a unified pipeline that combines all three analytical paradigms — fuzzy rule-based reasoning for interpretability, gradient-boosted trees for classification accuracy, and LSTM for temporal forecasting — within a single end-to-end architecture specifically designed for multi-sensor IoT sleep monitoring.
2.3 Theoretical Framework: Mamdani Fuzzy Inference System
The Mamdani algorithm realises fuzzy inference through four stages: fuzzification → rule evaluation → aggregation → defuzzification. In the fuzzification stage, crisp sensor readings are converted into degrees of membership in linguistic fuzzy sets (Low, Medium, High) via triangular (trimf) or trapezoidal (trapmf) membership functions. Each input variable — HR, HRV, ACC, N, T, D (sleep duration) — is thus described in natural-language terms amenable to expert-defined rules.
The composite sleep quality index is defined as: \( Q_{\text{sleep}}=w_1D+w_2\mathrm{HRV}-w_3W-w_4\mathrm{ACC}-w_5N \), where W is the number of awakenings and \( w_1-w_5 \) are weighting coefficients determined empirically during model training. Defuzzification employs the centroid (Centre of Gravity) method: \( Q_p=\frac{\sum_i \mu_i(Q)\cdot Q}{\sum_i \mu_i(Q)} \), yielding a scalar output in [0,1]. Interpretation: \( Q_p<0.4 \) — poor sleep quality; \( 0.4-0.7 \) — fair; \( Q_p>0.7 \) — good.
Representative inference rules: ‘IF HR is Medium AND HRV is High AND Noise is Low → THEN Sleep Quality is Good’; ‘IF Noise is High → THEN Sleep Quality is Poor’; ‘IF Duration is Short → THEN Sleep Quality is Poor’. This rule-based transparency supports explainable AI (XAI) requirements in health-sensitive applications.
2.4 Comparative Evaluation of Machine Learning Models
Theoretical benchmarking of six algorithms on the defined feature set yields the following performance estimates:
- Logistic Regression (Accuracy: 0.75) — linear baseline model, performs adequately when class boundaries are approximately linear;
- SVM (0.80) — maximises the classification margin using kernel functions (RBF), effective in non-linearly separable feature spaces;
- Random Forest (0.84) — bootstrapped ensemble of decision trees, robust to noise and provides feature importance rankings;
- XGBoost (0.87) — regularised gradient boosting, best-in-class performance for tabular classification;
- Neural Network (0.86) — multi-layer perceptron with ReLU activations and Dropout regularisation, captures complex non-linear interactions;
- LSTM (0.89, F1: 0.87, RMSE: 0.13) — recurrent architecture with a cell-state memory mechanism, theoretically optimal for multi-night time-series forecasting.
The LSTM model predicts next-night sleep quality from a six-night historical window: \( \widehat{Q}_{\text{sleep}}(t+1)=\mathrm{LSTM}([X_{t-5},\ldots,X_t]) \). The cell-state mechanism enables the model to capture circadian rhythms and longer-term sleep debt patterns. While the Mamdani fuzzy model ranks lower on quantitative metrics, its rule-based transparency directly drives the recommendation engine — demonstrating a complementary trade-off between interpretability and predictive accuracy.
2.5 Recommendation System and Research Perspectives
The recommendation module minimises the objective function \( J=\alpha(1-Q_{\text{sleep}})+\beta W+\gamma N+\delta A \), where α, β, γ, δ are expert-elicited weighting parameters. The optimal action \( u^*=\arg\min J^* \) generates personalised behavioural recommendations: acoustic environment optimisation, light management (blackout curtains, blue-light filtering), maintenance of ambient temperature within \(18-22\,^{\circ}\mathrm{C}\), sleep schedule stabilisation, and reduced pre-sleep physical loading.
Future research directions encompass: experimental validation against labelled polysomnographic datasets; integration with smartphone applications and wearable platforms; real-time monitoring pipeline implementation; development of adaptive, user-specific personalisation layers; and integration with telemedicine and clinical decision support systems.
3. Conclusion
The conducted research produced the following principal outcomes:
- A formal mathematical model of an IoT sleep monitoring system was developed: the input data vector X(t) was defined, data preprocessing procedures (noise filtering, min-max normalisation, temporal synchronisation) were specified, and a composite sleep quality index was derived.
- A Mamdani fuzzy inference system was constructed, incorporating linguistic input variables, membership functions, and an expert-derived rule base. The system satisfies explainable AI requirements and provides the direct computational basis for the personalised recommendation module.
- A theoretical comparative analysis of six machine learning algorithms was conducted. XGBoost (Accuracy: 0.87) achieved the highest performance for classification tasks; LSTM (Accuracy: 0.89) demonstrated superior results for temporal forecasting of sleep quality across multiple nights.
- Research limitations were identified: in the absence of a real physiological dataset, all quantitative results remain theoretical estimates; the proposed system is not intended as a substitute for clinical diagnosis.
Overall conclusion: the integration of IoT sensor data collection, Mamdani fuzzy inference, and machine learning constitutes a theoretically grounded architecture for an intelligent sleep quality assessment system. Future work should focus on experimental validation with real-world data and deployment within practical digital health solutions.
References
- Buysse D.J. Sleep Health: Can We Define It? Does It Matter? // Sleep. — 2014. — Vol. 37, No. 1. — P. 9–17.
- Mendonca F., Mostafa S.S., Ravelo-Garcia A.G., Morgado-Dias F. A Review of Obstructive Sleep Apnea Detection Approaches // IEEE Journal of Biomedical and Health Informatics. — 2019. — Vol. 23, No. 2. — P. 825–837.
- Perez-Pozuelo I., Zhai B., Palotti J. et al. The future of sleep health: a data-driven revolution in sleep science and medicine // NPJ Digital Medicine. — 2020. — Vol. 3. — P. 1–15.
- Mamdani E.H. Application of Fuzzy Logic to Approximate Reasoning Using Linguistic Synthesis // IEEE Transactions on Computers. — 1977. — Vol. C-26, No. 12. — P. 1182–1191.
- Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System // Proc. 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. — New York: ACM, 2016. — P. 785–794.
- Hochreiter S., Schmidhuber J. Long Short-Term Memory // Neural Computation. — 1997. — Vol. 9, No. 8. — P. 1735–1780.
- Breiman L. Random Forests // Machine Learning. — 2001. — Vol. 45. — P. 5–32.
- Zadeh L.A. Fuzzy sets // Information and Control. — 1965. — Vol. 8. — P. 338–353.
- Goodfellow I., Bengio Y., Courville A. Deep Learning. — Cambridge: MIT Press, 2016. — 775 p.
- Sundararajan K., Georgiev G., Patel K. et al. A review of wearables for sleep monitoring: from actigraphy to photoplethysmography // npj Digital Medicine. — 2021. — Vol. 4. — P. 1–9.

