ЖОО академиялық саясатын цифрландыру: жасанды интеллектке негізделген чатбот жүйесі

Мукатай Алинур Маралбекұлы
Студент, Ақпараттық жүйелер кафедрасы
Әл-Фараби атындағы Қазақ Ұлттық Университеті,
ҚР, Алматы қ.

Ғылыми жетекші: Шормакова Әсем Ноябревна
Әл-Фараби атындағы Қазақ Ұлттық Университеті
ҚР, Алматы қ.


Аңдатпа

Бұл мақалада жоғары оқу орындарының академиялық саясатын цифрландыру мәселелері қарастырылып, жасанды интеллектке негізделген интеллектуалды чатбот жүйесін әзірлеу тәсілі ұсынылады. Зерттеу барысында табиғи тілді өңдеу, семантикалық іздеу және Retrieval-Augmented Generation (RAG) архитектурасы қолданылды. Ұсынылған жүйе академиялық құжаттардан ақпаратты автоматты түрде іздеп, пайдаланушы сұрағына нақты және сенімді жауап беруге бағытталған. Нәтижесінде студенттер мен оқытушылар үшін ақпаратқа қолжетімділік жақсарып, әкімшілік жүктеме азаяды.

Түйін сөздер: жасанды интеллект, чатбот, академиялық саясат, NLP, RAG, семантикалық іздеу.

Қазіргі кезеңде білім беру жүйесін цифрландыру – жоғары оқу орындарының стратегиялық дамуының негізгі бағыттарының бірі. Университеттерде оқу процесін реттейтін академиялық саясаттар мен нормативтік құжаттардың көлемі үнемі артып келеді. Бұл құжаттар студенттердің оқу траекториясын, бағалау жүйесін, академиялық демалыс алу шарттарын және басқа да маңызды аспектілерді қамтиды.

Алайда мұндай ақпараттың күрделі құрылымы мен үлкен көлемі оны пайдаланушылар үшін қолжетімсіз етеді. Дәстүрлі іздеу тәсілдері (кілт сөз арқылы іздеу) көп жағдайда тиімсіз, себебі пайдаланушы сұрағы мен құжаттағы терминдер сәйкес келе бермейді.

Осы мәселені шешу үшін жасанды интеллект пен табиғи тілді өңдеу технологияларын қолдану өзекті болып табылады. Бұл мақалада академиялық саясат бойынша ақпаратты автоматты түрде іздеп, талдайтын интеллектуалды чатбот жүйесін әзірлеу қарастырылады.

Әдебиеттерге шолу

Ақпараттық іздеу (IR) және сұрақ-жауап (QA) жүйелері қазіргі ақпараттық технологиялардың маңызды бағыты болып табылады. Дәстүрлі әдістер (TF-IDF, BM25) мәтіндегі сөздердің жиілігіне негізделеді, бірақ семантикалық мағынаны ескермейді.

Соңғы жылдары бұл мәселені шешу үшін семантикалық іздеу әдістері кеңінен қолданылуда. Word2Vec, BERT, Sentence-BERT сияқты модельдер мәтінді векторлық кеңістікте бейнелеу арқылы сұрау мен құжат арасындағы мағыналық ұқсастықты анықтайды.

Сонымен қатар, Retrieval-Augmented Generation (RAG) архитектурасы ақпараттық іздеу мен генеративті модельдерді біріктіріп, жауаптардың дәлдігін арттырады. Бұл тәсіл нақты дереккөздерге сүйенген жауаптар құруға мүмкіндік береді.

Әдістеме

Зерттеу барысында интеллектуалды чатбот жүйесі келесі кезеңдер бойынша әзірленді:

1. Құжаттарды өңдеу

Академиялық саясат құжаттары PDF форматынан мәтінге түрлендіріліп, семантикалық фрагменттерге бөлінді.

2. Векторизация

Мәтіндер Sentence Transformers көмегімен векторлық кеңістікке айналдырылды.

3. Семантикалық іздеу

FAISS векторлық дерекқоры арқылы пайдаланушы сұрағына ең сәйкес мәтіндер анықталды.

4. RAG архитектурасын қолдану

Жүйе екі негізгі компоненттен тұрады:

Retriever – релевантты ақпаратты іздейді

Generator – жауапты генерациялайды

5. Веб-қосымша

Жүйе FastAPI негізінде серверлік бөлік және веб-интерфейс арқылы жүзеге асырылды.

Бұл тәсіл ақпаратты тек табумен шектелмей, оны түсінікті түрде ұсынуға мүмкіндік береді.

Нәтижелер

Зерттеу нәтижесінде келесі көрсеткіштерге қол жеткізілді:

Академиялық саясат бойынша сұрақтарға нақты жауап беру қамтамасыз етілді

Ақпаратты іздеу уақыты айтарлықтай қысқарды

Семантикалық іздеу дәстүрлі әдістерге қарағанда жоғары дәлдік көрсетті

Пайдаланушыларға сенімді дереккөздерге негізделген жауаптар ұсынылды

Жүйе студенттердің оқу процесіне қатысты сұрақтарына тиімді жауап бере алатыны анықталды.

Талқылау

Ұсынылған жүйе академиялық ақпаратқа қолжетімділікті арттыруда тиімді құрал екенін көрсетті.

Артықшылықтары:

Жауаптардың дәлдігі жоғары

Ақпарат нақты құжаттарға негізделеді

Жүйе масштабталуға икемді

Шектеулері:

Қазақ тіліндегі NLP ресурстары шектеулі

Үлкен модельдер есептеу ресурстарын қажет етеді

Кейбір күрделі сұрақтарға толық жауап беру қиын болуы мүмкін

Болашақта жүйені көптілді режимде дамыту және деректер қорын кеңейту ұсынылады.

Қорытынды

Бұл мақалада жоғары оқу орындарының академиялық саясатын цифрландыру үшін жасанды интеллектке негізделген чатбот жүйесі ұсынылды.

RAG архитектурасын қолдану арқылы жүйе пайдаланушы сұрағына нақты және сенімді жауап бере алады. Ұсынылған шешім студенттер үшін ақпаратқа қолжетімділікті арттырып, университеттің цифрлық трансформациясына ықпал етеді.

Пайдаланылған әдебиеттер

Devlin J. et al. BERT: Pre-training of Deep Bidirectional Transformers

Lewis P. et al. Retrieval-Augmented Generation

Jurafsky D., Martin J. Speech and Language Processing 

Manning C. et al. Information Retrieval

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Прокрутить вверх