Nutqni tanib olishning semantik va akustik modellariga o‘qitish uchun vositas bo‘lgan NLU-suite yangi versiyasiga sun’iy intellekt bilan o‘zaro ta’sir qilish funksiyasi qo‘shildi. Endi u asosiy amaliy vazifani hal qilish — berilgan sinflar asosida o‘qituvchi datasetlar yaratish imkonini beradi. Yechim GPT-4o modelidan foydalangan holda O‘zbekiston banklaridan birida muvaffaqiyatli ravishda sinovdan o‘tkazildi.
Modellarni o‘qitishda asosiy qiyinchiliklarni misollar to‘plash va tayyorlash, shuningdek, obyektlarni tasniflash tug‘diradi. Qoidaga ko‘ra, cheklangan miqdordagi o‘qitish misollari mavjud bo‘lgan semantik modellarni o‘qitish uchun “Few-shot” uslubidan yoki test to‘plami umuman bo‘lmasa, “Zero-shot” uslubidan foydalaniladi.
Ilgari, o‘qitish to’plamini shakllantirish uchun sun’iy intellekt bo‘yicha muhandislar yo o‘zlari o‘qitish misollarini yaratar yoki LLM modellaridan foydalanib, ularga kerakli obyektlarning sinflarini kiritar edilar. Ikkala yondashuv ham ishlab chiquvchilardan katta vaqt va kuch talab qilardi, chunki so‘rovlarning murakkabligi tufayli hatto LLM-modellarning ham yaratishi qiyin bo‘lgan juda ko‘p test misollarini generatsiyalashga to‘g‘ri kelardi. Bundan tashqari, LLM-modellar bilan ishlash tashqi servisga so‘rov yuborishni nazarda tutadi, bu ba’zi kompaniyalar uchun axborot xavfsizligi nuqtai nazaridan to‘g‘ri kelmasligi mumkin. Natijada, bunday yondashuv o‘qitishni sekinlashtirar va modelni foydalanishga topshirish muddatlarini oshirardi.
Hozirda U-BSS LLM-modellar sintetik ma’lumotlar to‘plamini yaratish uchun foydalanadigan yechimni taqdim etmoqda. Ushbu yondashuv “Few-shot” o’qitishning afzalliklaridan foydalanishga va ma’lumotlarni tayyorlash uchun zarur bo‘lgan vaqtni qisqartirishga imkon beradi, chunki tizim o‘qitish uchun maqbul bo‘lgan misollarni generatsiyalaydi. Yechim turli LLM modellari bilan mos keladi. Tizim foydalanuvchisi dialog modelini o‘qitish uchun muhim parametrlarni ko‘rsatib, prompt yoki maxsus so‘rov yaratadi. Keyin LLM-model ushbu so‘rovga ishlov beradi va turli xil o‘quv ma’lumotlari to‘plamini shakllantiradi.
“Yangi NLU-suite vositasi nutqni tanib olish modellarini ishlab chiqishni ancha osonlashtiradi va jadallashtiradi, bu esa o‘quv ma’lumotlarini to‘plash zaruratini istisno qiladi. Foydalanuvchilar faqat LLM-model uchun so‘rov yaratishlari yetarli bo‘ladi, shundan keyin kerakli ma’lumotlar atigi bir necha soat ichida tayyor bo‘ladi. Bu imkoniyat, kompaniya bozorga yangi mahsulot yoki xizmatni chiqarayotganda va tegishli senariyni tezkor amalga oshirish kerak bo‘lganda ayniqsa ham foydali. Datasetni generatsiya qilish uchun faqat promoga kiritilishi kerak bo‘lgan mahsulot yoki xizmatning qisqacha tavsifi kerak bo‘ladi. Ushbu funksiya orqasida biz LaBSE modelini o‘qitishga muvaffaq bo‘ldik, u hozirda muvaffaqiyatli qo‘llanilmoqda", — deb qayd etdi U-BSS direktori Pulat Xaliulin.