"Süni intellekt məlumat zirvəsinə çatıb, gələcək sintetik məlumatlardadır..."
İlon Mask və digər süni intellekt mütəxəssisləri belə bir fikirdədir ki, süni intellekt modellərinin öyrədilməsi üçün real məlumatlar, demək olar ki, tükənib.
Moderator.az xəbər verir ki, bu barədə "ixbt.com" nəşri yazıb.
"Biz süni intellektin öyrədilməsi üçün mövcud olan insan biliklərinin demək olar ki, hamısını tükəndirmişik. Bu, faktiki olaraq keçən il baş verib", - deyə Mask "Stagwell"in sədri Mark Penn ilə "X" platformasında yayımlanan söhbət zamanı bildirib.
Amerikanın "xAI" süni intellekt şirkətinin sahibi İlon Mask "OpenAI"-nın keçmiş baş elmi əməkdaşı İlya Sutskeverin dekabr ayında "NeurIPS" maşın öyrənməsi konfransında səsləndirdiyi fikirləri dəstəkləyib. Sutskever süni intellekt sənayesinin "məlumat zirvəsinə" çatdığını və öyrədici məlumatlar çatışmazlığının mövcud modelləşdirmə yanaşmalarını dəyişməyə məcbur edəcəyini proqnozlaşdırıb.
Mask bu problemi həll etmək üçün süni intellekt modelləri tərəfindən yaradılan sintetik məlumatların istifadəsini təklif edib. "Real məlumatları tamamlamağın yeganə yolu sintetik məlumatlardır, burada süni intellekt özü öyrədici materiallar yaradır. Sintetik məlumatlarla süni intellekt özünü qiymətləndirir və özünü öyrənmə prosesindən keçir", - deyə o, bildirib.
"Microsoft", "Meta", "OpenAI" və "Anthropic" kimi iri texnologiya şirkətləri artıq öz qabaqcıl süni intellekt modellərinin öyrədilməsi üçün sintetik məlumatlardan istifadə edir. "Gartner"in dəyərləndirmələrinə görə, 2024-cü ildə süni intellekt və analitika layihələrində istifadə olunan məlumatların 60 faizi sintetik yolla yaradılacaq.
Bu həftə mənbə kodu yayımlanan "Microsoft Phi-4" modeli sintetik və real məlumatların birləşməsindən istifadə edilərək öyrədilib. "Google Gemma" modelləri yaradılarkən də oxşar yanaşma tətbiq edilib. "Anthropic" öz effektiv sistemlərindən biri olan "Claude 3.5 Sonnet"in hazırlanmasında sintetik məlumatlardan istifadə edib, "Meta" isə "Llama" modellərinin son seriyasını süni intellekt tərəfindən yaradılan məlumatlarla təkmilləşdirib.
Sintetik məlumatlar üzərində öyrənmə iqtisadi baxımdan bir sıra üstünlüklərə malikdir. "Writer" startapı, demək olar ki, tamamilə sintetik mənbələr üzərində hazırlanmış "Palmyra X 004" modelinin cəmi 700 min ABŞ dollarına başa gəldiyini bildirir. Müqayisə üçün, "OpenAI"-nın oxşar modelinin dəyəri təxminən 4,6 milyon dollar təşkil edir.
Lakin bunun mənfi tərəfləri də mövcuddur. Bəzi araşdırmalar göstərir ki, sintetik məlumatlar "model kollapsına" səbəb ola bilər, nəticədə süni intellekt daha az "yaradıcı" və daha çox qərəzli ola bilər ki, bu da onun funksionallığını ciddi şəkildə poza bilər. Modellər mövcud məlumatlar əsasında sintetik məlumatlar yaratdığı üçün ilkin məlumatlardakı istənilən qərəz və məhdudiyyətlər nəticələrdə də təkrarlanacaq.