Vision Transformers
Osaka universitetining yapon tadqiqotchilari Vision Transformers sun'iy intellektining generativ modellari (ViT) insonga o'xshash vizual ishlov berish ko'nikmalarini rivojlantirishi mumkinligini ko'rsatadigan noyob tajriba natijalarini taqdim etdilar. Ushbu qobiliyatlar modellarda o'z-o'zidan paydo bo'ldi-aniq ko'rsatmalarsiz yoki oldindan belgilangan filtrlarsiz, ma'lum bir o'qitish usuli tufayli.
Yangi tadqiqot doirasida mutaxassislar Dino (o'z-o'zini distillash, yorliqsiz) deb nomlangan o'z-o'zini nazorat qilish texnikasini qo'lladilar, bu modellarga vizual sahnalarni idrok etish mexanizmlarini mustaqil ravishda shakllantirishga imkon berdi. Olimlar sun'iy intellektga qat'iy qoidalar berish o'rniga, tizimlarga video kontentning keng doirasini tahlil qilish orqali tabiiy muhitda vizual ma'lumotlarni o'rganishga ruxsat berishdi.
Tadqiqotning etakchi muallifi, doktor Takuto Yamamoto shunday tushuntirdi: "bizning modellarimiz shunchaki tasodifan tasvir elementlari o'rtasida almashmadi. Ular o'z-o'zidan ixtisoslashgan funktsiyalarni ishlab chiqdilar. Modellarning bir guruhi yuzlarga, ikkinchisi — raqamlarning konturlariga, uchinchisi — fonga barqaror e'tibor berishni o'rgandi. Bu inson vizual tizimiga xos bo'lgan sahnalarni segmentatsiya qilish va idrok etish strategiyasini aks ettiradi."
Gipotezani sinab ko'rish uchun olimlar modellarning vizual strategiyalarini bir xil videokliplarni ko'rgan odamlarning ko'z harakatlarini kuzatish natijasida olingan ma'lumotlar bilan solishtirishdi. Natijalar hayratlanarli bo'lib chiqdi: DINO usuli bo'yicha o'qitilgan modellar odamnikiga deyarli o'xshash xatti-harakatlarni namoyish etdi. Ulardan farqli o'laroq, an'anaviy sobit filtrli algoritmlarni qo'llagan tizimlar tasvirni idrok etishning g'ayritabiiy va parcha-parcha usullarini ko'rsatdi.
Modellarning hech biri qaysi ob'ektlarni mazmunli deb hisoblash kerakligi to'g'risida oldindan ko'rsatma olmaganligi alohida e'tiborga sazovor bo'ldi. Shunga qaramay, AI o'z-o'zidan shaxslarga ustuvor ahamiyat berishni boshladi, olimlarning fikriga ko'ra, bu ularning yuqori axborot mazmuni bilan bog'liq. Tadqiqotning katta muallifi, professor Shigeru Kitazava shunday dedi:"bu o'z — o'zini nazorat qiladigan o'rganish aqlli tizimlar-ham sun'iy, ham biologik ta'lim tabiatida asosiy narsani qo'lga kiritishga qodir ekanligining kuchli dalilidir".
Keyingi tahlillar tasdiqladi: DINO bilan o'qitilgan vit modellari nafaqat insonning vizual idrokiga o'xshash tuzilmalarni shakllantiribgina qolmay, balki ko'zni tuzatishning odatiy naqshlarini miqdoriy ravishda takrorladi. Bu, ayniqsa, inson xatti-harakati va sun'iy intellekt o'rtasidagi o'xshashlik maksimal bo'lgan odamlar ishtirokidagi sahnalarda namoyon bo'ldi.
Это исследование поднимает новые вопросы о границах возможностей искусственного интеллекта в понимании и интерпретации окружающего мира. Результаты, полученные в Университете Осаки, не только приближают нас к созданию по-настоящему “зрячих” машин, но и открывают путь к лучшему пониманию самого процесса человеческого восприятия.
Основательница и генеральный директор компании Wildberries Татьяна Ким в четвертый раз подряд признана самой богатой женщиной России. Ее состояние оценивается…
Илон Маск объявил о планах SpaceX по созданию четвертой версии ракеты Starship, которая должна стать крупнейшей в истории космонавтики и…
Компания Google объявила о запуске программы бета-тестирования приложения YouTube для Android TV, открыв пользователям доступ к новым экспериментальным возможностям сервиса.…
В 2025 году одним из ключевых направлений в дизайне швейцарских люксовых часов стал фисташковый оттенок. Этот мягкий и прохладный тон,…
Китайская индустрия электромобилей за последние годы превратилась в один из главных факторов трансформации мирового автомобильного рынка. Стремительные темпы роста производства…
Азиатский банк развития одобрил выделение кредита в размере 233,1 миллиона долларов США для реализации крупного инфраструктурного проекта в Каракалпакстане. Средства…