Digital

AQSh: AI bo'yicha eng yirik o'quv to'plamlaridan birida shaxsiy ma'lumotlar sizib chiqqanligi aniqlandi

Maxfiylik bo'yicha keng ko'lamli tadqiqotlar sun'iy intellektning generativ modellarini o'rgatish uchun ommaviy ma'lumotlar to'plamlaridan foydalanish bilan bog'liq jiddiy xavflarni aniqladi. Bu datacomp CommonPool ma'lumotlar to'plami bo'lib, u veb-qirqish asosida tuzilgan va 2023 yilga kelib 12,8 milliarddan ortiq namunalarni o'z ichiga oladi. Hatto kichik namunani (0,1%) tahlil qilishda mutaxassislar shaxsiy ma'lumotlarni o'z ichiga olgan minglab rasmlarni, shu jumladan pasport skanerlari, kredit kartalari, tug'ilganlik to'g'risidagi guvohnomalar, rezyumelar va boshqa nozik hujjatlarni topdilar.

Tadqiqotchilarning hisob-kitoblariga ko'ra, shaxsiy ma'lumotlarga ega bo'lgan tasvirlarning umumiy soni yuz millionlab odamlarga yetishi mumkin. Sog'liqni saqlash, tekshiruvlar natijalari, yashash joyi, fuqarolik holati, shuningdek oila a'zolari va tavsiya etuvchilar to'g'risidagi ma'lumotlarni o'z ichiga olgan mehnat hujjatlari-rezyumelar va muqovali xatlarga alohida e'tibor qaratildi. Ba'zi hollarda, bunday hujjatlar internetdagi ommaviy profillar orqali ma'lum odamlar bilan osongina bog'lanishi mumkin edi, bu esa tajovuzkorlarga elektron pochta, uy manzillari va davlat identifikatorlariga kirish imkonini berdi.

DataComp CommonPool laion-5b loyihasining davomi sifatida yaratilgan — stable Diffusion va Midjourney kabi modellarni o'z ichiga olgan tasvir generatorlarini o'rgatish uchun keng qo'llaniladigan ma'lumotlar to'plami. Ikkala ma'lumotlar to'plami ham 2014 yildan 2022 yilgacha avtomatlashtirilgan Internet skrapingi natijasida shakllangan. CommonPool ishlab chiquvchilari ilmiy maqsadlar va jamoatchilikka kirishni talab qilishgan bo'lsa-da, litsenziya tijorat maqsadlarida foydalanishni istisno qilmadi, bu esa potentsial xavf zonasini sezilarli darajada kengaytirdi.

Asosiy muammolar orasida avtomatik identifikatsiyalash usullarining samarasizligi mavjud. Tadqiqot namunasida 800 dan ortiq yuvilmagan shaxslar aniqlandi, bu ma'lumotlar bazasida 100 milliondan ortiq shunga o'xshash tasvirlar mavjudligini ko'rsatadi. Shuningdek, namunada elektron pochta manzillari, ijtimoiy xavfsizlik raqamlari va bank rekvizitlari kabi avtomatik PII tanib olish uchun filtrlar yo'q edi.

Shaxsiy ma'lumotlarni o'chirish uchun ariza berish imkoniyatiga ega platforma CommonPool-ni tarqatish bilan shug'ullanayotganiga qaramay, faqat ma'lumotlar bazasida ularning mavjudligini biladigan foydalanuvchilar o'z huquqlarini amalga oshirishlari mumkin. Bundan tashqari, agar o'qitilgan modellar ushbu ma'lumotlarni allaqachon birlashtirgan bo'lsa, ularni asl ma'lumotlar to'plamidan chiqarib tashlash o'quv izlarini olib tashlashni kafolatlamaydi.

Tadqiqotchilar mashinani o'rganish sohasidagi axloqiy va huquqiy qoidalarni zudlik bilan qayta ko'rib chiqish zarurligini ta'kidlaydilar. Joriy me'yoriy — huquqiy bazada — Evropada ham, AQShda ham-maxfiylikni himoya qilishning asosiy tamoyillarini chetlab o'tib, ommaviy ma'lumotlardan foydalanishga imkon beradigan bo'shliqlar mavjud. Ushbu sohada qat'iy tartibga solishning yo'qligi shaxsiy ma'lumotlarning ommaviy tarqalishi, modellarni nazoratsiz o'qitish va sun'iy intellekt texnologiyalariga bo'lgan ishonchni yo'qotish xavfini tug'diradi.

Tags: ITYuqori
Maili News

Maili.uz -O'zbekiston yangiliklar portali.

Recent Posts

Eronning Nahid-2 sun'iy yo'ldoshi va ionosfera-m ilmiy apparatlari Vostochny kosmodromidan uchirishga tayyorlanmoqda

25 июля 2025 года с российского космодрома Восточный запланирован запуск ракеты-носителя «Союз-2.1б», которая доставит на околоземную орбиту телекоммуникационный спутник Nahid-2,…

13 soat ago

AQSh: Starlink mamlakat hududida t-Satellite sun'iy yo'ldoshini ishga tushirdi

Американская компания Starlink запустила спутниковый сервис T-Satellite — телекоммуникационное решение, ориентированное на обеспечение мобильной связи в зонах, где отсутствует покрытие…

13 soat ago

AQSh: Microsoft Windows — ning eng barqaror versiyasini taqdim etdi-11 24H2

Американская корпорация Microsoft сообщила о достижении нового уровня стабильности в своей операционной системе: Windows 11 24H2 признана самой надёжной версией…

14 soat ago

AQSh: elon Maskning Starship aviakompaniyasi global havo bozorini o'zgartirishi mumkin

Американская компания SpaceX рассматривает возможность использования ракетной системы Starship не только для космических миссий, но и в качестве средства сверхбыстрого…

14 soat ago

AQSh: xAI sun'iy intellektni o'rgatish uchun dunyodagi birinchi gigavatt klasterini yaratmoqda

Компания xAI, основанная Илоном Маском, представила амбициозный проект в области высокопроизводительных вычислений — суперкластер Colossus 2, который станет первым в…

14 soat ago

AQSh: Jeyms Kemeron o'z karerasidagi eng hissiy film - "Avatar 3" ni taqdim etadi

Американский режиссёр Джеймс Кэмерон завершает работу над третьим фильмом знаменитой франшизы «Аватар». Картина под названием «Аватар 3: Огонь и пепел»…

14 soat ago