Digital

AQSh: AI bo'yicha eng yirik o'quv to'plamlaridan birida shaxsiy ma'lumotlar sizib chiqqanligi aniqlandi

Maxfiylik bo'yicha keng ko'lamli tadqiqotlar sun'iy intellektning generativ modellarini o'rgatish uchun ommaviy ma'lumotlar to'plamlaridan foydalanish bilan bog'liq jiddiy xavflarni aniqladi. Bu datacomp CommonPool ma'lumotlar to'plami bo'lib, u veb-qirqish asosida tuzilgan va 2023 yilga kelib 12,8 milliarddan ortiq namunalarni o'z ichiga oladi. Hatto kichik namunani (0,1%) tahlil qilishda mutaxassislar shaxsiy ma'lumotlarni o'z ichiga olgan minglab rasmlarni, shu jumladan pasport skanerlari, kredit kartalari, tug'ilganlik to'g'risidagi guvohnomalar, rezyumelar va boshqa nozik hujjatlarni topdilar.

Tadqiqotchilarning hisob-kitoblariga ko'ra, shaxsiy ma'lumotlarga ega bo'lgan tasvirlarning umumiy soni yuz millionlab odamlarga yetishi mumkin. Sog'liqni saqlash, tekshiruvlar natijalari, yashash joyi, fuqarolik holati, shuningdek oila a'zolari va tavsiya etuvchilar to'g'risidagi ma'lumotlarni o'z ichiga olgan mehnat hujjatlari-rezyumelar va muqovali xatlarga alohida e'tibor qaratildi. Ba'zi hollarda, bunday hujjatlar internetdagi ommaviy profillar orqali ma'lum odamlar bilan osongina bog'lanishi mumkin edi, bu esa tajovuzkorlarga elektron pochta, uy manzillari va davlat identifikatorlariga kirish imkonini berdi.

DataComp CommonPool laion-5b loyihasining davomi sifatida yaratilgan — stable Diffusion va Midjourney kabi modellarni o'z ichiga olgan tasvir generatorlarini o'rgatish uchun keng qo'llaniladigan ma'lumotlar to'plami. Ikkala ma'lumotlar to'plami ham 2014 yildan 2022 yilgacha avtomatlashtirilgan Internet skrapingi natijasida shakllangan. CommonPool ishlab chiquvchilari ilmiy maqsadlar va jamoatchilikka kirishni talab qilishgan bo'lsa-da, litsenziya tijorat maqsadlarida foydalanishni istisno qilmadi, bu esa potentsial xavf zonasini sezilarli darajada kengaytirdi.

Asosiy muammolar orasida avtomatik identifikatsiyalash usullarining samarasizligi mavjud. Tadqiqot namunasida 800 dan ortiq yuvilmagan shaxslar aniqlandi, bu ma'lumotlar bazasida 100 milliondan ortiq shunga o'xshash tasvirlar mavjudligini ko'rsatadi. Shuningdek, namunada elektron pochta manzillari, ijtimoiy xavfsizlik raqamlari va bank rekvizitlari kabi avtomatik PII tanib olish uchun filtrlar yo'q edi.

Shaxsiy ma'lumotlarni o'chirish uchun ariza berish imkoniyatiga ega platforma CommonPool-ni tarqatish bilan shug'ullanayotganiga qaramay, faqat ma'lumotlar bazasida ularning mavjudligini biladigan foydalanuvchilar o'z huquqlarini amalga oshirishlari mumkin. Bundan tashqari, agar o'qitilgan modellar ushbu ma'lumotlarni allaqachon birlashtirgan bo'lsa, ularni asl ma'lumotlar to'plamidan chiqarib tashlash o'quv izlarini olib tashlashni kafolatlamaydi.

Tadqiqotchilar mashinani o'rganish sohasidagi axloqiy va huquqiy qoidalarni zudlik bilan qayta ko'rib chiqish zarurligini ta'kidlaydilar. Joriy me'yoriy — huquqiy bazada — Evropada ham, AQShda ham-maxfiylikni himoya qilishning asosiy tamoyillarini chetlab o'tib, ommaviy ma'lumotlardan foydalanishga imkon beradigan bo'shliqlar mavjud. Ushbu sohada qat'iy tartibga solishning yo'qligi shaxsiy ma'lumotlarning ommaviy tarqalishi, modellarni nazoratsiz o'qitish va sun'iy intellekt texnologiyalariga bo'lgan ishonchni yo'qotish xavfini tug'diradi.

Tags: ITYuqori
Maili News

Maili.uz -O'zbekiston yangiliklar portali.

Recent Posts

Узбекистан принял участие в промышленном фестивале Ульсана 2025

В Ульсане состоялось открытие промышленного фестиваля, на котором Узбекистан был представлен делегацией во главе с хокимом Хайрулло Бозоровым. Площадка продемонстрировала…

1 hafta ago

Узбекистан и Беларусь заключили партнерство в машиностроении

Узбекистан и Беларусь согласовывают приоритеты промышленной кооперации с фокусом на машиностроение, где возможна быстрая капитализация компетенций обеих сторон. На переговорах…

1 hafta ago

Узбекистан и Венгрия расширяют сотрудничество в области профессионального обучения

В Ташкенте состоялась встреча министра по сокращению бедности и занятости Узбекистана Батира Захидова с делегацией Венгрии во главе с министром…

1 hafta ago

Президент Финляндии посетит Узбекистан 30–31 октября

Официальный визит президента Финляндии Александра Стубба в Узбекистан запланирован на 30–31 октября 2025 года. В Ташкенте состоится встреча глав государств,…

1 hafta ago

В Узбекистане открыта первая школа подготовки специалистов по ИИ

В Узбекистане начала работу Yandex ML School — первый специализированный центр подготовки специалистов по искусственному интеллекту, ориентированный на машинное обучение,…

1 hafta ago

В Московской области пройдет II Совет регионов России и Узбекистана

21–22 октября 2025 года в Московской области состоится II Совет регионов России и Узбекистана — ключевая платформа для обсуждения перспектив…

1 hafta ago