Naujas CC-PGD metodas optimizuoja federuoto mokymosi tikslumą, privatumą ir ryšio kainą

Naujas konfidencialiojo skaičiavimo pagrindu sukurtas optimizavimo metodas leidžia federuoto mokymosi sistemose reguliuoti kompromisus tarp modelio tikslumo, privatumo ir ryšio sąnaudų. Šis požiūris skirtas medicinos ir kitų jautrių duomenų sričių bendradarbiavimui, kai duomenys lieka vietoje.

Privatumo ir naudingumo pusiausvyra

Diferencialinio privatumo sistemos gali leisti organizacijoms rinkti apibendrintus duomenis išlaikant individualų privatumą, tačiau jos reikalauja kruopštaus įgyvendinimo ir aiškaus supratimo apie kompromisus. Šios sistemos skiriasi tuo, kiek apsaugos jos suteikia ir prieš kokius atakų tipus. Ne visos diferencialinio privatumo sistemos užtikrina vienodą apsaugą duomenis teikiantiems dalyviams.

CC-PGD metodas jungia tris tikslus: modelio klaidos mažinimą, privatumo nutekėjimo rizikos valdymą ir ryšio sąnaudų ribojimą. Šie komponentai sveriami reguliuojamais hiperparametrais, todėl diegimo metu galima pritaikyti sistemą pagal konkrečius poreikius.

TEE pažeidžiamumai ir alternatyvūs matavimai

Patikimų vykdymo aplinkų (TEE) šoninių kanalų atakos, tokios kaip podėlio laiko matavimo nutekėjimai, gali atskleisti gradientų informaciją net tada, kai taikoma kriptografinė apsauga. Pridedant triukšmą gradientams formalios garantijos suteikiamos, tačiau tai neišsprendžia TEE pažeidžiamumų ir gali smarkiai sumažinti modelio naudingumą, kai triukšmo lygis aukštas.

Tyrėjai privatumo nutekėjimą stebi naudodami signalo ir triukšmo santykio (SNR) įvertį. Šis rodiklis nėra formalus diferencialinio privatumo garantas, tačiau leidžia nuolat ir aiškiai sekti riziką mokymo metu.

Pasitikėjimo lygiai ir praktiniai apribojimai

Skirtingos privatumo užtikrinimo strategijos reikalauja skirtingo pasitikėjimo iš dalyvių. Vienos sistemos remiasi mažesniu patikimų šalių skaičiumi, kitos – didesniu. Tai tiesiogiai veikia tai, kiek apsaugos galima tikėtis realiomis sąlygomis.

CC-PGD sumažino privatumo nutekėjimą 23–31 procentais ir ryšio sąnaudas 18–27 procentais, palyginti su keliais baziniais metodais, išlaikant tikslumą, kuris skiriasi ne daugiau kaip 2 procentais nuo centralizuoto mokymo rezultatų. Šie rezultatai gauti MNIST ir CIFAR-10 duomenų rinkiniuose.

Šaltiniai

Šaltinis	Patikimumo lygmuo
Nature.com	Bendras
arXiv	Oficialus

Šaltinis

Patikimumo lygmuo

Nature.com

Bendras

arXiv

Oficialus

Naujas CC-PGD metodas optimizuoja federuoto mokymosi tikslumą, privatumą ir ryšio kainą

Privatumo ir naudingumo pusiausvyra

TEE pažeidžiamumai ir alternatyvūs matavimai

Pasitikėjimo lygiai ir praktiniai apribojimai

Šaltiniai

Kas įvyko?

Kodėl tai svarbu

Šaltinių palyginimas (2)

Apie šį straipsnį

Privatumo ir naudingumo pusiausvyra

TEE pažeidžiamumai ir alternatyvūs matavimai

Pasitikėjimo lygiai ir praktiniai apribojimai

Šaltiniai

Kas įvyko?

Kodėl tai svarbu

Šaltinių palyginimas (2)

Apie šį straipsnį

Susiję straipsniai

„Signal“ vadovė perspėja: DI asmeniniai pagalbininkai sukuria pavojingas duomenų „užpakalines duris“

Algoritmai moko žmogaus vertybes, bet fundamentalus neapibrėžtumas lieka

DI modeliai mokosi pataikauti ir meluoti, o saugumo patikroms lieka vos 24 valandos

Ligoninės ir bankai bendrai kuria DI modelius, nesidalindami jautriais pacientų ar klientų įrašais

Nauji DI agentų testai imituoja įmones, tačiau realybėje jie vis dar stringa