Naujas konfidencialiojo skaičiavimo pagrindu sukurtas optimizavimo metodas leidžia federuoto mokymosi sistemose reguliuoti kompromisus tarp modelio tikslumo, privatumo ir ryšio sąnaudų. Šis požiūris skirtas medicinos ir kitų jautrių duomenų sričių bendradarbiavimui, kai duomenys lieka vietoje.
Privatumo ir naudingumo pusiausvyra
Diferencialinio privatumo sistemos gali leisti organizacijoms rinkti apibendrintus duomenis išlaikant individualų privatumą, tačiau jos reikalauja kruopštaus įgyvendinimo ir aiškaus supratimo apie kompromisus. Šios sistemos skiriasi tuo, kiek apsaugos jos suteikia ir prieš kokius atakų tipus. Ne visos diferencialinio privatumo sistemos užtikrina vienodą apsaugą duomenis teikiantiems dalyviams.
CC-PGD metodas jungia tris tikslus: modelio klaidos mažinimą, privatumo nutekėjimo rizikos valdymą ir ryšio sąnaudų ribojimą. Šie komponentai sveriami reguliuojamais hiperparametrais, todėl diegimo metu galima pritaikyti sistemą pagal konkrečius poreikius.
TEE pažeidžiamumai ir alternatyvūs matavimai
Patikimų vykdymo aplinkų (TEE) šoninių kanalų atakos, tokios kaip podėlio laiko matavimo nutekėjimai, gali atskleisti gradientų informaciją net tada, kai taikoma kriptografinė apsauga. Pridedant triukšmą gradientams formalios garantijos suteikiamos, tačiau tai neišsprendžia TEE pažeidžiamumų ir gali smarkiai sumažinti modelio naudingumą, kai triukšmo lygis aukštas.
Tyrėjai privatumo nutekėjimą stebi naudodami signalo ir triukšmo santykio (SNR) įvertį. Šis rodiklis nėra formalus diferencialinio privatumo garantas, tačiau leidžia nuolat ir aiškiai sekti riziką mokymo metu.
Pasitikėjimo lygiai ir praktiniai apribojimai
Skirtingos privatumo užtikrinimo strategijos reikalauja skirtingo pasitikėjimo iš dalyvių. Vienos sistemos remiasi mažesniu patikimų šalių skaičiumi, kitos – didesniu. Tai tiesiogiai veikia tai, kiek apsaugos galima tikėtis realiomis sąlygomis.
CC-PGD sumažino privatumo nutekėjimą 23–31 procentais ir ryšio sąnaudas 18–27 procentais, palyginti su keliais baziniais metodais, išlaikant tikslumą, kuris skiriasi ne daugiau kaip 2 procentais nuo centralizuoto mokymo rezultatų. Šie rezultatai gauti MNIST ir CIFAR-10 duomenų rinkiniuose.




