Google ansöker om patent för system för anonymisering av data i AI-utvecklingen
Google har lämnat in en patentansökan för ett system som är utformat för att anonymisera storskaliga dataset, vilket ger förbättrade integritetsgarantier, vilket visar den växande betydelsen av dataintegritet i en tid av artificiell intelligens.
Google har lämnat in en patentansökan för ett system som är utformat för att anonymisera storskaliga dataset, vilket ger förbättrade integritetsgarantier, vilket visar den växande betydelsen av dataintegritet i en tid av artificiell intelligens.
Detta system, som fokuserar på att skapa "k-anonyma" datamängder, syftar till att skydda identiteterna inom dessa samlingar. K-anonymitet, som beskrivs av Google, fungerar som ett förbehandlingssteg som är avgörande för att säkra data före publiceringar eller dess användning för att träna maskininlärningsmodeller, inklusive djupa neurala nätverk.
Anonymisera dataobjekt
Processen går ut på att tilldela data till "entitetskluster" baserat på gemensamma egenskaper eller referenser. Genom att identifiera ett "majoritetsvillkor" inom varje kluster kan systemet anonymisera dataobjekt, vilket effektivt döljer gemensamma identifierare utan att förändra datasetets integritet eller struktur.
Googles metod, enligt ansökan, erbjuder ett alternativ till metoden "differential privacy", som kräver betydande förändringar av datastrukturen. Denna utveckling är en del av Googles bredare AI-strategi, där företaget har integrerat AI i olika erbjudanden, från att förbättra sin sökmotor till att slå samman DeepMind med sitt Brain Team. Teknikjättens AI-centrerade vision inkluderar höga förväntningar på sin chatbot, Bard, som syftar till att utöka sin användarbas till två miljarder.
Fokus på dataintegritet alltmer relevant
I en strid ström av AI-relaterade patentansökningar, som sträcker sig från energibesparande AI-träningsmetoder till verktyg för spamdetektering, blir Googles fokus på dataintegritet alltmer relevant. Företagets omfattande tillgång till användardata, som bekräftades i uppdateringen av integritetspolicyn i juli, ger det en unik position i AI-landskapet. Det är dock av största vikt att säkerställa högkvalitativa data som respekterar integriteten, särskilt med tanke på risken för att omvänd ingenjörskonst av AI-modeller avslöjar de data som de tränades på.
Medan branschaktörer som Microsoft och Oracle har utvecklat lösningar för att förhindra reverse engineering och algoritmiska attacker, tar Googles metod itu med datasekretess vid källan och minimerar sårbarheter före AI-träning. I takt med att konkurrensen inom AI intensifieras blir det avgörande för Google att upprätthålla robusta datasäkerhetsrutiner för att behålla sitt marknadsledarskap.