Tekniska bloggspel, Android-app-apk, tips och tricks

Data som ska vara anonym behöver inte vara det

Korskontroll av anonyma uppgifter a priori kan leda till att man tar reda på en persons identitet, mer eller mindre enkelt. En amerikansk forskare från Princeton markerade denna fågelskrämma samtidigt som hälsoministern i Frankrike påskyndade öppnandet av offentliga uppgifter.

0104000007507619-photo-anonymous.jpg

Varje morgon kan du gå till samma kafé och beställa samma sak. Efter ett tag kommer bartendern att känna till dina vanor men inte din identitet – om du aldrig pratar med honom. Men genom att observera lite kommer han att kunna förstå mer om dig. Det liknar mer eller mindre logiken i en värld av datainsamling på Internet. Till exempel är onlinereklambranschen väldigt förtjust i att bläddra i data och profiler.

I sin charter förklarar det franska annonsretargetingföretaget Criteo: “Vi vet inte vem du är. Vi känner inte till din adress, arbetsplats, födelsedatum, e-postadress, telefonnummer eller andra personliga uppgifter. Vi använder eller lagrar inte din IP-adress för inriktningsändamål. » Criteo samlar bara in “Anonyma uppgifter”, via cookies. De relaterar till onlinebeteende, ålder eller kön och datortyp.

Konsten att korskontrollera data

Men kommer denna information inte att räcka för att ta reda på identiteten på en Internetanvändare? Detta är avhandlingen som försvaras av en amerikansk datavetenskapsforskare, Arvind Narayanan, citerad av Qwartz. Han förklarar detta i en artikel med titeln “Det finns ingen magisk lösning: anonymitet existerar fortfarande inte”ett svar på Stiftelsen Information Technology and Innovation Foundation (.pdf) vitbok, med argumentet att anonymitet fungerar.

Ta platsdata, som i allt högre grad granskas av annonsörer när deras företag går över till mobila enheter. Enligt Arvind Narayanan, som påminner om en studie från 2013 i ämnet, kan 95 % av ägarna av smartphones omdefinieras genom att korsa minst fyra av deras geografiska platser, till exempel de som finns i mobilfotons metadata. Baserat på två platser, till exempel en återkommande resa hemifrån, kommer 50 % av personerna att kunna identifieras.

Två anonyma sårbarheter

Bruno Rasle, generaldelegat för det franska journalistförbundet för skydd av personuppgifter (AFCDP), som bildades efter ändringen av dataskyddslagen 2004, förklarade för oss att de två fallen kan få individer att arbeta för -identifiering av tredje part.

Den första är intern i företaget. ”När IT-team testar en ny version av programvaran vill de vara baserade på verklig data, så de använder ibland baslinjedata i produktionen. Det är inte alltid möjligt för företag att mäta risk, särskilt när utvecklingen görs av en utländsk tjänsteleverantör och därför är föremål för en annan lag…”specialistläkares varning.

Det andra potentiella intrånget är kärnan i den öppna datarörelsen, det vill säga det fria öppnandet av en privat eller offentlig organisations data. Bruno Rasle fortsatte: “De här uppgifterna har avidentifierats, men det kanske inte räcker. Under en AFCDP-konferens visade en läkare att hälsoministeriet publicerar data som han anser vara anonyma, men genom att stryka över dem med annan information kunde vi så småningom ta reda på namnen på vissa personer samt deras patologi. »

Datasäkerhetsexperten tillägger att data som delas i samband med öppna data aldrig helt kan tas bort från sitt innehåll, vilket riskerar att bli ointressant och därför odeklarerat. För att illustrera dess gränser citerar han ett experiment som utförts genom att kombinera data från Insee och Google Maps för att ta reda på identiteten på ägaren av en tomt… Ett resultat erhållits, återigen, ordet data är anonymt när det isoleras, men gör en mycket vettigt när det är länkat.

0140000007507621-photo-data-sant.jpg

Hälsa i centrum för debatten

I Frankrike, där framtida lagstiftning om tillgång till medicinska uppgifter förbereds, sa socialminister Marisol Touraine till sig själv “starkt övertygad och resolut fast besluten att säkerställa att tillgången till denna data förbättras”. Men hon tillade att hon inte ville “öppen utan gränser eftersom det, i motsats till vad vissa hävdar, finns risk för indirekt omdefiniering”. Minister önskar “särskilj så tydligt som möjligt anonymiserad data från indirekt nominerad data”.

I detta känsliga ämne varnar Arvind Narayanan. Han tog exemplet med Latanya Sweeney, numera chef för teknologiavdelningen vid US Federal Trade Commission, men som 1997 lyckades hämta guvernör William Welds medicinska journaler från offentligheten. För detta ändamål använde hon data från en medicinsk databas som inkluderade en patients kön, födelsedatum och postnummer, innan hon korskontrollerade med information som guvernören kände till… andra, dessa uppgifter kan erhållas när man röstar. listor eller på sociala nätverk.

Fortfarande i USA arbetar nätverket Heritage Health med en algoritm som använder offentliga data och medborgares medicinska historia för att förutsäga framtida sjukhusinläggningar, men även de som anses onödiga. Detta för att spara 30 miljarder dollar årligen som organisationen uppskattar är bortkastade. En tävling med stöd av 3 miljoner dollar skapades till och med för att belöna utvecklare som kunde omdefiniera patienter och förutsäga hur många dagar de skulle stanna på sjukhuset. Enligt Arvind Narayanan kan 12 % av människorna drabbas av samma öde, baserat på deras uppgifter.

Men vad gör polisen?

Från och med 2005 års ändring av den administrativa dokumentåtkomstkommittén, som har nya befogenheter för återanvändning av offentliga uppgifter, “Varje utländskt företag kan extrahera och korskontrollera administrativa data utan att upptäckas av något observatorium i Frankrike.”sa Bruno Rasle. “Detta företag kan till stor del tjäna pengar på denna data.”tillade han och påpekade att en kommande översyn av EU-direktivet 95 46 CE skulle kunna tvinga dessa företag att följa europeisk lag.

Bruno Rasle förklarade för oss att begreppet svårighet beaktas av amerikansk och tysk rättvisa. “Om jag lämnar in ett klagomål i USA för att mina uppgifter inte är tillräckligt skyddade, kommer rättsväsendet att granska ansträngningar som görs för att kringgå denna anonymitet. I Frankrike är det mer strikt. Det räcker med att någon lyckats omdefiniera en person så att företaget upptäcks vara fel.”, betonade experter. Men för honom är fullständig anonymitet nästan omöjlig. Så han föreslog inrättandet av ett oberoende observatorium.

När det gäller tillgång till medicinska data i Frankrike, föreställer sig Marisol Touranie att Cnil hanterar licensieringen av alla forskare, vare sig de är offentliga eller privata. För ministern är det ingen fråga om att tillhandahålla dessa uppgifter “Marknadsföringsstrategier för privata företag” .