Licht werpen op de schaduwen van internet (en schaduwen)

Licht werpen op de schaduwen van internet (en schaduwen)

Anonim

door Catherine Shen, Princeton University

Het spookbeeld van een gezichtsloos systeem dat gegevens van internetgebruikers verzamelt en persoonlijke profielen samenstelt, heeft wereldwijd alarm geslagen bij voorstanders van privacy. Arvind Narayanan, universitair docent informatica aan Princeton University, richtte het Web Transparency and Accountability Project (WebTAP) op bij het Center for Information Technology Policy (CITP) om moeilijke vragen met betrekking tot internetprivacy aan te pakken. Hoe kunnen gewone internetgebruikers zichzelf beschermen tegen trackers van derden? Wat kunnen beleidsmakers doen? Kan grotere transparantie en bewustwording zowel bedrijven als dagelijkse internetgebruikers ten goede komen?

Narayanan sloot zich aan bij Solon Barocas, een postdoctorale onderzoeksmedewerker bij CITP, om perspectieven te bieden op de ethische en sociale implicaties van online tracking.

Vraag: Hoe is WebTAP tot stand gekomen?

Barocas: Twee jaar geleden vertelde ik Arvind over mijn idee om individueel gerichte politieke advertenties online te maken en te analyseren. Arvind dacht dat er een algemener en ambitieuzer systeem kon worden gebouwd, een systeem dat alle soorten targeting- en personaliseringsschema's op internet zou kunnen reverse-engineeren. Arvind en zijn afgestudeerde studenten begonnen de nodige infrastructuur uit te bouwen en WebTAP kreeg concrete vorm. Ondertussen heb ik mijn proefschrift afgerond en ben ik lid geworden van CITP, waar ik mijn expertise over de ethiek van datamining op het web heb kunnen overbrengen.

Vraag: Differentiële behandeling van gebruikers als gevolg van algoritmen en datagebruik is een belangrijk punt van zorg. Hoe kan dat een gewone webgebruiker schaden?

Barocas: een goed voorbeeld komt uit een belangrijk artikel van Latanya Sweeney in Harvard, waar ze ontdekte dat Google-zoekopdrachten naar zwart klinkende namen eerder contextuele advertenties voor arrestatieregisters retourneerden dan die voor wit klinkende namen. Sweeney bevestigde dat de bedrijven die voor deze advertenties betaalden zich niet hadden willen concentreren op zwart klinkende namen; het feit dat zwart klinkende namen eerder dergelijke advertenties zouden activeren, leek eerder een artefact van het algoritme dat Google gebruikt om te bepalen welke advertenties naast de resultaten voor bepaalde zoekopdrachten moeten worden weergegeven. Dit aspect van het proces kan resulteren in de differentiële levering van advertenties die het soort vooroordelen weerspiegelen dat degenen die aan de advertenties worden blootgesteld, hebben.

Het kortere antwoord met betrekking tot schade is dat elke advertentie die een arrestatierapport suggereert, waarschijnlijk de indruk zal wekken die beslissers hebben over de persoon wiens naam ze hebben gegoogled. Denk bijvoorbeeld aan een werkgever die een sollicitant googelt.

Narayanan: naast advertenties, zoekresultaten, nieuwsfeeds, productaanbevelingen en, in sommige gevallen, zijn alle prijzen bekend die zijn afgestemd op de gebruiker. Aangezien dit dingen zijn waar de gebruiker actief naar op zoek is, wordt onze online ervaring gevormd door het effect van onze eerdere acties, zoals beoordeeld door een datamining-systeem.

Vraag: Met sociale mediaplatforms zoals Facebook, die zoveel voorkomen op internet, welke gevolgen vond je van het bladeren door een pagina met een "like" -knop op Facebook? Welke gevolgen zijn er wanneer een gebruiker op de knop klikt of niet?

Barocas: Er zijn hier twee verschillende problemen om op te merken. Ten eerste laat elke website met een Facebook-achtige knop op zijn pagina's Facebook weten dat u die website hebt bezocht, ongeacht of u op de knop hebt geklikt. De informatie die het verzamelt van dit soort passieve observaties kan invloed hebben op hoe het uw ervaring op haar website personaliseert, maar ook op het soort advertenties dat u zult zien. Ten tweede kan Facebook ook veel leren van die gelegenheden waarbij je bevestigend op de like-knop klikt, en niet alleen wat je je zou voorstellen. Onderzoekers hebben aangetoond dat allerlei conclusies over jou kunnen worden getrokken, gewoon op basis van wat je leuk vindt. De implicaties van iets leuks vinden voor je ervaring op Facebook en de rest van het web zijn volkomen onduidelijk. Onderzoekers werken eraan om deze effecten op de nieuwsfeed te meten, en veel andere platforms kunnen ook worden betrokken bij deze vragen.

Vraag: Moeten we diegenen die schaamteloos jagen op webgebruikers anders behandelen dan diegenen die onwetend zijn van bijvoorbeeld trackers van derden op hun sites?

Narayanan: WebTAP's stelling is dat meer transparantie op de lange termijn altijd beter is, ongeacht de motieven van een bedrijf. Voor ons gaat transparantie niet alleen over het schoonhouden van de consument, hoewel dat natuurlijk belangrijk is. Uitgevers, de pers en regelgevers profiteren allemaal van toegang tot informatie over tracking en personalisatie. We hebben geconstateerd dat zelfs als slechts een fractie van consumenten keuzes maakt op basis van privacy, dit een aanzienlijke druk op bedrijven kan uitoefenen om hun praktijken te veranderen.

Vraag: Wat zijn enkele verrassende ontdekkingen die je tijdens het project hebt gehad?

Narayanan: We hebben onderzoek gedaan naar vingerafdrukken op canvas, een geniepig type online tracking dat een opmerkelijk snelle opname heeft gezien. De technologie ging van het introduceren in een onderzoekspaper tot het onderwerp van een open-sourceproject en werd door een paar kleine spelers overgenomen voor inzet door AddThis, een widget die volgens Comscore meer dan honderd miljard maandelijkse paginabezoeken krijgt.

In hetzelfde onderzoek hebben we ook vastgesteld dat cookiesynchronisatie ongebreideld is - een techniek waarmee verschillende trackingbedrijven hun pseudonieme ID's van u met elkaar kunnen vergelijken. Zodra twee bedrijven hun cookies van u synchroniseren, zijn ze in staat om achter de schermen gegevens over u uit te wisselen, buiten het bereik van onze transparantietools.

In een andere verrassing ontdekten we dat een afluisteraar op het netwerk die advertentiecookies gebruikt om individuen te volgen - zoals het National Security Agency is geopenbaard - in wezen het geheel van hun online browse-activiteiten kan reconstrueren en kan koppelen aan hun echte wereld identiteit.

V: Ondanks alle tijd en geld die wordt besteed aan het ontwikkelen van online advertenties, negeren veel internetgebruikers deze. Waarom is dat zo en hoe beïnvloeden de voortdurende inspanningen om de reclame te verbeteren de consument?

Barocas: online adverteerders proberen marginale verbeteringen door te voeren in de zogenaamde klikfrequentie, het percentage mensen dat wordt blootgesteld aan een advertentie die erop klikt. De grote meerderheid van online advertenties krijgt nooit enige aandacht; meestal zijn de klikfrequenties minder dan 1 procent. De enige reden dat de meeste adverteerders kunnen overleven met zulke lage klikfrequenties, is dat ze vaak elke dag vele miljoenen, zo niet miljarden advertenties weergeven.

Een klikfrequentie van 1 procent voor dit enorme aantal kan nog steeds een aanzienlijk bedrag opleveren.

Vermoedelijk weerspiegelen de huidige klikfrequenties een soort geïnformeerde afweging tussen de kosten om effectiever te kunnen targeten en het verwachte voordeel, maar individuele spelers binnen de industrie zullen met elkaar blijven concurreren om nieuwe manieren te vinden om te genereren hoger rendement op de investering. De gebruikers zullen waarschijnlijk lijden in deze eindeloze wapenwedloop, omdat ze hierdoor onderworpen worden aan steeds uitgebreider volgen en verfijnde profilering.

Vraag: Wat is de volgende stap voor u op het gebied van onderzoek en de toekomst van beleidsvorming?

Narayanan: onderzoek naar webtransparantie bevindt zich op een kritiek moment. Een van de belangrijkste trends in de branche is het samenvoegen van online en offline tracking. Bedrijven kunnen nu hun klantendatabases van fysieke winkels gebruiken om diezelfde klanten online te targeten, of in-store deals en kortingsbonnen personaliseren op basis van een verscheidenheid aan gegevens, waaronder de online activiteiten van consumenten. Dit is een zorgwekkende ontwikkeling, omdat het verdere mogelijkheden biedt voor profilering en manipulatie. We hebben meer transparantie nodig over de soorten targeting die plaatsvinden. Kunnen onderzoekers het bijhouden? Het is gemakkelijk om een ​​bot te maken die online naar prijzen gaat kijken; we kunnen er geen maken die in winkels gaat winkelen, dus we moeten creatief zijn.

Ondertussen hebben we, wil de bestaande onderzoeksgroep zijn volledige impact kunnen bereiken, een sterkere band nodig met beleidsmakers, regelgevers en zelfregulatoren en handhavingsinstanties. Onze recente "Webprivacy en transparantie" -conferentie was een eerste stap, maar we zoeken altijd naar wegen voor nauwere samenwerking.