Vi vil finne deg: DNA-søk som brukes til å nabere Golden State Killer, kan hjemme hos omtrent 60% av hvite amerikanere

Joseph DeAngelo, den mistenkte Golden State Killer

Randy Pench / TNS / Newscom

Vi vil finne deg: DNA-søk som brukes til å nabere Golden State Killer, kan hjemme hos omtrent 60% av hvite amerikanere

Av Jocelyn KaiserOct. 11, 2018, 14:00

Hvis du er hvit, bor i USA, og en fjern slektning har lastet opp DNA-et til en offentlig stamdatabase, er det en god sjanse for at en internett-sleuth kan identifisere deg fra en DNA-prøve du forlot et sted. Det er konklusjonen av en ny studie, som finner ut at ved å kombinere en anonym DNA-prøve med noen grunnleggende informasjon som noen s røffe alder, kunne forskere begrense den personen til identitet til færre enn 20 personer ved å starte med en DNA-database med 1, 3 millioner individer.

Et slikt søk kan potensielt muliggjøre identifisering av rundt 60% av hvite amerikanere fra en DNA-prøve selv om de aldri har gitt sitt eget DNA til en stamdatabase. Om noen år kommer det virkelig til å være alle, sier studieleder Yaniv Erlich, en beregningsgenetiker ved Columbia University.

Studien ble utløst av arrestasjonen i april av den påståtte Golden State Killer, en mann i California som er tiltalt for en serie med flere tiår gamle voldtekter og drap. For å finne ham og mer enn et titalls andre kriminelle mistenkte siden da lovhåndhevingsbyråer tester først en DNA-prøve for et forbrytelsessted, som kan være gammelt blod, hår eller sæd for hundretusener av DNA-markører Skiltposter langs genomet som varierer blant mennesker, men hvis identitet i mange tilfeller deles med blod pårørende. De laster deretter opp DNA-dataene til GEDmatch, en gratis online database der alle kan dele dataene sine fra forbruker-DNA-testende selskaper som 23andMe og Ancestry.com for å søke etter pårørende som har sendt inn sitt DNA. Gjennomføring av GEDMatch s nesten 1 million profiler avslørte flere slektninger som tilsvarte tredje søskenbarn til kriminalitetsscenens DNA knyttet til Golden State Killer. Annen informasjon som slektsregister, omtrentlig alder og steder for kriminalitet tillot da sleuths å være hjemme på en enkelt person.

Genetikere spekulerte raskt i denne tilnærmingen kunne identifisere mange mennesker fra en ukjent DNA-sekvens. Men for å tallfeste hvor mange, tok Erlich og kollegene en nærmere titt på MyHeritage-databasen, som inneholder 1, 28 millioner DNA-profiler av personer som ser på deres familiehistorie. (Erlich er sjef for vitenskapssjef i DNA-testingsselskapet for aner.) Hvis du bor i USA og er av europeisk aner, er det 60% sjanse for at du har en tredje kusine eller nærmere slektning i denne databasen, projiserte teamet . Suksessraten deres var lik da de søkte på 30 tilfeldige profiler i GEDmatch. (Oddsen synker til 40% for noen av afrikansk aner som er sør for Sahara i MyHeritage-databasen.)

Forutsatt at du har en slektning i en av disse databasene, hva er sjansene for at politiet kan finne deg fra en uidentifisert DNA-prøve, slik de nabbet den påståtte Golden State Killer? For å finne ut av dette, kombinerte Erlich og kolleger MyHeritage-databaseinformasjonen med slektstrær, og demografiske data som grov alder og sannsynlig geografisk beliggenhet. I gjennomsnitt ga det dem mulighet til å bruke en hypotetisk DNA-sekvens for å være hjemme hos 17 "mistenkte" fra et basseng på rundt 850 mennesker, melder teamet i dag i Science.

GEDmatch omfatter sannsynligvis bare 0, 5% av den amerikanske voksne befolkningen, men millioner av amerikanere bruker DNA-tester for aner. Når GEDmatch-tallet stiger til 2%, vil mer enn 90% av mennesker av europeisk avstamming ha en tredje kusine eller en nærmere slektning og kan bli funnet på denne måten. "Det er overraskende hvor liten databasen trenger å være, " sier populasjonsgenetiker Noah Rosenberg ved Stanford University i Palo Alto, California, som ikke var involvert i arbeidet.

Rosenberg og kollegene viste i fjor at en profil i en forbruker-DNA-database kan matches med den samme personens profil i rettshåndhevelse av rettsmedisinske DNA-databaser, selv om de bruker et annet, mindre sett med DNA-markører. I dag i Cell rapporterer de at mer enn 30% av individer i rettsmedisinske databaser også kan knyttes til et søsken, foreldre eller barn i en forbrukerdatabase. De to typene databaser kombinert kunne gjøre det enda lettere å finne en mistenkt fra en DNA-prøve. Den koblede forbrukerens DNA-profil kan også avdekke fysisk utseende eller medisinsk informasjon for en kriminell eller deres pårørende, for eksempel gener for øyenfarge eller en sykdom, selv om den rettsmedisinske databasene ikke er ment å inneholde den typen informasjon. "Mer kan gjøres med dem enn det har blitt hevdet, " sier Rosenberg.

Selv om disse studiene er oppmuntrende nyheter for å løse forbrytelser, reiser de personvernhensyn for lovlydige borgere, sier Erlich. En mulig løsning som teamet hans foreslår, er at forbrukernes DNA-testende selskaper krypterer en kundes data digitalt, og at GEDMatch bare lar disse krypterte filene lastes opp. På den måten kunne et rettshåndhevingsbyrå ikke laste opp DNA-sekvensdata fra sin egen lab uten et anerfirmasamarbeid. (Politiet kan ikke bare late som om det er en kunde og sende DNA-prøver fra forbrytelsesområdet til selskaper som 23andMe fordi selskapets sekvenseringsmaskiner vanligvis ikke kan behandle knappe, forringede DNA-prøver.)

Erlich mener også amerikanske tjenestemenn må revidere føderale regler som beskytter mennesker som melder seg frivillig til forskningsstudier. En nylig revidert retningslinje for biomedisinske forskere, kalt Common Rule, forutsetter at en forskningsdeltager ikke lett kan identifiseres fra deres anonymiserte DNA-profil. Men i papiret brukte Erlichs team GEDMatch for å identifisere en kvinne som var en del av en studie som bruker hennes anonymiserte DNA-profil og fødselsdato, som ofte er offentlig tilgjengelig for forskere.

Genetiske policyeksperter er enige om at det er behov for endringer i hvordan slektsdatabaser og DNA-sekvenseringsfirmaer opererer eller reguleres. Den digitale signaturen kan være "en delvis løsning", sier jusprofessor Natalie Ram ved University of Baltimore i Maryland. Men alle aktørene i DNA-sekvenseringsindustrien direkte til forbruker vil måtte gå med på denne ordningen, konstaterer hun. "Hvis ikke, er vi tilbake til firkant."

I stedet hevdet hun og andre nylig i Science at stater og kongresser skulle vedta lover som begrenser situasjoner der rettshåndhevelse kan bruke slektsdatabaser for å finne mistenkte. Det kan være rimelig for en drapssak, men ikke for en liten forbrytelse, sier Ram. "Å finne den rette balansen er viktig."