Fragile Families

De technieken die wetenschappers gebruiken om de resultaten van grote datasets te voorspellen, kunnen tekortschieten als het gaat om het voorspellen van de resultaten van mensenlevens, volgens een massastudie onder leiding van onderzoekers van Princeton University in samenwerking met onderzoekers van veel instellingen, waaronder Virginia Tech.

Deze massale samenwerking, genaamd de Fragile Families Challenge, vertegenwoordigt een cohort van wetenschappers die statistische en machine-learning modellen bouwen om levensresultaten voor kinderen, ouders en huishoudens in de Verenigde Staten te voorspellen en te meten. Gepubliceerd door 112 co-auteurs in PNAS, suggereren de resultaten dat sociologen en datawetenschappers voorzichtig moeten zijn bij het gebruik van voorspellende modellen, vooral in het strafrechtsysteem en sociale programma’s.

Zelfs na het gebruik van de modernste modellen en een hoogwaardige dataset met 13.000 datapunten voor meer dan 4.000 families, waren de beste AI-voorspellende modellen niet erg nauwkeurig. Brian J. Goode, een onderzoekswetenschapper van het Fralin Life Sciences Institute in Virginia Tech, behoorde tot de data- en sociale wetenschappers die meededen aan de ‘Fragile Families Challenge’.

“Het is een poging om te proberen de complexiteit en complexiteit van het menselijk leven vast te leggen in gegevens en modellen. Maar het is verplicht om de volgende stap te nemen en modellen te contextualiseren in termen van hoe ze zullen worden toegepast om beter te redeneren over verwachte onzekerheden en beperkingen van een voorspelling. Dat is een heel moeilijk probleem om mee om te gaan, en ik denk dat de ‘Fragile Families Challenge’ laat zien dat we meer onderzoek nodig hebben op dit gebied, vooral omdat machine learning een grotere impact heeft op ons dagelijks leven leeft, ‘zei Goode. De modellering van Goode is uitgevoerd via het Discovery Analytics Center in Virginia Tech. Daar werkte hij samen met de directeur van het Discovery Analytics Center en de Thomas L. Phillips Professor of Engineering, Naren Ramakrishnan, en Debanjan Datta, een Ph.D. student aan de afdeling Computerwetenschappen van het College of Engineering.

“De studie laat ons ook zien dat we zoveel te leren hebben, en massale samenwerkingen als deze zijn enorm belangrijk voor de onderzoeksgemeenschap”, zegt de co-leadauteur van de PNAS-studie, Matt Salganik. Het project is geïnspireerd op Wikipedia, een van ‘s werelds eerste massale samenwerkingen, die in 2001 is gemaakt als een gedeelde encyclopedie. Salganik dacht na over welke andere wetenschappelijke problemen konden worden opgelost door middel van een nieuwe vorm van samenwerking, en toen sloot hij zich aan bij Sara McLanahan, de William S. Tod-hoogleraar sociologie en openbare aangelegenheden in Princeton, en bij de afgestudeerde studenten van Princeton, Ian Lundberg en Alex Kindel, beide bij de afdeling Sociologie.

McLanahan is hoofdonderzoeker van de Fragile Families and Child Wellbeing Study aan de Princeton and Columbia University, die een cohort van ongeveer 5.000 kinderen heeft onderzocht die tussen 1998 en 2000 in grote Amerikaanse steden zijn geboren, met een oversampling van kinderen van ongehuwde ouders. De longitudinale studie was bedoeld om het leven van kinderen geboren in ongehuwde gezinnen te begrijpen.

Door middel van enquêtes verzameld in zes golven (toen het kind werd geboren en toen het kind de leeftijden 1, 3, 5, 9 en 15 bereikte), heeft de studie miljoenen gegevenspunten over kinderen en hun families verzameld. Op 22-jarige leeftijd wordt weer een golf vastgelegd.
Op het moment dat de onderzoekers de uitdaging ontwierpen, waren gegevens van 15 jaar (die de onderzoekers in de paper de “hold-out-gegevens noemen) nog niet openbaar gemaakt. Dit creëerde de mogelijkheid om andere wetenschappers te vragen om de levensresultaten van de mensen in de studie door middel van een massale samenwerking.

Bronnen: PNAS/ Socius

Geef een reactie

Your email address will not be published. Required fields are marked with *.

Share via
Copy link
Powered by Social Snap