Big Data: Putem prezice tendințele populației (cum ar fi fericirea) prin intermediul aplicațiilor de sănătate?
Cu mai mult de cinci ani în urmă, am scris o piesă intitulată Fiabilitate și validitate într-o lume Web 2.0. A vorbit despre preocupările colectării datelor din eșantioane părtinitoare - fără a înțelege mai întâi în ce moduri, exact, eșantioanele respective pot fi părtinitoare.Acum, odată cu ubicuitatea aplicațiilor - programe descărcabile pentru smartphone-urile oamenilor - văd că apare aceeași problemă. Dezvoltatorii și antreprenorii urmăresc date din aceste aplicații fără să înțeleagă noțiunile de bază pentru colectarea de date științifice bune, fiabile. Și de ce contează - mai ales atunci când începeți să doriți să analizați toate aceste „date mari” (un termen oarecum prostesc ... în epidemiologie, de exemplu, oamenii de știință doar îl numesc „date”).
Datele personale de sănătate pot fi colectate de aceste aplicații fără părtinire și cumva pot fi transformate în măsurarea a ceva mai mare?
Răspunsul scurt: nu, nu ușor.
Sigur, există oameni care fac parte dintr-o mișcare de „sine cuantificat” - care doresc să urmărească și să măsoare fiecare aspect al sănătății lor personale (și presupus, sănătatea mintală). Însă acei oameni sunt în prezent 1 superiori și în niciun caz reprezentativi pentru populație în general.
Astfel de minorități pot constitui rapid majoritatea efortului de a colecta seturi de date mai mari pentru a analiza tendințele de sănătate sau bunăstare. Deși analizele rezultate vă pot spune ceva despre acest grup de oameni, ar fi nepotrivit să sugerați că generalizează restul populației (care, din punct de vedere demografic și comportamental, poate arăta și acționa foarte diferit).
Acest lucru nu se va schimba în curând, deoarece majoritatea aplicațiilor de sănătate sunt descărcate de oameni, utilizate o dată sau de două ori și apoi abandonate. Există un motiv pentru care majoritatea oamenilor nu mai folosesc aplicații de sănătate - în special cele menite să acționeze ca jurnal de date. Sunt plictisitori! Colectarea datelor despre dvs. este doar o sarcină foarte plictisitoare pentru majoritatea dintre noi să ne angajăm să facem activ în fiecare zi (sau chiar în fiecare săptămână).
Răspunsul complicat: aplicațiile trebuie să fie mai inteligente, conectate
Aplicațiile de sănătate menite să colecteze date nu reușesc în cele din urmă deoarece necesită introducere activă de către utilizator. Acesta este motivul pentru care înregistrările personale de sănătate nu au decolat niciodată în mod semnificativ.2 Oamenii sunt prea ocupați să-și trăiască viața pentru a fi deranjați să spună unei aplicații3 care sunt valorile lor zilnice.
Pentru ca aplicațiile de sănătate să reușească în cele din urmă, acolo unde majoritatea celorlalte încercări de software de urmărire a sănătății personale au eșuat, este ca acestea să își colecteze datele pasiv. Asta înseamnă că nu este necesară nicio intrare de la utilizator.
Desigur, suntem departe de astfel de valori, oferind date semnificative.Sigur, există dispozitive care rulează cât de mult alergi (de la Nike, desigur). Dar o aplicație care rulează este inutilă dacă nu vorbește cu aplicația pentru dietă, cu aplicația pentru nutriție sau cu aplicația pentru exerciții. Sau aplicația mea de mindfulness. Este o aplicație care măsoară o singură valoare în ființa complexă care sunt eu. Pur și simplu nu este mare lucru.
Încrederea este o piatră de temelie cheie
Adoptarea unor astfel de aplicații în rețea care partajează toate datele dvs. de sănătate au un alt obstacol, mai puțin tehnic, de asemenea - încredere. Companiile precum Facebook și Nike răspund în cele din urmă doar unui singur set de persoane - acționarii lor. Asta înseamnă că, dacă este în interesul lor să vă analizeze datele pentru lucruri din care pot câștiga bani, vor face acest lucru.
Startup-urile nu sunt mai bune, pentru că în loc de acționari, ele răspund doar capitalistilor de risc - creditori care caută doar cea mai bună și cea mai rapidă rentabilitate a investiției lor.
De ce aș vrea să am încredere în informațiile mele de sănătate - date care ar putea fi utilizate împotriva mea pentru refuzul viitor de asigurare sau stabilirea tarifelor mele de asigurare - companiilor care nu prea au interes să-mi protejeze confidențialitatea?
Ceea ce ne aduce din nou la primul punct - un eșantion părtinitor. Oamenii care oferă cu bucurie toate informațiile lor de sănătate companiilor cu scop lucrativ pentru a le analiza, colaționa și, în cele din urmă, să le asocieze (chiar dacă astfel de date sunt inițial anonimizate) nu sunt ca majoritatea oamenilor. Cei mai mulți dintre noi încă ne pasă să ne păstrăm informațiile despre sănătate pentru noi, la fel cum majoritatea dintre noi dorim să păstrăm informațiile noastre financiare pentru noi înșine.
Unde mergem de aici
Încercarea de a colecta date bazate pe populație (de exemplu, efectuarea de cercetări epidemiologice) din aplicațiile de sănătate are câteva probleme și oportunități pe care le-am identificat:
- Eșantionare părtinitoare din cauza minorității minuscule de oameni care utilizează în mod activ și continuu aplicații de sănătate
- Eșantionarea și utilizarea continuă ar putea fi îmbunătățite prin pasiv impotriva activ colectare de date
- Eșantionarea și utilizarea ar putea fi îmbunătățite în continuare prin utilizarea unei autorități de încredere pentru colectarea și stocarea datelor (nu o companie cu scop lucrativ sau o întreprindere de pornire)
- Aplicațiile care sunt conștiente una de cealaltă și schimbă date relevante despre sănătate despre mine sunt generația următoare - în loc de bogăția actuală de aplicații silente, necunoscute (stupide?)
Cred că este minunat ca dezvoltatorii să analizeze o problemă de sănătate, să dezvolte o aplicație pentru aceasta și să o lanseze în lume. Dar de prea multe ori aceste aplicații nu merg nicăieri, fără public. Sau sunt orfani de dezvoltatorii originali din lipsă de interes. Cele câteva aplicații populare de sănătate care câștigă un public robust sunt excepția, nu regula. Și chiar și atunci când obțin o acceptare pe scară largă, la fel ca sistemele electronice de evidență medicală din țara noastră, nu vorbesc între ei.
Dacă doriți să puteți spune ceva autoritar sau semnificativ cu privire la datele colectate dintr-o aplicație, trebuie să arătați că datele provin dintr-un eșantion reprezentativ al populației. În lipsa acestui fapt, datele dvs. ne spun doar despre un grup mic din populație - unul care nu arată ca majoritatea dintre noi.
Note de subsol:
- Și va fi pentru viitorul previzibil [↩]
- Și de ce Google își va închide în cele din urmă propriul dosar personal de sănătate mâine. [↩]
- Sau mai rău - și mai frecvent - a întregul set de aplicații care nu sunt conștienți de altul și nu pot face schimb de date unul cu celălalt [↩]