Izvori velikih podataka u medicini

Izvori velikih podataka u medicini

Jednostavna definicija velikih podataka u medicini je "ukupnost podataka vezanih uz zdravstvenu zaštitu i dobrobit pacijenata" (Raghupathi 2014). Ali što točno jesu ove vrste podataka i odakle dolaze?

Slijedi široki pregled vrsta i izvora velikih podataka od interesa za pružatelje zdravstvene skrbi, istraživače, obveznike, nositelje odluka i industriju.

Te kategorije međusobno ne isključuju, jer isti podaci mogu potjecati iz raznih izvora.

Niti ovaj popis nije iscrpan, jer će praktična primjena velike analize podataka zasigurno nastaviti širiti.

Klinički informacijski sustavi

To su tradicionalni izvori kliničkih podataka koje pružatelji zdravstvene skrbi navikavaju na pregled.

Potraživanja podataka od platitelja

Javni obveznici (npr. Medicare) i privatni obveznici imaju velike pohranjene podatke o njihovim korisnicima. Neki zdravstveni osiguravatelji sada također nude poticaje za dijeljenje vaših podataka o zdravlju.

Istraživanja

Istraživačke baze podataka sadrže informacije o sudionicima studije, eksperimentalnim tretmanima i kliničkim rezultatima. Velike studije obično sponzoriraju farmaceutske tvrtke ili vladine agencije. Primjena personalizirane medicine je uskladiti pojedine pacijente s učinkovitim tretmanima, na temelju uzoraka u kliničkim ispitivanjima podataka.

Ovaj se pristup kreće izvan primjene principa medicine utemeljenog na dokazima, pri čemu davatelj zdravstvenih usluga određuje da li pacijent dijeli široke karakteristike (npr. Dob, spol, rasu, klinički status) s sudionicima suđenja. Uz veliku analizu podataka, moguće je odabrati liječenje koje se temelji na puno više granuliranih informacija, poput genetskog profila raka pacijenta (vidi dolje).

Klinički sustavi podrške odlučivanju (CDSS) također se brzo razvijaju i sada predstavljaju veliki dio umjetne inteligencije (AI) u medicini.

Koriste podatke o pacijentima kako bi pomogli kliničarima u odlučivanju i često se kombiniraju s EHR-om.

Genetske baze podataka

Repozitorij ljudskih genetskih informacija i dalje se akumulira u brzom ritmu. Budući da je Projekt humanog genoma završen 2003., trošak ljudskog DNA sekvenciranja smanjen je za milijun puta. Osobni genomski projekt (PGP), pokrenut 2005. godine Harvard Medical School, nastoji slijediti i objaviti kompletne genome od 100.000 volontera iz cijelog svijeta. Sam PGP je glavni primjer velikog projekta podataka zbog običnog volumena i raznovrsnosti podataka.

Osobni genom sadrži oko 100 gigabajta podataka. Uz sekvenciranje genoma, PGP također prikuplja podatke iz EHR-ova, anketama i profilima mikrobioma.

Nekoliko tvrtki nudi komercijalnu bazu genetskog redoslijeda za zdravlje, osobne osobine i farmakogenetiku.

Ti se osobni podaci mogu podvrgnuti velikoj analizi podataka. Na primjer, 23e prestali pružati genetska izvješća povezana s zdravljem novim korisnicima od 22. studenoga 2013., kako bi se uskladili s američkom Uprava za hranu i lijekove. Međutim, 2015. tvrtka je počela ponuditi određene zdravstvene komponente svojeg testiranja na genetskoj sline, ovaj put uz odobrenje FDA-e.

Javni zapisi

Vlada drži detaljne zapise o događajima vezanim uz zdravlje, kao što su imigracija, brak, rođenje i smrt. Popis stanovništva SAD-a prikupio je ogromne količine informacija svakih 10 godina od 1790. godine. Web stranica statistike Censusa imala je 370 milijardi stanica od 2013. godine, a godišnje je dodano oko 11 milijardi više.

Web Pretraživanja

Informacije o pretraživanju weba koje su prikupile Google i drugi davatelji weba za pretraživanje mogli bi pružiti uvide u stvarnom vremenu koji se odnose na zdravlje populacije. Međutim, vrijednost velikih podataka iz obrasca pretraživanja weba može se poboljšati kombinirajući ga s tradicionalnim izvorima podataka o zdravlju.

Društveni mediji

Facebook, Twitter i ostale platforme društvenih medija generiraju bogatstvo podataka oko 24 sata, pružajući pogled na lokacije, zdravstvene ponašanja, emocije i društvene interakcije korisnika. Primjena velikih podataka društvenih medija u javno zdravstvo naziva se digitalnim otkrivanjem bolesti ili digitalnom epidemiologijom. Twitter, na primjer, koristi se za analizu epidemija gripe u općoj populaciji.

Projekt Svjetskog blagostanja koji je započeo na Sveučilištu Pennsylvania bio je još jedan primjer proučavanja društvenih medija kako bi bolje razumio ljudska iskustva i zdravlje. Projekt okuplja psihologe, statističare i kompjuterske znanstvenike koji analiziraju jezik koji se koristi prilikom interakcije na mreži, na primjer, prilikom pisanja ažuriranja statusa na Facebooku i Twitteru. Znanstvenici promatraju kako se jezik korisnika odnosi na njihovo zdravlje i sreću. Napredak u obradi prirodnog jezika i strojnog učenja pomažu svojim naporima. Nedavna publikacija sa Sveučilišta u Pennsylvaniji proučavala je načine predviđanja mentalne bolesti analiziranjem društvenih medija. Čini se da se simptomi depresije i drugih mentalnih zdravstvenih stanja mogu otkriti proučavanjem naše upotrebe Interneta. Znanstvenici se nadaju da će u budućnosti ove metode biti u mogućnosti bolje identificirati i pomoći rizičnim pojedincima.

Internet stvari (IoT)

Mnoge informacije o zdravlju također se prikupljaju i pohranjuju na mobilnim i kućnim uređajima .

Financijske transakcije

Transakcije kreditne kartice s pacijentima uključene su u prediktivne modele koje koristi Carolinas HealthCare System kako bi identificirali pacijente s visokim rizikom za ponovni prihvat u bolnicu. Davatelj zdravstvene skrbi sa sjedištem u Charlotteu koristi velike podatke kako bi pacijente podijelio u različite skupine, na primjer, na temelju bolesti i geografskog položaja.

Etičke i implikacije na privatnost

Treba naglasiti da u nekim slučajevima postoje važne etičke i privatne implikacije prilikom prikupljanja i pristupa podacima u zdravstvenoj zaštiti. Novi izvori velikih podataka mogu poboljšati naše razumijevanje onoga što utječe na pojedinca i zdravlje populacije, međutim, različite rizike treba pažljivo razmotriti i pratiti. Sada je također prepoznato da podaci koji su prethodno bili anonimni, mogu se ponovno identificirati. Na primjer, profesorica Latanya Sweeney s Harvardovog laboratorija za zaštitu podataka pregledala je 1.130 volontera uključenih u projekt Personal Genome. Ona i njena ekipa mogli su ispravno nazvati 42 posto sudionika na temelju informacija koje dijele (poštanski broj, datum rođenja, spol). To znanje može povećati našu svijest o potencijalnim rizicima i pomoći nam da bolje odluke o razmjeni podataka.

> Izvori:

> Conway M, O'Connor D. Društveni mediji, veliki podaci i mentalno zdravlje: trenutni napredak i etičke implikacije. Current Opinion in Psychology 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Veliki podaci, veći ishod. Journal of American Association za upravljanje zdravstvenim informacijama 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Otkrivanje depresije i mentalnih bolesti na društvenim medijima: integrativni pregled . Trenutni Mišljenje o bihevioralnim znanostima 2017; 18: 43-49.

> Lazer D, Kennedy R, kralj G, Vespignani A. Parabola o Google gripi: Zamke u velikoj analizi podataka . Science 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Velika analitika podataka u zdravstvu: obećanje i moćni al. Znanstveni informacijski znanosti i sustavi 2014 .; 2: 3.

> Sweeney L, Abu A, Winn J. Identificiranje sudionika u projektu osobnog genoma po imenu . Sveučilište Harvard. Privatnost podataka. Bijela knjiga 1021-1. 24. travnja 2013.