Betegségek közötti kapcsolat és az emberközpontú mesterséges intelligencia
BME körkép
A Műegyetem bioinformatikusai új perspektívát nyitottak a betegségek elmélyült megértése felé egy saját fejlesztésű betegségtérkép által, amelynek finomhangolása révén most lehetővé vált a depresszió új altípusainak azonosítása. A kutatás, amely Antal Péter egyetemi docens által vezetett csoport munkájának eredménye, jelentős lépésnek számít a szervezetünk kölcsönhatásainak feltárásában. A kutatóval a több mint egy évtizede zajló munkáról, valamint a mesterséges intelligencia emberközpontú használatáról beszélgettünk.
A betegségek közötti rendszerszintű kapcsolatok feltérképezését célzó kutatásuk már több mint egy évtizede folyik.
A most megjelent cikk módszertani hátterét adó kutatás a 2000-es évektől indult. A munkánk során felhasznált rendszerszemléletű valószínűségi modell a maximális takarékosság elve szerint csupán a betegségek közötti közvetlen összefüggéseket próbálja megragadni. Ez azt jelenti, hogy nem csupán változóknak a páronkénti asszociáltságát modelleztük, hanem azt néztük meg rendszerszinten, hogy melyek azok a betegségek közötti kapcsolatok, amelyek az adott absztrakciós szinten mindenképpen jelen vannak, még hogyha sztochasztikusak, véletlenszerűek is. További kérdés volna, amit a cikkben nem használtunk ki, és általában óvatosak vagyunk vele, hogy az így jelzett közvetlen kapcsolatok mennyiben tekinthetőek oksági relációknak, azaz használhatóak fel beavatkozások tervezéséhez. Azonban továbbra is nagy kérdés, hogy ha például azt látjuk, hogy egy bizonyos diéta egy adott betegség előfordulását kedvezően befolyásolja, akkor milyen tényezők zavarhatják be ezt a kapcsolatot. A mi munkánk arra irányult, hogy hogyan lehet rendszerszinten legalább azt kiszűrni, amikor egyéb megfigyelt változók mediálják ezt a kapcsolatot. Az előző példánál maradva azt szeretnénk jelezni, hogy egy diéta és egy betegség statisztikailag asszociált abban az esetben, ha az összes többi változót egy konstans értéken tudnánk tartani.
Jól értem, hogy önök előzetes vizsgálatokat végeznek, statisztikai sejtésekkel határoznak meg irányokat, amelyekbe érdemes az adott terület szakembereinek kutatni?
Így van. A biológia tudománya egy forradalmi változáson ment át a 2000-es évektől, amikor egy adatgazdagnak mondott korszakába ért. Ez azt jelenti, hogy a biológia több területén lehetővé vált egy adott fogalmi szinten minden entitást megmérni. A genetika ennek a mintapéldája. A 90-es évektől futó emberi genom projekt korábban nem tapasztalt módon, hamarabb és olcsóbban befejeződött a tervezettnél, előállítva egy konszenzuális emberi genomot, amely praktikusan minden gént leír. Manapság pedig már a teljes genomszekvenálás standard része az élettudományi kutatásoknak. Így nem szükséges leszűkíteni egy genetikai vizsgálatot már a legelején egy genomi régióra, vagy pár genetikai variánsra, hanem hipotézismentesen kezdhetünk el kutatni.
A gyakori betegségek kutatásánál egy alaphipotézis, hogy nem szükséges az emberben lévő összes, körülbelül 3 milliárd bázispárt megvizsgálnunk, hanem elegendő ebből nagyjából egy milliós nagyságrendű variáns készletet nézni, ami a leggyakoribb változásokat profilként mutatja, és hogyha ezeket megmérjük, akkor egy úgynevezett teljes genomi szélességű, hipotézismentes kutatás indulhat. Ez egy teljesen új tudományos hozzáállást eredményezett. Az a fajta empirikus, megszokott kutatási modell, ami egy hipotézis alapján tervezte a kísérletet, gyűjtött és értékelt ki adatokat, támasztotta alá vagy vetette el, esetleg bővítette azt, kiegészült egy teljesen más megközelítéssel. A mi kutatásunk is, habár természetesen nem a vakvilágba kutattunk, bizonyos értelemben hipotézismentes volt.
A biobankok, pontosabban biobanki adattárházak, korunk egy másik nagy fejleménye, melyek egy része kutatási célra is elérhető. Ezek felhasználásával akkor is el lehet végezni egy átfogó elemzést, ha nincsen priori fókusz, mert megnézzük, hogy az összes betegségre, azok összes tünetére, az összes lehetséges felhasznált gyógyszernek az elemzése folytán milyen szabályszerűségek mutatkoznak. Természetesen nagyon sokféle jogos kritikát fogalmaztak meg a hipotézismentes megközelítés alkalmazhatóságáról, amely a tudományos kutatás és felfedezés automatizálhatóságának kérdéséhez is elvezet.
Az egészségügyi adattárházakban a legtöbb esetben önkéntes hozzájárulók az adatok szolgáltatói, a kutatásokban pedig előre meghatározott kérdésekre korlátozzák az elérhető adatokat. Mindezeknek a biztonsági tevékenységek ellenére az információk védelmével és a felhasználásával kapcsolatosan lát sebezhetőséget, bizonytalanságot?
A doktori kutatásaim kezdetén, a 90-es évek második felében, pár száz fős adathalmazok voltak a megszokottak egy-egy kutatásban. A Wellcome Trust-nak egy 2000-es évektől tervezett, 2010-től feltöltött adatbázisa, a UK Biobank, aminek az adatait mi is használtuk, ma 500 ezer embernek tartalmazza a legkülönfélébb adatait. Az emberek azért léptek be önkéntes alapon, mert az az ígéret, hogy kiemelt egészségügyi figyelmet kapnak. Mivel benne van a genetikai profiljuk, ez nem csupán azt jelenti, hogy molekulárisan is ismertek a résztvevők, hanem azt is, hogy az összes rokonukról, akár egy genetikai variáns kapcsán, részletes információk érhetők el. Tanulságos, hogy nagyon kis számban, évente csupán egy tucat ember gondolja meg magát és vonja vissza a részvételét. Úgy tűnik, hogy a kiemelt egészségügyi figyelem miatt, vagy akár a közjó érdekében továbbra is úgy gondolják a résztvevők, hogy részt vesznek a programban. Az adatok nagy léptékű megosztásának kérdése egy ilyen játékelméleti szituációként is felfogható, hogy ha a közjó érdekében nem tesszük be az adatainkat, akkor egy gyógyszer felfedezésénél miért várjuk el, hogy a közjó finanszírozza a kezelésünket. A visszaélések ellen pedig a jogi védelemnek és a társadalmi kontrollnak kell erősnek lennie. Az adatokra és mesterséges intelligenciára vonatkozó szabályozásoknak hasonló léptékűnek kell lennie, mint a vegyi, biológiai vagy nukleáris fegyverekre vonatkozóknak, amelyek sikeresen akadályozták meg az elterjedésüket.
Az adatok társadalmi szinten sikeres felhasználásához fontos fejlemény, hogy az utóbbi évtizedben olyan statisztikai eljárások jelentek meg, amelyek garantálják, hogy az adat annak tulajdonosánál marad, közben pedig mégis lehetséges statisztikailag globálisan elemezni. Ez egy újabb szintlépés, méghozzá Európának egy fontos versenyelőnye. Az egyénileg vagy intézményesen birtokolt adat így decentralizált is lehet.
Sok port kavartak a párizsi olimpián alkalmazott AI eljárások, a biztonságvédelmi megfigyelések, amelyek alapvetően egy jó célt szolgáltak. Ezt a konkrét helyzetet, a felmerülő kérdésekkel kapcsolatosan mik a meglátásai?
A kihívások megértéséhez érdemes megemlíteni, hogy ebben az évben zárult le a Human-centered AI Masters (HCAIM) nemzetközi projekt a BME részvételével, aminek egy kiterjesztése jövőre indul. Célja, hogy a technológiai előrehaladás során emberközpontú mesterséges intelligencia használat alakulhasson ki az iparban és a piacon is.
A konkrét kérdésre válaszul elmond-
ható, hogy az európai jog tiltja a valós idejű biometrikus azonosítást, éles ellentétben a kínai megközelítéssel. Hasonlóan az EU AI Act tiltja az erre épülő közösségi pontrendszert is. A hazai kamerahálózatok esetében az EU-s szabályozásoknak megfelelően rendkívül fontos a jogszerűség és a társadalmi kontroll, hogy a felhasználás ténylegesen indokolt legyen, és ne adjon lehetőséget visszaélésekre.
Létezik ez a megközelítés, de ugyanakkor létezik az Ön által is említett kínai modell. Márpedig versenyhelyzetben élnek a világ országai. Eredményezhet információs hátrányt számunkra az emberközpontú megközelítés?
Én bízom az előbb említett statisztikai technikákban, amelyek biztosítják azt, hogy az adat a tulajdonosánál marad, és csupán olyan információk kerülnek megosztásra, amelyek statisztikai védelmet biztosítanak a személy vagy intézmény számára. Ezek a technikák egyrészt egy technológiai fejlődést kényszerítenek ki, másrészt bizalmat ébresztenek a résztvevőkben. Ha ez jól alakul, akkor az európai cégek kénytelenek lesznek olyan technikákat kifejleszteni, amelyek megőrzik az adatok védettségét, másrészt kialakul egy olyan nyíltság, ami miatt a társadalom könnyebben oszt meg magáról adatokat. Abban bízik Európa, hogy az itteni szabadság és az itteni védettség biztosítja azt, hogy több adatot fognak végül megosztani az emberek, mint amire egy centralizáltan megszervezett adatgyűjtés képes. Biztosan lesznek esetek, amikor ezzel egyesek megpróbálnak visszaélni, de ott remélhetőleg le fog csapni a törvény szigora.
Tehát ha jól értem, akkor az emberközpontú hozzáállás nemhogy versenyhátrányt, hanem ellenkezőleg, előnyt fog jelenteni Európa számára.
Mondhatnánk azt, hogy ez egy európai csűrcsavar, de valójában ez egy nagyon mély európai filozófia. Megtartani az egyéni szabadságot, és fontosnak tekinteni az személyes autonómiát, ezen túl kiszolgálni is azt, valamint bízni benne, hogy ez gazdagítja a társadalmat. Nem föntről kitalálni, hogy mit akar az egyén, vagy továbbmenve rendszabályozni valós időben.
Ha választhatna egy, az emberiséget nyomasztó problémát, amelyet szívesen megoldana, akkor melyik lenne az?
Az emberiségnek egy következő nagy kihívása, ami a modern ipari társadalmakban is megfigyelhető, az nem csupán az élettartam növelése, hanem az egészségben eltöltött idő hosszának növelése. Ebben kulcsszerepet játszik a neurodegeneratív betegségek kezelése, mint például az Alzheimer-kór, amelyre sajnos továbbra sincs átütő terápia vagy gyógyszer. A fertőző betegségek leküzdését, a szív- és érrendszeri betegségeknek valamilyen szintű kordában tartását, az onkológiai folyamatok megértését és adott mértékű kezelését úgy látszik, hogy abszolválta az emberiség. Szerintem egy természetes kívánság, személyes is persze, hogy az ember szeretné megőrizni az intellektuális integritását, itt nagyon jól jönne a segítség a mesterséges intelligenciától.
Mit jelent Önnek oktatni?
Az oktatás számomra egy közös problémamegoldás. Meg kell mondjam, én egy órámon akkor érzem jól magam, hogyha sikerül úgy összeállítani a mondanivalót, hogy az kerek egészet alkosson egy alapvető kérdés körül. Ez persze nem mindig tehető meg, de az ember mindig próbál új szempontokat keresni. A műegyetemi létem alatt több professzor demonstrálta azt, hogy hogyan lehet egy-egy alapvető kérdés köré felépíteni az előadásokat. Ez a problémamegoldási folyamat az, amit szeretnék én is átadni.