Kako vještačka inteligencija mijenja nauku

Najnoviji AI algoritmi istražuju evoluciju galaksija, izračunavaju funkcije kvantnih valova, otkrivaju nova hemijska jedinjenja i još mnogo toga. Postoji li nešto što naučnici rade, a da ne može biti automatizovano?

Ni jedan čovjek ili tim ljudi ne bi mogao pratiti lavinu informacija koje su proizveli mnogi današnji fizički i astronomski eksperimenti. Neki od njih svakodnevno snimaju terabajtove podataka – a bujica se samo povećava. Square Kilometar Array, radio-teleskop koji treba da se uključi sredinom 2020-ih, generisaće svake godine skoro isti promet podataka kao i cijeli internet.

Zato se mnogi naučnici okreću umjetnoj inteligenciji za pomoć. Sa minimalnim ljudskim unosom, AI sistemi kao što su vještačke neuronske mreže – kompjuterski simulirane mreže neurona koji oponašaju funkciju mozga – mogu da ore kroz planine podataka, naglašavajući anomalije i detektujući obrasce koje ljudi nikada nisu mogli da primjete.



Naravno, upotreba kompjutera za pomoć u naučnim istraživanjima seže unazad oko 75 godina, a metoda ručnog prenošenja podataka u potrazi za smislenim obrascima nastala je prije više od milenijuma. Ali neki naučnici tvrde da najnovije tehnike u mašinskom učenju i AI predstavljaju fundamentalno novi način rada u nauci. Jedan takav pristup, poznat kao generativno modeliranje, može pomoći u identifikaciji najvjerodostojnije teorije među konkurentskim objašnjenjima za podatke opservacije, zasnovane isključivo na podacima, i što je važno, bez ikakvog unaprijed programiranog znanja o tome koji fizički procesi mogu biti u radu u sistemu koji se istražuje. Zagovornici generativnog modelovanja vide ga kao dovoljno roman da bi ga se moglo smatrati potencijalnim „trećim putem“ učenja o univerzumu.

Izbrišimo sve što znamo o astrofizici. U kojoj mjeri bismo mogli ponovo otkriti to znanje, samo koristeći same podatke?

Kevin Schawinski

Tradicionalno, učili smo o prirodi kroz posmatranje. Razmislite o Johannesu Kepleru koji prelazi preko Tycho Braheovih stolova planetarnih pozicija i pokušava da razabere osnovni obrazac. (Na kraju je zaključio da se planete kreću u eliptičnim orbitama.) Nauka je takođe napredovala kroz simulaciju. Astronom bi mogao modelirati kretanje Mliječnog puta i njegove susjedne galaksije, Andromeda, i predvidjeti da će se sudariti za nekoliko milijardi godina. I posmatranje i simulacija pomažu naučnicima da stvaraju hipoteze koje se zatim mogu testirati sa daljim zapažanjima. Generativno modeliranje se razlikuje od oba ova pristupa.

“To je u osnovi treći pristup, između posmatranja i simulacije”, kaže Kevin Šavinski, astrofizičar i jedan od najinovantnijih zagovornika generativnog modeliranja, koji je do nedavno radio na Švajcarskom federalnom institutu za tehnologiju u Cirihu (ETH Zurich). “To je drugačiji način za napad na problem.”

Neki naučnici vide generativno modeliranje i druge nove tehnike jednostavno kao električni halat za obavljanje tradicionalne nauke. Ali većina se slaže da AI ima ogroman uticaj i da će njena uloga u nauci samo rasti. Brian Nord, astrofizičar iz Fermijeve nacionalne akceleratorske laboratorije, koji koristi umjetne neuronske mreže za proučavanje kosmosa, je među onima koji se boje da ne postoji ništa što ljudski naučnik ne može učiniti da ne može da bude automatizirano. “To je pomalo zastrašujuća misao”, reče on.

Otkriće generacije



Otkako je diplomirao, Schawinski je postao poznat po svojoj nauci. Dok je radio na svom doktoratu, suočio se sa zadatkom da klasifikuje hiljade galaksija na osnovu njihovog izgleda. Budući da za taj posao nije postojao lako dostupan softver, on je odlučio da ga iskoristi – i tako je rođen projekt za naučnike Galaxy Zoo. Počevši od 2007. godine, obični korisnici računara pomogli su astronomima tako što su prijavili svoje najbolje pretpostavke o tome koja galaksija pripada kategoriji u kojoj je većinsko pravilo obično vodilo do ispravnih klasifikacija. Projekat je bio uspješan, ali, kao što Schawinski napominje, AI je to sve zasjenio: “Danas, talentovani naučnik sa iskustvom u mašinskom učenju i pristupu računarstvu u oblaku mogao bi da uradi cijelu stvar za jedno popodne.”

Schawinski se 2016. godine okrenuo snažnom novom halatu generativnog modeliranja. U suštini, generativno modeliranje pita se koliko je vjerovatno, pod uvjetom X, da ćete primijetiti ishod Y. Pristup se pokazao nevjerojatno moćan i svestran. Na primjer, pretpostavimo da generativni model hranite skupom slika ljudskih lica, pri čemu je svako lice označeno s dobi osobe.

Dok se kompjuterski program češlja kroz ove “podatke o obuci”, počinje da crta vezu između starijih lica i povećanu vjerovatnoću bora. Na kraju, on može da “ostari” svako lice koje je dano – to jest, može predvideti koje fizičke promjene će određeno lice bilo koje starosti proći.

Nijedno od ovih lica nije stvarno. Lica u gornjem redu (A) i lijeva kolona (B) su konstruisana generativnom kontradiktornom mrežom (GAN) koristeći građevinske elemente pravih lica. GAN je zatim kombinovao osnovne karakteristike lica u A, uključujući njihov spol, starost i oblik lica, sa finijim osobinama lica u B, kao što su boja kose i boja očiju, da bi stvorili sva lica u ostatku rešetke.



Najpoznatiji generativni sistemi za modeliranje su „generativne kontradiktorne mreže“ (GAN). Nakon adekvatnog izlaganja podacima obuke, GAN može popraviti slike koje imaju oštećene ili nestale piksele, ili mogu učiniti oštre fotografije mutnim. Oni uče da izvuku informacije koje nedostaju putem takmičenja (otuda termin “kontradiktorni”): Jedan dio mreže, poznat kao generator, generiše lažne podatke, dok drugi dio, diskriminator, pokušava da razlikuje lažne podatke od stvarnih podataka. Kako program teče, obje polovice postaju sve bolje. Možda ste vidjeli neke od hiper-realističnih, “GAN-proizvedenih” lica koja su nedavno kružila – slike “čudno realističnih ljudi koji zapravo ne postoje”, kako je to rekao jedan naslov.

Šire gledano, generativno modeliranje uzima skupove podataka (tipično slike, ali ne uvijek) i razbija svaki od njih u skup osnovnih, apstraktnih gradivnih blokova – naučnici to nazivaju “latentnim prostorom podataka”. Algoritam manipulira elementima latentni prostor kako bi se vidjelo kako to utječe na izvorne podatke, a to pomaže u otkrivanju fizičkih procesa koji djeluju u sistemu.



Ideja o latentnom prostoru je apstraktna i teška za vizualizaciju, ali kao gruba analogija, zamislite šta bi vaš mozak mogao da uradi kada pokušate da odredite pol ljudskog lica. Možda primjetite frizuru, oblik nosa, i tako dalje, kao i obrasce koje ne možete lako staviti u riječi. Kompjuterski program na sličan način traži istaknute karakteristike među podacima: Iako nema pojma šta je brk ili kakav spol, ako je obučen u skupovima podataka u kojima su neke slike označene kao “muškarac” ili “žena”, i neki imaju oznaku “brkovi”, brzo će zaključiti vezu.

Kevin Šavinski, astrofizičar koji vodi AI kompaniju pod nazivom Modulos, tvrdi da tehnika nazvana generativno modeliranje nudi treći način učenja o univerzumu.

U radu objavljenom u decembru u astronomiji i astrofizici, Schawinski i njegovi kolege iz ETH Zuricha Dennis Turp i Ce Zhang koristili su generativno modeliranje kako bi istražili fizičke promjene koje galaksije prolaze kroz evoluciju. (Softver koji koriste, tretira latentni prostor donekle drugačije od načina na koji ga tretira generativna kontra-mreža, tako da nije tehnički GAN, iako sličan.) Njihov model je stvorio umjetne skupove podataka kao način ispitivanja hipoteza o fizičkim procesima. Oni su, na primer, pitali kako je “gašenje” formiranja zvjezda – naglo smanjenje formacije – povezano sa povećanjem gustine okoline galaksije.

Za Šawinija, ključno pitanje je koliko informacija o zvjezdanim i galaktičkim procesima može biti zadirkivano samo iz podataka. “Izbrišimo sve što znamo o astrofizici”, rekao je on. “U kojoj mjeri bismo mogli ponovno otkriti to znanje, samo koristeći same podatke?”

Prvo, slike galaksija su redukovane na njihov latentni prostor; zatim, Šawinski je mogao da podesi jedan element tog prostora na način koji je odgovarao određenoj promjeni u okolini galaksije – na primjer, gustina okoline. Tada je mogao ponovo da generiše galaksiju i vidi koje razlike su se pojavile. “Sada imam mašinu za generiranje hipoteza”, objasnio je on.

“Mogu da uzmem cijelu gomilu galaksija koje su prvobitno u okruženju niske gustine i čine ih da izgledaju kao da su u okruženju visoke gustine, ovim procesom.” Okruženja niske do visoke gustoće, postaju crvenija, a njihove zvijezde postaju centralnije koncentrirane. To odgovara postojećim opažanjima o galaksijama, rekao je Schawinski. Pitanje je zašto je to tako.



Sljedeći korak, kaže Schawinski, još nije bio automatizovan: „Moram da dođem kao čovjek i kažem:„ U redu, kakva fizika bi mogla objasniti ovaj efekat? ”„ Za proces u pitanju, postoje dva prihvatljiva objašnjenja: Možda galaksije postaju crvenije u okruženjima velike gustine jer sadrže više prašine, ili možda postaju crvenije zbog pada formacije zvjezda (drugim riječima, njihove zvijezde imaju tendenciju da budu starije). Sa generativnim modelom, obe se ideje mogu testirati: Elementi u latentnom prostoru koji se odnose na prašnjavost i stope formiranja zvjezda su promenjeni da bi se vidjelo kako to utiče na boju galaksija. “A odgovor je jasan”, rekao je Schawinski. Crvenije galaksije su “gde je formacija zvjezda pala, a ne one gde se prašina promjenila. Zato bismo trebali dati prednost tom objašnjenju.”

Pristup se odnosi na tradicionalnu simulaciju, ali s kritičkim razlikama. Simulacija je “suštinski zasnovana na pretpostavkama”, rekao je Schawinski. “Pristup je reći:” Mislim da znam koji su osnovni fizički zakoni koji dovode do svega što vidim u sistemu. “Tako da imam recept za formiranje zvjezda, imam recept za to kako se ponaša tamna materija, i tako dalje. Stavio sam sve svoje hipoteze tamo, i pustio sam da se simulacija pokrene. I onda pitam: Da li to izgleda kao stvarnost? ”Ono što je on učinio sa generativnim modeliranjem, rekao je on,“ u nekom smislu, upravo je suprotno od simulacije. Mi ne znamo ništa; ne želimo da pretpostavimo ništa. Mi želimo da nam podaci kažu šta se dešava. ”

Očigledan uspjeh generativnog modeliranja u ovakvoj studiji očigledno ne znači da su astronomi i postdiplomci postali suvišni – ali čini se da predstavlja promjenu u stepenu u kojem se učenje o astrofizičkim objektima i procesima može postići umjetnim vještinama sistema koji ima malo više u svojim elektronskim prstima od ogromnog skupa podataka. “To nije potpuno automatizovana znanost – ali ona pokazuje da smo u stanju barem djelomično izgraditi alate koji čine proces nauke automatskim”, rekao je Schawinski.



Generativno modeliranje je očigledno moćno, ali da li je to uistinu novi pristup nauci, otvoreno je za raspravu. Za Davida Hogga, kosmologa sa Univerziteta u Njujorku i Flatiron Instituta (koji, kao i Quanta, finansira Simons fondacija), tehnika je impresivna, ali u konačnici samo vrlo sofisticiran način izdvajanja uzoraka iz podataka – što su astronomi radili vjekovima. Drugim riječima, to je napredni oblik promatranja plus analiza. Hoggov sopstveni rad, kao i Schawinski, u velikoj mjeri se oslanja na AI; on koristi neuronske mreže da klasifikuje zvjezde prema njihovom spektru i da zaključi druge fizičke atribute zvjezda koristeći modele vođene podacima. Ali on vidi svoj rad, kao i Schawinski, kao istinitu nauku. “Ne mislim da je to treći put”, rekao je nedavno. „Samo mislim da mi kao zajednica postajemo mnogo sofisticiraniji o tome kako koristimo podatke. Konkretno, postajemo mnogo bolji u poređenju podataka sa podacima.

Za dalje čitanje posjetite:

https://www.quantamagazine.org/how-artificial-intelligence-is-changing-science-20190311/

Share

Leave a Reply

Your email address will not be published. Required fields are marked *