Zbornik povzetkov AI IN NAPREDNE TEHNOLOGIJE V ZNANOSTI Konferenca, Ljubljana, 22. oktober 2024 Konferenca se je odvijala v okviru interdisciplinarnega strokovno-izobraževalnega dogodka BEST dnevi znanosti (22. – 24. oktober 2024) Kraj dogodka: Univerza v Ljubljani, Fakulteta za kemijo in kemijsko tehnologijo, Večna pot 113, 1000 Ljubljana Urednici: Zara Bunc Tinkara Korošec Založnik zbornika in organizator konference: Društvo BEST Ljubljana Kraj in leto izida: Ljubljana, 2024 Publikacija je izšla v elektronski obliki in je dostopna na spletnem naslovu: https://www.best-dnevi-znanosti.si Kataložni zapis o publikaciji (CIP) so pripravili v Narodni in univerzitetni knjižnici v Ljubljani COBISS.SI-ID 212100355 ISBN 978-961-96808-0-3 (PDF) KAZALO SKLOP KEMIJA IN KEMIJSKO INŽENIRSTVO ____________________________________ 2 SKLOP RAČUNALNIŠTVO IN INFORMATIKA____________________________________ 5 SKLOP BIOKEMIJA __________________________________________________________ 8 Okrogla miza - Bioinformatika: Most med celico in tehnologijo ____________________ 11 1 SKLOP KEMIJA IN KEMIJSKO INŽENIRSTVO Več-ravensko modeliranje pri kemijskem zajemanju, hrambi in uporabi energije izr. prof. dr. Blaž Likozar (Kemijski inštitut) Vse bolj se soočamo s potrebo po uporabi nestanovitnih virov obnovljive energije (navajeni smo predvidljive pasovne proizvodnje), hkrati pa s surovinami, ki se od poznanih (premog, nafta, fosilni zemeljski plin …) precej razlikujejo, govorimo pa seveda o vodi, CO2, dušiku ... Kemija, inženirstvo, pa tudi računalništvo se tu srečajo s tako imenovanimi naprednimi materiali (katalizatorji, hranilniki, polprevodniki …), pa tudi s pojmom dvojnega prehoda, ko je treba zelenega podpreti z digitalizacijo, ki pa se razteza od samega rešetanja snovi pa do vodenja obratovanja postopkov pri proizvodnji oz. povečevanju. Več-ravensko napovedno modeliranje se razteza od ravni, manjše od atomov, pa vse do tovarn, obratov ali vozil – tako je moč doprinesti k nekaterim ključnim izzivom, s katerimi se srečuje človeštvo. Kemija v forenziki dr. Tomaž Gostič (Nacionalni forenzični laboratorij) Nacionalni forenzični laboratorij (NFL) je specializirana notranja organizacijska enota generalne policijske uprave. Glavna naloga NFL je podajanje poročil o preiskavah in izvedenskih mnenj s področja forenzičnih znanosti. NFL je razdeljen na šest oddelkov. Oddelek za kemijske preiskave, Oddelek za biološke preiskave, Oddelek za fizikalne preiskave, Oddelek za daktiloskopijo, Oddelek za preiskave dokumentov NAC/CNAC ter Oddelek za kakovost in razvoj. Oddelek za kemijske preiskave je zaradi posebnega načina analiziranja neznanih snovi oddelek z največ instrumentalne opreme v Nacionalnem forenzičnem laboratoriju in tudi oddelek, ki obvladuje največ različnih instrumentalnih metod. Več kot 80 % zahtevkov za kemijske preiskave se nanaša na preiskave drog, med katere sodi tudi metodologija kemijskih karakterizacij in identifikacij novih psihoaktivnih substanc (NPS). Nove psihoaktivne substance predstavljajo velik izziv številnim forenzičnim laboratorijem predvsem zaradi pomanjkanja podatkov in referenčnih materialov. Identifikacija novih psihoaktivnih substanc je lahko zelo časovno in tehnično zahtevna. Vključuje različne analitske metode in primerjave z že obstoječimi snovmi. Težave nastanejo zaradi hitre evolucije sinteznih postopkov in konstantne 2 spremembe formulacij. Pri procesu identifikacije pomaga sodobna tehnologija, baze podatkov ter izmenjava forenzično kredibilnih informacij. Optimalni modeli: Uporaba matematičnega modeliranja v sodobnem kemijskem inženirstvu doc. dr. Rok Ambrožič (Fakulteta za kemijo in kemijsko tehnologijo) Z razvojem velikih podatkovnih baz in naprednih analiznih metod so matematični modeli postali nepogrešljiv pristop v sodobnem kemijskem inženirstvu. Ti modeli vključujejo integracijo mehanističnih, statističnih in hibridnih pristopov v raziskovalne in industrijske procese, kar omogoča njihov razvoj in optimizacijo. Poleg tega se je v zadnjem času razširila uporaba naprednih računalniških orodij, kot je računalniška dinamika tekočin (CFD), kar omogoča natančnejšo procesno vizualizacijo ter simulacijo in s tem večjo napovedno moč. Nekateri primeri uporabe matematičnega modeliranja v kemijskih procesih so optimizacija reakcijske kinetike in snovnega transporta za trajnostno katalizo, dizajn skalabilnih separacijskih operaciji za zaključne biofarmacevtske procese, uporaba CFD simulacije za optimizacijo (bio)kemijskih procesov in uporaba matematičnih modelov za hitro ter neinvazivno določanje količine imobiliziranih proteinov. Te inovativne metode in modeli prispevajo k napredku in trajnostni prihodnosti kemijskega inženirstva. KRKA in nekaj primerov uporabe AI v praksi: od razvoja do proizvodnje izdelkov - Morfološka analiza farmacevtskih kristalov dr. Srečko Zupančič in Lovro Klenovšek (Krka d. d.) Umetna inteligenca postaja vse bolj aplikativna tudi v industriji. V farmacevtskem podjetju Krka d. d. jo uporabljajo tudi za reševanje problematik, kot je morfološka analiza farmacevtskih kristalov, kjer je natančna karakterizacija delcev ključna za zagotavljanje kakovosti izdelkov. Tradicionalne metode, kot je ročna analiza slik, so počasne in nagnjene k napakam, zato je glavni cilj naloge razviti avtomatizirano rešitev. Uporabljena sta napredna modela strojnega vida, LOCA in Ef icientSAM, ki omogočata natančno prepoznavanje delcev z minimalnimi napakami. Rezultati kažejo, da avtomatizirana rešitev izboljša natančnost in hitrost analize, kar je obetavno za uporabo v industriji. 3 Določanje kemične sestave zvezd - kako dolgo še? prof. dr. Tomaž Zwitter (Fakulteta za matematiko in fiziko) Naša Galaksija je tipična galaksija v Vesolju, zato lahko njeno nastajanje in evolucija služita kot splošen model. Je tudi ena redkih galaksij, v kateri je mogoče opazovati posamezne zvezde. Mnoge zvezde so dolgožive. Starost našega Sonca je tretjina starosti vesolja, zvezde manjših mas pa so lahko nastale že zelo kmalu po nastanku vesolja. Študije kemične sestave in dinamičnih lastnosti zvezd v Galaksiji zato predstavljajo alternativo kozmičnim opazovanjem oddaljenih galaksij. Večino fizikalnih parametrov zvezd je mogoče razkriti le s spektroskopskimi opazovanji. Za pridobitev relevantnega vzorca je potrebno opazovati zelo veliko število zvezd, ki so razporejene po celotnem nebu. Za to nalogo je zato potrebno obsežno spektroskopsko določanje kemične sestave zvezd, ki naglo napreduje: ta mesec smo objavili kemično zastopanost 31 elementov v skoraj milijonu zvezd. Vendar so raziskovanja vesolja resno ogrožena, zlasti zaradi brezvestnega izstreljevanja desettisočev umetnih satelitov in škodljive nočne razsvetljave. 4 SKLOP RAČUNALNIŠTVO IN INFORMATIKA Veliki jezikovni modeli: izzivi in dileme prof. dr. Marko Robnik Šikonja (Fakulteta za računalništvo in informatiko) Veliki jezikovni modeli, kot je ChatGPT, so temeljito spremenili način dela na mnogih področjih, med drugim tudi informacijske tehnologije in študij. V osnovi so jezikovni modeli namenjeni verjetnostnemu modeliranju jezika in tipično napovedujejo naslednjo ali predhodno besedo ali znak. V začetku so temeljili predvsem na statistikah skupin besed, npr. zaporedju dveh ali treh besed, izračunanih na velikih besedilnih zbirkah. Iz njih se že da napovedati naslednjo besedo, kar je koristno pri prepoznavanju govora. Z nevronskimi mrežami so jezikovni modeli pridobili mnogo daljši kontekst, večjo sposobnost predstavitve besedil in generiranja človeku všečnih tekstov. Učijo se kar iz velikanskih množic besedil na internetu. Učenje poteka z napovedovanjem naslednje besede, pravilni odgovori pa so znani, saj jih lahko vzamemo iz dejanskih besedil. Razvoj velikih jezikovnih modelov se premika v smer vključevanja dodatnega zanesljivega znanja vanje. V velike, že naučene modele, se vključuje npr. faktografsko znanje iz Wikipedije in DBpedije, jezikovno znanje, znanje o logičnem in zdravorazumskem sklepanju, poskuša pa se tudi iz modelov odstraniti pristranskosti, npr. spolne in rasne. Pomembno se je seznaniti z aplikacijami umetne inteligence, njeno pristranskostjo, ki se lahko pojavlja, ter možnih prihodnjih smeri razvoja, skupaj s potencialnimi vplivi na ljudi. Predstavitev raziskav na področju tehnologij za ocenjevanje funkcionalnih sposobnosti za vožnjo pri starejših voznikih in invalidih prof. dr. Jaka Sodnik (Fakulteta za elektrotehniko) Ocena sposobnosti za vožnjo (F2D) posameznika je ključna za zagotavljanje varnosti cestnega prometa, še posebej, ko govorimo o starejših voznikih in osebah z različnimi zdravstvenimi težavami. Tradicionalne ocene F2D pogosto vključujejo oceno funkcionalnosti okončin, pregled vida, nevropsihološke teste ter včasih tudi preizkus z inštruktorjem v realnem prometu. Ti postopki so pogosto dolgotrajni, dragi, zahtevajo sodelovanje večjega števila zdravnikov in strokovnjakov ter so težko vedno popolnoma objektivni. SimFit2Drive je celovita rešitev, pri kateri smo k razvoju prispevali tudi na UL FE. Ta vključuje ocenjevanje senzomotoričnih in kognitivnih sposobnosti ter združuje vse prej omenjene teste v en sam, celovit preizkus sposobnosti v simuliranem voznem okolju. SimFit2Drive posnema klasično 15 Me sam, celovit preizkus sposobnosti v simuliranem voznem okolju. SimFit2Drive posnema klasično vozilo in vključuje vse klasične avtomobilske komponente (volan s servomotorjem, armaturno ploščo, pedala z merilnimi celicami za natančno merjenje sile pritiska). Dodatno vsebuje prilagoditve za invalide, ki omogočajo upravljanje vozila samo z rokami kot alternativo pedalom. Sistem po opravljenih testih samodejno generira poročilo, ki vključuje oceno kognitivnih, senzoričnih in motoričnih sposobnosti za vožnjo. Pilotne študije v sodelovanju z URI Soča so pokazale visoko korelacijo med rezultati SimFit2Drive in uveljavljenimi nevrološkimi ter senzomotoričnimi testi, ki se uporabljajo v klinični praksi. Študije uporabniške sprejemljivosti kažejo, da simulacija realnega voznega okolja pacientom omogoča boljšo demonstracijo njihovih sposobnosti in večjo sprejemljivost rezultatov, tudi če so ti negativni. Strojno učenje za modeliranje dinamičnih sistemov prof. dr. Ljupčo Todorovski (Fakulteta za matematiko in fiziko, Institut “Jožef Stefan”) Modeliranje dinamičnih sistemov, torej sistemov, ki skozi čas spreminjajo svoje stanje na podlagi opazovanj njihovega obnašanja, je pogosta naloga raziskovalcev z različnih znanstvenih področij. Najpogosteje uporabljen formalizem za modeliranje dinamičnih sistemov so diferencialne enačbe. Tradicionalni pristop k modeliranju predvideva, da raziskovalci iz teoretičnega znanja in temeljnih principov svojega področja izpeljejo strukturo diferencialnih enačb za opazovani sistem. Nato s pomočjo numeričnih metod določijo vrednosti parametrov, ki minimizirajo razliko med opazovanimi podatki in simulacijo modela. Po drugi strani pa algoritmi strojnega učenja samodejno zgradijo model črne škatle (v zadnjem času pogosto nevronske mreže), ki poskuša čim natančneje napovedati obnašanje opazovanega sistema. V naši raziskovalni skupini razvijamo algoritme strojnega učenja, ki na podlagi opazovanega obnašanja konstruirajo diferencialne enačbe, katerih simulacija se temu obnašanju čim bolj prilega. Glavna prednost teh algoritmov je, da raziskovalcem omogočajo samodejno gradnjo modelov v formalizmu, ki jim je razumljiv in omogoča nadaljnje ročno spreminjanje ter analizo modelskih enačb. Raziskovalci lahko delovanje teh algoritmov usmerjajo s predznanjem s svojega področja, kar po eni strani povečuje računsko učinkovitost algoritmov, po drugi pa omogoča gradnjo smiselnih modelov, ki so v skladu s teorijo, obstoječimi raziskavami in primerljivi z ročno zgrajenimi modeli. 6 6 Me MeMe Aplikacija umetne inteligence v industriji in večjih podjetjih Tadej Magajna (Lek d. d.) V hitro spreminjajočem svetu umetne inteligence je vprašanj glede aplikacije znanja, pridobljenega tekom študija, več kot odgovorov. Pri aplikaciji znanja umetne inteligence pri večjih podjetjih obstaja veliko zmotnih prepričanj, umetna inteligenca pa po zaslugi industrije napreduje s svetlobno hitrostjo. Pasti "Know-it-all mindset" mišljenja pri delu z njo se zato kažejo kot razlogi zakaj pri uporabi umetne inteligence, včasih podvomimo o relevantnosti znanja, pridobljenega tekom študija. Najboljši kompromis obeh svetov je odprtokodna skupnost. Odprtokodna orodja so v industriji ne le prisotna, ampak so pogosto hrbtenica in osnova celotnih sistemov umetne inteligence. Študente pa moramo spodbujati k udejstvovanju v Open Source skupnosti. Astra AI - Prvi slovenski AI tutor za matematiko Andrej P. Škraba (Astra AI) Za pomoč pri učenju in študiju vse bolj uporabljamo umetno inteligenco. Slednja postaja tudi sestavni del internetnih platform in spletnih orodij. Astra AI je napredni spletni AI-inštruktor, ki umetno inteligenco uporablja za poučevanje. Astra AI je bila postavljena z namenom, da se zmanjšajo stroški inštrukcij in da se učenje naredi bolj učinkovito. Ponuja individualizirano pomoč pri učenju in pomaga razumeti zahtevne koncepte, ponuja tudi prilagojene rešitve in spodbuja samostojno učenje. 7 7 SKLOP BIOKEMIJA Napredne tehnologije v raziskavah agresivnih rakov doc. dr. Barbara Breznik (Nacionalni inštitut za biologijo) Možganski tumorji gliomi ostajajo neozdravljivi raki z zelo slabim preživetjem bolnikov. V sklopu raziskav na Oddelku za genetsko toksikologijo in biologijo raka na Nacionalnem inštitutu za biologijo iščemo nove molekularne tarče in možnosti zdravljenja gliomov s pomočjo naprednih laboratorijskih tehnologij in računalniških pristopov. Pri raziskovanju uporabljamo inovativne tumorske modele v laboratoriju, metode prostorske biologije in računalniške pristope, s katerimi iščemo odgovore o odpornosti agresivnih tumorjev na zdravljenje. Uporabljamo tudi Gliobanko, ki je odprtokodna podatkovna biobanka, ki hrani klinične in sproti ugotovljene znanstvene informacije o shranjenih bioloških vzorcih. Kako lahko z umetno inteligenco načrtujemo nove proteine in rešujemo nove izzive? dr. Ajasja Ljubetič (Kemijski inštitut) Proteini so ključne molekule za življenje. Z modernimi metodami umetne inteligence (RFDiffusion, ProteinMPNN, AlphaFold2/3) lahko načrtujemo popolnoma nove proteine, ki se v naravi sicer ne pojavljajo. Novi proteini so izjemno stabilni in se dobro izražajo, zato lahko z njimi rešujemo sodobne izzive. Med drugim lahko pripravimo virusne inhibitorje, nova cepiva, stabilnejše encime, biosenzorje in proteinske robote. De novo načrtovanje proteinov ima tako ogromen potencial na področju medicine in industrije. Za področje je bila letos podeljena Nobelova nagrada za Kemijo. 8 8 Temeljni modeli v medicini asist. Martin Špendl (Fakulteta za računalništvo in informatiko) Tako kot se človek uči na podlagi izkušenj, se matematični modeli učijo na podlagi podatkov. Njihov namen je dovolj dobro opisati zakonitosti narave, s čimer omogočajo posploševanje preko meja možnih poskusov. Tako, na primer, poznamo vrednost absolutne ničle temperature, kljub temu da te vrednosti v praksi ne moremo izmeriti. Učenje "preprostih" domenskih modelov na manjšem naboru podatkov je v zadnjih letih izpodrinilo učenje temeljnih modelov na velikih zbirkah podatkov. Veliki jezikovni modeli so začeli val temeljnih modelov na področju naravnega jezika, kjer dosegajo izjemne rezultate zunaj svoje učne domene. Temeljni modeli so tudi v biologiji presegli rezultate prejšnjih modelov na področju napovedovanja izražanja genov, strukture proteinov in ustvarjanja besedil. V onkologiji in zdravljenju raka so ključni podatki o izraženosti genov, saj odražajo dejansko stanje tumorskega tkiva. Napredne tehnologije omogočajo merjenje izraženosti na nivoju posameznih celic (angl. single-cell RNA-Seq). Temeljni modeli posameznih celic omogočajo virtualno predstavitev celice in opazovanje njenega odziva na spremembe v izraženosti posameznega gena, na primer tarče zdravila. Kombinatorna genetika kot vir podatkov za strojno učenje prof. dr. Uroš Petrovič (Biotehniška fakulteta, Institut “Jožef Stefan”) Nedavni napredek na področju sintezne biologije, vključno z metodami za preurejanje genoma, je omogočil nove pristope v kombinatorni genetiki. Kombinatorna eksplozija je razlog, da lahko eksperimentalno določimo fenotip le za manjši delež genotipov. Metode strojnega učenja omogočajo napovedovanje fenotipa na osnovi dovolj velikih učnih množic podatkov. Kombinatorne genetske eksperimente lahko načrtujemo tako, da bodo zagotovili optimalne učne množice podatkov za napovedovanje tudi biomedicinsko pomembnih fenotipov. 9 9 Inovacije v Novartisu: Kako umetna inteligenca in napredne tehnologije spreminjajo razvoj izr. prof. dr. Aleš Ručigaj (Novartis d. o. o.) Uporaba umetne inteligence je prisotna tudi v razvoju bioloških molekul, med drugim v farmacevtskem podjetju Novartis. Umetno inteligenco in napredne tehnologije uporabljamo že v začetni fazi razvoja pri napovedovanju 3D strukture proteinov in določanju njihovih lastnosti (možnosti oksidacije, težnji k agregaciji ipd.). Nadalje umetno inteligenco načrtujemo izboljšave obstoječih molekul, in sicer z namenom pridobivanja molekul z želenimi lastnostmi. Umetno inteligenco in napredne tehnologije uporabljamo tudi pri procesnem delu proizvodnje aktivnih proteinov, od bioprocesa v bioreaktorju, čiščenja in izolacije proteina do polnjenja sterilnega produkta v viale ali siringe. V tem delu posamezne procesne korake opišemo z modelnimi enačbami, ki jih uporabimo za simulacijo procesa, končni cilj pa je ustvarjanje digitalnih dvojčkov – kopij realnih procesov v digitalnem okolju. To nam pomaga pri optimizaciji proizvodnih procesov, zmanjšanju stroškov in izboljšanju kakovosti izdelkov. Umetna inteligenca postaja vse bolj prisotna pri vsakdanjem operativnem delu v obliki osebnega asistenta pri ustvarjanju vsebin, organizaciji sestankov, analizi podatkov, upravljanju nalog ter učenju in usposabljanju. 10 10 Okrogla miza - Bioinformatika: Most med celico in tehnologijo Ker vstopamo v dobo naprednih tehnologij za analizo bioloških sistemov, ki nam podajo velike količine podatkov, je računalniška obdelava le-teh neizbežna. Prav tako so pristopi modeliranja in načrtovanja bioloških molekul vse bolj zmogljivi. Na okrogli mizi na temo bioinformatike bodo spregovorili asist. Ana Halužan Vasle (Fakulteta za računalništvo in informatiko), prof. dr. Sašo Džeroski (Institut “Jožef Stefan”), izr. prof. dr. Miha Moškon (Fakulteta za računalništvo in informatiko) in doc. dr. Anže Županič (Nacionalni inštitut za biologijo). Govorili bodo o metodologijah, ki jih v svojih raziskavah uporabljajo, kako se strokovnjaki računalniških ved in naravoslovnih ved tu združujejo ter kako to sodelovanje izgleda v praksi. 11 11 12