Kutatási infrastruktúrák

MTA SZTAKI – TK cloud infrastruktúra kiépítése társadalomtudományi elemzésekre

A projektben a társadalom- és természettudományi kutatások közötti interdiszciplináris együttműködés, valamint a mesterséges intelligenciára épülő társadalomtudományi kutatások korszerű infrastruktúrájának megteremtése érdekében egy új, könnyen kezelhető, nagy kapacitású Cloud-platformot alakítottunk ki az MTA Társadalomtudományi Kutatóközpontja és az MTA SZTAKI együttműködésében. A kutatók a projekt keretében a TK PTI Comparative Agendas Project-jének adatait pilot projektként használva a nagy terjedelmű szöveges vagy képi adatbázisok mesterséges intelligenciára épülő elemzésére alakítottak ki környezetet. Korábban a mesterséges intelligenciára épülő (így szövegbányászati vagy gépi tanulásos) kódolás saját desktop gépén zajlott, aminek a hardver kapacitását maximálisan kihasználva is korlátozott lehetőségek voltak a futtatás során: többek között részekre kellett bontani a kódolandó korpuszt, hogy le tudjon futni a program, illetve bizonyos beállítások mellett nem is lehetett lefuttatni a programot, mivel azoknak túl nagy lett volna a kapacitásigénye. A kutatók az eredményeik javítása érdekében a gépi tanulás során ezen technikai korlátokat meghaladva az MTA SZTAKI-ban rendelkezésre álló cloud infrastruktúrát használták.

A TK és a SZTAKI kutatói együttműködésében az MTA Cloud-ban Apache Spark keretrendszerű klaszter felállítása történt. A klaszter indulásképpen összesen 40 darab VCPU és 160 GB RAM kapacitással rendelkezik. A felhasználás megkönnyítése érdekében Jupyter Notebook és R Studio Web Server felhasználói felületeken keresztül lehet kapcsolódni a klaszterhez. Továbbá a kutatók a Spark keretrendszer gépi tanulás könyvtárát tudják használni a kódolási feladatok párhuzamosításához. A hagyományos gépi tanulásos módszerek mellett így már mély tanulásos (deep learning) eljárások is elérhetőek a rendszerben. A pilot projekt sikerei alapján megkezdődhet az infrastruktúra fejlesztése a szélesebb kutatási igények befogása irányában. Ez mind szoftver-fejlesztést, mind hardver-kapacitás bővítést szükségessé tesz, melynek keretében a projekteknek egy könnyen kezelhető, a desktop programokkal (R, python stb.) gyakorlatilag megegyező webes felületen, egyedi azonosítók kiosztásával válik elérhetővé a Cloud kapacitás, kiváltva ezzel a desktop infrastruktúra fejlesztésének igényét, a nemzetközi szolgáltatókkal kötött szerződéseket, valamint az eddig projekt-költségvetésekből finanszírozott egyedi környezet kialakítást.

KSH-KRTK kutató szoba

Az MTA KRTK 2013. június 23. napja 2018. február 01. napja között problémamentesen együttműködött a KSH épületében létrehozott Kutatószoba üzemeltetése, használata tárgyában. A KSH épületében létrehozott Kutatószobát az MTA KRTK és a KSH áthelyezte az MTA Humán Tudományok Kutatóházába (pontos cím: lásd III.1. pont). Ennek érdekében a KSH és az MTA KRTK 2018. február 01. napján megállapodást kötött a KSH-KRTK kutatószoba üzemeltetésére.

Az MTA KRTK és a KSH a kutatószoba üzemeltetése tárgyában megkötött együttműködési megállapodásukban lefektették, hogy a kutatószoba használatát az MTA TK részére is biztosítják. Az MTA KRTK az együttműködési megállapodásból fakadó jogokat és kötelezettségeket az MTA TK-val, mint a Kutatószobát használó szervezettel szemben is érvényesíti és szabályozza. Jelenleg került kidolgozásra az MTA KRTK és az MTA TK közötti megállpodás, maelynek keretében, az MTA KRTK vállalja, hogy az MTA KRTK beruházásával létrehozott, és az MTA KRTK és a KSH által üzemeltett Kutatószoba használatát lehetővé teszi az MTA TK-val közalkalmazotti jogviszonyban álló kutatók részére is.

Az European Social Survey (ESS)

A European Social Survey-t (ESS) az Európai Bizottság kezdeményezte 2001-ben abból a célból, hogy kétévente nemzetközileg összehasonlító adatokat nyerhessen az európai társadalmak demográfiai, társadalmi állapotáról, a lakosság politika és közéleti preferenciáinak alakulásáról és a társadalmi attitűdök illetve a cselekvéseket befolyásoló értékek változásairól.

A Magyar Tudományos Akadémia Társadalomtudományi Kutatóintézete (MTA TK), illetve korábban két különálló kutatóintézete a kezdetektől fogva a nemzetközi együttműködés tagja, és az eddigi 8 kutatási hullám mindegyikében részt vett. Jelenleg a 9. hullám előkészületei zajlanak. Az ESS adatai egyedülálló lehetőséget biztosítanak az európai társadalmak állapotának feltérképezésére, az országok, ország-csoportok közötti különbségek és az időbeli változások nyomon követésére, a magyar társadalomban zajló folyamatok nemzetközi összehasonlításban való értelmezésére. Az ESS adatai nemcsak a tudományos szakemberek, de az európai és a nemzeti kormányok és közpolitikák, a civil szféra számára is értékes adatokkal szolgálnak.

Az ESS kutatások talán legnagyobb erőssége és egyben értéke, hogy az adatfelvétel igen szigorú és folyamatosan ellenőrzött módszertani szabályainak köszönhetően ez vált az egyik legbiztosabb módszertani alapokon nyugvó nemzetközi együttműködéssé. A résztvevő országok társadalmát jellemző mutatókat közösen alakítják ki, mindenhol azonos módszertant követnek, így Európa-szerte összehasonlíthatóvá váltak a mérési eredmények.

Az ESS 2013-ban ERIC (European Research Infrastructure Consortium) státuszt. A Magyar Kormány kötelezettségvállalásának köszönhetően Magyarország 2017 óta teljes jogú tagja az együttműködésnek. A projekt szakmai megvalósításának felelőse továbbra is az MTA Társadalomtudományi Kutatóintézete.

Az ESS mint „közjószág”

A kutatások adatbázisai és teljes dokumentációja szabadon hozzáférhető és bárki által használható. 2018-ban 2257 regisztrált felhasználója volt hazánkban (és összesen közel 132ezer felhasználója a világban). Az MTA TK kutatói mellett az ESS adatokat intenzíven használják az egyetemi oktatásban mind a diákok társadalomtudományi módszertani képzésében illetve évfolyamdolgozatok, szakdolgozatok és disszertációk elkészítéséhez, valamint az MTA valamint más kutatóintézetek kutatói, egyetemek oktatói és hallgatói, a média képviselői. Csak Magyarországon körülbelül 150 tudományos és közpolitikai publikáció használta fel az ESS adatait az elmúlt évek során, és több ezer publikáció született az ESS adatainak felhasználásval Európa szerte. Az MTA TK-ban évente  szervezünk haza konferenciát és 2018-ban visegrádi regionális konferenciának adtunk otthont. Az ESS tehát egy igazi tudományos „közjószág”.