GE

საქართველოში პირველი თანამედროვე საუნივერსიტეტო გამოთვლითი ცენტრი ილიაუნის ეკუთვნის

2018 წელს ილიას სახელმწიფო უნივერსიტეტში საფუძველი ჩაეყარა საქართველოში პირველ, თანამედროვე, საუნივერსიტეტო გამოთვლით ცენტრს. ცენტრი, დიდი საერთაშორისო გამოცდილების მქონე ქართველ და უცხოელ მკვლევართა ხელმძღვანელობით მუშაობს მონაცემთა ანალიზის, დიდი მონაცემების დამუშავების ხელსაწყოების დანერგვისა და გამოყენების, ხელოვნური ინტელექტის ტექნოლოგიების შექმნისა და კვლევის მიმართულებით.

თანამედროვე სამყაროში საკვანძო მნიშვნელობა აქვს მონაცემებიდან ინფორმაციის მიღებასა და მის საფუძველზე ცალკეული პროცესისა თუ მოვლენის შესახებ ახალი ცოდნის შექმნას, რაც საუნივერსიტეტო განათლების აუცილებელი კომპონენტია.

ცენტრის უპირველესი დანიშნულებაა კომპიუტერული მეცნიერებების მიმართულებით სტუდენტთა მომზადება, ასევე კვლევითი პროექტების განხორციელება, რაც ილიაუნის მკვლევრებს საშუალებას მისცემს ცენტრალიზებული მართვისა და დაშვების სისტემის საშუალებით გამოიყენონ მისი, როგორც პროგრამული უზრუნველყოფის, ასევე გამოთვლითი და მონაცემთა სანახის რესურსები.

დღესდღეობით ილიაუნის გამოთვლით ცენტრს აქვს 240 ბირთვი, 572 გიგაბაიტი ოპერატიული მეხსიერება და ათ ტერაბაიტამდე მონაცემთა სანახი, რაც პროექტების სხვადასხვა მიმართულებით განხორციელების საშუალებას იძლევა.

ილიაუნის გამოთვლით ცენტრს პროფესორი ერეკლე მაღრაძე ხელმძღვანელობს.

რას წარმოადგენს გამოთვლითი ცენტრი?

ერეკლე მაღრაძე: გამოთვლით ცენტრს ილიაუნისთვის ბევრი დანიშნულება აქვს. მათგან ყველაზე მთავარია, რომ ცენტრი წარმოადგენს ექსპერიმენტულ და სასწავლო ინფრასტრუქტურას კომპიუტერული მეცნიერებებისა და კომპიუტერული ინჟინერიის პროგრამების სტუდენტებისთვის. ამ პროგრამებზე ისწავლება ბევრი ისეთი თანამედროვე და მოთხოვნადი საგანი, რომელთაც გამოთვლითი რესურსი სჭირდებათ. მეორე – ილიას სახელმწიფო უნივერსიტეტში აქცენტს ვაკეთებთ მანქანური სწავლებისა და ხელოვნური ინტელექტის ტექნოლოგიების მიმართულების განვითარებაზე, რომელიც გამოიყენება სხვადასხვა სფეროში. ეს შეიძლება იყოს ბუნებრივი ენის დამუშავების მიმართულება, კომპიუტერული ხედვის ამოცანების გადაწყვეტა, დროითი მწკრივების ანალიზი. ასეთი ტიპის ამოცანების მანქანური სწავლების ალგორითმებით გადაჭრას სჭირდება მნიშვნელოვანი გამოთვლითი რესურსი, რომელიც საკმარისად ვერ იქნება ერთ ცალკე აღებულ პერსონალურ კომპიუტერზე ან სერვერზე. ამიტომ გამოთვლითი ცენტრის აპარატურას ვაერთიანებთ კლასტერულ ინფრასტრუქტურაში და შედეგად ვიღებთ ერთიან, ბევრად უფრო მძლავრ გამოთვლით რესურსს და მონაცემთა დიდ სანახს. საბოლოო ჯამში, ეს რესურსები, ასე თუ ისე, საკმარისია მნიშვნელოვანი და რთული ამოცანების გადასაჭრელად. ასევე იძლევა საშუალებას, რომ პარალელურად ვაწარმოოთ კვლევაც.

საუნივერსიტეტო გამოთვლითი ცენტრები უნივერსიტეტებს და მათში შემავალ კვლევით ინსტიტუტებს უზრუნველყოფს ინტერდისციპლინური კვლევებისთვის შესაბამისი რესურსებით და წარმოადგენს თანამედროვე გამოყენებით თუ ფუნდამენტურ მეცნიერებებში კვლევის აუცილებელ კომპონენტს. გამოთვლითი ცენტრი მხოლოდ კომპიუტერულ მეცნიერებებში მომუშავე სპეციალისტებს ან სტუდენტებს არ სჭირდებათ, არამედ სჭირდება მეცნიერების ნებისმიერ დარგს, რომელსაც შეხება აქვს დიდი რაოდენობის მონაცემებთან და საჭიროებს ამ მონაცემების რაღაც ფორმით ანალიზს. ესენია: ფიზიკა, ქიმია, ბიოლოგია, ეკოლოგია, გეოლოგია, გეოფიზიკა, ენათმეცნიერება და, ზოგადად, საბუნებისმეტყველო, ტექნიკური და სამედიცინო მეცნიერებების უამრავი დარგი.

რომელ პროექტზე/პროექტებზე მუშაობთ ამ ეტაპზე?

ერეკლე მაღრაძე: ამ მომენტისთვის აქტიურად ვმუშაობთ ქართული ენის მოდელის შექმნაზე მანქანური სწავლების ტექნოლოგიების გამოყენებით. ასეთი მოდელის შესაქმნელად აუცილებელია გამოყენებული იყოს ენის რაც შეიძლება მოცულობითი კორპუსი – ქართულ ენაზე დაწერილი უამრავი ტექსტის ერთობლიობა. კორპუსს, ასე თუ ისე, მოვუყარეთ თავი და ახლა ჩვენ ვამუშავებთ, რომ მის ცალკეულ წინადადებას და მასში შემავალ სიტყვებს მოვუძებნოთ სათანადო რიცხვობრივი ასახვა – წარმოდგენა. ასე გარდაქმნილი ტექსტი კი, გვაძლევს საშუალებას, რომ ენის კორპუსი გამოყენებული იყოს მანქანური სწავლების მოდელის გასაწვრთნელად. ამ მომენტისთვის მოგროვებული გვაქვს 20 გიგაბაიტამდე ტექსტური მონაცემები, რაც ნიშნავს რამდენიმე ათეულ ათას ტექსტს და რამდენიმე მილიონ წინადადებას, უფრო კონკრეტულად, ამ ეტაპისთვის უკვე გვაქვს დაახლოებით 40 მილიონამდე სიტყვა.
მანქანური სწავლების ალგორითმის ამ მონაცემებზე გაწვრთნის შედეგად უნდა მივიღოთ მოდელი, რომელიც, წინადადების ციფრულ რედაქტორში აკრეფისას, გვირჩევს შემდეგ სიტყვას. ანუ მოდელი მიხვდება ჩვენი წინადადების კონტექსტს და მოგვაწოდებს სიტყვას, რომელიც ყველაზე მეტად შეესაბამება ჩვენ მიერ უკვე დაწერილი სიტყვების ერთობლიობას. ასევე, იგივე პრინციპზე შექმნილი სხვა მოდელის საშუალებით გვინდა განვსაზღვროთ წინადადების გამართულობა. ჯგუფი, რომელიც ვმუშაობთ ამ პროექტზე, ვგეგმავთ რომ შექმნილი მოდელები გამოვიყენოთ ქართულ ენაზე დაბეჭდილი ტექსტის გასაანალიზებლად. კერძოდ, როდესაც მოხდება ნაბეჭდი ტექსტის დასკანერება, შემდგომ ჩვენმა შექმნილმა მოდელებმა მოახერხონ ამ სკანირებული დოკუმენტიდან ტექსტის ამოღება და მისი კორექტირება, რაც ძალიან მნიშვნელოვანია, თუ მაგალითად სკანირებული ტექსტი დაზიანებულია ან მკაფიოდ არ იკითხება გარკვეული სიტყვები ან ასოები სიტყვებში. აღსანიშნავია, რომ სკანირებული დოკუმენტიდან ტექსტის ამოღების მოდელი უკვე მზად არის, იგი გამზადდა დავით სოსელიას ჯგუფის მიერ (დავით სოსელია, ლევან შუღლიაშვილი, ირაკლი კობერიძე). ამ ეტაპზე კი ვცდილობთ, რომ ენის მოდელის სიზუსტე გავზარდოთ და მივიდეთ 80-90%-ის ინტერვალზე. შემდეგ კი უკვე მსურველებს მივაწოდოთ ეს მოდელები, როგორც ერთიანი ციფრული სერვისი. აღნიშნული კვლევა ხორციელდება რუსთაველის ეროვნული სამეცნიერო ფონდის დაფინანსებით და მასში ჩართულები არიან ახალგაზრდა მკვლევრები.

როგორ ხედავთ ცენტრის განვითარებას?

ერეკლე მაღრაძე: ცენტრის განვითარებისთვის უპირველესად საჭიროა თანამშრომლობა. ამ ეტაპზე ვცდილობთ თანამშრომლობა დავამყაროთ დიდ კომერციულ ღრუბლოვან ინფრასტრუქტურის სერვისების მომწოდებლებთან. გვინდა, ამას დაემატოს აკადემიური პროგრამები იმავე მომწოდებლებისგან. ასევე აქტიური კომუნიკაცია გვაქვს ევროპულ გამოთვლით ცენტრებთან, რომლებიც სხვადასხვა მიმართულებით მუშაობენ. პირველი კოლაბორაცია, ალბათ მაინც იქნება ენის დამუშავების ტექნოლოგიების მიმართულებით მომუშავე ჯგუფებთან ერთად. ჩვენს უნივერსიტეტს ასევე ძალიან ძლიერი ფიზიკოსების გუნდი ჰყავს, რომლებთან ერთადაც, იმედი მაქვს, ურთიერთობას დავამყარებთ სხვა უნივერსიტეტებთან. პირველი რიგის ამოცანაა, ჩვენი კომუნიკაციის ქსელის მაქსიმალური გაფართოება, რომ ცენტრი ბევრი მიმართულებით ჩაერთოს. მეორეა აკადემიური მიმართულება: რაც გულისხმობს მეტი სტუდენტის ჩართვას გამოთვლითი ცენტრის მართვასა და ოპერირებაში, მის ავტომატიზაციაში, მის მიერ მიწოდებული სერვისების გაუმჯობესებაში და ამ სერვისების გამოყენებაში უნივერსიტეტის მეტი კვლევითი ჯგუფის ჩართვაში. ეს ყველაფერი კი არ არის ადვილი და გულისხმობს უნივერსიტეტის მკვლევრებისთვის ხარისხიანი და გამართული რესურსების მიწოდებას.

ვინჩენცო ლაგანი, ილიაუნის ასოცირებული პროფესორია ბიოინფორმატიკის მიმართულებით.

თქვენ, როგორც ბიოინფორმატიკის მიმართულების სპეციალისტს, რამდენად გეხმარებათ უნივერსიტეტის გამოთვლითი ცენტრი?

ვინჩენცო ლაგანი: თანამედროვე ტექნოლოგიები საშუალებას გვაძლევს ბიოლოგიური სისტემები მაღალ დონეზე შევისწავლოთ, რაც აქამდე წარმოუდგენელი იყო. ჩვენ შეგვიძლია შევისწავლოთ თითოეული გენის მოქმედება ბიოლოგიური სინჯის თითოეულ უჯრედში. ეს კი გვაძლევს საშუალებას გავიგოთ, როგორ მუშაობს სიცოცხლე. თუმცა ამას თავისი ღირებულება აქვს. ბიოლოგიური სისტემების სწავლა გულისხმობს უზარმაზარი რიცხობრივი მონაცემების გენერირებას. ჩვენ ვსაუბრობთ თითოეული სინჯიდან მიღებულ გიგაბაიტებზე და ამ მონაცემების ანალიზი ნიშნავს ათობით ან ასობით გამოთვლით საათს ერთ კომპიუტერზე. სწორედ ამ დროს შეუძლია ილიას სახელმწიფო უნივერსიტეტის გამოთვლით ცენტრს დახმარება. ამგვარი ინფრასტრუქტურით შეგვიძლია დავგეგმოთ და განვახორციელოთ ექსპერიმენტები რამდენიმე ნიმუშზე, რასაც რამდენიმე საათი დასჭირდება ძველი ინფრასტრუქტურით დახარჯული დღეების ნაცვლად. ჩვენ გამოთვლით ცენტრს რამდენიმე პროექტისთვის ვიყენებთ. მაგალითად, ვთანამშრომლობთ მკვლევრებთან შვედეთსა და საუდის არაბეთში – ვცდილობთ ტვინის მეხსიერების მასის მოლეკულური მექანიზმის შესწავლას. სხვა პროექტში, ბერძენ და რეგიონულ ჯგუფებთან ერთად, ვცდილობთ გავიგოთ, რომელი მეტაბოლიტები ცირკულირებენ სისხლში ფილტვის კიბოს ადრეული ეტაპიდან. ეს მნიშვნელოვანი განაცხადებია და, იმედი გვაქვს, პრაქტიკულ შედეგებს მივიღებთ. ბოლოს: კომპიუტერული ცენტრის არსებობა მნიშვნელოვანი ინსტრუმენტია სწავლების ხარისხის გასაუმჯობესებლად. ჩვენ შეგვიძლია სტუდენტებს გავაცნოთ ყველა ახალი ტექნოლოგია, რომელიც ბიოლოგიურ ინფორმატიკას იყენებს.

თამუნა ჭაღიაშვილი ილიაუნის ფიზიკისა და ასტრონომიის პროგრამის, მზის ფიზიკის მიმართულების დოქტორანტია.

თქვენთვის, როგორც დოქტორანტისთვის, რამდენად მნიშვნელოვანია გამოთვლითი ცენტრის არსებობა და დამუშავებულ მონაცემებზე წვდომა?

თამუნა ჭაღიაშვილი: ძალიან მნიშვნელოვანია უნივერსიტეტში გამოთვლითი ცენტრის არსებობა, რადგან ჩემი კვლევის დიდი ნაწილი მონაცემების დამუშავებას გულისხმობს. დღეს არცერთი მეცნიერება არ არის მხოლოდ თეორიული ხასიათის – მონაცემების ანალიზი და მონაცემებზე დაყრდნობით თეორიების ვერიფიკაცია ფუნდამენტურად განსაზღვრავს კვლევას ყველა სფეროში, განსაკუთრებით კი ჩემს სფეროში, ასტროფიზიკაში, რომელშიც დაკვირვებითი მონაცემების გაანალიზების გარეშე არაფერი გამოვა. საუნივერსიტეტო გამოთვლითი ცენტრები ფუფუნებაა მკვლევრისთვის. ადრე ასეთი კლასტერები მხოლოდ რამდენიმე კვლევით ცენტრსა თუ უნივერსიტეტში არსებობდა, ისიც საზღვარგარეთ (ჩემი გამოცდილებით). ეს ცენტრები გვეხმარებოდა კვლევაში, მაგრამ გასაგებია, რომ, როდესაც არ ეკუთვნი მათ კვლევით ჯგუფებსა თუ უნივერსიტეტებს, გამოთვლით ცენტრთან წვდომა საკმაოდ შეზღუდულია. ილიაუნის გამოთვლითი ცენტრი უნივერსიტეტის მკვლევრებს დიდ უპირატესობას – ჩვენს მონაცემებზე თითქმის შეუზღუდავი რესურსით მუშაობის საშუალებას – გვაძლევს.

თანამედროვე სამყაროში მეცნიერება მონაცემთა დამუშავების გარეშე რამდენად რელევანტურია?

თამუნა ჭაღიაშვილი: თანამედროვე სამყაროში, არა მხოლოდ სამეცნიერო, არამედ ბიზნესის საქმიანობაც წარმოუდგენელია მონაცემების დამუშავებისა და ანალიზის გარეშე. ტექნოლოგიების განვითარებასთან ერთად იზრდება მონაცემთა რაოდენობაც და, შესაბამისად, მზარდია მოთხოვნაც მძლავრ გამოთვლით ცენტრებზე. მაგალითისთვის, ადრეული პერიოდების ასტრონომიის მონაცემები გროვდებოდა ჯერ თიხის ფირფიტებზე, შემდგომ – ჩანახატების სახით ფურცელზე. გალილეო გალილეიმ მზის ლაქები სწორედ ფურცელზე ფანქრით დახატა. ფოტოგრაფიის გამოგონებასთან ერთად დაიწყო მონაცემების ფოტოფირფიტებზე დაფიქსირება, რაც საშუალებას გვაძლევდა, ღამეში 3-4 ფოტოფირფიტაზე აგვესახა ცის თაღი. დღეს ccd კამერების დახმარებით, წუთში რამდენიმე მონაცემის შეგროვებაა შესაძლებელი. თანამედროვე საშუალებებმა გაზარდა მონაცემების რაოდენობა და გვაჩვენა, რომ მხოლოდ ადამიანის რესურსი ამდენი მონაცემის დამუშავებას ვერ გასწვდება. ამისთვის საჭიროა გამოთვლითი ცენტრებისა და გამოთვლითი კლასტერების არსებობა. ეს მიმართულება მზარდია და კიდევ უფრო მეტად მოთხოვნადი გახდება მომავალში.

თემურ ჩიჩუა, ილიას სახელმწიფო უნივერსიტეტის ციფრული ლაბორატორია Unilab-ის Python პროგრამირების მიმართულების ხელმძღვანელი და მკვლევარია.

რა დატვირთვა აქვს გამოთვლით ცენტრს და რაში შეიძლება ის გამოიყენოს ახალგაზრდა მკვლევარმა, სტუდენტმა?

თემურ ჩიჩუა: ხშირ შემთხვევაში, კვლევითი პროცესი მუშაობისას სხვადასხვა თეორიული გამოთვლებითა თუ ექსპერიმენტებით მიღებული მონაცემების შენახვასა და მათ დამუშავებას გულისხმობს. რაც უფრო იზრდება მონაცემთა მოცულობა, მით უფრო დიდი დრო და რესურსია საჭირო კომპიუტერულად მათ დასამუშავებლად. ამ შემთხვევაში კვლევით ცენტრს გამოთვლითი პროცესის დაჩქარებასა და გამარტივებაში გადამწყვეტი როლი შეუძლია ითამაშოს. მონაცემთა გამოთვლითი ცენტრი დიდი ზომის მონაცემთა შენახვის და საჭიროებისამებრ, მათ პარალელურად დამუშავების საშუალებას იძლევა, რადგან მისი დაპროექტება სწორედ ამგვარი ამოცანების გათვალისწინებით ხდება. ნებისმიერი დარგის სტუდენტს, რომელიც კვლევით სამუშაოებს ატარებს, მონაცემებთან მუშაობს და საჭიროებს მათ სწრაფი და უსაფრთხო დამუშავებას, მონაცემთა ცენტრი მნიშვნელოვან შესაძლებლობებს სთავაზობს. თანამედროვე სამყაროში გვაქვს სხვადასხვა ალტერნატიული სერვისი (მაგ., პოპულარულ Cloud გამომთვლელ მანქანებთან დისტანციური წვდომა). ამგვარი სერვისის ღირებულების წინასწარი ზუსტი გათვლა რიგ პრობლემებთან არის დაკავშირებული. ძნელია წინასწარ განსაზღვრო, რა რაოდენობის ექსპერიმენტების ჩატარება იქნება საჭირო ან რა შეიძლება ღირდეს ამა თუ იმ კვლევითი პროექტისათვის გამოთვლების წარმოება. უნივერსიტეტის დამოუკიდებელი, აქტიური და ხელმისაწვდომი მონაცემთა გამოთვლითი ცენტრის არსებობა გადამწყვეტია უნივერსიტეტის კვლევითი ცხოვრებისა და სამეცნიერო პროექტების წარმატებული, თანამედროვე სირთულეებზე მორგებული მსვლელობისთვის.

რატომ გაგიჩნდათ ინტერესი გამოთვლითი ცენტრის მიმართ?

თემურ ჩიჩუა: კვლევები, რომლებზეც ვმუშაობ, სწორედ დიდ გამოთვლით რესურსებს საჭიროებს. ჩვეულებრივი კომპიუტერის რესურსები საკმარისი არ არის ამგვარი სამუშაოების შესასრულებლად. ხშირად პროცესის ზოგიერთი ამოცანა რამდენიმე დღის ხანგრძლივობის გამოთვლით სამუშაოებს მოიცავს. ამისთვის საჭიროა მძლავრი რესურსები და სტაბილური, უსაფრთხო კომპიუტერული გარემო, დაცული ტექნიკური შეფერხებებისგან. მონაცემთა ცენტრის არსებობა კი კვლევითი პროექტების სრულფასოვნად განხორციელების შესაძლებლობას იძლევა. სწორედ ამიტომ დავინტერესდი კვლევითი ცენტრით.

დასვით კითხვა და მიიღეთ პასუხი - ედუს საცნობარო სამსახური