ELM VƏ TƏHSİL
XXI əsrin əsas çağırışlarından biri “Big Data”
Bakı, 10 iyul, AZƏRTAC
İnformasiya texnologiyalarının yaranması ötən əsrin 60-cı illərinə təsadüf edir. İnternetin inkişafı, yeni-yeni proqram və sistemlərin yaradılması, qloballaşma XX əsrin 90-cı illərindən etibarən informasiya texnologiyalarının inkişafının daha sürətlə getməsini göstərir.
İnformatika, eləcə də informasiya texnologiyaları elmi inkişaf etdikcə yeni-yeni elmi terminlər, anlayışlar da meydana gəlib və gündəlik həyatımıza daxil olub. Bunlara nümunə olaraq infokommunikasiya, informasiyalaşma, informasiya cəmiyyəti, informasiya resursları və xidmətləri, bilik bazası, spam, provayder, host, XML, HTTP və s. göstərmək olar. Bu terminlərdən biri də “Big Data”dır.
“Big Data” anlayışı və mahiyyəti
Son illərdə daha fəal surətdə leksikonumuza daxil olan “Big Data” termini ilk dəfə 1998-ci ildə “Silicon Graphics” şirkətinin kompüter elmləri üzrə mütəxəssisi Con Meşi tərəfindən istifadə edilib. Bu terminə bir qədər sonra, yəni 2000-ci ildə Francis Dieboldun akademik mühitdə dərc olunan tədqiqatında rast gəlinir. Lakin termin 100 ildən çox tarixə malik həftəlik “Nature” jurnalının 2008-ci il sentyabr ayının “Big Data” mövzusuna həsr olunmuş xüsusi nömrəsində professor Klifford Linçin “Böyük verilənlər. Sizin verilənlər necə böyüyür?” mövzusunda məqaləsi ilə populyarlıq qazanıb. Belə ki, məqalədə “böyük verilənlərlə işləmək imkanları yaradan texnologiyalar elmin gələcəyinə necə təsir edə bilər?” sualının cavabı araşdırılıb, verilənlərin elmdə, xüsusilə elektron elmdə rolundan bəhs edilib. Bu sahəyə maraq isə 2011-ci ildən artıb.
Hazırda böyük verilənlərin həcmi 1 terabaytdan başlayaraq daha böyükhəcmli verilənlər hesab olunur.
“Big Data”nın mahiyyətini izah edən müxtəlif təriflər mövcuddur. Razılaşdırılmış tərifin olmaması “Big Data” fenomeninin anlaşılmasında qeyri-müəyyənlik yaradır. Böyük verilənlər dedikdə, çox böyük, sürətli və emal üçün çox mürəkkəb verilənlər başa düşülür. ABŞ-ın “Forrester Consulting” şirkəti bu texnologiyanın mahiyyətini “Big Data” özündə çox böyük həcmdə verilənlərdən məzmun çıxaran texnika və texnologiyaları birləşdirir” kimi formalizə edir. Kaliforniyanın Berkli Universitetinin kompüter elmləri üzrə professoru Maykl Franklinə görə: “böyük verilənlər (BV)– onlarla işləmək üçün böyük xərc tələb edən və çətinliklə informasiya əldə edilən verilənlərdir”. ABŞ-ın Milli Standartlaşma və Texnologiyalar İnstitutu isə iddia edir ki, BV dedikdə “həcmi mövcud üsul və sistemlərin imkanlarını ötüb keçən verilənlər” təsəvvür edilir. “Böyük” məfhumu mövcud hesablama səviyyəsinə görə nisbidir.
“Big Data” mənbələri
Son onillikdə informasiyaya əlyetərliyin asanlaşması və kommunikasiya vasitələrinin çoxalması nəticəsində hər il rəqəmsal informasiyanın həcmi həndəsi silsilə ilə artır. Statistikaya görə, bəşəriyyətin mövcudluğundan 2003-cü ilə qədərki dövrdə dünyada cəmi 5 ekzabayt məlumat generasiya olunub. 2012-ci ildə rəqəmsal informasiyanın həcmi 500 dəfə artaraq 2.7 zetabayt olub. Dünyada informasiyanın həcminin 2020-ci ildə 44 zetabayta çatacağı proqnozlaşdırılır. Bu da planetin hər sakininə düşən 5200 geqabayt informasiya deməkdir. ABŞ-ın “International Business Machines” şirkətinin məlumatına görə, dünyada hər gün 2.5 trilyon bayt məlumat hazırlanır. Həmçinin hər dəqiqədə 100 milyon e-mail göndərilir, “Google” axtarış sistemində 2 milyon axtarış sorğusu, “Facebook” sosial şəbəkəsində 350 geqabayt məlumat emal olunur. Bununla yanaşı, 570-dən çox veb-sayt yaradılır, “YouTube” internet-servisinə hər dəqiqə 72 saatlıq yeni video yüklənir və s. Bu rəqəmlər həqiqətən də verilənlərin həcminin çox böyük olduğunu bir daha sübut edir.
BV-nin əsas mənbələrini elmi eksperimentlər, sensor və sosial şəbəkələr, dövlət qurumlarının agentlikləri və portalları, iqlim haqqında məlumat ötürücüləri, nəqliyyatın intellektual idarə edilməsi sistemləri, GPS siqnalları, GIS sistemlər, böyük şirkətlərin bazaları, elektron poçt, smartfonlar vasitəsilə alınmış rəqəmsal foto və videolar, böyük satış mərkəzləri, bank əməliyyatları və s. təşkil edir. Bir sözlə, böyük verilənlərin mənbələri hədsiz dərəcədə çoxdur. Verilənlərin potensial mənbələrinin müxtəlifliyi artdıqca qismən strukturlaşdırılmış və strukturlaşdırılmamış verilənlərin həcmi də artır. BV-nin mənbələri əsasən beş kateqoriyaya bölünür: veb-verilənlər və sosial media, maşınlar vasitəsilə yaradılan verilənlər, böyük tranzaksiya verilənləri, elmi verilənlər, insanların yaratdığı verilənlər.
“Big Data” texnologiyalarının yaranmasını şərtləndirən əsas amillər
“Big Data” texnologiyaları verilənlərin həcminin çox böyük sürətlə artması nəticəsində “informasiya partlayışı” fazasının yaranması ilə əlaqədardır. İnformasiyanın həddindən artıq çoxalması informasiya yükü problemi yaradır. Bu gün “informasiya partlayışı”nın xarakterik nümunələri çoxdur. Biznes strukturlarında biznes-proseslərin informasiyalaşdırılması elmi təşkilatlarda ölçmələrin aparılmasında yeni imkanların yaranması, dövlət qurumlarında, həmçinin ictimai kommunikasiya şəbəkələrində xidmətlərin sayının və funksionallığının artması ilə bağlıdır. Sürətlə artan verilənlərin öhdəsindən gəlmək məqsədilə informasiya texnologiyaları sahəsinin nəhənglərindən olan “Google” şirkəti tərəfindən “File System Google” və “MapReduce” proqram-aparat platforma yaradılıb. Bunun əsasında açıqkodlu “Apache Hadoop” və “Hadoop File System” proqram təminatları işlənib və bununla da BV texnologiyalarının əsası qoyulub.
Böyük verilənlər artıq ABŞ və bir sıra qərb dövlətlərində elmi ictimaiyyət, biznes cəmiyyətləri, hökumət strukturları tərəfindən neft qədər strateji resurs kimi dəyərləndirilir, bu sahədəki problemlərə çox böyük önəm verilir. Onu demək kifayətdir ki, ABŞ-ın Prezident Administrasiyası 2012-ci ilin martında BV sahəsində “Böyük verilənlərin tədqiqi və inkişafı” təşəbbüsünü elan edib. Təşəbbüs çərçivəsində böyük verilənlər texnologiyalarının ABŞ dövlət siyasətinin aparıcı istiqamətlərində istifadəsi üçün kompleks tədbirlərin keçirilməsi layihələrin işlənməsi nəzərdə tutulub, böyükhəcmli rəqəmsal verilənlərin təşkili və analizi üçün aidiyyəti dövlət agentliklərinə 200 milyon dollar həcmində vəsait ayrılıb. 2013-cü ildə Yaponiya hökuməti BV üzrə milli proqramın işlənməsini dərc edib, Avstraliya “Public Service Big Data Strategy” strategiyasını qəbul edib. Böyük Britaniya, Almaniya, Çin və digər dövlətlərdə də böyük verilənlər strateji əhəmiyyətli vacib resurs kimi dəyərləndirilməkdədir.
Hazırda böyük verilənlər mövzusu istər biznes sahəsində, istərsə də elmi mühitdə son dərəcə məşhurdur. Nüfuzlu beynəlxalq təşkilatlar, elmi qurumlar tərəfindən çox böyük həcmdə informasiyanın emalının müxtəlif aspektlərinə həsr olunmuş çoxsaylı konfranslar, simpoziumlar, seminarlar, forumlar keçirilməkdədir. Müzakirə və tədqiq olunan əsas mövzular: böyük verilənlərin arxitekturası, idarə edilməsi modelləşdirilməsi, analitikası, alətləri, açıq platformalar, “Big Data” xidmət kimi biznesin səmərəli idarə edilməsi, elektron dövlətdə və cəmiyyətdə böyük verilənlərin analitikası, vizuallaşdırma, təhlükəsizlik, böyük verilənlər üçün alqoritmlər və s.
“Nature”, “Science”, “Computer” və s. kimi bir çox nüfuzlu elmi jurnalların xüsusi nömrələri bu mövzuya həsr olunub. Son illərdə işıq üzü görmüş böyük verilənlərin elmi-nəzəri problemlərini işıqlandıran “Journal of Big Data”, “International Journal of Big Data”, “International Journal of Big Data Intelligence”, “Big Data Research”, “Big Data & Society” və s. kimi akademik jurnalların nəşri isə bir daha bu sahədəki problemlərin nə qədər aktual olmasından xəbər verir.
Azərbaycanda “Big Data” üzrə aparılan tədqiqatlar
Azərbaycan Milli Elmlər Akademiyasının (AMEA) İnformasiya Texnologiyaları İnstitutunun layihə baş mühəndisi, texnika üzrə fəlsəfə doktoru Məkrufə Hacırəhimovanın sözlərinə görə, Azərbaycan informasiya kommunikasiya texnologiyalarının (İKT) dövlət idarəçiliyində hərtərəfli tətbiqi sahəsində yüksək mövqe tutan ölkələrdəndir: “Azərbaycanda XXI əsrin əsas çağırışlarından olan “Big Data” üzrə ilkin tədqiqatlar 2014-cü ildə AMEA İnformasiya Texnologiyaları İnstitutunun direktoru, akademik Rasim Əliquliyevin rəhbərliyi altında aparılıb. İnstitutda böyük verilənlərin analizi ilə bağlı çoxsaylı metod və alqoritmlər işlənilib. Bu sahədə araşdırmalar uğurla davam etdirilir. Hazırda bəzi fəaliyyət sahələrində həmin texnologiyadan istifadəyə artıq start verilib. Regionda “bulud” texnologiyası əsasında yaradılmış ilk Data Mərkəz artıq istismara hazırdır. Data Mərkəzin istifadəyə verilməsi ölkədə “Elektron Hökumət”in genişlənməsinə, həm dövlət, həm də qeyri-dövlət orqanlarının informasiya məlumatlarının saxlanılmasına imkan verəcək.
AMEA İnformasiya Texnologiyaları İnstitutunda böyükhəcmli məlumatlar toplusundan biliklərin əldə olunması problemləri üzrə elmi tədqiqatlar aparılır. Eyni zamanda, institutda AMEA-nın elmi müəssisələrinin 4000-ə yaxın kompüteri qoşulmuş “AzScienceNet” şəbəkəsinin böyük yaddaş və hesablama resurslarına malik Data Mərkəzi fəaliyyət göstərir. Mərkəzin hesablama gücü 17 teraflops, xarici yaddaşının həcmi 400 terabaytdır. Böyük verilənlər üçün əsas infrastruktur elementlərindən hesab olunan bu mərkəz istifadəçilərə böyük hesablama resursları tələb edən mürəkkəb elmi məsələlərin həlli üçün “bulud” xidmətləri, AMEA-nın institut və təşkilatlarına məlumatların saxlanılması üçün yaddaş resursları təqdim edir”.
Ümumiyyətlə, Azərbaycanda ilk “Big Data” Tədqiqat Mərkəzi 2017-ci ildə ADA Universitetində fəaliyyətə başlayıb.
Beynəlxalq təşkilatlar və inkişaf etmiş ölkələr tərəfindən bu sahədə müxtəlif istiqamətlər üzrə bir sıra sənədlər qəbul edilib. İKT sektorunun inkişaf səviyyəsinə, İnternet və mobil istifadəçilərin sayına görə MDB məkanında üstünlüyə malik olan, regionda dayanıqlı iqtisadi inkişafı ilə seçilən Azərbaycanın gələcəkdə siyasətinin formalaşdırılması, rəqabət qabiliyyətini qoruması üçün “Big Data” texnologiyalarından istifadə və bu istiqamətdə qabaqcıl ölkələrin təcrübələrini öyrənmək və onlardan bəhrələnmək olduqca vacibdir. Eyni zamanda, ölkədə “Big Data” texnologiyalarının tətbiqinin prioritet sahələrinin müəyyənləşdirilməsi, ölkənin milli “Big Data” strategiyasının hazırlanması, elektron infrastrukturun, açıq verilənlər şəbəkəsinin yaradılması və dövlət tərəfindən dəstəklənməsi, verilənlər üzrə mütəxəssis yetişdirilməsi və “Big Data” texnologiyalarının tətbiqi ilə əlaqədar hüquqi sənədlərin qəbul edilməsi zəruri məsələlərdir.
Ziyadxan Həsənov,
AZƏRTAC-ın müxbiri
Yazı Azərbaycan Respublikasının Prezidenti yanında Kütləvi İnformasiya Vasitələrinin İnkişafına Dövlət Dəstəyi Fondunun keçirdiyi müsabiqəyə təqdim etmək üçündür.