Nors geriausi šiuolaikiniai natūralios kalbos modeliai jau lenkia žmogų kai kuriais aspektais, pavyzdžiui, kalbų mokėjime, jie vis dar nesiekia eksperto lygio visose srityse. Tačiau būtent toks siekis yra visų didžiųjų DI įmonių tikslų sąraše. Spėliojama, kad bendrasis dirbtinis intelektas gali būti pasiektas artimiausiu metu, o numatomos datos svyruoja nuo 2025 iki 2030 metų.

Pranešime spaudai Vaidas Mačiulis, IT įmonės „Cognizant“ programinės įrangos inžinierius, išskiria 5 dirbtinio intelekto priemones, kurias verta žinoti, norint neatsilikti nuo technologijų tendencijų.

  • Pastarųjų metų tendenciją atspindi multimodalūs natūralios kalbos modeliai. Jų išskirtinumas, palyginti su tradiciniais modeliais, pavyzdžiui, „ChatGPT“, yra tas, kad jie gali apdoroti ne tik tekstą, bet ir kitas medijas, tokias kaip paveikslėliai ar vaizdo įrašai. „OpenAI“ su „GPT-4“ modeliu pirmieji pasiūlė šią galimybę vartotojams, suteikdami galimybę suprasti tiek tekstą, tiek paveikslėlius. Pavyzdžiui, galite nufotografuoti pyragą, atsiųsti nuotrauką dirbtiniam intelektui ir paklausti pyrago recepto.
  • „Cloude 3“ – tai naujausias multimodalus modelis iš „Anthropic“ kompanijos, kuris pasirodė esąs pranašesnis už „GPT-4“, tapdamas šiuo metu geriausiu natūralios kalbos modeliu. Jis geba rašyti tekstus, programuoti ar tiesiog būti pašnekovu. Naujausią lyderių lentelę galima stebėti pokalbių robotų arenoje.
  • „Gemmini 1.5“ – tai „Google“ atsakas į „GPT-4“, kuris yra multimodalus natūralios kalbos modelis, pasižymintis įspūdingu vieno milijono žodžių konteksto langu. Per vieną užklausą „Gemmini“ gali apdoroti apie 700 tūkst. žodžių, kas yra beveik tas pats kaip dešimt Hario Poterio knygų. Be to, jis gali suprasti ne tik tekstą ir paveikslėlius, bet ir vaizdo įrašus.
  • „SORA“ yra dar neišleistas viešai „OpenAI“ kompanijos vaizdo generavimo modelis, kuris netikėtai nustebino interneto vartotojus savo gebėjimu kurti filmukus, prilygstančius Holivudo studijų kokybei. Filmukų pavyzdžius galima rasti „OpenAI“ „YouTube“ paskyrose. Svarbu paminėti, kad filmukai generuojami vien iš tekstinių užklausų, nors jų trukmė kol kas yra tik kelios sekundės.
  • „Voice Engine“ iš „OpenAI“ yra neseniai pristatytas kalbos iš teksto generavimo modelis. Skirtingai nuo ankstesnių sistemų, „Voice Engine“ kalba natūraliai, išreikšdamas emocijas, ir gali imituoti bet kurio žmogaus balsą, remiantis vos 15 sekundžių trukmės įrašu. Dėl potencialių rizikų, susijusių su tokio modelio panaudojimu, „OpenAI“ kol kas neskuba jo viešai išleisti.
 Vaidas Mačiulis, IT įmonės „Cognizant“ programinės įrangos inžinierius

Įmonės vis labiau skatina naudoti


DI taip pat stipriai veržiasi į klientų aptarnavimo sferą. Pavyzdžiui, kreipiantis į „Amazon“ pagalbos centrą, dažnai susisiekiate ne su žmogumi, o su dirbtiniu intelektu. Ši tendencija pastebima ir lietuviškose įmonėse.

Verslo investicijos į DI patvirtinamos ir akcijų rinkos duomenimis. „Nvidia“, anksčiau žinoma kaip vaizdo plokščių gamintoja, dabar didžiąją dalį pelno gauna iš lustų, skirtų DI mokymui, gamybos. Nuo 2020-ųjų jos akcijos pabrango daugiau nei dešimt kartų, o tai išvedė „Nvidia“ į trečią vietą pasaulyje pagal rinkos kapitalizaciją, nusileidžiant tik „Microsoft“ ir „Apple“.

Jis dalijasi, kad nors DI kompanijos varžosi, kuriant vis pažangesnius naujus modelius, kitos įmonės siekia pirmosios ir efektyviausiai panaudoti jau prieinamus sprendimus.

„Programavimo įmonės vis labiau skatina savo darbuotojus naudotis programavimo asistentais, tokiais kaip „Microsoft Copilot“, kuris yra apmokytas remiantis beveik visu atviru kodu, prieinamu internete. „Cognizant“ organizacija suteikia galimybę įsigyti „Copilot“ licenciją visiems savo darbuotojams“, – pranešime spaudai pabrėžia IT ekspertas.

Dėl to itin svarbu bendrauti su darbuotojais apie DI, skatinti juos sekti vykstančius pokyčius rinkoje. Taip pat verta vesti dialogą, kaip DI gali paveikti jų darbą bei kaip pasiruošti pokyčiams, kuriuos jis atneš.