Hogyan lépjünk át a big data korszakából a jobb adatok világába?
Dan Sommer, a Qlik Market Intelligence vezetője legutóbbi Bridging the Trust Gap in Generative AI:The Big to Better Data Imperative címmel tartott előadásában ismertette a 2024-es év 10 legfontosabb trendjét.
Egyértelműen a mesterséges intelligencia fellendülésének idejét éljük. A generatív AI egy új, nagyobb termelékenység és jólét korszakába vezet bennünket.
Azonban egyre többen adnak hangot aggodalmuknak, sokan korlátoznák, és akár meg is állítanák ezt a fejlődést. A fő ellenérvük az, hogy a generatív AI számára szükséges adatok elérhetősége (data access) eddig mindenki számára szabad volt az adatok forrásának követhetősége nélkül, a minőségellenőrzésének teljes hiányával, ami miatt a káros és hibás adatok negatívan befolyásolták az AI megítélését.
Ha minden így marad, a hamis adatok jelenléte komoly veszélyt jelenthet majd az üzleti világra és a társadalom egészére nézve is, ezért egy olyan új modellt kell találnunk, amely elősegíti a jobb — és megbízhatóbb — adatok használatát.
Dan Sommernél a jobb adatok definíciója a következő: adatok, amelyek az 5V kezelésével kiterjesztik a tipikus Big Data jellemzőket, hogy készen álljanak az AI-ra. A korábbi 3V Volume, Velocity, Variety kiegészült a következő kettővel: Validity, és Value. (Nagyságrend, sebesség, változatosság, érvényesség és érték).
A 2024-es év legfontosabb trendjei a fenti 5V tengelyen helyezkednek el, van azonban néhány problémás pont, amit érdemes megismerni, mielőtt tovább mennénk a top 10 trendre.
Túl sok adat:
A generatív AI jelenleg kizárólag emberi kifejezéseken keresztül tanulja a hasznos dolgokat, de sajnos a haszontalan szemetet is, ez pedig zavarossá és félrevezethetővé teszi. Ha ez a trend így marad, éveken belül az információ javarésze AI által generálódik majd, ami a termelékenység felől nézve jó hír, a megbízhatóság szempontjából viszont aggodalomra adhat okot.
Túl kevés adat:
Egyre több cég zárja el adatait az AI elől, csökkentve az elérhető minőségi információ mennyiségét, ami egyértelműen a nem megbízható eredmények megjelenését segíti elő tovább késleltetve az AI gazdaság kezdetét.
Törvényhozás:
Mivel a bizalom kulcsfontosságú minden technológiai újítás elfogadásához, a törvényhozók a félretájékoztatás visszaszorításáért és az adatvédelmi szabályok (GDPR) érvényesítéséért küzdenek. Ugyan azóta visszavonták, de Olaszország egy időben be is tiltotta a generatív AI alkalmazások használatát. Az EU MI rendelete is kockázatosnak tartja a többé-kevésbé szabályozatlan gyakorlatot és számos korlátozást helyezett kilátásba, ezzel is tovább rontva az AI hatékonyságát.
Fenntarthatóság:
A generatív AI energiafogyasztása igen magas, ami a költségek növekedéséhez és nem kívánatos környezeti hatásokhoz vezet. Egy becslés szerint 2027-re az AI adatközpontok több áramot fogyaszthatnak, mint Hollandia egésze. Ha ez így marad a világgazdaság és a fenntarthatósági törekvések is veszélybe kerülhetnek.
Emberi faktor:
Az emberi tényező és a címkézés még mindig szükséges a generatív AI megfelelő működéséhez. De ahogy a tévedések és a hatékonyság egyensúlyát keressük, a képzett munkaerő hiánya tovább lelassíthatja a fejlődést.
Nagyvállalati sikertelenségek:
Egyelőre még nem hoztak nyilvánosságra olyan hibákat a generatív AI által, amik nehéz helyzetbe hozták volna a szupervállalatokat, de a használat növekedésével valószínűleg egyre több ilyet fogunk megismerni. A legbátrabb úttörők lesznek azok, akik először hibákkal fognak találkozni.
A bizalom kérdése:
Továbbra is sok ellenérzés tapasztalható a generatív AI-jal szemben. A Qlik felmérése szerint jelenleg a cégek kevesebb, mint fele rendelkezik AI stratégiával, és sok nagy cég továbbra sem engedi munkavállalóinak az AI alkalmazások használatát, mert még sokat kell fejleszteni őket. Ezzel szemben a cégek adatait is AI kompatibilissé kell varázsolni.
Dan Sommer a zenefogyasztás elmúlt évtizedekben bekövetkezett változásaihoz hasonlítja az AI térhódítását. A Napster és a Piratebay elterjedésével mindenki számára elérhetővé vált a zene, ráadásul ingyen. Amióta a Spotify, Itunes és a többi streaming szolgáltató a piacra került ez megváltozott, így a jogi oldal is rendeződött, és mindenki jól járt, a dalszövegírók, a zeneszerzők. Minél többet hallgatják a dalodat, annál jobban jársz. Az AI-nál is hasonló fejlődést kell elérni, az adatkészítőknek több interakcióba kell lépniük és „kereskedni” az adatokkal: minél többet használunk értékes, minőségi és valós adatokat, annál jobb eredményeket érünk el.
Az adatmenedzsment, az analitika és az automatizálás mind hozzá fog járulni, hogy az AI értékesebb legyen a felhasználók számára. A következő 10 trend komoly hatást fog gyakorolni erre a piacra 2024-ben.
1. A Hibrid AI segíti-e az átmenetet – vajon a klasszikus AI nő-e fel a feladathoz, vagy a GenAI lép a helyébe?
Manapság mindenhol a GenAI-ról van szó, ám nem szabad elfelejteni, hogy az elmúlt években számos egyéb AI törekvés is volt. A machine learning és az augmentáció például egészen elfogadottá vált. A BARC szerint a tradicionális AI elég fejlett már ahhoz, hogy széles körben használják, szemben a GenAI-jal, amivel épp csak ismerkedünk.
2. A GenAI az adatfogyasztói élményt fogja javítani a betekintésekkel – hogyan segíti elő a technikailag kevésbé felkészült dolgozók fejlődését?
Nem mindenki akar alkalmazásokat készíteni. Legtöbben csak válaszokat szeretnének kapni a kérdéseikre minél hamarabb, továbbá jobban bíznak az emberekben, mint az adatokban. A megoldás a kollaboráció és az adatmegosztás. Ez a felhasználói kör jobban kedveli az automatikusan generált vizualizációkat, kiegészítve természetes nyelven megfogalmazott magyarázatokkal. További pozitívum, ha mindez az általuk használt rendszereken belül valósul meg.
3. A strukturálatlan adatok korszaka – vajon a GenAI lehet a megoldás ezek elemzésére?
Az adatok jó része nincsen sorokba és oszlopokba rendezve (e-mailek, belső kommunikációs csatornák stb). A metaadatok, szemantikus technikák, tudásgráfok és vektoros adatbázisok segítenek a strukturált és strukturálatlan adathalmazok feldolgozásában
4. A BI-ból az AI-ba, és vissza – hogyan segíti a GenAI az üzleti analitikát?
A GenAI szupersebességgel fejlődik. Elegendő egy fájlt ráhúzni a chat-felületre és indulhat a beszélgetés. Lekérdezések és kódok generálódnak, tartalmak íródnak. Egyszerű vizualizációk és üzleti előrejelzések ismerhetők meg. Ez a BI segítsége az AI számára.
Következő lépésként érdemes a vállalati szintű eszközöket használni további elemzéshez, ami a GenAI előnyeit helyezi előtérbe. Ez az AI segítsége a BI számára. A két mód közötti váltás (a beágyazhatóság, csatlakozási lehetőségek és API-k segítségével), minden platformon maximálisan kihasználható.
5. Fontos az adat eredete – ismeri a származásukat, bízik bennük?
Az adatminőség és az származásuk már az AI előtti világban is kulcsfontosságú volt. Azonosítható, érthető adatforrásokra van szükség különösen a nyilvános LLM-eknél, ahol az adatok eredete jelenleg nem ellenőrizhető, enélkül pedig az AI nem képes a tényeket és a fikciót megkülönböztetni, gondoljunk csak a deepfake és hamis információ áramlására. Ezért egy olyan mechanizmus priorizálására van szükség, ami egyértelműen tudja jelezni az adatok eredetiségét
6. A kezdő fejlesztők számának növekedése megköveteli az AI műveltség fejlesztését – mekkora felelősséget adhatunk a fejlesztőknek?
Rövid idő alatt vált a low-code, illetve az angol nyelvű kódolás domináns programozási nyelvvé, ezért megnövekedett a „mindennapi fejlesztők” által készített alkalmazások száma. Nagy hatalmat biztosít ez mindenki számára, ezért a megfelelő oktatás elengedhetetlen. Ha eddig az adatműveltséget helyeztük előtérbe, akkor mostantól az AI-műveltséget kell.
7. A data engineering, a data analytics és a data science összeolvad – elkerülhető lesz a haladó tudás és eszközök használata?
Az IDC 2023-as Data Management felmérése szerint a vállalatok szeretnek olyan megoldásokat használni, amelyek minél több képességet biztosítanak, mindezt egy eladótól igénybe venni. Új platformok jelennek meg, fejlődnek az adatszövetek és kiegészülnek az AI képességeivel és egy újfajta felhasználó születik, aki képes bonyolultabb kérdéseket is megválaszolni. Mostantól nem az a kérdés, hogy milyen eredményt értünk el az előző Q-ban, hanem „melyik ügyfeleket célozzuk meg?”, vagy „melyik munkavállalónk megtartása került veszélybe és milyen okok vezettek ehhez?”.
8. Az AI és az automatizálás körforgást idéz elő – miért tolódik az AI fókusza az elemzésről a végrehajtás felé?
Eddig elsősorban az LLM-eket és a generatív AI-t az elemzések elvégzésére és az érvelések megerősítésére használták, nem pedig a cselekvésre, de most számos izgalmas erőfeszítés van folyamatban például a cselekvések és érvelések szinergizálására. Ehhez természetesen valós-idejű transzformált adatokra van szükség. Ehhez és az automatizáláshoz kapcsolódó GenAI-nak kevesebb emberi bevitelre lesz szüksége, akik viszont cserébe a döntéshozásra tudnak több időt fordítani.
9. Az AI testreszabása legvégső lépcsőfok – hogyan fejlesszük GenAI eszközöket specifikusan az üzleti igények kielégítésére?
A jelenlegi, korai genAI alkalmazások skálázhatók, de generikusak és többnyire B2C szempontok alapján készülnek. Idővel egyre több B2B megoldás is készül majd, amiket különböző szektorok és üzletágak problémáinak megoldására lehet majd használni, főleg akkor, ha az applikációk magja általános lesz és a részleteket lehet testre szabni. A cégek adatai fontos nyersanyaggá válnak, amikkel kereskedni lehet, csakúgy mint az elkészített applikációkkal.
10. Az adat egy termék – az AI valóban az utolsó lépés az adatok monetizálása felé?
Az AI és egyéb technológia áttörések miatt az adatszövetek és adathálók az elmúlt évben váltak realitássá. Az egyik, a felhasználók számára fontos tényezője mindennek az „adat, mint termék.” Ez a termékmenedzsment elvek adatokhoz történő alkalmazásáról szól, olyan kérdések feltevésével, hogy milyen problémá(ka)t oldunk meg és milyen célra fogjuk használni. Prioritás az adatminőség, az irányítás és a használhatóság. Az adat a fogyaszthatósága alapjává válik mind az analitika, mind pedig az AI területén.
Ha az adatok eddig is fontosak voltak, akkor a genAI idejében még fontosabbá válnak, hiszen a nagy mennyiségű adatfelhasználásról váltanunk kell a jó és megbízható adatok irányába. Hogyan változtassuk az adatainkat jobb adatokká? Az aranyláz során is elsősorban azok jártak jól, akik az ásókat, farmernadrágokat és csizmákat gyártották, illetve azok, akik a vasutat építették. Ehhez hasonlóan az a platform válik majd értékessé, amelyik lehetővé teszi majd a jobb adatok megtalálását. Ez a változás jelenleg zajlik, az AI hamarosan a mindennapok részévé válik, ami egy olyan szintű változásnak ígérkezik, mint amilyet az internet hozott és egy újfajta,ä< innovációkkal és gazdagsággal teli világ képét vetíti előre.
További információk a Qlik honlapján találhatók.