Egyre inkább feltörekvőben van az AI (MI – Mesterséges Intelligencia) napjainkban. Egyre több olyan tartalommal találkozhatunk, legyen szó képekről, videókról, vagy blog cikkekről, amelyeket már nem ember készített, hanem egy számítógépes program. Nagy port is tudnak kavarni, hiszen már egy olyan szintre emelkedtek, amely játszik a valóság érzetünkkel. A mostani cikkben megnézzük, milyen hatása van jelenleg az emberekre az ilyen tartalmaknak, milyen kárt okoz, vagy éppen milyen jótékony hatása van, és egyúttal megnézzük hogyan lehet kiszúrni az AI-al létrehozott tartalmakat.
MI működése
Az MI már nem egy mai gondolat, már 40-50 évvel ezelőtt is találhatunk példákat arra, hogy az emberi agy lényegében elektronikus impulzusok halmaza. Egyesek és nullák. Amelyet egyszerű szerrel leképezhetünk és programozási nyelvek segítségével imitálhatunk. 1950-ben jelent meg ezeknek a rendszereknek a vizsgálatára a Turing teszt, ami elsősorban a gép és ember közötti kommunikációt pontozza. Természetesen ekkoriban még viszonylag egyszerűen felépített rendszerekről beszélünk, illetve “ha ezt írja akkor ezt válaszolom” felépítéssel.
Manapság a legfelkapottabb eszközök között van a ChatGPT – amiről már mi is írtunk néhány gondolatot, a Claude, vagy LLama a Meta saját nagy nyelvi modellje (Large Language Model – LLM). Az LLM-ek az AI egy alfajába tartoznak. Működés tekintetében, egyszerűsséggel élve, megpróbálják megjósolni, hogy a bevitt információk alapján mi a következő szó, tehát a várt eredmény. A következő kép jól mutatja ezt.
A bevitt információt követően történik egy súlyzás, hiszen egy-egy mondatban egy-egy szó értéke nem egyenlő, amit az MI is figyelembe vesz. Az MI-ben bevitt információk, ami alapján az MI is tanult, megpróbálja megkeresni a párokat, az úgynevezett hálóban, és a legvalószínűbb információ tömböt visszaadni a felhasználó számára.
A szövegek generálása mellett már találkozhatunk bármely felületen képekkel, videókkal, sőt zenékkel is, amit az MI generált. Nemrégiben ilyen volt a zsiráf megmentése egy szikláról.
De ide tehetjük a legújabban megjelent Lo-Fi típusú zenéket is, amelynél kiemelkedő volt a napokban a What is ? nevezetű csatorna videója.
Habár utóbbiról nem tudjuk biztosan, de várhatóan AI-al generáltt zenéről beszélhetünk. Kijelenthetjük, hogy nehéz dolgunk van a felismerésével.
Árulkódó jelek
Kezdetként a nagy nyelvi modelleket vizsgáljuk meg, hogy milyen elemeket tudunk felismerni az általuk generált szövegekben. Olyan elemeket, amelyeket emberek által írt szövegekben nem tűnnek fel.
Hallucináció
Az LLM-ek sokszor szoktak hallucinálni, ami azt jelenti, hogy a bevitt szöveg alapján olyan információkat is visszaadnak, amelyek nem egyeznek a valóságnak. Például történelmi események során kinevezhetnek olyan uralkodókat, akik nem is léteztek az adott korban. Különböző módszerek során félrevihetnek minket, mert valamilyen megoldás köthető a bevitt információ alapján. Vagy olyan tényezőket használhatnak tárgyakra, amelyek nem a legmegfelelőbbek, pl. szín helyett érzelem társítása. Ez mögött ismételten a fenti képen mutatott működés áll.
Szokatlan megfogalmazás, szóhasználat
Kétségtelen, hogy ez az emberekre is igaz, de a mesterséges intelligencia által gyártott tartalmakra méginkább. Ahelyett, hogy a pontra térne sablonos szövegeket használ, általános leírások ad, sokszor használ ugyanolyan szavakat, nem megfelelően építi fel a logikát a megírt szöveg mögött. Persze léteznek már specializált LLM-ek, amelyek egymással kommunikálnak, és akár felépíthető egy főszerkesztő-író páros is, hogy még specializáltabb szövegeket írjanak. De erről később beszélünk.
Továbbá indokolatlan nagyszavakakkal, vagy külföldi szavakkal is telitűzdelheti az LLM a szöveget, csak hogy a valódiságát próbálja tükrözni a tartalomnak. De könnyen észrevehetjük a tartalom tényleges olvasása során, hogy inkább szükségtelen, sőt értelmetlen a szakmai szó, vagy magyarosított külföldi szó használata a szövegben.
Személytelen írás
Ismételten specifikáció kérdése, hiszen a mai modelleket már részletesen beprogramozhatjuk különböző előre megírt promptok segítségével, viszont a legtöbb várhatóan az interneten már megtalálhatom tartalomban fogjuk ezt észrevenni. Főleg az álhíreket-áltartalmakat gyártó oldalak esetében vehetjük észre, hogy nincs stílusa a megírt szövegnek, nincs egyediesége, mondhatjuk nincs lelke a tartalomnak. Ez teljességében abból adódik, hogy egyszerű leírás alapján tömkelegével gyártatják ezeknek az eszközöknek a segítségével a rosszabbnál rosszabb tartalmakat, csak hogy az oldalon található hirdetésekből bevételt szerezzenek.
AI képek felismerése
Szerencsénkre a szövegek mellett az MI-vel generált képek felismerése mondhatni egyszerű. Legalábbis, ha a képgenerálás folyamata után nem végeznek “stabilizálást”, tehát nincs utómunka, akkor könnyen észrevesszük, hol lóg ki a lóláb.
Részletek hiánya, valóságtalan elemek
Nézzük csak meg a következő képet, amelyhez hasonló száguldott végig nemrégiben a magyar interneten is.
Ha elsőre ránézünk szinte nem látni semmi furcsát, mivel olyan hihetetlen a kép, hogy egy hölgy ilyen mintát rakjon ki különböző zöldségekből. De ahogy közelebb megyünk elkezdjük megvizsgálni már is láthatjuk, hogy 6 lábujj található meg, azok is elnyúltak. Felfedezhetünk még néhány apróságot, mint pl. a paprikák formája, néhány helyen “egybe növése”, forrása. De elmondhatjuk, hogy ez a kép biztosan utómunkán is átment, mert elég jól sikerült.
A legtöbb esetben könnyen találunk hibákat, ismételten a sablonos meghatározás miatt. Például nézzük a következő képet, amelyet most készítettünk a József Attila: Tiszta szívvel c. vers alapján.
Nézzük csak meg a generált képen látható ujjakat, a csákány végét, vagy éppen a fiú szemét. Egyre inkább fognak eltűnni ezek a látványosságok, ahogy fejlődnek az algoritmusok, de még most könnyen felfigyelhetünk ezekre.
Szövegek a képen
Valószínű, hogy idáig nem találkoztunk olyan MI generált képpel amin szöveg volt, mert azonnal felismertük volna. Egyszerűen még nincs teljesen jó megoldás arra, hogy az AI tökéletesen helyezze a szövegett a képre. Ahogy a fenti képen, úgy a szövegben is történni fog elváltozás, az élek nem lesznek tökéletesek.
AI generált videók felismerése
Végül pedig elérkeztünk a videókhoz, amelyet pedig jelenleg a legkönnyebb felismerni. Észrevehetjük az inkozisztens mozdulatokat, érdekes mimikákat, összemosódó képeket, nem megfelelő színhasználatot. Valószínű találkoztunk a Will Smithről 2023-ban generált AI videókat. Vegyük figyelembe, hogy a 2024-es videó ténylegesen Will Smithről készült felvételek.
Na mármost elvileg ez 2023-ban történt, de kétségtelen hogy elég előrehaladott modelleket találunk, amelyek szinte hihetetlen videókat tudnak készíteni. Habár az OpenAI, a ChatGPT megalkotója bejelentette a Sora nevezetű modelljét, és elképesztő videót osztott meg, amelyre ránézve tényleg azt hihetjük, hogy valós felvételt generált. Azonban a modell a mai napig még nem használható.
Vegyük észre az apró jeleket, ahogy a kutya az egyik ablakból a másikba lép át, miközben nem lenne számára hely. Ahogy a strandon lévő kutya esetében elrepülő madár csak úgy eltűnik a selfie bot mögött, vagy az építkezés során véget nem érő fa darabok, a járművek kerekének méretei.
A legfontosabb a figyelmes tartalomfogyasztás
Habár napjainkban csak görgetünk és görgetünk, a számtalan 10 másodperces videók között, fontos hogy figyelemmel legyünk amikor tartalmat fogyasztunk. Gondoljuk meg kétszer, hogy amit nézek, hallgatok, vagy olvasok az tényleg valóságos-e vagy sem. Lehet jó kezdeményezéseket találunk az egyes platformokon, mint például a YouTube, Facebook és Instagram is már megköveteli az AI által generált tartalom jelölését, ha pedig a rendszer úgy érzékeli automatikusan el is helyezi ezt a jelzőt. De amíg például a Google találatai között megjelenhet AI által generált tartalom, amennyiben segítőkész, elvesznek az emberek által készített, valós tartalmak.
Próbáljuk ismersőeinknek is felhívni a figyelmét, főleg az idősebbek körében, hiszen ők még abban a korban nevelkedtek, amikor még nem léteztek ezek a technológiák, és a mindennapi hírek között egy ilyen megbúvó tartalom, bármilyen jelzés nélkül átverheti a valóság érzetüket. Ahogy akár nekünk is.
Jótékony és kártékony hatása
Jogosan hallhatjuk, hogy a mesterséges intelligencia elveszi az emberek munkáját. Ez kiemelten igaz például a kikötőkben tárolt konténerek mozgatására, ahol már csak egy fülkében egy fő felügyelheti a gépek automatikus mozgását. Vagy az amerikai földeken több tízezer hektár vetés, termelés, aratás folyamatát is hasonló módon csak egy fő felügyeli, azt is távolról, akár az otthona kényelméből.
A fenti pontok összegzését pedig egy következő cikkben fogjuk megvitatni, ezért iratkozz fel, hogy ne maradj le a legújabb tartalmakról.