Hiperperszonalizáció, robotpodcastok, satöbbi – AI és média

MI Stúdió S02 E32

  2020-10-29

Hallgass minket a YouTube-on!

Ez az MI Stúdió, ahol a legmenőbb szakértők segítségével fejtjük meg a mesterséges intelligencia rezdüléseit, és követjük le a legújabb MI trendeket. Hörömpöli-Tóth Levente vagyok, tartsatok velünk! 2. évad 32. epizód, összességén pedig a 39. adás - itt tart most az MI Stúdió, ahonnan mindenkit sok szeretettel üdvözlünk! Mai témánk a mesterséges intelligencia és a média kapcsolata, ennek kivesézéséhez Virág Attilát a Hírstart.hu, Magyarország legnagyobb hír aggregátor oldalának vezetőjét hívtuk meg. Nagyon köszönjük, hogy itt vagy velünk Attila!

V.A.: – Üdvözlök mindenkit!

H-T. L.: – Akár hiszed, akár nem, de nem biztos, hogy mindenki tudja, mi az a híraggregátor oldal, úgyhogy lehet, hogy itt lenne érdemes kezdeni a beszélgetést. Egy picit helyezzük képbe így a hallgatókat, hogy miről is van szó.

V.A.: – Rendben. Az aggregálás szó úgy kerül a képbe, hogy nagyon sok hírt gyűjtünk össze, tehát egy híraggregátor oldal nem tesz mást, mint valamilyen technológiával különböző híroldalak tartalmait gyűjti össze. Esetünkben RSS segítségével a hírek címeit, leadjeit, ugye időpontjait, linkjeit gyűjtjük össze egy helyre, pár percenként frissítve. Tehát nagyon nagy frekvenciával. A Hírstart.hu-n több száz hazai hírforrás be van fűzve, tehát nagyon sok. Gyakorlatilag a teljes médiát lefedjük, ha úgy tetszik. Ha valamilyen oldal még nincs bent, annak vagy technikai oka van, vagy technikai oka van, tehát, hogy nem adtak RSS feed-et, tehát most küldjék el nekünk. A híreket tematizáljuk, tehát vannak olyan híraggregátorok, ahová egyszerűen csak beömlenek a hírek és forrásonként lehet választani, nálunk nagyon mély tematikákra lehet szűrni. Van, hogy az adott híroldal megadja, hogy belföld vagy autó-motor sport tehát, valamilyen tematikába ad át hírt, és mi is így bontjuk, vagy még tovább szelektáljuk. Mondjuk, a kultúra tematikát film, zene színház, ilyen mélyebb tematikákba is belemegyünk és ezeket szemlézzük hárompercenként frissítve az olvasóinknak. A Hírstart maga az nem csak a domainon érhető el, ami elhangzott, hanem más egyéb oldalaknak is szolgáltatunk technológiát, applikációnk is van és hírfigyelés szolgáltatást is működtetünk, tehát hogyha például kifejezetten bizonyos kulcsszavakra vagy kíváncsi, hogy azok megjelentek-e a hírekben, a címekben, leadekben szerepelnek, akkor tudsz erről napi értesítést kérni magadnak. Tehát egy ilyen médiafigyelésre is használható. Főleg azok a célcsoportunk, akik nem akarnak különböző oldalakat egyesével bepötyögni, hanem egyben akarnak látni tematikákat, vagy több hírforrástól szeretnének látni anyagokat. Rendszerünk specialitása, hogy nagyon régóta észreveszi az azonos témában megjelent híreket, ezeket hírcsokrokba gyűjti és így a látogatók nagyon könnyen tudnak szelektálni aközül, hogy az adott hírt melyik forrásból olvassák el.

H-T. L.: – És milyen szerencse, hogy a tematikák között ott van a mesterséges intelligencia is, nem meglepő módon, és nagyon reméljük, hogy az ai-hungary.com-on megjelenő nagyszerű tartalmas és izgalmas MI híreket is majd felkapja az algoritmusotok. Abból, amit most elmondtál, teljesen egyértelmű, hogy ugye a nagy hírügynökségek híreit is szemlézitek, ezek ugye vezető helyen szerepelnek, és ezzel már át is evezünk egy kicsit a témánkra, a mesterséges intelligenciára, hiszen a legnagyobbaknál, mint például Bloomberg-nél, ott azért már nagyon komoly az MI-nek a használata. Ott már a tartalmak egyharmadát is automatizált rendszerek állítják elő, van nekik ez a kis Cyborg nevű szoftverük, ami gyakorlatilag valós időben képes a pénzügyi jelentéseket is értelmezni, de a Washington Post-nál is van a „kis házi” bejáratott Heliograf nevű megoldás, ami hasonló babérokra tör. Ennek alapján, hogy látod, hogy alakul át az újságíróknak a munkája? Van még rájuk szükség egyáltalán?

V.A.: – Abszolút van rájuk szükség! Ha azt nézzük, hogy az említett nagy cégek a Microsoftnak az MSN szolgáltatásából a robotoknak, pontosabban mesterségesintelligencia alapú algoritmusoknak adták át a hírszemlézést és egy nem szerencsés kép-szöveg párosítással rasszista felütése lett egy szemlének, mert nem volt rajta emberi kontroll. Tehát a kontextus probléma azért még megvan a szövegértelmezésben, nagyon nehéz, és ha azt nézzük, hogy például a magyar nyelvet még nehezebb értelmezni algoritmusokkal, akkor az emberi felügyelet az nem hagyható ki, viszont szerintem nagyon hatékonyan támogatható az újságírók munkája. Ahogy említetted például a gazdasági vetületét, annak idején még nem MI alapú volt, hanem egyszerűen csak digitális adatközléssel megjelentek a tőzsdei automatizált hírek, ezzel bekerültek a tőzsdére olyan cégek is a forgalomba, a nagyobb forgalomba, akiket előtte nem szemléztek az újságírók és ez nagyon nagy lendületet adott a tőzsdéknek. Hazánkban is most van egy ilyen kísérleti projekt ezzel kapcsolatban. Azt gondolom, hogy pont a még részletesebb a még több, a még fontosabb, a még trendszerűbb adathoz jutást segíti az újságíró munkájában, hogyha valamiféle intelligenciát, akár mesterséges intelligenciát használ ebben.

H-T. L.: – Igen, tehát említetted itt az etikai vetületét az MI-nek, valóban itt elég sok még az, amin javítani kell, és hát a másik aspektus pedig szintén nagyon fontos, hogy gyakorlatilag ezzel a merítést lehet tágítani, gyakorlatilag az újságírók inkább az érdemi feladatokra tudnak koncentrálni. Na most, nálatok, hogy jelenik meg mindez, milyen algoritmusokat használatok és mire?

V.A.: – Naponta 4-6 ezer hír link kerül be a rendszerünkbe, szemmel látható tömeg és nagyon nagy a látogatói elérésünk hogyha a Hírstartot, Startlapot nézzük akkor havonta több mint 2 millió látogatót érünk el a Gemius DKT mérése alapján. Ezzel kezdeni akartunk valamit, tehát azt látni kell, hogy a Facebook, a Google, YouTube videó, a TikTok, mindenféle médiumok megjelennek és az olvasói közönség, pontosabban a fogyasztói közösség az vándorol ide-oda és változnak a fogyasztói szokások. És ebben valahogy meg kell jelenünk nekünk is, ehhez kerestünk egy olyan formátumot, amivel tudunk mit kezdeni és automatizálni tudjuk, erre egy lehetséges kimenetet, a Google Cloud-nak az MI által támogatott Cloude szolgáltatásaiban találtunk. Van egy TTS, egy Text To Speech szolgáltatás, ami mélytanuló algoritmusokkal modellez emberszerű hangot, beszédet. Ez már nagyon rég megjelent, még az Android rendszerbe is beépített szinten, és a Microsoft termékekbe is már beépítésre került, viszont van egy olyan az algoritmusuk, ami nagyon jól érthető és nagyon jól használható, távolról programozható, gyakorlatilag kommunikálni lehet ezzel az MI-vel. Nagyon egyszerűen: elküldünk neki egy szöveget és ő ezt visszaküldi hangban, jól hangsúlyozott felolvasással. Értelemszerűen, ha rossz szöveget küldünk neki akkor egy rossz felolvasást fog visszaküldeni. Ezt használtuk fel egy hír felolvasásra. A rendszerünkben egy nagyon komplex tracking metódus van, amiből ki tudjuk válogatni az éppen aktuális tematikában aktuális forrásokból a legjobb híreket, amik nagyon érdekelhetik a látogatókat.

H-T. L.: – Ezt újságírók végzik, a hírválogatást?

V.A.: – Nem ez teljesen automatizált.

H-T. L.: – És a keresőszavakon alapul, vagy megnézitek, hogy mondjuk az adott téma mennyire forró és milyen érdeklődésre tart számot?

V.A.: – Igen. Ha honnan nézzük, hogy mondjuk van egy hírforrás, aki általánosságban ír híreket, vegyük azt film és gameing tematikába, de ezek jól nem különülnek el nála, akkor nálunk vannak algoritmusok, amik ezeket szétválasztják. Ez viszonylag egyszerű, ebben még nincsen mesterségesintelligencia. Ezeket szétválasztjuk, már el tudom különíteni, hogy a filmes híreket csak azoknak küldöm szemlézve, akik a filmes hírek iránt érdeklődnek, és a gaming tematikát pedig erről leválasztva másoknak. Ha ebből még kiválasztjuk azokat, akik kellő hosszúságú címet, leadet adtak át és az értelmezhető is, tehát nincsenek benne értelmetlen rövidítések, akkor megint csak szűkíthető a halmaz algoritmusokkal. Utána pedig még erre rá tudom rakni a látogatói aktivitást, hogy bizonyos időn belül ebben a tematikában, melyek a legjobb hírek éppen, és ezekből tudok egy feed-et csinálni, át tudom adni a robotnak, a robot feldolgozó rendszerünknek, amely legyártja ebből a Google Cloud segítségével a hanganyagot. Gyakorlatilag, tehát ez a workflow.

H-T. L.: – Gyakorlatilag egy hiper-perszonalizáció csináltok?

V.A.: – Igen. Hát van egy szakértői rendszerünk, ami csatlakozik egy AI-hoz, hogyha most nagyon le akarjuk butítani a dolgot.

H-T. L.: – Mik az első visszajelzések, ennek a robot podcastnak a kapcsán? Én is belehallgattam, egyébként teljesen rendben van. A hölgy, ugye egy hölgy az, aki megosztja itt velünk a gondolatokat és a híreket, azért egy picit nekem ő fagyos még, de nem tudom, hogy el lehet-e menni ebbe az irányba, hogy egy kicsit emberibb legyen, melegebb legyen a hangsúlyozása?

V.A.: – Ezért került alá zene, automatikusan vágja alá a rendszer a zenét. Került alá Equalizer kompresszor, hogy az eredeti nyers hangot így valahogy egy kicsit ilyen stúdiósabbá, hírfelolvasó-szerűvé tegyük. És azért legyünk őszinték, vannak olyan rádiós, vagy TV-s hír felolvasók, akik nem beszélnek ilyen szépen. Tehát hogyha, innen nézzük, akkor még van hová fejlődnie valóban, és bármikor amikor megjelenik egy újabb, jobb beszédhang akár mondja a női mellett egy férfi is, akkor ezt bevonjuk. Abszolút gyorsan alkalmazkodni tudunk ehhez, kipróbáljuk és akkor átállunk arra.

H-T. L.: – De a hallgatóknak alapvetően tetszik?

V.A.: – Igen, mondok egy adatot: havonta kétszázezer lejátszás fölött vagyunk. Tehát adáslejátszás, és az adásokat nagyjából végig hallgatják, mindegyiket. Ugye ezek egy 3, 4, 5 perces adások. Naponta négy adásunk van, két friss hírekkel, egy film-zene-szórakozás és egy technológiai hír. Viszonylag hamar elértük ezt a havi kétszázezer fölötti lejátszási számot, ami azt jelenti, hogy hetente is ötvenezer fölött vagyunk. Ez úgy gondolom egy elég nagy siker ahhoz képest, hogy ez így a 0-ról indult meg. Ha azt nézzük, ugye mi egy forgalomterelő oldal vagyunk, magunkra nehéz forgalmat terelni más forrásból, hiszen mi vagyunk a kezdőpont azoknak, akik hozzánk jönnek, mégis sikerült elérni. Sikerült vele egy elég nagy visszatérést elérni. Másrészt, hogyha megnézzük azt, hogy érdekli-e látogatókat, ha más paramétereket vizsgálunk: a hírszemléket, amik elhangzanak feltesszük a weboldalunkra és a podcast.hirstart.hu-ra, azt látjuk, hogy lekattintanak híreket és utána elmennek a túloldalra, hogy elolvassák a teljes változatát ezeknek az anyagoknak. Ha pedig tovább megyünk ebben, kapunk különféle visszajelzéseket van, aki autóban szereti hallgatni és akkor mondjuk van egy kisebb közönség, aki mondjuk Spotify-on, vagy Google podcast-en, iTunes-on keresztül hallgatja, mivel ott is elérhetők a csatornák, de inkább a weboldalon keresztül mennek föl a látogatók. Például vannak olyanok, hogy idős közönség is hallgatja. Pontosan azért, mert fáradt szeme, nem lát jól, a szemüvegét ki kéne cserélni és egyéb problémák vannak, és akkor sokkal jobb neki, hogyha meghallgat egy olyan hírszemlét, ami nem a megszokott kereskedelmi csatornákban szól, és ráadásul akkor hallgatja meg, amikor akarja.

H-T. L.: – Valóban tényleg rengeteg előnye van, és hát ahogy említetted nagyon változatos is a tartalma, de akkor menjünk egy picit tovább ennek alapján. Hiszen ez is csodálatosan mutatja, mennyire fontos, hogy az egyes médiumok ne csak siránkozzanak, sápítozzanak, hogy itt az AI és mindent letarol, hanem inkább vegyék saját kezükbe a sorsukat és innovatív megoldásokkal próbáljanak egy kicsit elébe menni ezeknek a trendeknek. Ez egy tökéletes példa erre, és hát nekem még eszembe jut a News Break-nek a példája, amely gyakorlatilag a semmiből csinált egy 10 milliós ügyfélbázist, pusztán azzal, hogy hiper-perszonalizált médiatartalmakat kezdtek el gyártani és csöpögtetni. Erre építve talán nézzük egy kicsit végig azt, hogy oké ez az online világ, de a többi médiumot, hogyan alakítja át az AI, hiszen mindegyikre hat. Az online-ra, a rádiós, a tévés és hát a print médiumokra egyaránt.

V.A.: – Konkrét printes példát tudok erre mondani. A Hírstart a Centrál Médiacsoporthoz tartozik, ahol van például a Nők Lapja is, egy nagyon régi lap, ami komoly archívummal rendelkezik, és miért is ne lehetne előszedni, hogy mi volt egy 80-as évekbeli életmód cikkben? Ugye nagyon nehéz ebben kutatni, tehát mondjuk felépítünk erre egy adatbázist, de abban is nehéz kutatni. Ilyenkor jön az, hogy valahogy, azért a kereső szavakon túl jó lenne valahogy címkézni, hogy könnyebb legyen megtaláljuk ezeket. Van egy ilyen projekt házon belül, egy címkéző projekt mélytanulással felépítve, az online termékeinket feldolgozza, és nemsokára jönnek a printes anyagok is. Ugye, ennek van sales piaci kimenete például, hogy csak azokat akarom elérni, mint hirdető, akik mondjuk az utóbbi időszakban elolvasták a Bors és híreket, tehát egy ilyen szegmentálás. A mélytanulással címkézett hírek, az olyan portfólióban készült anyagoknál elérhető. A másik véglet, amikor egy printes anyagot akarok úgy megérteni, hogy mi is történik benne, ez nagyon segíti a kutató munkáját a szerkesztő munkáját hogyha, egy ilyen van mögötte. Ehhez ez készül nálunk egy ilyen címkéző rendszer, tehát maga címkéző rendszer gyakorlatilag kész is van, csak fel kell dolgozni hozzá az archívumot. Ez egy gyakorlati példa. Ha egy másik részről a nézem, hogy mondjuk szeretne valaki egy Latabár filmet készíteni egy újat, akkor gyakorlatilag erre a deepfake által, ami ugye AI támogatott lehetőség van. Hogy kivágjuk azokat az jeleneteket és összerakjunk belőle egy új filmet. Vagy nemrég jelent meg ugye egy AI által készített Elvis Presley szám, Elvis Presley ízű szám.

H-T. L.: – Igen, bár kicsit kásás volt azért.

V.A.: – Igen, tehát ez még nagyon a kezdete a dolgoknak, viszont látszik, hogy a művészeti ágakban erősen kísérleteznek vele. A médiaiparban is, én azt látom, hogy gyakorlatilag nem az szerintem a probléma, hogy ez a technológia elérhető-e és létezik-e, hanem hogy mennyire ismerem föl, hogy ezt tudom használni. Tehát amikor mondjuk valaki a telefonját elindítja és bemondja „OK GOOGLE!”, vagy „Helló Szivi!” akkor tudja, hogy ezt be lehet mondani. Tehát, hogy tudom-e azt, hogy lehet egy ilyet használni. Vagy például, amikor, ez egy teljesen más példa, a Facebookra optimalizálok híreket, akkor gyakorlatilag én egy AI-val beszélgetek, megpróbálom megérteni a nyelvét, hogy hogyan tudom neki úgy tálalni az anyagokat, hogy az azt eljuttassa a célközönségemhez és ekkor beszélgetek egy párbeszéd zajlik. Úgyhogy a médiaiparban nagyon egyszerű eszközök vannak már arra, hogy AI-t használjunk, ott van előttünk, nem kell érte iszonyatos pénzeket fizetni. A nagy cégek ezeket odateszi elénk, csak meg kell tanulni optimalizálni magunkat erre, a folyamatainkat.

H-T. L.: – Amit elmondasz, abból nekem az jön le, igazából nagyon úgy tűnik, hogy a hazai szereplők is azért egyre inkább próbálják a trendeket követni és valahogy a maguk javára fordítani mindezt.

V.A.: – Igen, és akár egy printes is. Tehát hogyha mondjuk, pont most a COVID miatt ahogy csökken a print eladás: hogyan juttattom el az én print számomat, az én célközönségemhez, online? És akkor már bejön, hogy a Google-nél vagy a Facebooknál az AI által feldolgozott látogatói szegmenseket hogyan használom? Akkor már AI-t használok.

H-T. L.: – Igen, és hát ugye ez elvisz minket ahhoz a nagy kérdéshez, hogy gyakorlatilag ez átok-e vagy lehetőség a média számára? Itt már ugye pedzegettük ezt a témát, főleg azért, mert lássuk be, tényleg a Google és a Facebook korában szinte mindent az visz, hogy ők mit fognak neked felajánlani? Hogy tudod-e ezt kikerülni és, hogy tud a média saját maga ura lenni? Hogy tudja visszavenni a kezdeményezést? A cyber kor előtt minden a szerkesztőségekből indult és ott is végződött, de most teljesen megváltoztak az erőviszonyok.

V.A.: – Abszolút! Konkrét Hírstart példát hozok az, hogy mi egy mélytanuló algoritmust fejlesszünk a látogatói elérés szegmentálására és egyéb ilyen megoldásokra, ahhoz egyrészt iszonyatos mennyiségű adat kell. Sok adat van nálunk, de még nem annyi én azt gondolom, amiből egy nagyon jó minőségű megoldást lehet produkálni. A másik, hogy ezek nagyon drága fejlesztések, hogyha mi magunk csináljuk. Ilyenkor valahogy definiálni kell magunkat a látogató felé, hogy egy általános Facebook hírfolyamba, ahol benne vagyok a saját buborékomban és azt olvasom, amit nem én akarok, hanem amit azt gondolom, hogy akarok.

H-T. L.: – Lásd: Netflix – The Social Dilemma című filmjét.

V.A.: – Igen, de a Google keresési találatoknál ugyanez. Azt találom meg, amit akarok? Mi ezt a Hírstartnál a látogatóra bízzuk, ő szegmentálja a tartalmat, tehát mi előállítjuk a szegmenseket és ő akár elrejtheti az adott hírforrást, hogy ő ezt nem akarja olvasni, de teljesen nem tűnik el, hanem csak elszürkül és elő tudja hozni magának. Ki tud jönni ebből a buborékból, ha akar, és mindig ott lesz az alternatíva, hogy ő visszaléphet vagy tágíthatja a saját látás körét, vagy akár a tematikáját. Meghagyjuk a tudatosságot, egy más tudatállapotban olvasnak ilyenkor a látogatók híreket. Azt gondolom, a méréseink alapján ugyanaz a látogató, aki Facebookról jön, kevesebb értéket képvisel a kattintások viselkedés tekintetében mintegy aggregát oldalról. Tehát a Startlapról átmenő látogató az CPC minőséget produkál konverzióban még most is, mondjuk egy Google kampányhoz képest, ami egy brutális erőt képvisel és pont azért, mert meghagyjuk dönteni a látogatót. Ez egy magasabb tudatosságot ad neki.

H-T. L.: – Hát ez szuper! Én úgy látom, hogy az AI és a média kapcsolata egyre intimebb lesz és azt megígérhetjük, hogy mi az első sorból fogjuk mindezt követni. Minden hallgatót folyamatosan fogunk tájékoztatni a fejleményekről. A mai adásba viszont most több sajnos nem fér bele, azt gondolom a lényeget sikerült összefogunk nagyon szépen köszönjük, hogy itt volt voltál velünk Attila!

V.A.: – Én is köszönöm a lehetőséget! Sziasztok!

H-T. L.: – Nagyszerű! A hallgatóknak pedig köszönjük a figyelmet a technikát továbbra is Nőtig Ádám kollégám varázsolja, mint ahogy fogja a következő adásban is. Találkozunk legközelebb! Kövessetek minket kedvenc podcast lelőhelyeteken, illetve böngésszétek új gyűjtőoldalunkon, az ai-hungary.com-ot! Sziasztok!

Ez volt az MI stúdió, ahol a legmenőbb szakértők segítségével fejtjük meg a mesterséges intelligencia rezdüléseit. Az MI Stúdió, az MI Koalíció podcastja, amely a hazai mesterségesintelligencia ökoszisztéma szakmai fórumaként működik. Még több tartalomért kövesd az MI Stúdiót a nagyobb podcast-platformokon és ne felejtsd el értékelni az adást! Az észrevételeket, megjegyzéseket az [email protected] e-mailcímre, vagy a Mesterséges Intelligencia Koalíció közösségi médiafelületen várjuk. Találkozunk a következő epizódban!

Podcastunkat a SpeechTex technológiájával leiratozzuk.

Hallgass minket a Spotify-on !

Hallgass minket Anchor-on!

Házigazda

Hörömpöli-Tóth Levente

MI Koalíció kommunikációs vezető

Vendége

Virág Attila

A Hírstart.hu és a Startlap Csoport technológiai vezetője