e-magyar.hu: digitális nyelvfeldolgozó rendszer

  2019.08.23       MTA Nyelvtudományi Intézet    

Az élményről

Az e-magyar rendszer az emberi intelligenciát igénylő szövegolvasási, szövegértési feladat alapvető, kezdeti lépéseit automatikusan valósítja meg: a szöveg nyelvi jellemzőit automatikus módon fedi fel, teszi explicitté. Egy tetszőleges szövegrészt feldolgozva megtudjuk az egyes szavak szófaját, szótövét, alaktani (morfológiai) elemzését, a mondatok kétféle mondattani (szintaktikai) elemzését, megkapjuk a főnévi csoportokat és a tulajdonneveket. Az online felületen ezek az elemzési szintek többféleképpen is vizualizálódnak.

Mit próbálj ki?

Az e-magyar.hu rendszer jelenleg az alábbi szövegfeldolgozási feladatokat valósítja meg: -szavakra és mondatokra bontás; -morfológiai elemzés; -szótövezés; -morfológiai egyértelműsítés; -függőségi mondatelemzés; -összetevős mondatelemzés; -főnévi csoportok felismerése; -tulajdonnév-felismerés. A feladatoknak ez a sorrendje a nyelv szintjeit, valamint a feldolgozás nehézségét is követi. A rendszer minden nyelvi egységhez képes elemzést adni, de vannak korlátai, így a nem szabványos nyelvi elemek esetében valószínűleg kevésbé pontos elemzést ad, mint például: -elírások, helyesírási hibák; -a közösségi médiában alkalmazott rövidítések, emotikonok; -régi(es) szövegek; -versek, dalszövegek.

Szükséges perifériák

Egér , Billentyűzet , Kijelző

A technológia magyarázata

A rendszer egybegyűjti, egy egységes láncba integrálja és közzéteszi az elemzési lépéseket megvalósító számítógépes magyar nyelvfeldolgozó eszközöket. Az eszközök közül néhány szabályalapú, de nagy részük gépi tanuláson alapul. Fontos szempont az interoperabilitás, vagyis az egyes eszközök közötti átjárhatóság megteremtése.

Mi ebben az MI?

Az elemzőláncba kötött eszközök közül néhány szabályalapú, de nagy részük gépi tanuláson alapul. A modellek a magyarra elérhető legnagyobb gold standard minőségű szöveghalmazokon lettek betanítva.

Kipróbálom 
A technológia tulajdonosa
MTA Nyelvtudományi Intézet
Milyen típusú MI-t használ a technológia?
Természetes szöveg feldolgozás
Alkalmazott megoldás
Általános bemutató
Felhasználási terület
Szoftver és Internet
Közvetlen felhasználási módok
Mindenféle magyasabb szintű szövegfeldolgozáshoz, illetve nyelvtechnológiai feladathoz ezek jelentik a kezdeti lépéseket. Ezenfelül használják még: -irodalmi, stilometriai kutatásokhoz; -jogi szövegek automatikus feldolgozásához; -menetrend- és utazástervező szolgáltatásokhoz.
Közvetetten
Minden olyan feladathoz, amiben szöveges bemenetet kell valamilyen szinten feldolgozni és a benne impliciten megtalálható információkat explicitté tenni, pl. információkinyerés, szövegbányászat, gépi fordítás stb.
Üzleti funkció
Kutatás és fejlesztés
Technológia létrehozásának időpontja
2016.11.01