e-magyar.hu: digitális nyelvfeldolgozó rendszer
2019.08.23
MTA Nyelvtudományi Intézet
Az élményről
Az e-magyar rendszer az emberi intelligenciát igénylő szövegolvasási, szövegértési feladat alapvető, kezdeti lépéseit automatikusan valósítja meg: a szöveg nyelvi jellemzőit automatikus módon fedi fel, teszi explicitté. Egy tetszőleges szövegrészt feldolgozva megtudjuk az egyes szavak szófaját, szótövét, alaktani (morfológiai) elemzését, a mondatok kétféle mondattani (szintaktikai) elemzését, megkapjuk a főnévi csoportokat és a tulajdonneveket. Az online felületen ezek az elemzési szintek többféleképpen is vizualizálódnak.
Mit próbálj ki?
Az e-magyar.hu rendszer jelenleg az alábbi szövegfeldolgozási feladatokat valósítja meg: -szavakra és mondatokra bontás; -morfológiai elemzés; -szótövezés; -morfológiai egyértelműsítés; -függőségi mondatelemzés; -összetevős mondatelemzés; -főnévi csoportok felismerése; -tulajdonnév-felismerés. A feladatoknak ez a sorrendje a nyelv szintjeit, valamint a feldolgozás nehézségét is követi. A rendszer minden nyelvi egységhez képes elemzést adni, de vannak korlátai, így a nem szabványos nyelvi elemek esetében valószínűleg kevésbé pontos elemzést ad, mint például: -elírások, helyesírási hibák; -a közösségi médiában alkalmazott rövidítések, emotikonok; -régi(es) szövegek; -versek, dalszövegek.
Szükséges perifériák
Egér , Billentyűzet , Kijelző
A technológia magyarázata
A rendszer egybegyűjti, egy egységes láncba integrálja és közzéteszi az elemzési lépéseket megvalósító számítógépes magyar nyelvfeldolgozó eszközöket. Az eszközök közül néhány szabályalapú, de nagy részük gépi tanuláson alapul. Fontos szempont az interoperabilitás, vagyis az egyes eszközök közötti átjárhatóság megteremtése.
Mi ebben az MI?
Az elemzőláncba kötött eszközök közül néhány szabályalapú, de nagy részük gépi tanuláson alapul. A modellek a magyarra elérhető legnagyobb gold standard minőségű szöveghalmazokon lettek betanítva.