e-magyar.hu: digitális nyelvfeldolgozó rendszer
23/08/2019
MTA Nyelvtudományi Intézet
About the fun technologie
Az e-magyar rendszer az emberi intelligenciát igénylő szövegolvasási, szövegértési feladat alapvető, kezdeti lépéseit automatikusan valósítja meg: a szöveg nyelvi jellemzőit automatikus módon fedi fel, teszi explicitté. Egy tetszőleges szövegrészt feldolgozva megtudjuk az egyes szavak szófaját, szótövét, alaktani (morfológiai) elemzését, a mondatok kétféle mondattani (szintaktikai) elemzését, megkapjuk a főnévi csoportokat és a tulajdonneveket. Az online felületen ezek az elemzési szintek többféleképpen is vizualizálódnak.
What should you try?
Az e-magyar.hu rendszer jelenleg az alábbi szövegfeldolgozási feladatokat valósítja meg: -szavakra és mondatokra bontás; -morfológiai elemzés; -szótövezés; -morfológiai egyértelműsítés; -függőségi mondatelemzés; -összetevős mondatelemzés; -főnévi csoportok felismerése; -tulajdonnév-felismerés. A feladatoknak ez a sorrendje a nyelv szintjeit, valamint a feldolgozás nehézségét is követi. A rendszer minden nyelvi egységhez képes elemzést adni, de vannak korlátai, így a nem szabványos nyelvi elemek esetében valószínűleg kevésbé pontos elemzést ad, mint például: -elírások, helyesírási hibák; -a közösségi médiában alkalmazott rövidítések, emotikonok; -régi(es) szövegek; -versek, dalszövegek.
Required peripheries
Mouse , Keyboard , Display
Explaining the tech
A rendszer egybegyűjti, egy egységes láncba integrálja és közzéteszi az elemzési lépéseket megvalósító számítógépes magyar nyelvfeldolgozó eszközöket. Az eszközök közül néhány szabályalapú, de nagy részük gépi tanuláson alapul. Fontos szempont az interoperabilitás, vagyis az egyes eszközök közötti átjárhatóság megteremtése.
What is the AI relevance here?
Az elemzőláncba kötött eszközök közül néhány szabályalapú, de nagy részük gépi tanuláson alapul. A modellek a magyarra elérhető legnagyobb gold standard minőségű szöveghalmazokon lettek betanítva.