e-magyar.hu: digitális nyelvfeldolgozó rendszer

  23/08/2019       MTA Nyelvtudományi Intézet    

About the fun technologie

Az e-magyar rendszer az emberi intelligenciát igénylő szövegolvasási, szövegértési feladat alapvető, kezdeti lépéseit automatikusan valósítja meg: a szöveg nyelvi jellemzőit automatikus módon fedi fel, teszi explicitté. Egy tetszőleges szövegrészt feldolgozva megtudjuk az egyes szavak szófaját, szótövét, alaktani (morfológiai) elemzését, a mondatok kétféle mondattani (szintaktikai) elemzését, megkapjuk a főnévi csoportokat és a tulajdonneveket. Az online felületen ezek az elemzési szintek többféleképpen is vizualizálódnak.

What should you try?

Az e-magyar.hu rendszer jelenleg az alábbi szövegfeldolgozási feladatokat valósítja meg: -szavakra és mondatokra bontás; -morfológiai elemzés; -szótövezés; -morfológiai egyértelműsítés; -függőségi mondatelemzés; -összetevős mondatelemzés; -főnévi csoportok felismerése; -tulajdonnév-felismerés. A feladatoknak ez a sorrendje a nyelv szintjeit, valamint a feldolgozás nehézségét is követi. A rendszer minden nyelvi egységhez képes elemzést adni, de vannak korlátai, így a nem szabványos nyelvi elemek esetében valószínűleg kevésbé pontos elemzést ad, mint például: -elírások, helyesírási hibák; -a közösségi médiában alkalmazott rövidítések, emotikonok; -régi(es) szövegek; -versek, dalszövegek.

Required peripheries

Mouse , Keyboard , Display

Explaining the tech

A rendszer egybegyűjti, egy egységes láncba integrálja és közzéteszi az elemzési lépéseket megvalósító számítógépes magyar nyelvfeldolgozó eszközöket. Az eszközök közül néhány szabályalapú, de nagy részük gépi tanuláson alapul. Fontos szempont az interoperabilitás, vagyis az egyes eszközök közötti átjárhatóság megteremtése.

What is the AI relevance here?

Az elemzőláncba kötött eszközök közül néhány szabályalapú, de nagy részük gépi tanuláson alapul. A modellek a magyarra elérhető legnagyobb gold standard minőségű szöveghalmazokon lettek betanítva.

Let's try it! 
Owner of the technology
MTA Nyelvtudományi Intézet
What type of AI is used by the technology?
Természetes szöveg feldolgozás
Applied solution
Általános bemutató
Area of ​​use
Software and Internet
Direct uses
Mindenféle magyasabb szintű szövegfeldolgozáshoz, illetve nyelvtechnológiai feladathoz ezek jelentik a kezdeti lépéseket. Ezenfelül használják még: -irodalmi, stilometriai kutatásokhoz; -jogi szövegek automatikus feldolgozásához; -menetrend- és utazástervező szolgáltatásokhoz.
Indirect uses
Minden olyan feladathoz, amiben szöveges bemenetet kell valamilyen szinten feldolgozni és a benne impliciten megtalálható információkat explicitté tenni, pl. információkinyerés, szövegbányászat, gépi fordítás stb.
Business function
Research and development
Date of creating tech
01/11/2016