Helyesírás-ellenőrző programok versenye
Dömötör Andrea, a Pázmány Péter Katolikus Egyetem Nyelvtudományi Doktori Iskolájának hallgatója nemcsak a gépi fordítókat versenyeztette egymással, de tesztnek vetette alá legismertebb és leghasználtabb helyesírás-ellenőrző programjainkat is. Aki írt valaha is szöveget számítógépen, biztosan igénybe vette ezeket az alkalmazásokat, s ha nem, erősen javasoljuk – persze gondolkodni nem tudnak helyettünk. Lássuk, mit eredményezett a teszt.
Mielőtt eredményt hirdetnénk (és ítéletet mondanánk), nem árt végiggondolni, mire lehet képes egy gépi helyesírás-ellenőrző, illetve hogy mire szeretnénk valójában használni. Az biztos, hogy a számítógépnek nem lehet úgy megtanítani a helyesírási szabályzatot, ahogy azt egy ember ismeri és használja, hiszen mit kezdhetne például a kiejtésre vagy a jelentésváltozásra vonatkozó szabályokkal? Számára a begépelt szó nem jelent többet egy számsornál, és sosem hallotta azt kiejtve. Az elütéseket és az egyszerű hibákat a szótár alapján szűrik a rendszerek, és matematikai módszerrel keresnek a leírt alakhoz közeli, a szótárban megtalálható javaslatot. A szó szintjén nem felismerhető hibákat viszont, mint például az egyeztetés vagy az összetett szavak helyesírása, nagyon nehéz gépi eszközökkel kezelni. Ilyen esetekben már a nyelvi elemző erősségén múlik a hibajavítás sikeressége.
A versenyben két szövegszerkesztő, egy internetes helyesírási szótár és egy helyesírási tanácsadó portál vett részt. A népszerű Microsoft Word helyesírás-ellenőrzőjének alapja a Morphologic által fejlesztett Helyesek elnevezésű programcsomag. Vetélytársa a Google Chrome, Firefox és a Libre Office által is használt Hunspell nevű szabad szoftver. Emellett versenyeztettük még az MTA weboldalát, a helyesiras.mta.hu-t és a legnagyobb magyarországi helyesírási adatbázist, a magyarhelyesiras.hu-t, bár ez utóbbi nincs egészen azonos súlycsoportban a többiekkel, hiszen csak szótár, nincs elemzőrendszere.
A teszt négy feladattípusból állt, ebből három – mind embernek, mind gépnek – kifejezetten nehéznek mondható. Az ellenőrzőknek dönteniük kellett összetett szavak kötőjeles vagy egybeírásáról, javítaniuk kellett földrajzi neveket és azok -i-képzős alakjait, alkalmazniuk kellett toldalékolási és mássalhangzó-egyszerűsítési szabályokat, illetve hosszú és rövid magánhangzók között kellett választaniuk. A felismert és javított szavakért 1 pontot kaptak a versenyzők, ha jót javítottak rosszra, -1-et, ha nem volt reakció, 0-t, ha pedig felismerték, hogy az alak hibás, de nem adtak rá javaslatot, akkor fél pontot.
Rovatunk keretei nem engedik meg, hogy részletesen ismertessük a teszt eredményeit – de elolvashatják őket az anyanyelvapolo.hu Helyesírás-ellenőrző programok versenye cikkében. A verseny a teljesség igénye nélkül készült, és inkább játék, mint reprezentatív teszt, de a legfontosabb tanulság így is jól látható: egyik rendszer sem gondolkodik helyettünk. Bár az egyszerű és tipikus hibákat mindegyik program jól kezelte, a bonyolultabb problémákat már nem bízhatjuk egészen a gépre. A piros aláhúzás jelzés: nézzük meg még egyszer, mit írtunk, gondoljuk át, helyes-e így, és ha kell, nézzünk utána. Üssük fel például A magyar helyesírás szabályait.
Az eredeti adás 2018. febr. 28-án hangzott el a Kolozsvári Rádióban.