Minden nap rá tudok csodálkozni arra, hogy milyen nagyszerű, ha egy technikai eszköz ki tudja javítani a helyesírási hibáit annak a szövegnek, amit leírok. A csodán túl viszont érdemes föltenni a kérdést, hogy miért van szükség a digitális szövegalkotó eszközökben (például a szövegszerkesztőkben, a levelező rendszerekben, a böngészőkben stb.) nyelvi ellenőrző rendszerre?

A digitális, azaz jellemzően billentyű útján történő szövegbevitel nem természetes az emberek számára, hisz senki sem tanul így írni az iskolában. Mindenkit tollal, papíron tanítanak írni, olvasni. Ez alól persze kivételt képeznek, a professzionális gépírók, akik külön tanfolyamon, iskolában tanulnak meg tíz ujjal, vakon gépelni, ezzel szemben a legtöbben csak saját magunk, külső segítség nélkül, gyakorlás útján tanulják meg a billentyűzet kezelését. Így mivel a klaviatúra használata új közeg, olyan hibákat is elkövetünk a használata során, amelyeket kézírással nem szoktunk. Minderre rárakódnak a tudáshiányból vagy figyelemhiányból fakadó helyesírási, nyelvhelyességi hibák, amelyek a hagyományos kézírásunk során is előfordulnának.

Image: Arvind Balaraman / FreeDigitalPhotos.net

Ezek az okok arra ösztökélik a szövegszerkesztők és egyéb, szövegbevitelre használható alkalmazások fejlesztőit, hogy az írást, a digitális szövegbevitelt segítő, a számítógépes környezet, illetve akár a felhasználó sajátosságaihoz alkalmazkodó nyelvhelyességi segédeszközöket fejlesszenek. Ezeknek az eszközöknek több típusa létezik, nem érdemes összekeverni őket, hisz vannak egyszerű behelyettesítésen alapuló, típushibákat figyelő, nagyon egyszerű eszközök. Ezek nem igazi nyelvi segédeszközök, hisz csak arra tudnak figyelni, hogy például ha egy szónak nemcsak az első betűje nagy, hanem az első kettő, akkor azt kijavítja. Ezt a javítólistát szerintem már minden szövegszerkesztőt használó személy megnézegette.

Image: healingdream / FreeDigitalPhotos.net

Érdemesebb a valódi nyelvi segédeszközökről beszélni. Látszólag nagyon egyszerű volna, ha az előző típushoz hasonlóan minden jellemzően előforduló eltérést, hibát egy listába foglalnák, és az eszköz valós időben figyelné az eltéréseket, és minden általa hibásnak vélt alakot kicserélne a listában szereplő helyesre. Több hibája is van ennek a koncepciónak. A nyelv ugyanis nagyon rugalmas, kreatívan használható, viszonylag bonyolult rendszer, ezért egy ilyen statikus lista vélhetően nagyobb károkat okozna, mint amennyit segítene. Arról nem is beszélve, hogy még a mai hardverek világában is lelassítaná a rendszert ez a megoldás.

Emiatt szükségképpen a következő megoldást alkalmazzák. Nyelvészekből és programozókból álló csoportok modellezik az adott nyelvet, annak elsősorban az alaktani, morfológiai, grammatikai rendszerét, és az aktuális szóalakokat a nyelvi modellen alapuló bonyolult algoritmusok elemzik, és valószínűsítik, hogy milyen morfémákból, milyen szóalaknak kell az adott helyen szerepelnie. Ha ettől eltérés van, akkor a rendszer megoldást javasol. A magyar nyelv a digitális nyelvi modellezés szempontjából túlzottan bonyolult, így a fejlesztőknek komoly nehézségeket kell megoldaniuk.

Csak néhány, igen egyszerű példával világítom meg a helyzetet. Nem mindig könnyű eldönteni, mi minősül önálló szónak. Első megközelítésben mindenki azt mondaná, hogy az minősül önálló szónak, ami előtt és ami után szóköz van. Ez sok esetben igaz lehet, ám mi van az igekötőkkel, ha ige után állnak, vagy ha beékelődik közé és az ige közé egy harmadik szó? Akkor a helyesírási szabályok szerint külön kell írni, de ettől az igekötő nem lesz önálló szó. Ugyanígy viselkedik a névutó is, azt is külön írjuk, és mégsem önálló szó. De itt van az a rengeteg szótőváltozat, hogy csak a legegyszerűbbet említsem: a víz toldalék nélkül hosszú í-vel szerepel, de ha tárgy ragot kap, akkor lerövidül a belső magánhangzó: víz + et = vizet. Arról nem is beszélve, hogy a tárgy ragjának az alakja: -t, ám itt mégis -et alakban szerepel. Ezek a problémák az elemi helyesírást ismerők számára nem okoznak nehézséget, ám a számítógép nem jár iskolába, ő algoritmusok alapján működik, a fejlesztők pedig igyekeznek minél tökéletesebb számítógépes nyelvi modellt alkotni gépeink számára.

Bódi Zoltán