Szolgáltató adatai Help Sales ÁSZF Panaszkezelés DSA

A helyesírás-ellenőrzők nehézségei

Minden nap rá tudok csodálkozni arra, hogy milyen nagyszerű, ha egy technikai eszköz ki tudja javítani a helyesírási hibáit annak a szövegnek, amit leírok. A csodán túl viszont érdemes föltenni a kérdést, hogy miért van szükség a digitális szövegalkotó eszközökben (például a szövegszerkesztőkben, a levelező rendszerekben, a böngészőkben stb.) nyelvi ellenőrző rendszerre?

A digitális, azaz jellemzően billentyű útján történő szövegbevitel nem természetes az emberek számára, hisz senki sem tanul így írni az iskolában. Mindenkit tollal, papíron tanítanak írni, olvasni. Ez alól persze kivételt képeznek, a professzionális gépírók, akik külön tanfolyamon, iskolában tanulnak meg tíz ujjal, vakon gépelni, ezzel szemben a legtöbben csak saját magunk, külső segítség nélkül, gyakorlás útján tanulják meg a billentyűzet kezelését. Így mivel a klaviatúra használata új közeg, olyan hibákat is elkövetünk a használata során, amelyeket kézírással nem szoktunk. Minderre rárakódnak a tudáshiányból vagy figyelemhiányból fakadó helyesírási, nyelvhelyességi hibák, amelyek a hagyományos kézírásunk során is előfordulnának.

Image: Arvind Balaraman / FreeDigitalPhotos.net

Ezek az okok arra ösztökélik a szövegszerkesztők és egyéb, szövegbevitelre használható alkalmazások fejlesztőit, hogy az írást, a digitális szövegbevitelt segítő, a számítógépes környezet, illetve akár a felhasználó sajátosságaihoz alkalmazkodó nyelvhelyességi segédeszközöket fejlesszenek. Ezeknek az eszközöknek több típusa létezik, nem érdemes összekeverni őket, hisz vannak egyszerű behelyettesítésen alapuló, típushibákat figyelő, nagyon egyszerű eszközök. Ezek nem igazi nyelvi segédeszközök, hisz csak arra tudnak figyelni, hogy például ha egy szónak nemcsak az első betűje nagy, hanem az első kettő, akkor azt kijavítja. Ezt a javítólistát szerintem már minden szövegszerkesztőt használó személy megnézegette.

Image: healingdream / FreeDigitalPhotos.net

Érdemesebb a valódi nyelvi segédeszközökről beszélni. Látszólag nagyon egyszerű volna, ha az előző típushoz hasonlóan minden jellemzően előforduló eltérést, hibát egy listába foglalnák, és az eszköz valós időben figyelné az eltéréseket, és minden általa hibásnak vélt alakot kicserélne a listában szereplő helyesre. Több hibája is van ennek a koncepciónak. A nyelv ugyanis nagyon rugalmas, kreatívan használható, viszonylag bonyolult rendszer, ezért egy ilyen statikus lista vélhetően nagyobb károkat okozna, mint amennyit segítene. Arról nem is beszélve, hogy még a mai hardverek világában is lelassítaná a rendszert ez a megoldás.

Emiatt szükségképpen a következő megoldást alkalmazzák. Nyelvészekből és programozókból álló csoportok modellezik az adott nyelvet, annak elsősorban az alaktani, morfológiai, grammatikai rendszerét, és az aktuális szóalakokat a nyelvi modellen alapuló bonyolult algoritmusok elemzik, és valószínűsítik, hogy milyen morfémákból, milyen szóalaknak kell az adott helyen szerepelnie. Ha ettől eltérés van, akkor a rendszer megoldást javasol. A magyar nyelv a digitális nyelvi modellezés szempontjából túlzottan bonyolult, így a fejlesztőknek komoly nehézségeket kell megoldaniuk.

Csak néhány, igen egyszerű példával világítom meg a helyzetet. Nem mindig könnyű eldönteni, mi minősül önálló szónak. Első megközelítésben mindenki azt mondaná, hogy az minősül önálló szónak, ami előtt és ami után szóköz van. Ez sok esetben igaz lehet, ám mi van az igekötőkkel, ha ige után állnak, vagy ha beékelődik közé és az ige közé egy harmadik szó? Akkor a helyesírási szabályok szerint külön kell írni, de ettől az igekötő nem lesz önálló szó. Ugyanígy viselkedik a névutó is, azt is külön írjuk, és mégsem önálló szó. De itt van az a rengeteg szótőváltozat, hogy csak a legegyszerűbbet említsem: a víz toldalék nélkül hosszú í-vel szerepel, de ha tárgy ragot kap, akkor lerövidül a belső magánhangzó: víz + et = vizet. Arról nem is beszélve, hogy a tárgy ragjának az alakja: -t, ám itt mégis -et alakban szerepel. Ezek a problémák az elemi helyesírást ismerők számára nem okoznak nehézséget, ám a számítógép nem jár iskolába, ő algoritmusok alapján működik, a fejlesztők pedig igyekeznek minél tökéletesebb számítógépes nyelvi modellt alkotni gépeink számára.

Bódi Zoltán

1 Tovább

Szoftvertipp - egyszerű szövegszerkesztők

Egy ideje azon kaptam rajta magamat, hogy szinte mindenre egyszerű szövegszerkesztőt használok. Blogbejegyzés, elemzés, cikk vagy egy feljegyzés, mind egy faék egyszerűségű programmal készül. Hihetetlenül megdobja az ember alkotóképességét egy olyan alkalmazás, amit nagyon gyorsan be lehet lakni, és nem vonja el a figyelmet mindenféle sallanggal magáról az alkotásról. Az operációs rendszerekhez járó megoldások, finoman szólva sem kényeztetik el a felhasználókat. Az alternatívák szinte végtelenül sorjáznak, viszont a könnyen használható, nyílt forráskódú és a sok formátumot támogató hármasból általában csak kettő választható. Pedig van olyan szoftver, ami mindhárom feltételt teljesíti. Ez a lista nálam csak két programot számlál, egyet GNU/Linux rendszerre, egyet pedig Windows-ra. Szubjektív kedvencek következnek.

Gedit - GNU/Linux (Gnome)

Mindig is irigykedve néztem, hogy mennyire hatékonyan lehet programozni a TextMate névre hallgató programmal. Mivel sok kódot írok, így én is kerestem már egy ideje a nekem legjobban kézre eső megoldást. Szerelemebe is estem néhánnyal hosszabb-rövidebb időre. Aztán a mézeshetek elmúltával jött a kijózanodás. Nem ritkán túl hamar is.

Majd rátaláltam az új szerelmemre a Gnome beépített szerkesztőjére a gedit-re.

Persze aki ismeri a programot az teljes joggal kiálthat fel, hogy nekem elmentek otthonról!

Nos nem egészen. Csak a gedit olyan mint a békakirály. Homlokon kell csókolni néhány plug-in-nel és a gmate kiegészítővel. Erre az átváltozik egy szempillantás alatt egy TextMate klónná. Te is megteheted a varázslatot kevesebb mint egy perc alatt.

a gedit akcióban

 

Szokás szerint az Ubuntu receptet közlöm amit a terminál ablakból kell megfőzni:

sudo apt-get install gedit gedit-plugins
cd ~/Downloads
git clone http://github.com/gmate/gmate.git
cd gmate
sh ./install.sh

Ennyi is volt. Legközelebb amikor a gedit programot elindítjuk akkor nem csak a kinézete változik meg a programunknak de funkcióiban is egy jelentősen kibővült olyan szerkesztővel állunk majd szemben, amiről mindig is álmodtunk. A még jobb testreszabhatóság érdekében érdemes körülnézni az Edit > Preferences > Plugins menük tájékán és engedélyezni mindazokat a kiegészítőket melyekre nekünk szükségünk lehet.

Notepad++ - Windows

A Windows felhasználóknak sem kell elkeseredniük, nekik ott van a Notepad++, amit innen letölthet bárki. Ha valaminek, akkor ennek a programnak ott a helye azon alkalmazások között, amit egyetlen egy felhasználó sem nélkülözhet. Az egyszerű tennivaló listáktól, a gyors feljegyzéseken át a nehézsúlyú felhasználásig (pl. programozás), mindenre lehet használni, ami a szövegkezeléssel kapcsolatos.

Notepad++ képernyőkép

 

Természetesen ez a program is nyílt forráskódú és nagyon könnyen használható.

3 Tovább

Netidők Blogtársaság

blogavatar

Digitális talkshow írásban is. Itt a Netidők! Ez a Netidők c. rádióműsor (Petőfi Rádió) blogja. Mindaz, ami elhangzik az adásban, meg ami nem.

Utolsó kommentek