Szolgáltató adatai Help Sales ÁSZF Panaszkezelés DSA

A helyesírás-ellenőrzők nehézségei

Minden nap rá tudok csodálkozni arra, hogy milyen nagyszerű, ha egy technikai eszköz ki tudja javítani a helyesírási hibáit annak a szövegnek, amit leírok. A csodán túl viszont érdemes föltenni a kérdést, hogy miért van szükség a digitális szövegalkotó eszközökben (például a szövegszerkesztőkben, a levelező rendszerekben, a böngészőkben stb.) nyelvi ellenőrző rendszerre?

A digitális, azaz jellemzően billentyű útján történő szövegbevitel nem természetes az emberek számára, hisz senki sem tanul így írni az iskolában. Mindenkit tollal, papíron tanítanak írni, olvasni. Ez alól persze kivételt képeznek, a professzionális gépírók, akik külön tanfolyamon, iskolában tanulnak meg tíz ujjal, vakon gépelni, ezzel szemben a legtöbben csak saját magunk, külső segítség nélkül, gyakorlás útján tanulják meg a billentyűzet kezelését. Így mivel a klaviatúra használata új közeg, olyan hibákat is elkövetünk a használata során, amelyeket kézírással nem szoktunk. Minderre rárakódnak a tudáshiányból vagy figyelemhiányból fakadó helyesírási, nyelvhelyességi hibák, amelyek a hagyományos kézírásunk során is előfordulnának.

Image: Arvind Balaraman / FreeDigitalPhotos.net

Ezek az okok arra ösztökélik a szövegszerkesztők és egyéb, szövegbevitelre használható alkalmazások fejlesztőit, hogy az írást, a digitális szövegbevitelt segítő, a számítógépes környezet, illetve akár a felhasználó sajátosságaihoz alkalmazkodó nyelvhelyességi segédeszközöket fejlesszenek. Ezeknek az eszközöknek több típusa létezik, nem érdemes összekeverni őket, hisz vannak egyszerű behelyettesítésen alapuló, típushibákat figyelő, nagyon egyszerű eszközök. Ezek nem igazi nyelvi segédeszközök, hisz csak arra tudnak figyelni, hogy például ha egy szónak nemcsak az első betűje nagy, hanem az első kettő, akkor azt kijavítja. Ezt a javítólistát szerintem már minden szövegszerkesztőt használó személy megnézegette.

Image: healingdream / FreeDigitalPhotos.net

Érdemesebb a valódi nyelvi segédeszközökről beszélni. Látszólag nagyon egyszerű volna, ha az előző típushoz hasonlóan minden jellemzően előforduló eltérést, hibát egy listába foglalnák, és az eszköz valós időben figyelné az eltéréseket, és minden általa hibásnak vélt alakot kicserélne a listában szereplő helyesre. Több hibája is van ennek a koncepciónak. A nyelv ugyanis nagyon rugalmas, kreatívan használható, viszonylag bonyolult rendszer, ezért egy ilyen statikus lista vélhetően nagyobb károkat okozna, mint amennyit segítene. Arról nem is beszélve, hogy még a mai hardverek világában is lelassítaná a rendszert ez a megoldás.

Emiatt szükségképpen a következő megoldást alkalmazzák. Nyelvészekből és programozókból álló csoportok modellezik az adott nyelvet, annak elsősorban az alaktani, morfológiai, grammatikai rendszerét, és az aktuális szóalakokat a nyelvi modellen alapuló bonyolult algoritmusok elemzik, és valószínűsítik, hogy milyen morfémákból, milyen szóalaknak kell az adott helyen szerepelnie. Ha ettől eltérés van, akkor a rendszer megoldást javasol. A magyar nyelv a digitális nyelvi modellezés szempontjából túlzottan bonyolult, így a fejlesztőknek komoly nehézségeket kell megoldaniuk.

Csak néhány, igen egyszerű példával világítom meg a helyzetet. Nem mindig könnyű eldönteni, mi minősül önálló szónak. Első megközelítésben mindenki azt mondaná, hogy az minősül önálló szónak, ami előtt és ami után szóköz van. Ez sok esetben igaz lehet, ám mi van az igekötőkkel, ha ige után állnak, vagy ha beékelődik közé és az ige közé egy harmadik szó? Akkor a helyesírási szabályok szerint külön kell írni, de ettől az igekötő nem lesz önálló szó. Ugyanígy viselkedik a névutó is, azt is külön írjuk, és mégsem önálló szó. De itt van az a rengeteg szótőváltozat, hogy csak a legegyszerűbbet említsem: a víz toldalék nélkül hosszú í-vel szerepel, de ha tárgy ragot kap, akkor lerövidül a belső magánhangzó: víz + et = vizet. Arról nem is beszélve, hogy a tárgy ragjának az alakja: -t, ám itt mégis -et alakban szerepel. Ezek a problémák az elemi helyesírást ismerők számára nem okoznak nehézséget, ám a számítógép nem jár iskolába, ő algoritmusok alapján működik, a fejlesztők pedig igyekeznek minél tökéletesebb számítógépes nyelvi modellt alkotni gépeink számára.

Bódi Zoltán

1 Tovább

Csizma az asztalon, avagy fonetika és kódtörés?

Csizma az asztalon, avagy fonetika és kódtörés?

Feltörték a Skype beszélgetések titkosítását, szólt a hír 2011 júniusának első napjaiban. A szenzációnak számító kódtörésnek az az érdekessége, hogy a titkosítási kódot nem is fejtették vissza, hanem - a hír szerint - a beszélgetésben elhangzó szöveg hangállományához tartozó adatcsomagok nagysága alapján fejtették vissza a hangzó beszédet. Tehát nem klasszikus kódtörésről van szó, hanem fonológiai, fonetikai elemzésről. A hírhez az is hozzátartozik, hogy egyelőre csak az angol nyelvre működik a rendszer. További érdekesség, hogy nyelvészeti, tehát tudományos módszerekkel rekonstruálták a titkosított VoIP beszélgetések hangzását a University of North Carolina kutatói, Andrew M. White, Austin R. Matthews, Kevin Z. Snow és Fabian Monrose (a teljes tanulmány itt olvasható: http://www.cs.unc.edu/~amw/resources/hooktonfoniks.pdf).

 


Image: digitalart / FreeDigitalPhotos.net

 

Ez a módszer ráirányítja a figyelmet a hangzó beszéd számítógépes vizsgálatára. A nyelvtudománynak a beszéddel, a hangzással foglalkozó ága a fonetika, ami a beszédhangok, illetve a beszéd hangtani, akusztikus sajátosságait vizsgálja. Pontosabban a beszédhangok fonetikai típusait, képzésbeli jellemzőit, a magán- és mássalhangzók jellemzőit, típusait vizsgálja, igyekszik megismerni és leírni a beszédhangok beszéd közbeni módosulásait. Másrészt a hangzó szöveg intonációját, tempóját, hangerejét, nyomatékviszonyait, dallamát, tehát összefoglalva a prozódiai jellemzőit vizsgálja.


A hangzással foglalkozó másik nyelvtudományi ág a fonológia, ami a beszédhangok, fonémák minőségén túl azok grammatikai szerepét kutatja.

Világos, hogy a fonetika és a fonológia nem létezhet műszeres mérések és gépi adatfeldolgozás nélkül. Annál is inkább fontos ez, mert az élő beszéd akusztikai, fonetikai jellemzőinek leírásakor olyan adatokat kell megfigyelni, amelyet az emberi fül nem képes pontosan észlelni, és ráadásul a statisztikai elemzés számára számszerűsíteni is kell ezeket az adatokat. Például mi alapján lehet objektíven bebizonyítani, hogy valakinek mekkora a beszédtempója? Meg kell mérni, és itt már a milliszekundumos nagyságrend körében vagyunk. Tehát a mérőműszerek használata, a mérési eredmények statisztikai, matematikai elemzése és feldolgozása mindig is része volt a fonetikai kutatásoknak.

A modern számítógépes nyelvi elemző eszközök világában viszont nagy tömegű, informatikai rendszerek segítségével produkált, digitális formátumú beszédfolyamok mintázatainak, visszatérő állandó tulajdonságainak az elemzésére is lehetőség nyílik. Ez is szükséges volt ahhoz, hogy nyelvészekből és a VoIP rendszerek informatikai tulajdonságait jól ismerő informatikusokból álló munkacsoport meg tudja fejteni fonetikai elemzéssel és következtetéssel az angol nyelvű titkosított VoIP szövegfolyamok hangállományát.

 

Bódi Zoltán 

 

| Még több lehetőség

0 Tovább

Áram nélkül a fővárosban

Egy barátom olyan lakásba költözött a budapesti belváros közepén, ahonnan a szolgáltató kikötötte az áramot és egy pereskedés miatt az egyelőre nem is kapcsolható vissza. Elgondolkodtam, hogy vajon milyen hatással lehet az ember életére, ha egy ilyen fontos közmű nélkül kell élnie.

Először is szögezzük le, hogy szerencsére meleg víz és fűtés van a lakásban, ezeket nem kapcsolták ki, tehát „csak” az áramot kell nélkülözni. Vegyük számba, hogy mit jelent ez. Először is, nincs világítás, tehát minden olyan helyiségben, ahol nincs ablak, csak ajtó, szinte mindig félhomály vagy teljesen sötét van (pl. fürdő, WC, kamra). Az ezekhez a helyekhez kapcsolódó tevékenységeket sötétben vagy zseblámpa mellett kell végezni. De így sem használható a mosógép, a villanyborotva, a hajszárító vagy a hősugárzó. Azokban a helyiségekben, ahol van ablak, napközben javarészt nélkülözhető az áram, ha a tevékenységünk nem igényel elektromos készüléket. Főzni például leginkább nappal lehet, amikor kint világos van, viszont így sem tudjuk használni a konyhában a mikrohullámú sütőt, az elektromos vízforralót, az árammal működő kávéfőzőt és nincs hűtő sem. A nappaliban nem lehet tévézni, az elemes zsebrádió vagy a máshol (például munkahelyen) feltöltött mp3 lejátszó viszont használható – amíg le nem merül. Ha besötétedik és olyasmit akarunk csinálni, amihez fény kell – például olvasni szeretnénk – akkor gyertyát vagy zseblámpát tudunk használni.

Mi a helyzet az információs és kommunikációs technológiák használatával? 10-15 évvel ezelőtt igazán gondban lettünk volna, ha áram nélkül szerettünk volna számítógépet használni és azon internetezni. Ma már viszont egy naponta a munkahelyen (vagy máshol) feltölthető laptoppal és mobiltelefonnal (vagy mobil stick-kel) akár fél napot is lehet otthon internetezni, anélkül, hogy rászorulnánk a 220-ra. Tehát minden este ülhetünk a gyertyafényes szobában és közben olvashatjuk a postr blogposztjait vagy böngészgethetünk az interneten.

Ahogy azonban a fentiekből kitűnhet, elég sok mindenről le kell mondanunk áram nélkül. Bár nem lehetetlen így élni, de sokkal inkább kötve vagyunk a nappalok és éjszakák váltakozásához, mint ahogy azt megszoktuk. Az áram hiánya egyaránt rányomja a bélyegét a tevékenységeinkre és az időbeosztásunkra (a napi rutinra), annak tervezhetőségére.

Persze ne higgyük, hogy áram nélkül élni kuriózum lenne – legfeljebb a magyar főváros közepén számít annak. Ha belegondolunk több ember élt áram nélkül a világtörténelemben, mint árammal és jelenleg is csak a fejlett világban ennyire kézenfekvő a folyamatos áramszolgáltatás a lakásokban (bár Magyarországon is tízezrek élnek áram nélkül, főleg tanyákon). Végeredményben tehát civilizációs függésről van szó, csak legtöbbször ezt nem vesszük észre, mivel az áram olyan közmű, amit természetesnek tekintünk – és véleményem szerint ez így is van jól. Sokkal inkább szemet szúr viszont a csak mostanában közművé váló infokom szolgáltatásoktól való függésünk és sokan szeretnek is szörnyülködni afelett, hogy egyesek „nem tudnak mobiltelefon vagy internet nélkül élni”. Nekik azt javaslom, hogy próbáljanak meg áram nélkül boldogulni néhány napig és rá fognak ébredni, hogy ők is ugyanúgy függők, csak ennek nincsenek tudatában.

Pintér Robesz

0 Tovább

Mennyire okosak a magyar városok?

Veszprémben mutatták be az MTA Regionális Kutatások Központjának Nyugat-magyarországi Intézete Okos városok (Smart cities) címmel készült tanulmányát. Az IBM Magyarország megbízásából folytatott kutatás lehetőséget adott rá, hogy az Akadémia szakértői átfogó felmérést készítsenek kilenc vidéki magyar város fejlettségéről, innovációs adottságairól, hatékonyságukról erőforrásaik felhasználásában. A tanulmány megállapításai nyomán számos konkrét lehetőség körvonalazódott a hatékony városüzemeltetéstől az intelligens közlekedés-irányítási megoldásokon át a mobil technológiákon alapuló turistairányító rendszerekig. A városok „okos” projektterveikhez EU-s és kormányzati forrásokért is pályázhatnak. A műsorban Pongrácz Ferenctől, az IBM operatív igazgatójától érdeklődtem, hogy mi a helyzet Magyarországon.

Szilágyi Árpád: Mit jelent az, hogy okos város?

Pongrácz Ferenc: Azt jelenti, hogy használjuk azokat az okos technológiákat, amik ma már elérhetők. Ezt úgy lehet elképzelni, mintha egy élőlénnyé válna a város. Vannak érzékszervei, ezek lehetnek telefonok, kamerák, mindenféle érzékelő eszközök. Aztán van egy idegrendszere, ezek mindenféle hálózatok, telefonhálózat, internet, a közlekedés. És van egy agya is.

Szilágyi Árpád: Ez utóbbi a város irányítását jelenti?

Pongrácz Ferenc: Azt jelenti, hogy azt a rengeteg információt ma már modern eszközökkel fel lehet dolgozni. Statisztikai elemzéseket lehet készíteni, előrejelzéseket lehet készíteni és aztán be lehet avatkozni a közlekedésbe és egy csomó területbe.

Szilágyi Árpád: Úgy hallottam, hogy létezik egy mérőszám, ami megmutatja, hogy ha megnézzük a város különböző jellemzőit, akkor hol tart mondjuk egy 10-es skálán az a bizonyos város.

Pongrácz Ferenc: Van egy kutatóintézetünk, ami eredetileg arra szakosodott, hogy javaslatokat tegyen befektetőknek, hogy hol érdemes a pénzüket kamatoztatni és ez a kutatóintézet kidolgozott egy módszertant arra, hogy mennyire okos egy város. Körülbelül négyszáz mutatószám van, például hogy mennyi az internetet használók aránya vagy száma a városban, közülük hányan használják a netet ügyintézésre. De vannak más mérőszámok is, például a hagyományosabbak: az egy főre eső GDP a városban, vagy az egy főre eső vízfogyasztás. Tehát rendkívül széles a mutatóknak a köre és két dimenzió mentén csoportosítjuk ezeket. Az egyik a városnak a szolgáltatásait fedi le, hogy mit nyújt az embereknek. A másik dimenzió meg négy kategóriától függ: költenek-e az adott területre a városban (ha nem költenek, akkor kisebb az esélye, hogy eredményes lesz az adott terület), a második kategória, hogy azt mennyire logikusan, struktúráltan teszik, egy stratégia mentén, a harmadik szól az informatikáról, azaz, hogy a modern rendszereket mennyire használják és az utolsó, hogy ennek mi az eredménye.

Szilágyi Árpád: Mit lehet mondani e számok alapján a magyar városokról?

Pongrácz Ferenc: Két felmérést is csináltunk. A részletes felmérésnél három magyar várost hasonlítottunk össze nyolc egyéb várossal, amelyek magyarok és nem magyarok. És volt egy másik felmérés, ahol kilenc magyar várost viszonyítottunk egymáshoz, nagyon hasonló módszertannal, bár ez egy kicsit kevésbé volt részletes. Azt lehet mondani, hogy egy 10-es skálán, hogy ha minden városnak kivennénk a legjobb gyakorlatát és egy elméleti legjobb várost építenénk ebből össze, akkor 8,3 pontot érne el.

Szilágyi Árpád: Tehát 10-es nem tud senki elérni?

Pongrácz Ferenc: Nem, az az elméleti maximum. A legjobb város a mérés alapján Stockholm, amely 7,4 pontot ért el. A magyar városok pedig 4,4 és 4,7 pont között vannak. Egyébként nem nagy különbség van a magyar városok között. Csehországban, pl. Brno körülbelül 5 pontot ér el.

Szilágyi Árpád: Ezek szerint nagyon le vagyunk maradva?

Pongrácz Ferenc: Igen.

Szilágyi Árpád: Lehet-e következtetni a magyar városok jelenlegi helyzetéből, ezt a fejlődési tempót követve, hogy mikor érik utol, egyáltalán utolérhetik-e Stockholmot valaha is?

Pongrácz Ferenc: Én optimista ember vagyok. Gyakran látjuk, hogy akik később lépnek be a technológiai fejlődésbe, azok nagyobbat tudnak ugrani. Volt erre a történelemben sok példa. Most lehetőségünk van arra, hogy amiket mások már jól megcsináltak, azokat mi viszonylag gyorsan adoptáljuk. Tehát én nem tartom kizártnak azt a forgatókönyvet se, hogy egy nagy ugrással akár élre is tudunk törni. Persze ehhez nagyon optimistának kell lenni…

Szilágyi Árpád

 

0 Tovább

Mit jelent a lájkolás?

A lájkolást mint új szóalakot már lassan megszokjuk, hisz olyan gyakran fordul elő. Ezt az idegen szóátvételt szabályosan, a megszokott módszerek szerint illesztettük be a nyelvünkbe. Az alakja azért tűnhet furcsának, mert ez a nyelvi változás most ment végbe, és még nyilvánvaló számunkra a szó idegen formája. Az –l beillesztő funkciójú igeképzővel nagyon sok idegen eredetű szót honosítottunk nyelvünk története során, csak a régi folyamatokról már nem nyilvánvaló, hogy idegen eredetű szó áll mögöttük, például így alkottuk a kapál, a kaszál igénket is.

A lájkolás szóalak formája azért praktikus, mert kijelöli a használati (pragmatikai) környezetét, mindenki számára egyértelmű, hogy lájkolni a Facebookon, a közösségi portálokon, a blogokon, tehát jellemzően a web kettes felületeken lehet. A lájkolás pontos jelentése azonban nem mindig egyértelmű, ennek a körvonalazásához számba kell venni a lehetséges kontextusait is.


Image: Master isolated images / FreeDigitalPhotos.net

 

A Facebookon jelent meg először a like vagy  magyarul a tetszik gomb, ami ennek a közösségi portálnak a kezdetén a bejelölt ismerőseinkkel kapcsolatos tetszésnyilvánítás kifejezésére szolgált, tehát hogy a feltöltött képek és egyéb információk tetszenek-e. A like gomb az igazi funkcióját az üzenőfal megjelenésével tölti be, hisz oda mindenki szinte bármilyen információt, képet, videót, hírt feltölthet, amiről az ismerősök megjelölhetik, hogy tetszik-e nekik. A Facebook mellett blogokon és egyéb internetes publikációs felületeken is egyre általánosabb a tetszésnyilvánító gombok különböző fajtája.


Ám nem minden információra lehet egyértelműen azt válaszolni, hogy tetszi-e. Például 2011. májusának utolsó napjaiban Mádl Ferenc volt köztársasági elnök halála kapcsán a Facebookon kialakult egy vita, hogy lehet-e az ezzel kapcsolatos információkat, részvétnyilvánításokat lájkolni vagy sem. Ebből kiderült, hogy nem mindenki számára egyértelmű, hogy a lájk ’tetszik’ gomb nem csak azt jelenti, hogy ’tetszik’, hanem általában azt is, hogy ’pozitív érzelmeket viseltetek az aktuális téma iránt’. Ez viszont adott esetben (egy halálhír kapcsán) ellentmond a lájkolás azaz a tetszésnyilvánítás alapjelentésének. A helyzet valóban félreérthető. Ebben az esetben a lájk jelentése ’részvétnyilvánítás’, illetve a részvétnyilvánítók tárborába való tartozásnak, a csoport-összetartozásnak a jelzése.

Velem történt meg, hogy egy állatkínzásról és az ellene való fellépésről szóló blogbejegyzést lájkoltam, és a kommentáromban úgy éreztem, meg kell magyarázni, miért tettem: hogy nem az állatkínzásról szóló alaphír tetszik, hanem az, hogy ezt a szörnyűséget a szerző megírta a blogjában, és a hasonló esetekkel szembeni fellépésre, összefogásra buzdított. Tehát itt a lájkolás jelentése ’együttérzés, szimpátia a pozitív erkölcsi értékekkel’.

A napokban olvastam a Facebook üzenőfalán, hogy az egyik ismerősöm azt írta, nagyon szomorú, mire egy másik ismerősöm lájkolta ezt a bejegyzést, melynek az lett az eredménye, hogy a szomorú személynek rögtön jobb kedve lett. Itt a lájkolás jelentése ’vigasztalás’, ’mosoly’, ’szimpátia’, ‘öröm’. A sort még sokáig lehetne folytatni.

Tehát a lájkolás alapjelentése világos, ám az aktuális jelentése csak a pontos szövegkörnyezetből azonosítható, és ez néha a látszólagos ellentmondások miatt félreértésekhez is vezethet, kis odafigyeléssel és empátiával viszont könnyen átlendülhetünk ezeken a félreértéseken.

 

Bódi Zoltán

 

| Még több lehetőség

3 Tovább

Netidők Blogtársaság

blogavatar

Digitális talkshow írásban is. Itt a Netidők! Ez a Netidők c. rádióműsor (Petőfi Rádió) blogja. Mindaz, ami elhangzik az adásban, meg ami nem.

Utolsó kommentek