Image: dan / FreeDigitalPhotos.net
Image: Simon Howden / FreeDigitalPhotos.net
Image: dan / FreeDigitalPhotos.net
Image: Simon Howden / FreeDigitalPhotos.net
Egyszerűen nem tudom elhinni, hogy az emberek képtelenek tanulni mások kárán. Hiába sulykolja mindenki évek óta, hogy ez így nem mehet tovább, rossz vége lesz, másképp kell csinálni. Szakértők évek óta azt javasolják, hogy a jelszavaink legyenek egyediek, véletlenszerűek és kiszámíthatatlanok, még ha ezeket magunknak is nehezebb megjegyeznünk. Hiába. Lassan tényleg elhiszem, hogy a Föld a Naprendszer bolondokháza.
Az iPhone-ra kifejlesztett Big Brother Camera Security nevű program készítői összegyűjtötték 200 000 felhasználójuk által megadott PIN-kódot (anonim módon pusztán csak azt, semmilyen más személyes adatot), és kielemezték jelszóadási szokásaikat.
Tizenvalahány év biztonsági könyörgése után az eredmény tragikus/elkeserítő/ijesztő/elképesztő. A leggyakrabban használt PIN-kód továbbra is az „1234”. A második helyről nem lehet leszorítani a „0000” kombinációt. A harmadik helyre került az a kombináció, amelyet azok használnak, akik semmilyen alakzatban nem tudnak elhelyezni négy számot. Ők a számsor egyetlen négyjegyű oszlopát használják, a középső „2580” kombinációt. A negyedik helyre került az elpusztíthatatlan 1111. Ezek után következtek a különböző évszámok, elsősorban az 1980 és 2000 közöttiek.
Nemrég a Sony szervereiről ellopott adatokon is elvégeztek egy ilyen elemzést. Mik a leggyakoribb jelszavak? "password", "123456", "abc123". Minden száz emberből csak egy használ olyan jelszót, amely valamelyest fejtörést okozna a rosszakaróknak.
Ezek után már nekem is az a véleményem, hogy csak azért nem vettük fel még a kapcsolatot a földönkívüli idegenekkel, mert nem találnak értelmes életet a Földön.
Minden nap rá tudok csodálkozni arra, hogy milyen nagyszerű, ha egy technikai eszköz ki tudja javítani a helyesírási hibáit annak a szövegnek, amit leírok. A csodán túl viszont érdemes föltenni a kérdést, hogy miért van szükség a digitális szövegalkotó eszközökben (például a szövegszerkesztőkben, a levelező rendszerekben, a böngészőkben stb.) nyelvi ellenőrző rendszerre?
A digitális, azaz jellemzően billentyű útján történő szövegbevitel nem természetes az emberek számára, hisz senki sem tanul így írni az iskolában. Mindenkit tollal, papíron tanítanak írni, olvasni. Ez alól persze kivételt képeznek, a professzionális gépírók, akik külön tanfolyamon, iskolában tanulnak meg tíz ujjal, vakon gépelni, ezzel szemben a legtöbben csak saját magunk, külső segítség nélkül, gyakorlás útján tanulják meg a billentyűzet kezelését. Így mivel a klaviatúra használata új közeg, olyan hibákat is elkövetünk a használata során, amelyeket kézírással nem szoktunk. Minderre rárakódnak a tudáshiányból vagy figyelemhiányból fakadó helyesírási, nyelvhelyességi hibák, amelyek a hagyományos kézírásunk során is előfordulnának.
Image: Arvind Balaraman / FreeDigitalPhotos.net
Ezek az okok arra ösztökélik a szövegszerkesztők és egyéb, szövegbevitelre használható alkalmazások fejlesztőit, hogy az írást, a digitális szövegbevitelt segítő, a számítógépes környezet, illetve akár a felhasználó sajátosságaihoz alkalmazkodó nyelvhelyességi segédeszközöket fejlesszenek. Ezeknek az eszközöknek több típusa létezik, nem érdemes összekeverni őket, hisz vannak egyszerű behelyettesítésen alapuló, típushibákat figyelő, nagyon egyszerű eszközök. Ezek nem igazi nyelvi segédeszközök, hisz csak arra tudnak figyelni, hogy például ha egy szónak nemcsak az első betűje nagy, hanem az első kettő, akkor azt kijavítja. Ezt a javítólistát szerintem már minden szövegszerkesztőt használó személy megnézegette.
Image: healingdream / FreeDigitalPhotos.net
Érdemesebb a valódi nyelvi segédeszközökről beszélni. Látszólag nagyon egyszerű volna, ha az előző típushoz hasonlóan minden jellemzően előforduló eltérést, hibát egy listába foglalnák, és az eszköz valós időben figyelné az eltéréseket, és minden általa hibásnak vélt alakot kicserélne a listában szereplő helyesre. Több hibája is van ennek a koncepciónak. A nyelv ugyanis nagyon rugalmas, kreatívan használható, viszonylag bonyolult rendszer, ezért egy ilyen statikus lista vélhetően nagyobb károkat okozna, mint amennyit segítene. Arról nem is beszélve, hogy még a mai hardverek világában is lelassítaná a rendszert ez a megoldás.
Emiatt szükségképpen a következő megoldást alkalmazzák. Nyelvészekből és programozókból álló csoportok modellezik az adott nyelvet, annak elsősorban az alaktani, morfológiai, grammatikai rendszerét, és az aktuális szóalakokat a nyelvi modellen alapuló bonyolult algoritmusok elemzik, és valószínűsítik, hogy milyen morfémákból, milyen szóalaknak kell az adott helyen szerepelnie. Ha ettől eltérés van, akkor a rendszer megoldást javasol. A magyar nyelv a digitális nyelvi modellezés szempontjából túlzottan bonyolult, így a fejlesztőknek komoly nehézségeket kell megoldaniuk.
Csak néhány, igen egyszerű példával világítom meg a helyzetet. Nem mindig könnyű eldönteni, mi minősül önálló szónak. Első megközelítésben mindenki azt mondaná, hogy az minősül önálló szónak, ami előtt és ami után szóköz van. Ez sok esetben igaz lehet, ám mi van az igekötőkkel, ha ige után állnak, vagy ha beékelődik közé és az ige közé egy harmadik szó? Akkor a helyesírási szabályok szerint külön kell írni, de ettől az igekötő nem lesz önálló szó. Ugyanígy viselkedik a névutó is, azt is külön írjuk, és mégsem önálló szó. De itt van az a rengeteg szótőváltozat, hogy csak a legegyszerűbbet említsem: a víz toldalék nélkül hosszú í-vel szerepel, de ha tárgy ragot kap, akkor lerövidül a belső magánhangzó: víz + et = vizet. Arról nem is beszélve, hogy a tárgy ragjának az alakja: -t, ám itt mégis -et alakban szerepel. Ezek a problémák az elemi helyesírást ismerők számára nem okoznak nehézséget, ám a számítógép nem jár iskolába, ő algoritmusok alapján működik, a fejlesztők pedig igyekeznek minél tökéletesebb számítógépes nyelvi modellt alkotni gépeink számára.
Bódi Zoltán
Mi jut eszükbe a magyar internetezőknek erről a jelről? Az NRC friss kutatása szerint a Facebook által meghonosított like-gombról a felnőtt netpolgárok 17 százaléka asszociál magára a közösségi oldalra, míg a lájkolási funkció 28 százalékuknak ugrik be. Érdekes tehát, hogy a többség agyában valami mást hív elő a kép – tipikusan a felfelé mutató hüvelykujj tradicionális jelentéseit: az okét és egyéb pozitív visszajelzéseket.
Jelentős különbség figyelhető meg ugyanakkor a fiatalok és az idősebbek asszociációiban. Míg a 18-29 évesek 70 százaléka említi a Facebook-like vonulat valamelyik elemét, addig a negyven felettieknek már kevesebb mint egynegyede; ők elsöprő többségben a kézjel hagyományos üzeneteire gondolnak, annak ellenére, hogy aktív internetezőként ők is rendszeresen találkozhatnak az ikonnal.
A korcsoportok közötti különbség a like-gomb használatában is megmutatkozik, bár az kijelenthető, hogy szinte mindenki él a lájkolás lehetőségével. A Facebook-használók közel 90 százaléka legalább egy alkalommal lájkolt valamit az elmúlt egy hónapban, tízből négyen pedig rendszeresen kattintanak, ha valami elnyeri a tetszésüket. A fiatalok aktívabbak, és a nők körében is több mint másfélszer annyi szorgos lájkolót találunk, mint a férfiak táborában. Így nem meglepő, hogy a két végletet a húszas éveikben járó hölgyek, illetve az ötven feletti férfiak jelentik: előbbiek 56, utóbbiaknak viszont csupán 19 százaléka használja rendszeresen a funkciót.
És hogy mit lájkolunk leggyakrabban a Facebookon? Ismerőseink rövid posztjai vezetik a listát, de alig maradnak el e mögött a fotók és a megosztott linkek; sőt a közösségi oldal látogatóinak fele a közelmúltban legalább egyszer lájkolta valamilyen cég, márka oldalát (illetve az oldalhoz kapcsolódó aktivitást), 30 százalékuk pedig mások által megosztott reklámra dobott egy „tetszik”-et. Persze az ilyen, a marketingesek orcájára elégedett mosolyt csaló lájkok relatíve ritkábbak, így havi lájk-adagunkban csekély súllyal szerepelnek.
A felmérés rávilágított arra is, hogy az igazi „lájker” a Facebook határain túl sem feledkezik meg a tetszésnyilvánítás kattintós módjáról. A júzerek 12 százaléka hírek, cikkek, blogposztok esetén is rendszeresen lájkol, de további 46 százalékukkal is elő-előfordul, hogy él a beágyazott like-gomb kínálta lehetőséggel.
Kurucz Imre
Csizma az asztalon, avagy fonetika és kódtörés?
Feltörték a Skype beszélgetések titkosítását, szólt a hír 2011 júniusának első napjaiban. A szenzációnak számító kódtörésnek az az érdekessége, hogy a titkosítási kódot nem is fejtették vissza, hanem - a hír szerint - a beszélgetésben elhangzó szöveg hangállományához tartozó adatcsomagok nagysága alapján fejtették vissza a hangzó beszédet. Tehát nem klasszikus kódtörésről van szó, hanem fonológiai, fonetikai elemzésről. A hírhez az is hozzátartozik, hogy egyelőre csak az angol nyelvre működik a rendszer. További érdekesség, hogy nyelvészeti, tehát tudományos módszerekkel rekonstruálták a titkosított VoIP beszélgetések hangzását a University of North Carolina kutatói, Andrew M. White, Austin R. Matthews, Kevin Z. Snow és Fabian Monrose (a teljes tanulmány itt olvasható: http://www.cs.unc.edu/~amw/resources/hooktonfoniks.pdf).
Image: digitalart / FreeDigitalPhotos.net
Ez a módszer ráirányítja a figyelmet a hangzó beszéd számítógépes vizsgálatára. A nyelvtudománynak a beszéddel, a hangzással foglalkozó ága a fonetika, ami a beszédhangok, illetve a beszéd hangtani, akusztikus sajátosságait vizsgálja. Pontosabban a beszédhangok fonetikai típusait, képzésbeli jellemzőit, a magán- és mássalhangzók jellemzőit, típusait vizsgálja, igyekszik megismerni és leírni a beszédhangok beszéd közbeni módosulásait. Másrészt a hangzó szöveg intonációját, tempóját, hangerejét, nyomatékviszonyait, dallamát, tehát összefoglalva a prozódiai jellemzőit vizsgálja.
A hangzással foglalkozó másik nyelvtudományi ág a fonológia, ami a beszédhangok, fonémák minőségén túl azok grammatikai szerepét kutatja.
Világos, hogy a fonetika és a fonológia nem létezhet műszeres mérések és gépi adatfeldolgozás nélkül. Annál is inkább fontos ez, mert az élő beszéd akusztikai, fonetikai jellemzőinek leírásakor olyan adatokat kell megfigyelni, amelyet az emberi fül nem képes pontosan észlelni, és ráadásul a statisztikai elemzés számára számszerűsíteni is kell ezeket az adatokat. Például mi alapján lehet objektíven bebizonyítani, hogy valakinek mekkora a beszédtempója? Meg kell mérni, és itt már a milliszekundumos nagyságrend körében vagyunk. Tehát a mérőműszerek használata, a mérési eredmények statisztikai, matematikai elemzése és feldolgozása mindig is része volt a fonetikai kutatásoknak.
A modern számítógépes nyelvi elemző eszközök világában viszont nagy tömegű, informatikai rendszerek segítségével produkált, digitális formátumú beszédfolyamok mintázatainak, visszatérő állandó tulajdonságainak az elemzésére is lehetőség nyílik. Ez is szükséges volt ahhoz, hogy nyelvészekből és a VoIP rendszerek informatikai tulajdonságait jól ismerő informatikusokból álló munkacsoport meg tudja fejteni fonetikai elemzéssel és következtetéssel az angol nyelvű titkosított VoIP szövegfolyamok hangállományát.
Bódi Zoltán
Utolsó kommentek