Impresszum Help Sales ÁSZF Panaszkezelés DSA

Titkosírás megfejtése számítógépes nyelvészeti támogatással

Az Index.hu híre szerint egy számítógépes szakértő és nyelvész társai a modern gépi fordítóprogramok technikáit is felhasználták egy 1730-as évekből származó rejtjelezett könyv titkosításának felderítéséhez.

Módszerében is különlegesnek számít az, ahogy egy amerikai-svéd kutatócsoport megfejtette a mindeddig elolvashatatlan tartalmú, 105 oldalas, 18. századi kézírásos könyv, az úgynevezett Copiale Cipher szövegét.

A metódus során felhasználták számítógépes nyelvészet és azon belül a gépi fordítóprogramok módszertanát, melynek köszönhetően a csoport az első 16 oldal megfejtését mutatta be. A kutatás szerint ez a szöveg egy olyan titkos társaság szertartásainak és politikai nézeteinek a leírása az 1730-as évekből, melynek tagjai valamilyen oknál fogva le voltak nyűgözve a szemészettől, bár maguk nem voltak szemészek.

A kézirat megfejtésekor az áttörést akkor érték el, amikor rájöttek, hogy a vegyesen latin betűkből és változatos jelekből álló szövegben a latin betűk jelzik a szóközöket, a szimbólumok pedig a betűket, illetve a jelzett hangzók mennyiségi jellemzőit (hosszú, rövid hangzók).

A módszer újdonsága és a siker egyik titka, hogy felhasználták a statisztikai alapú fordítórendszerek új eredményeit. Erre alapoztak, amikor a német nyelvet feltételezve szógyakoriság-elemzést végeztek a kódolt szövegen.
(A cikk forrása: http://index.hu/tech/2011/10/27/szamitogeppel_fejtettek_meg_egy_titkosirast/)

*

Az eredeti könyv egyik oldalpárja, melyen jól láthatók a latin betűkkel összekapcsolt változatos formájú jelek.

 

A számítógépes nyelvészet lényege, hogy a nyelvi szerkezetek, alkotóelemek mennyiségi jellemzőit, illetve az ezekből levezethető minőségi összefüggéseket az informatikai eszköz nagy számítási kapacitásának igénybe vételével elemzik, számolják. Ennek köszönhetően a kutatók olyan összefüggésekre jöhetnek rá, amelyekre hagyományos, kézi módszerekkel csak igen nehezen, mert a számítógépek olyan hatalmas nyelvi anyagot képesek egyszerre áttekinteni, amekkorában az emberi elme képtelen átfogó összefüggéseket fölfedezni. A jelenlegi kriptográfiai elemzésnél is igen fontos mozzanat volt, hogy a hatalmas terjedelmű szövegben az ismétlődéseket, és azoknak a nyelvi szerkezetekkel való összefüggését igen nagy számítási kapacitás igénybevételével tudták feltárni, összeszámolni és meghatározni.

A másik eljárás, pedig a manapság már igen fejlett számítógépes fordítástámogató rendszer igénybevétele volt, ennek köszönhetően pedig a statisztikailag feltárt mintázatokat, szerkezeti hasonlóságokat különböző nyelvek szerkezeti alapjellemzőivel hasonlították össze. Így jöttek rá arra a történeti kutatásokkal korábban már valószínűsített tényre, hogy a szöveg német nyelvű tartalmat titkosított.

Minden bizonnyal bravúros az eljárás módszertana, amelyet a kriptográfia tudománya távlatilag is beépíthet a módszerei közé. Így az erősen interdiszciplináris titkosírás, illetve titkosítás-megfejtés, -elemzés tudományában tovább erősödik az informatikai, statisztikai, nyelvészeti terület.

*

Akit érdekel a felfejtett szöveg eredetije, az itt találgatja:
http://stp.lingfil.uu.se/~bea/copiale/images150/00.png az első oldala, majd a végén a 00.png helyére kell 01.png, 02.png-t írni, egészen az 54.png- ig, amelyen a csodás borító látható.

 

Bódi Zoltán

(Az Index.hu hírének nyomán)

 

| Még több lehetőség

0 Tovább

Lencsevégen a szavak (Fanyalgó)

Gróf Miklós fanyalgójához némi bevezető: asztaltársaságunkhoz eljutott az ún. "augmented reality" (azaz kiterjesztett valóság) egy újabb érdekes megvalósításáról szóló hír, amelyet igen látványos videóval demonstrálnak a YouTube-on. Kezdjük a videóval (nagyon beszédes!) és utána átadjuk a (lencsevégre kapott) szót Gróf Miklósnak...

 

Azért ez fantasztikus - ha persze nem "photoshop" az egész és nem az újabb kollektív átejtés magasiskolája. Rátartom a telefont a feliratra és ékes magyarsággal olvashatom: mi a fenét is szeretnének annyira a helybéliek. Nem baj, ha nincs meg a magamhoz való eszem, képtelen vagyok körülnézni, nem tudok felismerni egy embert, akitől kérdezhetek, vagy annyi fáradságot sem vettem magamnak utazás előtt, hogy legalább NÉHÁNY alapfogalommal tisztában legyek. Nemcsak strand-táblánál jó ez a kütyü. Ha pl. bizonytalan politikai helyzetben lévő országba kirándulunk, egyből érteni fogjuk a tüntetők feliratait, könnyedén eligazodunk letartóztatásunk esetén egy helyi rendőrörsön, vagy akár az ottani bevásárlóközpontban sem kell gondolkodnunk, hogy merre is vannak pl. a tésztafélék. Némileg ugyan ciki vagy dehó lesz a "Tíz év múlva-együttes" CD-it nézegetni a helyi CD-boltban - mert eljön az idő, amikor az EGÉSZ valóság csakis ezzel az izével lesz értelmezhető számunkra -, de legalább rájöhetünk: mennyi marhaság vesz minket körül, melyek angolul, németül épp angolságuk vagy németségük miatt oly elegánsnak tűntek, miközben valójában talán még a hazai ostobaságoknál is szerencsétlenebbek.

Nyugodtan kijelenthetjük: immár végképp beköszöntött a Homo Informaticus korszaka, melyben a VALÓSÁG csupán apropó arra, hogy ahol csak lehet, beiktassunk valamit a gondolkodás helyébe, a valósággal való természetes, normális - bár olykor kétségkívül  talányokkal terhelt - kontaktálás folyamatába.

Nézzük: mi is jellemző talán leginkább a Homo Informaticus első generációs törzsfejlődési temékére.

Emberünk fel se néz. Vadul nyomkodja mobilját, laptopját, bármilyét, csak ne kelljen felnéznie. Utaztunk nyáron az olasz tengerpart varázslatos vasútvonalán. Embert nem láttam kinézni az ablakon. Mindenki nyomkodott valamit, e-mailezett, játszott, telefonált, chatelt, tudomisén. És most itt ez a szövegfelismerő ketyere. Amellyel méginkább megspórolható lesz a valósággal való tényleges szemkontaktus nyomasztó terhének viselése, hogy a mögötte álló GONDOLKODÁS, a fantázia, a helyzetmegoldó képesség fontosságát ne is említsem.

1993-as japán kirándulásom alkalmával sokszor átéltem az analfabetizmus nyomasztó érzését, mert nemhogy elolvasni nem tudtam azt, ami japánul ott állt a metróállomástól reptéren át mindenütt, de sokszor még maga az írás is díszítőelemnek tűnt a számtalan hasonló között. "Ennek a gondnak immár vége, ugorjon át Hiroshimába és magyarul nézhet körül az új iPhone-nal". Mennyire egyszerű is lenne, illetve lesz. (Feltéve, ha megvan a program a japán, kínai,  thaiföldi, arab és egyéb írásjelek felismerésére.) Ugyanakkor dögunalom.

El tudják képzelni, mekkora buli volt úgy rendelni egy tokiói tteremben, hogy lövésem sem volt az étlapról? Amikor ki kellett találnom: hogy kerülhető meg az írás és a nyelv ismeretének totális hiánya? Pompásan szórakoztam, amikor körbevezettem a pincért az étteremben, és megmutogattam neki, a többiek vacsora-választásaiból mi lenne nekem is érdekes. Nyilván egyszerűbb fogni az iPhone-t, rátartani az étlapra és ékes japánsággal közölni nyelvhalrendelésünket... de így, a helyzetmegoldás és fantázia kényszere alatt találhattam rá az abacussal Shinkansen-jegyárat számoló japán öreg bácsikára az ultramodern gyorsvasút pénztárában, így ismerkedhettem meg a sagai hőlégballonfesztivál helyi hotdogsütőjének extra ötleteivel. Mert segítségre szorultam és ebben a helyzetben a nyílt tekintet és az emberi mosoly érte a legtöbbet.

Amikor utazom, mindig szeretem az adott nyelv ritmusát, zenéjét, kiejtve, leírva, latinos vagy egyéb beütéssel, esetleg anélkül. Nem azért megyek külföldre, hogy saját nyelvemen olvassak mindent és megkíméljem magam a gondolkodás kényszerű terhétől. Az eljövendő, szuperbiztos, iPhone-fordította világ persze sokkal praktikusabb és gyorsabb lesz. Nem érnek minket meglepetések, nem tudunk ugyan semmit, de mégis minden a miénk lehet... illetve mindazt annak hihetjük, amit a kijelzőn - és CSAKIS OTT - látunk.

Haverjaim nagy szorgalommal használják a fordítóprogramokat, hogy bizonyítsák irántam és a magyar nyelv iránti szeretetüket. Nem mertem nekik eddig visszaírni, hogy ha lehet, sürgősen hagyjanak fel vele. Nem akaorm őket megsérteni... és nem szeretném magam megfosztani azoktól a hajmeresztő és sokszor bájos baromságoktól, melyek GÉPMAGYARBA öltve érkeznek öt kontinensről minden este, hogy sokszor visítva rúgom ki a széket magam alól.

Gróf Miklós

1 Tovább

Tvittelsz, csipogsz vagy csiripelsz?

twitter idegen nyelven

Gondoltam egy nagyot, hogy lefordítom a kedvenc Twitter kliensemet magyarra. Ettől egyszerűbb feladat kevés van, gondolhatja bárki. Ez általában igaz is, amíg bele nem fogunk egy ilyen feladatba. A problémát nem is a már ismert kifejezések fordítása jelenti, hanem az újak átültetése a magyar nyelvre. Kezdjük egyből magával a Twitter kifejezéssel. Magyarul ez csipog, csiripel, csivitel lesz a szó szerinti fordításban. A mindennapi szóhasználatban a csiripel, már egyértelműen az angol tweet szó helyett használatos. Van már turulunk ami csiripel, az emberek ha csipognak, csiripelnek, akkor mindenki tudja, hogy Twitter-t használnak.

 

A Twitter használatához azonban nem csak a tweet - azaz a csipogás, csiripelés - tartozik hozzá. Angolul az emberek "újracsiripelnek" egy tweet-et, azaz másnak a csipogását kürtölik világgá, amire a "retweet" szó használatos. Ráadásul a szóhoz kötődik egy egyértelmű rövidítés, az "RT" is. Ha a csipog, csiripel szavakat elfogadjuk a "tweet" magyar megfelelőjének, akkor a logika szerint az "újracsipog" és az "ÚCS" is elfogadható lenne. E két utóbbiról azonban szerintem mindenki érzi, hogy senki sem használná a mindennapi nyelvben.

 

Kérdezgettem az ismerőseimet is, hogy ők hogyan oldanák fel a problémát. Jöttek is az ötletek sorjában: csirip, recsirip, RCS, csivit, recsivit, csipog, recsipog... A végén arra gondoltam, hogy a legjobb az lenne, ha megtartanánk az angol kifejezéseket magyaros írásmód mellett. Így a következőket fogom használni: tweet - tvít, to tweet - tvittelni, to retweet - retvittelni. Ettől a csipog és a csiripel, mint remek magyar szavak a közbeszédben szerintem tovább élnek, de a csiripelő kliens felületén sokkal jobb, ha ezeket az új, magyaros írásmóddal használható szavakat használjuk. Így a szolgáltatáshoz kapcsolódóan már megszokott rövidítések is értelmesek maradnak a magyaros írásmód mellett.

 

Példamondatok az új szavakkal:

Ági küldött egy tvítet Jenőnek. Géza retvittelte a tegnapi tvítemet. Szoktál tvittelni? Küldtem egy RT-et.

Ha van jobb ötleted, ne tartsd magadban, írd meg nyugodtan.


Kapcsolódó írások: Hotot - a szexi twitter kliens

További elérhetőségek:

4 Tovább

Netidők Blogtársaság

blogavatar

Digitális talkshow írásban is. Itt a Netidők! Ez a Netidők c. rádióműsor (Petőfi Rádió) blogja. Mindaz, ami elhangzik az adásban, meg ami nem.

Utolsó kommentek