Az Index.hu híre szerint egy számítógépes szakértő és nyelvész társai a modern gépi fordítóprogramok technikáit is felhasználták egy 1730-as évekből származó rejtjelezett könyv titkosításának felderítéséhez.
Módszerében is különlegesnek számít az, ahogy egy amerikai-svéd kutatócsoport megfejtette a mindeddig elolvashatatlan tartalmú, 105 oldalas, 18. századi kézírásos könyv, az úgynevezett Copiale Cipher szövegét.
A metódus során felhasználták számítógépes nyelvészet és azon belül a gépi fordítóprogramok módszertanát, melynek köszönhetően a csoport az első 16 oldal megfejtését mutatta be. A kutatás szerint ez a szöveg egy olyan titkos társaság szertartásainak és politikai nézeteinek a leírása az 1730-as évekből, melynek tagjai valamilyen oknál fogva le voltak nyűgözve a szemészettől, bár maguk nem voltak szemészek.
A kézirat megfejtésekor az áttörést akkor érték el, amikor rájöttek, hogy a vegyesen latin betűkből és változatos jelekből álló szövegben a latin betűk jelzik a szóközöket, a szimbólumok pedig a betűket, illetve a jelzett hangzók mennyiségi jellemzőit (hosszú, rövid hangzók).
A módszer újdonsága és a siker egyik titka, hogy felhasználták a statisztikai alapú fordítórendszerek új eredményeit. Erre alapoztak, amikor a német nyelvet feltételezve szógyakoriság-elemzést végeztek a kódolt szövegen.
(A cikk forrása: http://index.hu/tech/2011/10/27/szamitogeppel_fejtettek_meg_egy_titkosirast/)
*
Az eredeti könyv egyik oldalpárja, melyen jól láthatók a latin betűkkel összekapcsolt változatos formájú jelek.
A számítógépes nyelvészet lényege, hogy a nyelvi szerkezetek, alkotóelemek mennyiségi jellemzőit, illetve az ezekből levezethető minőségi összefüggéseket az informatikai eszköz nagy számítási kapacitásának igénybe vételével elemzik, számolják. Ennek köszönhetően a kutatók olyan összefüggésekre jöhetnek rá, amelyekre hagyományos, kézi módszerekkel csak igen nehezen, mert a számítógépek olyan hatalmas nyelvi anyagot képesek egyszerre áttekinteni, amekkorában az emberi elme képtelen átfogó összefüggéseket fölfedezni. A jelenlegi kriptográfiai elemzésnél is igen fontos mozzanat volt, hogy a hatalmas terjedelmű szövegben az ismétlődéseket, és azoknak a nyelvi szerkezetekkel való összefüggését igen nagy számítási kapacitás igénybevételével tudták feltárni, összeszámolni és meghatározni.
A másik eljárás, pedig a manapság már igen fejlett számítógépes fordítástámogató rendszer igénybevétele volt, ennek köszönhetően pedig a statisztikailag feltárt mintázatokat, szerkezeti hasonlóságokat különböző nyelvek szerkezeti alapjellemzőivel hasonlították össze. Így jöttek rá arra a történeti kutatásokkal korábban már valószínűsített tényre, hogy a szöveg német nyelvű tartalmat titkosított.
Minden bizonnyal bravúros az eljárás módszertana, amelyet a kriptográfia tudománya távlatilag is beépíthet a módszerei közé. Így az erősen interdiszciplináris titkosírás, illetve titkosítás-megfejtés, -elemzés tudományában tovább erősödik az informatikai, statisztikai, nyelvészeti terület.
*
Akit érdekel a felfejtett szöveg eredetije, az itt találgatja:
http://stp.lingfil.uu.se/~bea/copiale/images150/00.png az első oldala, majd a végén a 00.png helyére kell 01.png, 02.png-t írni, egészen az 54.png- ig, amelyen a csodás borító látható.
Bódi Zoltán
(Az Index.hu hírének nyomán)
Utolsó kommentek