Csizma az asztalon, avagy fonetika és kódtörés?

Feltörték a Skype beszélgetések titkosítását, szólt a hír 2011 júniusának első napjaiban. A szenzációnak számító kódtörésnek az az érdekessége, hogy a titkosítási kódot nem is fejtették vissza, hanem - a hír szerint - a beszélgetésben elhangzó szöveg hangállományához tartozó adatcsomagok nagysága alapján fejtették vissza a hangzó beszédet. Tehát nem klasszikus kódtörésről van szó, hanem fonológiai, fonetikai elemzésről. A hírhez az is hozzátartozik, hogy egyelőre csak az angol nyelvre működik a rendszer. További érdekesség, hogy nyelvészeti, tehát tudományos módszerekkel rekonstruálták a titkosított VoIP beszélgetések hangzását a University of North Carolina kutatói, Andrew M. White, Austin R. Matthews, Kevin Z. Snow és Fabian Monrose (a teljes tanulmány itt olvasható: http://www.cs.unc.edu/~amw/resources/hooktonfoniks.pdf).

 


Image: digitalart / FreeDigitalPhotos.net

 

Ez a módszer ráirányítja a figyelmet a hangzó beszéd számítógépes vizsgálatára. A nyelvtudománynak a beszéddel, a hangzással foglalkozó ága a fonetika, ami a beszédhangok, illetve a beszéd hangtani, akusztikus sajátosságait vizsgálja. Pontosabban a beszédhangok fonetikai típusait, képzésbeli jellemzőit, a magán- és mássalhangzók jellemzőit, típusait vizsgálja, igyekszik megismerni és leírni a beszédhangok beszéd közbeni módosulásait. Másrészt a hangzó szöveg intonációját, tempóját, hangerejét, nyomatékviszonyait, dallamát, tehát összefoglalva a prozódiai jellemzőit vizsgálja.


A hangzással foglalkozó másik nyelvtudományi ág a fonológia, ami a beszédhangok, fonémák minőségén túl azok grammatikai szerepét kutatja.

Világos, hogy a fonetika és a fonológia nem létezhet műszeres mérések és gépi adatfeldolgozás nélkül. Annál is inkább fontos ez, mert az élő beszéd akusztikai, fonetikai jellemzőinek leírásakor olyan adatokat kell megfigyelni, amelyet az emberi fül nem képes pontosan észlelni, és ráadásul a statisztikai elemzés számára számszerűsíteni is kell ezeket az adatokat. Például mi alapján lehet objektíven bebizonyítani, hogy valakinek mekkora a beszédtempója? Meg kell mérni, és itt már a milliszekundumos nagyságrend körében vagyunk. Tehát a mérőműszerek használata, a mérési eredmények statisztikai, matematikai elemzése és feldolgozása mindig is része volt a fonetikai kutatásoknak.

A modern számítógépes nyelvi elemző eszközök világában viszont nagy tömegű, informatikai rendszerek segítségével produkált, digitális formátumú beszédfolyamok mintázatainak, visszatérő állandó tulajdonságainak az elemzésére is lehetőség nyílik. Ez is szükséges volt ahhoz, hogy nyelvészekből és a VoIP rendszerek informatikai tulajdonságait jól ismerő informatikusokból álló munkacsoport meg tudja fejteni fonetikai elemzéssel és következtetéssel az angol nyelvű titkosított VoIP szövegfolyamok hangállományát.

 

Bódi Zoltán 

 

| Még több lehetőség