Impresszum Help Sales ÁSZF Panaszkezelés DSA

Lingodroid - elmélkedés a nyelvtudás nélküli nyelvi robotról

Az ausztrál University of Queensland és a Queensland University of Technologykutatói olyan robotokat fejlesztettek ki, amelyek hozzájárulnak a térbeli orientáció, a nyelvi kommunikáció kapcsolatának és a nyelvi rendszernek a kutatásához. Ruth Schultz, Arren Glover, Michael J. Milford, Gordon Wyeth és Janet Wiles a Lingodroids: Studies in Spatial Cognition and Language (Lingogroidok: A területérzékelés és a nyelv tanulmányozása) című publikációjukat 2011 májusában közölték az IEEE International Conference on Robotics and Automation (ICRA) című konferencián Shanghaiban.

 

Azért jó ötlet egy nyelvi képességekkel felruházott robot használata az általános nyelvészeti kutatásokra, mert így előállítható az a közel ideális helyzet, hogy a nyelvi rendszert olyan módszerrel kutassák, amelyet nem befolyásol a kutató saját nyelvismerete, nyelvi kompetenciája. Ez a nyelvtudomány régi kutatási paradoxona, miszerint csak olyan kutatók tudnak pontos képet adni a nyelvekről, amelyeknek a kutatási módszereit nem befolyásolják a saját nyelvtudásuk. Ehhez az ideális kutató egy nyelvtudás nélküli szereplő lenne, ami ugye paradoxon. Ezt lehet feloldani a robotokkal.

A nyelvtudományi ágak végső célja minden esetbe az, hogy a végső kérdésekre keresse a választ: milyenek a nyelvek valójában és miért olyanok, hogyan alakultak ki, és miért alakultak ki a mai formájukban, miért és hogyan változnak a nyelvek, milyen általános jellemzői vannak  a nyelveknek. Ez utóbbi kérdéskör megvilágítása az általános nyelvészet körébe tartozik.

Az általános nyelvészet tehát a nyelvek egészére, vagy bizonyos csoportjaira általában jellemző, közös sajátosságokat, úgy nevezett univerzálékat kutat, másrészt pedig  nyelvtípusokba sorolja a nyelveket, hogy a tulajdonságait jobban meg tudja ismerni. A nyelvi univerzálék tehát függetlenek a nyelvrokonságtól, hisz egymással rokoni kapcsolatban nem lévő nyelveknek is lehetnek közös univerzáléik. Ahhoz, hogy ezeket az univerzálékat megismerhessük, a nyelvi rendszerek alapos ismeretére van szükség. A hagyományos módszerrel ez olyan hatalmas és széles körű nyelvtudással rendelkező kutatót igényelt, amelynek az általános nyelvismerete alapján megfelelő intuíciói lehettek, majd ezeket kellett a vizsgált  nyelveken ellenőrizni. Az informatikai eszközök segítségével nyelvi modelleket, adatbázisokat lehet felállítani, és ezekből tud meríteni az informatikai eszköz, ezt a korpuszt tudja összehasonlítani. Sokkal nagyobb kapacitással és gyorsasággal tud dolgozni egy ilyen eszköz, mint egy ember. Ám a nagy felkészültségű kutatóra ezután is szükség lesz, mert a számítógépes elemzés által elvégzett összehasonlítások, statisztikai eredmények valóságtartalmát értékelni kell, és ki kell szűrni belőlük az ismétlődéseket, értelmetlenségeket.

A bejegyzés kiindulópontjául szolgáló cikk a Lingodriodokról itt olvasható.


Bódi Zoltán

 

| Még több lehetőség

0 Tovább

10 hihetetlen régi komputerhirdetés

Szinte hihetetlen, hogy a hetvenes-nyolcvanas években milyen volt az ár/ teljesítmény arány a számítástechnikában. Ma ezt már elképzelni sem tudjuk: az egyetlen hordozható eszköz a floppy akkora, mint egy szalvéta. Egy merevlemez akkora, mint egy kocsikerék, és a kapacitása 10 megabájt. Egy XT még csak álom. Ma már nevetséges képességek, elképesztő árak. Néhány hirdetés erről a korszakról sokkal jobban mesél:

80 megabájt 12 000 dollár alatt (1977)

 

Mia fene az az elektronikus levél (1981)

 

Technico Inc TMS9900: "Két byte jobb mint egy" (1978)

 

16 kilobájtos memóriamodul (kb. 1977)

 

Telefon modem (1971)

 

A színes komputert bemutatja Isaac Asimov (1982)

 

"Aktatáska hordozhatóság" (1976)

 

Már húsz éve csábítottak, hogy felejtsük el a papír alapú számlázást(1991)

 

"Bemutatjuk a Microsoft Excelt" (1987)

 

"Megterveztünk egy forradalmi koncepciót" (1985)

 

Tücsi, a galaktikus

 

1 Tovább

Nyelvtörténet számítógéppel

Koreai eredetű a japánnyelv címmel jelent meg az Index.hu-n az alábbi hír:
A japán nyelv eredetével kapcsolatban számítógépes modellezéssel kimutatták, hogy valamennyi úgynevezett japánnyelv egyetlen közös őstől származik mintegy 2182 évvel ezelőttről - ez az időszak egybeesik a Koreai-félszigetről elindult hatalmas vándorlási hullámmal. A Tokiói Egyetem kutatói, Sean Lee és Haszegama Tosikazu a japánnyelv 210 kulcsszavából listát készítettek, és kivetítették a listát 59 különböző dialektusra. A kutatók olyan alapszavakat választottak, mint például a testrészek elnevezése, a számok, a főbb főnevek és névmások. A tanulmány a japánnyelv eredetéről a Proceedings of the Royal Society című szaklapban jelent meg.

 

 

Image: Nutdanai Apikhomboonwaroot / FreeDigitalPhotos.net

 *

A nyelvek közötti rokonság kérdésével a több mint kétszáz éves történeti összehasonlító nyelvtudomány foglalkozik, tehát megvan a kifinomult módszertana, amely szerint a mai nyelvek rokonságának kutatásában igazán jelentős, új eredmények már csak elszórva valószínűsíthetők.

A népek vándorlásának megvan a nyelvi hatása is, ezt areális (területi) hatásnak hívjuk, amely kulturális kölcsönhatásoknak, a rövidebb-hosszabb ideig tartó érintkezésnek köszönhető, melynek során kultúrák, nyelvek és népek keveredhetnek. Ez nem rokoni kapcsolat, csak érintkezés.

Nehéz eldönteni, hogy melyek a rokonnyelvek és melyek az areális vagy kulturális érintkezésben lévő nyelvek. Ennek az alapja a történeti összehasonlító nyelvtudomány, amelynek az alapmódszerei már a 18. század végén megjelentek!

A módszer lényege: megfelelően kiválasztott nyelvi adatok mennyiségi és minőségi összehasonlítása. Lényegében adatbázisok közötti szignifikáns szabályszerűségek kereséséről van szó.


Image: jscreationzs / FreeDigitalPhotos.net

  

Az összehasonlítandó nyelvi adatbázisokból kizárjuk a hasonló hangzást, a gyermeknyelvi szavakat, a hangutánzó, hangulatfestő és indulatszavakat. A lényeges, összehasonlítandó nyelvi rendszertani elemek: a) hanzgókészlet, b) nyelvtani rendszer (ragozás, szerkezetek, nyelvtani jelentések kifejezőeszközei stb.), c) szókészlet. A leglátványosabb mindezek között a szókészlet, mert azzal szembesül leginkább a laikus, ám ez a legbizonytalanabb és leggyorsabban változó részrendszer, és a nyelvtani rendszer változik a leglassabban, az a legállandóbb.

Tehát viszonylag nagy és szabályozott számú nyelvi adatbázisok elemei közötti szignifikáns és egyben szabályszerű mintázatok kereséséről van szó: ezt kiválóan meg lehet gyorsítani számítógépes eszközökkel, melynek köszönhetően olyan szabályszerűségeket is felfedezhetünk, amelyeket a kézi, intuitív módszerrel csak igen nehezen. Jegyezzük meg rögtön, hogy ez a statisztikai, számítógépes módszer olyan szabályszerűségeket is fölismerhet, amelyek nem használhatók a nyelvészeti kutatásban. Az adatbázisok feltöltése, illetve tisztítása tehát továbbra is emberi munka lesz, mert a nagy szószámú, már eleve meglévő számítógépes korpuszokban mindenféle szó van, nem csak alapszókincsbeli, ám a történeti összehasonlító módszer szerint csak alapszókincsbeli, alapnyelvbeli elemeket szabad összehasonlítani. Az adatbázisok megfelelő szabályszerűségek szerinti összehasonlítása viszont jól végrehajtható statisztikai módszerekkel! Mindez a modern számítógépes nyelvészet területeihez tartozik.

 

Bódi Zoltán 

 

| Még több lehetőség

0 Tovább

Új fejezet a Grammy-díjak történetében

Első alkalommal került a Grammy-díjazottak közé egy számítógépes játék zenéje. Christopher Tin még 2005-ben készítette a most díjazott Baba Yetu c. dalt, amely a „Legjobb instrumentális szám kísérő énekesekkel” kategóriában nyerte el a magas kitüntetést.

Christopher Tin

A  Baba Yetu-t a Civilization IV c. körökre osztott számítógépes stratégiai játék főcímzenéjeként lehet hallani. Az első Civilization játékot még 1991-ben alkotta meg csapatával Sid Meier és az azóta elkészült verziók (2010-ben jelent meg a Sid Meiers Civilization V.) során a világ legjelentősebb civilizációinak történelmét írhatjuk újra. A játékban egy telepessel kezdünk és mindig az a cél, hogy várost alapítsunk, fejlesszünk és felvirágoztassuk.

Ha a Grammy-díjak történetét újraírni már nem is lehet, de legalábbis új fejezetet lehet kezdeni. Christopher Tin, a 35 éves amerikai zeneszerző 2005-ben készítette el a Civilization IV. zenéjét. A dal szövege egyébként szuahéli nyelven a Miatyánk keresztény ima fordítása. A dal hatására jellemző, hogy sok játékos csak azért időzött a program főmenüjében, hogy hallgathassa a Baba Yetu-t, sőt a játék megjelenése után a szerzemény önálló életre kelt, hiszen az eltelt kb. öt év alatt ezer alkalommal adták elő különféle kórusok amerikai rendezvényeken, és még a Dubai szökőkút műsorának egyik aláfestő zenéjeként is használják. Christopher Tin debütálló albuma, a Calling All Dawns egyébként 2009-ben jelent meg, ennek nyitó tétele lett az újrahangszerelt Baba Yetu, amelyet a a sowetói evangélikus kórus ad elő. A lemez egyébként kapott egy másik Grammyt is, mégpedig a „Best Classical Crossover Album” kategóriában is győzedelmeskedett.

Az album tizenkét dalát tizenkét különböző nyelven adják elő, a már említett szuahélin kívül lengyelül, franciául, perzsául és maori nyelven; és közreműködik hat kontinens több mint kétszáz muzsikusa.


Itt meghallgatható a Grammy-díjas játékzene: KLATTY.



Szilágyi Árpád-Spányik Balázs

1 Tovább

Az elveszett információ pótlása

Kétségtelen, hogy a régészek számára is új korszak köszöntött be a számítógép használatával. Ha addig nem, hát 1993-ban már mindenki számára nyilvánvalóvá vált ez, amikor Steven Spielberg bemutatta a Jurassic Parkot. Természetesen nem a történet genetikai fantasztikumára gondolok a dínók „felélesztésével”, hanem arra, ahogyan a filmes technológia befogadta a számítógépes grafikát és animációt (CGI), aminek segítségével oly’ hihetővé vált, hogy a T-Rex tényleg ott van az élőszereplők körül.

No de honnan tudjuk azt, hogy miképpen nézett ki a T-Rex? Hiszen élő ember nem látott még igazi T-Rex-et! Bármennyire is ott van ma már az emberi memóriánkban az őshüllő valóságosnak tűnő képe, azért azt tudnunk kell, hogy az nem több, mint a részleges tudásunk alapján összerakott hiányos mozaik kép, amelyben vannak bizonyos hiányok. Ezeket az információ-réseket pedig részben tudományos összefüggések, szabályszerűségek, részben pedig – ha már más nincs – a teremtő fantáziával töltik ki. Aki kicsit is szereti böngészni a hollywoodi filmek DVD változatának ’Hogyan csinálták’ werkjeit, kulisszatitkait, annak nem furcsa, hogy a Jurassic Park lemezén elmesélik, miképpen alkották meg a dínók hangját. Ha jól átgondoljuk a módszert, ez még inkább blöffszerű folyamat, mint a dínók küllemének újraalkotása a részismeretek alapján. És persze eleve nincs esély sem arra, hogy meghallgassunk egy igazi dínó üvöltését. (Arról nem is beszélve, hogy a régen kihalt állatok hangját nem csupán a hangkeltő szervük alakja és más fizikai jellemzője befolyásolta, hanem az idegrendszerük központja, az agya is, gondoljunk csak arra, hogy nem mindegy, hogy egy rövid üvöltésről, egy hosszú vonításról vagy éppen szakaszosan ismétlődő ugatásról van szó.) Persze, egy film esetében nem is a valósághűség 100%-os hitelessége a fontos, hanem a hihetőség, hogy akár így is lehetett volna.


Másról van szó, ha az emberi történelem különböző mozaikkockáit kell a helyére illeszteni. A régészeknek és történészeknek most jön az igazi nagy lehetőség, amikor már nem csak a szövegekkel lehet körülírni a múlt egy-egy részletét, hanem a számítógépes képmanipulációt is gond nélkül felhasználhatják. Erre érdekes példa, amit a Múlt-kor portál tegnapi cikkében bemutat: egy történelmi személyiség, az első amerikai elnök, George Washington arcképét igyekeznek rekonstruálni digitális eszközökkel. Az a része hasonlít a dínók elektronikus újraalkotásához, hogy rendelkezésre állnak részinformáció, amiből egy valósághű képet akarnak létrehozni – csak hogy Washingtonról létezik festett képmás, nem is egy. A módszer lényege az volt, hogy ugyanazon festő egyik modelljéről létezett korabeli fotó is, az ezen a festményhez képest tetten érhető eltérések alapján módosítani lehet a festő további képein is az arcképeket – már feltéve, hogy a festő ugyanazokat a hibákat és torzításokat követte el minden egyes képen.

A digitális rendszerek persze annál pontosabb képet tudnak „átlagolni”, minél több képi információt adunk meg, akár minél több festménnyel befolyásoljuk a végső képet.

Nem véletlen, hogy miért az utóbbi években szaporodtak meg a számítógépes régészettel kapcsolatos hírek (lásd például: Virtuális régész rekonstruálja az ókori civilizációt, Számítógép a régészet szolgálatában) és a Netidők műsorban is évekkel ezelőtt (2005 április 28-án) beszámoltunk az Aquincumi Múzeum múltba tekintő „periszkópjáról”. Az ókori romok között sétálva ugyanis két olyan távcsövet találunk, amelybe belenézve láthatjuk, amint a számítógépes rendszer a romok valóságos képére vetíti az ókori épületek virtuálisan rekonstruált látványát. Ráadásul, ha körbenézünk a távcsővel, akkor a gép pontosan követi az elmozdulást és már a virtuális épület azon részét látjuk, ami a látómezőbe kerül.

Szilágyi Árpád

1 Tovább

Netidők Blogtársaság

blogavatar

Digitális talkshow írásban is. Itt a Netidők! Ez a Netidők c. rádióműsor (Petőfi Rádió) blogja. Mindaz, ami elhangzik az adásban, meg ami nem.

Utolsó kommentek