Impresszum Help Sales ÁSZF Panaszkezelés DSA

Lingodroid - elmélkedés a nyelvtudás nélküli nyelvi robotról

Az ausztrál University of Queensland és a Queensland University of Technologykutatói olyan robotokat fejlesztettek ki, amelyek hozzájárulnak a térbeli orientáció, a nyelvi kommunikáció kapcsolatának és a nyelvi rendszernek a kutatásához. Ruth Schultz, Arren Glover, Michael J. Milford, Gordon Wyeth és Janet Wiles a Lingodroids: Studies in Spatial Cognition and Language (Lingogroidok: A területérzékelés és a nyelv tanulmányozása) című publikációjukat 2011 májusában közölték az IEEE International Conference on Robotics and Automation (ICRA) című konferencián Shanghaiban.

 

Azért jó ötlet egy nyelvi képességekkel felruházott robot használata az általános nyelvészeti kutatásokra, mert így előállítható az a közel ideális helyzet, hogy a nyelvi rendszert olyan módszerrel kutassák, amelyet nem befolyásol a kutató saját nyelvismerete, nyelvi kompetenciája. Ez a nyelvtudomány régi kutatási paradoxona, miszerint csak olyan kutatók tudnak pontos képet adni a nyelvekről, amelyeknek a kutatási módszereit nem befolyásolják a saját nyelvtudásuk. Ehhez az ideális kutató egy nyelvtudás nélküli szereplő lenne, ami ugye paradoxon. Ezt lehet feloldani a robotokkal.

A nyelvtudományi ágak végső célja minden esetbe az, hogy a végső kérdésekre keresse a választ: milyenek a nyelvek valójában és miért olyanok, hogyan alakultak ki, és miért alakultak ki a mai formájukban, miért és hogyan változnak a nyelvek, milyen általános jellemzői vannak  a nyelveknek. Ez utóbbi kérdéskör megvilágítása az általános nyelvészet körébe tartozik.

Az általános nyelvészet tehát a nyelvek egészére, vagy bizonyos csoportjaira általában jellemző, közös sajátosságokat, úgy nevezett univerzálékat kutat, másrészt pedig  nyelvtípusokba sorolja a nyelveket, hogy a tulajdonságait jobban meg tudja ismerni. A nyelvi univerzálék tehát függetlenek a nyelvrokonságtól, hisz egymással rokoni kapcsolatban nem lévő nyelveknek is lehetnek közös univerzáléik. Ahhoz, hogy ezeket az univerzálékat megismerhessük, a nyelvi rendszerek alapos ismeretére van szükség. A hagyományos módszerrel ez olyan hatalmas és széles körű nyelvtudással rendelkező kutatót igényelt, amelynek az általános nyelvismerete alapján megfelelő intuíciói lehettek, majd ezeket kellett a vizsgált  nyelveken ellenőrizni. Az informatikai eszközök segítségével nyelvi modelleket, adatbázisokat lehet felállítani, és ezekből tud meríteni az informatikai eszköz, ezt a korpuszt tudja összehasonlítani. Sokkal nagyobb kapacitással és gyorsasággal tud dolgozni egy ilyen eszköz, mint egy ember. Ám a nagy felkészültségű kutatóra ezután is szükség lesz, mert a számítógépes elemzés által elvégzett összehasonlítások, statisztikai eredmények valóságtartalmát értékelni kell, és ki kell szűrni belőlük az ismétlődéseket, értelmetlenségeket.

A bejegyzés kiindulópontjául szolgáló cikk a Lingodriodokról itt olvasható.


Bódi Zoltán

 

| Még több lehetőség

0 Tovább

Nyelvtörténet számítógéppel

Koreai eredetű a japánnyelv címmel jelent meg az Index.hu-n az alábbi hír:
A japán nyelv eredetével kapcsolatban számítógépes modellezéssel kimutatták, hogy valamennyi úgynevezett japánnyelv egyetlen közös őstől származik mintegy 2182 évvel ezelőttről - ez az időszak egybeesik a Koreai-félszigetről elindult hatalmas vándorlási hullámmal. A Tokiói Egyetem kutatói, Sean Lee és Haszegama Tosikazu a japánnyelv 210 kulcsszavából listát készítettek, és kivetítették a listát 59 különböző dialektusra. A kutatók olyan alapszavakat választottak, mint például a testrészek elnevezése, a számok, a főbb főnevek és névmások. A tanulmány a japánnyelv eredetéről a Proceedings of the Royal Society című szaklapban jelent meg.

 

 

Image: Nutdanai Apikhomboonwaroot / FreeDigitalPhotos.net

 *

A nyelvek közötti rokonság kérdésével a több mint kétszáz éves történeti összehasonlító nyelvtudomány foglalkozik, tehát megvan a kifinomult módszertana, amely szerint a mai nyelvek rokonságának kutatásában igazán jelentős, új eredmények már csak elszórva valószínűsíthetők.

A népek vándorlásának megvan a nyelvi hatása is, ezt areális (területi) hatásnak hívjuk, amely kulturális kölcsönhatásoknak, a rövidebb-hosszabb ideig tartó érintkezésnek köszönhető, melynek során kultúrák, nyelvek és népek keveredhetnek. Ez nem rokoni kapcsolat, csak érintkezés.

Nehéz eldönteni, hogy melyek a rokonnyelvek és melyek az areális vagy kulturális érintkezésben lévő nyelvek. Ennek az alapja a történeti összehasonlító nyelvtudomány, amelynek az alapmódszerei már a 18. század végén megjelentek!

A módszer lényege: megfelelően kiválasztott nyelvi adatok mennyiségi és minőségi összehasonlítása. Lényegében adatbázisok közötti szignifikáns szabályszerűségek kereséséről van szó.


Image: jscreationzs / FreeDigitalPhotos.net

  

Az összehasonlítandó nyelvi adatbázisokból kizárjuk a hasonló hangzást, a gyermeknyelvi szavakat, a hangutánzó, hangulatfestő és indulatszavakat. A lényeges, összehasonlítandó nyelvi rendszertani elemek: a) hanzgókészlet, b) nyelvtani rendszer (ragozás, szerkezetek, nyelvtani jelentések kifejezőeszközei stb.), c) szókészlet. A leglátványosabb mindezek között a szókészlet, mert azzal szembesül leginkább a laikus, ám ez a legbizonytalanabb és leggyorsabban változó részrendszer, és a nyelvtani rendszer változik a leglassabban, az a legállandóbb.

Tehát viszonylag nagy és szabályozott számú nyelvi adatbázisok elemei közötti szignifikáns és egyben szabályszerű mintázatok kereséséről van szó: ezt kiválóan meg lehet gyorsítani számítógépes eszközökkel, melynek köszönhetően olyan szabályszerűségeket is felfedezhetünk, amelyeket a kézi, intuitív módszerrel csak igen nehezen. Jegyezzük meg rögtön, hogy ez a statisztikai, számítógépes módszer olyan szabályszerűségeket is fölismerhet, amelyek nem használhatók a nyelvészeti kutatásban. Az adatbázisok feltöltése, illetve tisztítása tehát továbbra is emberi munka lesz, mert a nagy szószámú, már eleve meglévő számítógépes korpuszokban mindenféle szó van, nem csak alapszókincsbeli, ám a történeti összehasonlító módszer szerint csak alapszókincsbeli, alapnyelvbeli elemeket szabad összehasonlítani. Az adatbázisok megfelelő szabályszerűségek szerinti összehasonlítása viszont jól végrehajtható statisztikai módszerekkel! Mindez a modern számítógépes nyelvészet területeihez tartozik.

 

Bódi Zoltán 

 

| Még több lehetőség

0 Tovább

Nyelvi profilalkotás

A virtuális lábnyommal, a felhasználói profilunkkal kommunikációs magatartásunkat, nyelvhasználatunkat is kiadjuk. Ráadásul, ha ezt a közösségi oldalakon tesszük, akkor jellemzően ez összeköthető az identitásunkkal is. Ez a nyelvészeti kutatásokban új perspektívát nyit, hiszen hagyományosan az egyéni nyelvhasználat (idiolektus) nagyon nehezen és lassan kutatható terület volt a nyelvtudományban, hiszen senki sem adja ki szívesen a személyes levelezését kutatási célokra.

A közösségi szolgáltatások megjelenésével viszont ez a lehetőség soha nem látott mértékben gyorsult fel. Önként közölt adatokkal, torzításmentesen, pontos, személyes nyelvi adatokat közölnek nagy felhasználói tömegek. Ezzel nagyon könnyen lehet megfelelő statisztikai mintavételezéssel fölrajzolni, megalkotni egy személy vagy egy csoport nyelvhasználatának, idiolektusának, dialektusának a szabályait, jellemzőit. Például meg lehet figyelni a sajátos kötőszóhasználatot, a jellegzetes frazeológiahasználatot, a spontán szerkesztési szabályokat, mondatszerkesztési módokat (használ-e alárendeléseket, és ha igen, milyet), jól feltérképezhető az egyénre jellemző szóhasználat, a nyelvi reakciók, az emocionális tartalom kifejezése és a jellegzetes helyesírási hibák is.

 

Image: Idea go / FreeDigitalPhotos.net

A nyelvi profil megalkotásával egy személy pszichikai képét, jellemvonásait, szociális, kulturális képét is nagyon pontosan föl lehet vázolni, és ez nem is elsősorban a kutatásban, hanem a bűnüldözésben vagy a bűnelkövetésben játszik fontos szerepet.

A kutatás számára a nyelvi profilalkotásnak, a tömegessége és a torzításmentessége miatt van jelentősége, hisz ezekkel a befolyásmentesen közölt adatokkal könnyen lehet vizsgálni a nyelvi attitűdöt (a presztízsviszonyokat, a szabályok érvényességi körét), a nyelvi változásokat, azok terjedési sebességét, hatókörét.

Bódi Zoltán

 

| Még több lehetőség

0 Tovább

Digitális lábnyomok a virtuális térben

Az interneten nemcsak dokumentumok, adatok rendeződek hálózatba, hanem emberek is, jól példázzák ezt a közösségi hálózatok, amelyeken a valós életben már meglévő kapcsolatrendszerét szervezi, erősíti, tartja fenn a felhasználó, ezek közül a legnépszerűbb a Facebook, de van még számos ilyen szolgáltatás. A felhasználók ezeken a közösségi hálózatokon és általában a mai weben egyre több adatot osztanak meg magukról tudatosan vagy akaratlanul is, és ezzel a ténnyel nem mindenki szembesül. Amikor kitöltjük és megosztjuk a profiloldalunkat a Facebookon vagy a Google-ben, vagy vásárolunk a neten és megadjuk a kártyaszámunkat, vagy egyszerűen böngészünk, keresőszolgáltatásokat veszünk igénybe, nyilvánosan vagy zárt adatbázisban azonosító adatokat adunk magunkról (felhasználónév, IP-cím, személyes adatok, lokális adatok stb.), megadjuk a felhasználói szokásainkat is.

Image: Salvatore Vuono / FreeDigitalPhotos.net

 

Képletesen, metaforikusan fogalmazva úgy is érthetjük, hogy a world wide web virtuális terében barangolva digitális lábnyomot hagyunk magunk után. Hogy a képi világ teljes legyen, azzal, hogy egy webhely URL-jét elérjük a böngészőnkön keresztül, úgy is mondhatjuk, hogy felkeressük azt, és ha felkeressük, és ott járunk, akkor a metaforikus lábnyomunkat is otthagyjuk a virtuális térben. Legfeljebb nem látjuk, viszont tudni kell róla.

A metaforikus lábnyom kifejezés egyébként nem csak az interneten használatos, hanem más témakörökben is, például divatos manapság az ökológiai lábnyom kifejezés is.

Nem kell idegenkedni a metaforikus kifejezések elemei közötti látszólagos távolságtól, hisz a képi kifejezésekben pont ezek a képzettársítások az izgalmasak.

A téma folytatásában a digitális lábnyomok nyelvészeti vonatkozásait olvashatják vasárnap (május 22-én).

Bódi Zoltán

 

| Még több lehetőség

0 Tovább

Lesújt a kalapács!

A játékosok, illetve különböző interaktív webes szolgáltatások felhasználói találkozhatnak a banhammer kifejezéssel. Az előzménye a ban, illetve ahogy a magyar kifejezéskészletbe beépült, a bannol, kibannol ‘kitilt’. A banhammer a kétezres évek terméke, amikor az egyik online közösségi játékban a csaló játékosokat úgy tiltották ki (bannolták ki), hogy a játékos felhasználónevére, illetve karakterére a kitiltáskor egy kalapács sújtott le. Ezzel hangsúlyozottan is jelezték a közösség számára is, hogy a játékos ki van tiltva. Az egyszerű bannolás során a kitiltott felhasználó egyszerűen eltűnik a felhasználók sorából, senki nem veszi észre a kitiltás tényét, csupán maga a felhasználó, aki nem tud belépni, a rendszerbe. A banhammer viszont nyilvánosan, vizuálisan jelzi az egész közösségnek, a büntetést. Kicsit hasonlít a középkori nyilvános kalodába zárás, illetve a nyilvános kivégzés gyakorlatához. Míg az egyszerű kibannolás pedig olyan, mintha egy tömegből a titkosrendőrök feltűnés nélkül kiemelnének valakit.

A banhammer szóösszetétel két eleme a ban ‘kitilt’, ‘megtilt’, és az utótagja a hammer ‘kalapács’. A kifejezés lefordíthatatlan, összetett, metaforikus jelentéstartalma van. Mindenesetre rendkívül látványos a képi hátter.

 

Image: Boaz Yiftach / FreeDigitalPhotos.net

 

Itt merül föl az idegen szavak átvételének a kérdése. Lehet ehhez objektív, tudományos szempontok szerint viszonyulni, illetve szubjektív, ízlésbeli szempontok szerint is. Ízlésekkel nem érdemes vitatkozni: valakinek tetszenek az idegen kifejezések, valakinek nem. A hasznosságukat viszont nem lehet vitatni. A nyelvek természetes módon kapcsolatba kerülnek más nyelvekkel is, és ekkor kontaktusjelenségek jöhetnek létre, vagyis az egyik nyelv a másiknak átadhat nyelvi elemeket. Ekkor jelennek meg az idegen szavak is, amelyek tehát elengedhetetlen elemei a nyelvek életének. Nyelvünk az évezredek során sok idegen szót vett át más nyelvektől, és jó néhányat át is adott más nyelveknek. A konkrét példáinkra térve a kibannol érdekes, jellemző példája az idegen szavak nyelvünkbe való beépülésének: képzővel és igekötővel láttuk el, így beillesztettük a nyelvi rendszerbe, legalábbis az egyik szókincsrétegünkbe, a játékosok szókincsébe. Ebben a szövegkörnyezetben a bannol vagy kibannol olyan kifejezés, ami más stílusértékkel jelentkezik, mint a kitilt, bár a kifejezések jelentése teljesen egyforma. A banhammer viszont teljesen idegen szó, magyar változatáról nem tudok, a jelentéstartalma pedig sajátos, a játékosok szókincsének angol alapjai miatt nem is várható, hogy magyar változata jönne létre.

 

Bódi Zoltán

 

| Még több lehetőség

0 Tovább

Netidők Blogtársaság

blogavatar

Digitális talkshow írásban is. Itt a Netidők! Ez a Netidők c. rádióműsor (Petőfi Rádió) blogja. Mindaz, ami elhangzik az adásban, meg ami nem.

Utolsó kommentek