Impresszum Help Sales ÁSZF Panaszkezelés DSA

A metainformáció fontosabb mint gondolnánk!

A mai informatikai rendszerek világában talán észre sem veszi az egyszerű felhasználó, hogy milyen nagy jelentősége van a metainformációknak. Érdemes tehát megfejteni, hogy mit is jelent az, hogy metainformáció.

A meta- görög eredetű előtag, azt jelenti, hogy 'valaminek az elvonatkoztatott, áttételes formája', a különböző tudományterületeken ennél sokkal konkrétabb jelentésben használják. A meta- a nyelvészetben is ismerős előtag, a metanyelv a nyelvről szóló nyelv. Roman Jakobson híres kommunikációs alapmodelljében a metanyelv a kommunikációnak azt a velejáróját jelenti, amikor az érintkező felek az információcsere során használt kódot olyan funkcióban használják, hogy a nyelvről szóló adatokat közölnek vele, magát a kommunikációs folyamatot elemzik, reflektálnak kommunikációs szerepükre. Tehát amikor rákérdeznek egy szó jelentésére, vagy a használatban lévő nyelvi elemekről mondanak véleményt a kommunikáló felek, illetve a kommunikációs kód szerkezetét, szabályszerűségeit, jelentését írják le, akkor a metanyelvi funkció kerül elő. A metakommunikáció pedig a verbális kommunikációt kísérő kommunikációs kódok rendszere. Tehát összefoglalva és általánosítva a metakód vagy metainformáció a kódról vagy az információról szóló kód, az információ, a kód elvonatkoztatott modellje, formája.

 Image: jscreationzs / FreeDigitalPhotos.net

 

Az informatikában a metainformációkat, metakódokat nagyon széleskörűen használják, csak néhány közismertebb példát mutatok be ezek közül. Talán a legalapvetőbb metakód a fájlnév, hisz amikor nevet adunk egy állománynak, akkor a rendszer e név alapján azonosítja a fájlt, ezért jellemzően a felhasználónak is célszerű olyan fájlnevet választania, amelyik azonosíthatja az állomány tartalmát.

 Image: graur razvan ionut / FreeDigitalPhotos.net

 

Az egyik legkönnyebben megérthető metainformáció a GPS eszközök által produkált koordináta adatok csoportja, ezek kapcsolódhatnak például egy fotóhoz, vagy a pillanatnyi tartózkodási helyünket azonosító GPS adatok is ilyenek, amikor mondjuk egy közösségi szolgáltatásba bejelentkezve rögtön megjelenik az aktuális helyünkhöz kötődő adatsor. A GPS metaadatok sora még hosszan folytatható.

Itt látható ennek a posztnak a címkefelhője

 

A másik jellemző példája az informatikai eszközökben használatos metaadatoknak, amikor például egy blogbejegyzést ellátunk címkékkel, más néven megtegeljük a posztot. A címkékből metainformációs adathálózat, úgy nevezett címkefelhő jöhet létre az erre alkalmas programok segítségével. Tehát a modern informatikai eszközök már arra is lehetőséget nyújtanak, hogy a metainformációk közötti összefüggésrendszert, hálózatot is bemutassák.

A world wide web alapja a metainformáció, hisz a webes dokumentumokat, állományokat címkék, indexek, kulcsszavak, azaz metainformációk alapján keressük meg. A metainformációk hálózatából álló webes rendszer az úgy nevezett szemantikus web vagy másként mondva a web 3.0. Ez a web jövőjeként elismert rendszer a weben tárolt adatsorozatoknak a jelentéséről, struktúrájáról, összefüggéseiről szóló metainformációkból létrehozott hálózatot kapcsolja össze a ténylegesen elérhető információkkal, és mindezt a felhasználó számára kereshetővé, elérhetővé teszi. Ez azért jó, mert például a keresést könnyíti meg, ugyanis az információkeresést felfoghatjuk metainformációs stuktúrák alkalmazásának is, vagyis amikor keresünk egy szöveget a weben, akkor a keresőprogramokba a szöveggel összefüggő metainformációkat írunk be, és a jó kereső ezek alapján meg is találja a szöveget. A szemantikus web pedig pont ezt a módszert fejleszti tovább.

És végül említsük meg, hogy minden nyelvi támogatást nyújtó szoftverben (pl. helyesírás-ellenőrzőben) van egy metanyelvi rendszer, hiszen nyelvi modellek alapján következteti ki az alkalmazás, hogy az adott helyen milyen nyelvi kódnak kell szerepelnie.

A metainformációk tehát az informatikának köszönhetően egyre látványosabb és egyre hasznosabb szerepet játszanak mindennapi életünkben.

 

Bódi Zoltán

0 Tovább

Nem indul a gépem

Főleg akkor bosszantó ez, amikor másnapra egy blogposztot szeretnék összehozni. Reggel a PC a szokásos teendők közepette csak egy feketén maradt képernyővel válaszolt, többszöri újraindítás után is csak néhány elárvult füttyögés volt a válasz. Mit lehet tenni? Alább összefoglalom saját gyakorlatomat, mely talán a hozzám hasonlóknak is hasznos lehet. Nyugalom, nem a PC szereléséről lesz szó. És gyorsan hozzáteszem, hogy ez a poszt elsősorban azoknak szól, akik nem kívánják az ún. felhőalkalmazásokra építeni a személyes digitális környezetüket.

Bennem legalábbis fel sem merül, hogy a felhőre építsek. Éppen a számítógépes környezetem állandósága miatt, s hogy az adataimhoz lehetőleg mindig hozzáférjek, nem csak akkor, amikor megy a netkapcsolat, és az adott felhőalkalmazás is megy.

Nézzük, mi minden biztosítja jelenlegi nyugalmamat:

1.) Hordozható merevlemez. Ma már a hétköznapi halandó számára is elérhetőek a brutálisan nagy kapacitású (1-2 terabájtos) hordozható merevlemezek. Olyan nagyok, hogy a PC teljes tartalmát le tudom menteni, akkor is, ha már a Gmail (egy főre kiszabott) tárkapacitását is meghaladó az archívált postaládám, és az összes Netidők műsort örzöm a számítógépemen. Szánjuk rá azt a 10-20 ezer forintot, megéri. És aztán ha megvan az eszköz, akkor tényleg mentsük is adatainkat rendszeresen. Mondjuk kéthetente. Tényleges összeomlás esetén csak az utolsó két hét anyagai vesznek el. De a nagyon fontos adatokat, akár naponta, vagy félnaponta is menthetjük. És ha eljő' a minden gépet előbb-utóbb érinntő elmúlás, akkor ezt a hordozható merevlemezt egyszerűen USB porton csatlakoztatjuk a másik géphez.


Kép forrása: http://lessofme-lora.blogspot.com/2007_08_01_archive.html


2.) Másik gép. Manapság már nem olyan nehéz hozzájutni olyan olcsó géphez, ami nem mai darab, de az alapfeladatokra (szövegszerkesztés, netezés) bőven megfelelő. Sőt, éppen ezen meggondolásból szerintem a már kinőtt, túlhaladott eddigi pécénket semmiképpen sem érdemes kidobni vagy elajándékozni. Hiszen ismerjük a rigolyáit, ismerjük a képességeit, rajta vannak az általunk használt programok, a netkapcsolatot is beállítottuk rajta. Tehát tartsuk meg tartalékgépnek! Az asztal alatt/mögött elfér ez is, még csak ki sem kell húzni, viszont nagyon jól jön, amikor az aktuális gépünk - bármilyen okból - rakoncátlankodik. Javaslom azt is, hogy ezt a másodgépet teljes konfigurációként tartsuk meg, azaz a billentyűzetét, monitorát és egerét is tartsuk meg, és az egészet összerakva. Így gond esetén csak benyomjuk ezt a másik gépet, és be tudunk nézni a portálok híreibe, webmaillel a levelezésünkbe, vagy a közösségi oldalakba. És ha az 1-es pont szerinti hordozható merevlemezt csatlakoztatjuk ehhez a másodgéphez, akkor hozzáférünk az adatainkhoz is.

Hát pontosan így írom most én is ezt a posztot. Benyomtam a régi gépem és használom. A blogkiszolgáló rendszerünk (a Postr.hu) szerkesztő felülete pedig értelemszerűen felhőalkalmazás, oda már simán ki tudom másolni ezt a szöveget. De jó, hogy most nem kellett egy internetkávézóba mennem posztot írni!

Szilágyi Árpád


PS: telefonon azt a tippet adta Spányik "Chatman" Balázs, hogy elképzelhetően a gépem videokártyája adta meg magát. Miután felteszem ezt a posztot, utána is nézek...

0 Tovább

Kishalak és nagyhalak

Az identitással és a személyes adatokkal való visszaélés napi probléma az internethasználók körében. Szerintem kétféle felhasználó van, az egyik már valamilyen csalás áldozatává vált, míg a másik ezután lesz áldozat. Annyi mindenesetre igaz, hogy érdemes tudatosítani a közvéleményben az internetes csalások létét, és hogy illik felkészülni rájuk. Talán segít ebben, ha áttekintjük a legalapvetőbb informatikai csalásokról szóló kifejezéseket, így kiderülhet, hogy ezeknek milyen a képi világa, milyen összefüggések vannak köztük és milyen a személetmódjuk.

 

Image: Chris Sharp / FreeDigitalPhotos.net

 

Az egyik legalapvetőbb eljárás, és legáltalánosabb kifejezés a scam, amely angolul azt jelenti, hogy 'csalás', 'szélhámosság'. A kifejezés konkrét tevékenységet is jelöl, másrészt egyre inkább használják az internetes csalások összefoglaló jelentésében. A scam tevékenység közel áll a phishing nevű csaláshoz, csak az a különbség, hogy míg a scam valamilyen előnnyel kecsegteti a személyes adatait megadó személyt, addig a phishing inkább meg akarja téveszteni a kiszemelt áldozatokat. A scam és a phishing nyelvi szemlélete azt mutatja, hogy míg a scam konkrét személyt vagy személyeket akar átverni, becsapni, addig a phishing arctalan, szürke tömegnek képzeli az áldozatokat, hisz a phishing eredeti jelentése 'halászat'.

A scam és a phishing magyarítása kényes kérdés. Először is azt kell mérlegelni, hogy szükséges-e a magyar sztenderdben megszokottabb alakokkal helyettesíteni ezeket az új kifejezéseket vagy sem. Szerintem a minden áron való magyarításra nincs szükség, ezek az új kifejezések követik az informatikai szaknyelv angol mintáját. Értelmezés, magyarázat céljából viszont hasznos lehet a magyarítás. A scam jelentését jól lefedi a csalás, internetes csalás. A phishing helyett mondhatjuk az adathalászat kifejezést, ám tegyük hozzá, hogy az idegen eredetű metaforikus kifejezéseket tükörfordítással átültetni nem mindig szerencsés. Jelen esetben az adathalászat szóalak a magyar nyelvszemléletben is átlátható, befogadható.

A scam személyre szabott változata a spear phishing, ami olyan identitáslopást célzó tevékenység, amely kiszemeli a konkrét áldozatot, és személyre szabott, a megtévesztésig hihető körülmények között próbálja az áldozata személyes adatait kicsalni. Jól mutatja ezt a személyes jelleget a kifejezés elsődleges jelentése 'lándzsás halászat', tehát amikor a bennszülöttek a vízben lándzsával szúrják le egyenként a halakat.

Amikor a phishing tevékenységet VoIP telefonálás segítségével végzik, akkor a kifejezésben formailag is megjelenik a VoIP szóalakot szimbolizáló v betű, így alkották meg a vishing szóalakot. Ez tehát inkább szimbolikus, mint metaforikus kifejezésmód, a vishing a nyelvhasználók asszociációs készségére alapoz, és csak az értheti meg, aki már ismeri az alapkifejezést, a phishinget.

A phishing típusú tevékenységek célja az identitáslopás, amely angolul is ugyanígy van: indentity theft. Ez egy pontos, leíró típusú szerkezet, amely nélkülöz mindenféle képiséget, szimbolikusságot, nem kapcsolódik más jelentéskörökkel. Ám arra hívja fel a figyelmünket, hogy a személyes adatok megszerzése ugyanolyan lopás, mint ha valakinek a pénzét lopja el egy zsebtolvaj. Azért jó szembesülni ebben a szerkezetben a lopás szóalakkal, mert így tudatosíthatjuk, hogy az identitásunk adatai lophatóak, vagyis értékesek.

 

Image: Patchareeya99 / FreeDigitalPhotos.net

 

Az internetes csalások egy másik csoportja a spam köré épül. A spam típusú tevékenység jellemzően nem a megcélzott személy vagy csoport identitását akarja ellopni, hanem már ezeknek az adatoknak a birtokában végez kéretlen (célzott vagy vaktában végzett) reklámtevékenységet, és a hirdetéseken keresztül készteti valamilyen aktivitásra a felhasználót. A spam eredeti jelentése legendás és ismerős, a híres Moty Python-féle húskonzerves jelenetből származik, és a már-már unalmas, tömeges, mindenhol jelenlévő jellegre utal. A spam tehát szemléletmódjában közel áll a phishinghez, hisz mindkét tevékenység tömeges, arctalan, a nagy számú áldozati csoport alapján működik.

A spam és a scam szóalak hasonlósága sem véletlen, hisz a két tevékenység is igen hasonló. A scam voltaképpen egy spamféle, csak identitáslopásra van specializálva, míg a spam egy sima kéretlen reklámlevél.

A spam bonyolult, áttételes képi háttere miatt nehezen magyarítható, hisz a metaforikus kifejezés lefordításával a magyar kultúrkör számára ismeretlen kifejezést kapnánk, ha a spam helyett húskonzervet mondanánk, senki nem értené meg. A körülíró formákkal (pl. kéretlen reklámlevél, levélszemét stb.) pont az a képi háttér és intellektuális környezet vész el, ami a kifejezés stilisztikai értékét adja. Itt ütközünk olyan problémába, hogy az idegen metaforák átültetése mennyire bonyolult kérdés.

Jól megfigyelhető összefüggés, hogy az alapkifejezések (spam, phishing) tömeges, általános műveleti köre után jelennek meg később az egyre inkább célzott, egyre szofisztikáltabb, egyre inkább személyre szabott jelentésű, kisebb alaki változtatással megalkotott kifejezések (phishing, spear phishing, vishing). Ugyanezt a folyamatot megfigyelhetjük a spam esetében is, a spim az IM-eken vagyis az instant messengereken keresztül érkező spam, a spit pedig az internetes telefont veszi igénybe, a splog pedig a spam blog.

Van egy igen érdekes kifejezés is, amely a spam szóalak jelentéskörébe tartozik, ez a bacn vagyis a bacon 'szalonna' jelentésű szó írásbeli módosulása. A húskonzerv és a szalonna ugyanabba jelentéskörbe tartozik, és a kifejezések által jelzett két tevékenység is hasonló, a bacn is e-mailek egy csoportja, amely lehet akár tömeges is, ám jellemzően nem kéretlenül jöttek, hanem a tudtunkkal, de nem olvassuk el őket vagy csak átfutjuk, ám nem töröljük, csak gyűlnek a postafiókunkban, hasonlóan, mint a spamek. A bacn és a spam közös jelentésmozzanata a tömegesség.

Bódi Zoltán

0 Tovább

Nyelvtörténet számítógéppel

Koreai eredetű a japánnyelv címmel jelent meg az Index.hu-n az alábbi hír:
A japán nyelv eredetével kapcsolatban számítógépes modellezéssel kimutatták, hogy valamennyi úgynevezett japánnyelv egyetlen közös őstől származik mintegy 2182 évvel ezelőttről - ez az időszak egybeesik a Koreai-félszigetről elindult hatalmas vándorlási hullámmal. A Tokiói Egyetem kutatói, Sean Lee és Haszegama Tosikazu a japánnyelv 210 kulcsszavából listát készítettek, és kivetítették a listát 59 különböző dialektusra. A kutatók olyan alapszavakat választottak, mint például a testrészek elnevezése, a számok, a főbb főnevek és névmások. A tanulmány a japánnyelv eredetéről a Proceedings of the Royal Society című szaklapban jelent meg.

 

 

Image: Nutdanai Apikhomboonwaroot / FreeDigitalPhotos.net

 *

A nyelvek közötti rokonság kérdésével a több mint kétszáz éves történeti összehasonlító nyelvtudomány foglalkozik, tehát megvan a kifinomult módszertana, amely szerint a mai nyelvek rokonságának kutatásában igazán jelentős, új eredmények már csak elszórva valószínűsíthetők.

A népek vándorlásának megvan a nyelvi hatása is, ezt areális (területi) hatásnak hívjuk, amely kulturális kölcsönhatásoknak, a rövidebb-hosszabb ideig tartó érintkezésnek köszönhető, melynek során kultúrák, nyelvek és népek keveredhetnek. Ez nem rokoni kapcsolat, csak érintkezés.

Nehéz eldönteni, hogy melyek a rokonnyelvek és melyek az areális vagy kulturális érintkezésben lévő nyelvek. Ennek az alapja a történeti összehasonlító nyelvtudomány, amelynek az alapmódszerei már a 18. század végén megjelentek!

A módszer lényege: megfelelően kiválasztott nyelvi adatok mennyiségi és minőségi összehasonlítása. Lényegében adatbázisok közötti szignifikáns szabályszerűségek kereséséről van szó.


Image: jscreationzs / FreeDigitalPhotos.net

  

Az összehasonlítandó nyelvi adatbázisokból kizárjuk a hasonló hangzást, a gyermeknyelvi szavakat, a hangutánzó, hangulatfestő és indulatszavakat. A lényeges, összehasonlítandó nyelvi rendszertani elemek: a) hanzgókészlet, b) nyelvtani rendszer (ragozás, szerkezetek, nyelvtani jelentések kifejezőeszközei stb.), c) szókészlet. A leglátványosabb mindezek között a szókészlet, mert azzal szembesül leginkább a laikus, ám ez a legbizonytalanabb és leggyorsabban változó részrendszer, és a nyelvtani rendszer változik a leglassabban, az a legállandóbb.

Tehát viszonylag nagy és szabályozott számú nyelvi adatbázisok elemei közötti szignifikáns és egyben szabályszerű mintázatok kereséséről van szó: ezt kiválóan meg lehet gyorsítani számítógépes eszközökkel, melynek köszönhetően olyan szabályszerűségeket is felfedezhetünk, amelyeket a kézi, intuitív módszerrel csak igen nehezen. Jegyezzük meg rögtön, hogy ez a statisztikai, számítógépes módszer olyan szabályszerűségeket is fölismerhet, amelyek nem használhatók a nyelvészeti kutatásban. Az adatbázisok feltöltése, illetve tisztítása tehát továbbra is emberi munka lesz, mert a nagy szószámú, már eleve meglévő számítógépes korpuszokban mindenféle szó van, nem csak alapszókincsbeli, ám a történeti összehasonlító módszer szerint csak alapszókincsbeli, alapnyelvbeli elemeket szabad összehasonlítani. Az adatbázisok megfelelő szabályszerűségek szerinti összehasonlítása viszont jól végrehajtható statisztikai módszerekkel! Mindez a modern számítógépes nyelvészet területeihez tartozik.

 

Bódi Zoltán 

 

| Még több lehetőség

0 Tovább

Vége az ingyenes internetnek?

Május végén új szabályozás lép életbe az Európai Unióban az internetes cookie (süti) használata kapcsán. Hasonló lépésre készülődnek a tengerentúlon is, ahol nemrégiben terjesztettek elő törvényt a témában. De mindezeken túl a webes technológiák közé is be kívánják illeszteni a cookiek újfajta kezelhetőségét. A lépésekkel azt szeretnék elérni, hogy a felhasználók jobban védhessék személyes adataikat az interneten. Mindez azonban gyökeresen megváltoztathatja a böngészést és nem mellékesen hatással van az erre épülő iparágak működésére, üzleti modelljeik fenntarthatóságára, így végeredményben akár az ingyenes internet végét is jelenthetik.

Az, hogy ki figyelheti meg az internetes tevékenységünket, persze eredendően rajtunk, internetezőkön kellene, hogy múljon. Az internetes cookie a meglátogatott weboldalak által a felhasználó gépén elhelyezett adatcsomag, amelynek célja, hogy legközelebb már felismerhesse az oldal a látogatót, így egyszerűbb, személyre szabottabb legyen annak kiszolgálása. Az internetes sütik célja tehát elvileg az, hogy kényelmesebbé, hatékonyabbá tegyék a böngészést. Előfordul azonban, hogy a felhasználók megkérdezése és tudta nélkül egyéb célokra is felhasználják, például célzott hirdetésekhez gyűjtenek vele információkat. Az új szabályozás és technológiai megoldás lényege, hogy megtilthassák a felhasználók a velük kapcsolatos cookiek kezelését, ráadásul Európában egyenesen kötelező lesz előzetes engedélyt kérni a felhasználótól, mielőtt cookie települhet a gépére (jelenleg vita folyik arról, hogy a már elfogadott elvet hogyan lehet az egyes nemzeti jogrendszerekbe beilleszteni és a gyakorlatban kivitelezni).

A cél természetesen támogatandó és nemes. Mi akkor a bajom vele? A dolog kivitelezhetősége és nem szándékolt következményei. A cookiek célzott szolgáltatásokat tesznek lehetővé, illetve kényelmesebbé teszik a böngészést, jelenleg szinte teljesen észrevétlenül. Ha az embereket folyamatosan arra késztetjük, hogy a sütik elfogadását engedélyezzék (például felugró ablakokban), akkor az rontja az internetezés élményét, miközben egyáltalán nem garantálja a kívánt cél elérését (személyes adataikat tekintve tudatosabbak legyenek az internetezők, legyen lehetőségük megválasztani, hogy kinek mit engedélyeznek ezen a téren). Különböző, az internetre épülő iparágak (mint például a reklámozás – vagy a piackutatás, amiben én is dolgozom) félelmei szerint a törvényeknek megfelelő megoldások és a felhasználók jelenlegi járatlansága (mondhatjuk tudatlansága), nemtörődömsége oda vezethet, hogy a böngészőbe beépülő automatikus megoldások, mások által meghatározott alap beállítások fogják meghatározni azt, hogy a laikusok többsége hogyan fogja kezelni a jövőben az internetes sütiket. Mindez pedig oda vezethet, hogy az internetes reklámok kevésbé lesznek célozhatók vagy a kutatások kivitelezhetők, adataik megbízhatóak és relevánsak, mivel a felhasználók tömegesen tilthatják meg az ehhez szükséges cookiek települését.

Persze mondhatja az egyszeri felhasználó, hogy ez nem az ő baja. Csakhogy az ingyenes internetnek elválaszthatatlan része a célzott reklám, sok esetben ez teszi lehetővé a tartalom ingyenességét, e nélkül nem lenne ugyanolyan az internet. Tehát az új szabályozás feletti aggodalom nem csupán néhány, az internetezőkön „élősködő”, amúgy megtűrt rossznak tekintett iparág lobbistáinak nyavalygása. Ha az amúgy nemesnek tekinthető cél (rendelkezhessünk az adataink felett az interneten) kivitelezése felemásra sikeredik, annak hosszú távon lehetnek kihatásai az internet működésére, mivel a reklám alapú üzleti modell alapjait kérdőjelezhetik meg. Magyarul nem lesz (annyi) pénz a reklámokból a felhasználóknak nyújtott ingyenes tartalmakra és internetes szolgáltatásokra. A felhasználók az adataik (és a reklámra irányuló figyelmük) helyett kénytelenek lesznek a saját pénzükkel is fizetni. Az új szabályozásokhoz kapcsolódóan tehát olyan megoldásokra volna szükség, ahol az adatok feletti rendelkezés és az internet jelenlegi üzleti alapjai megférnek egymás mellett.

Pintér Robesz

 

12 Tovább

Netidők Blogtársaság

blogavatar

Digitális talkshow írásban is. Itt a Netidők! Ez a Netidők c. rádióműsor (Petőfi Rádió) blogja. Mindaz, ami elhangzik az adásban, meg ami nem.

Utolsó kommentek