Terminoen glosarioa

9 11 2009
  • Autenticidad. Garantía del carácter genuino y fidedigno de ciertos materiales digitales, es decir, de que son lo que se afirma de ellos, ya sea objeto original o en tanto que copia conforme y fiable de un original, realizada mediante procesos perfectamente documentados.

  • Protección de datos. Operaciones destinadas a resguardar los dígitos binarios que constituyen los objetos digitales de pérdidas o de modificaciones no autorizadas.

  • Patrimonio digital. Conjunto de materiales digitales que poseen el suficiente valor para ser conservados para que se puedan consultar y utilizar en el futuro.

  • Preservación digital. Acciones destinadas a mantener la accesibilidad de los objetos digitales a largo plazo.
  • Metadatos de preservación. Metadatos destinados a ayudar a la gestión de la preservación de materiales digitales documentando su identidad, características técnicas, medios de acceso, responsabilidad, historia, contexto y objetivos de preservación.

  • Programa de preservación. Conjunto de disposiciones (y de los responsables de tomarlas) destinadas a garantizar la accesibilidad permanente a los materiales digitales.





Dokumentazio tradizionala vs. dokumentazio digitala

7 11 2009

Oro har esanda, gure tradizioan, dokumentu hitza zera definitzeko erabili izan ohi da: euskarri baten gorde daitekeen esanahidun informazio-unitatea. Honen arabera, denok dakigunez, dokumentuak dira liburuak, aldizkariak baita bertan aurki ditzakegun artikuluak, gutunak, fakturak eta gai ezberdinen inguruko informeak. Bestalde, irudiak, grafikoak, argazkiak, irudiak, pelikulak eta bideoak ere badira dokumentuak; baita disko, zintza, kartutxo eta “kasetetan” grabatutakoak ere.

Guzti hauek, ezaugarri ezberdinak dituzten arren (forma: testua, irudi finkoa, soinua; euskarria: papera, zinta, larrua…), funtsean, gauza bera dira: erregistratutako informazio-unitatea.

Honen arabera, euskarri elektroniko batean gordetako edozein informazio-unitateri dokumentu digital deritzo. Euskarria diskette, CD Rom edo bestelakoak izan daiteke. Inprimitutako dokumentu bat izan beharrean, dokumentu digital bat da.

Dokumentazio tradizionala eta digitala konparatzean, zenbait ezaugarri eta ezberdintasun aurki ditzakegu:

  • Izaera interaktiboa –> Dokumentu tradizionaletan, irakurketa pasiboa egiten du irakurleak. Irakurleak dokumentuaren esanak jasotzen ditu, baina ezin dezake dokumentuaren edukiaren gaineko galderak egin ezta ideia berriak gehitu, iritziak eman etab. Dokumentu digitalari esker, ostera, dokumentu tradizionalak eskaintzen ez dizkigun baliabide guztiak erabili ditzakegu, alegia, irakurleak edukiak modifikatu ahal izatea, formatua aldatu ahal izatea, iritziak ematea, gai baten inguruko galderak egitea etab.
  • Izaera multimediatikoa –> Dokumentu tradizionalak monomediatikoak dira, hau da, modu bakar batean informatzen dute. Testu batek hitzen bitartez transmititzen du, argazki batek irudi baten bitartez, eta grabazio batek soinu baten bidez. Hala ere, jakin badakigu gaur egun hiru elementuak konbinatu daitezkeela eta komunikazio multimediatikoa sortu daitekeela. Hau da, hain zuzen ere, dokumentu digitalaren ezaugarririk nagusiena: multimediatikoak izatea.
  • Hipertextualitatea –> Dokumentu tradizionalean, aldez aurretik ezarritako orden bat daukagu. Liburu bat irakurtzean, esaterako, orden jakin bat jarraitu behar dugu (hasieratik amaierara). Nahiz eta irakurleak orden hori aldatu ahal duen, eta beste batean irakurri, idazleak nolabait ezarri digun ordena dugu. Dokumentu digitalean, ordea, esteken bitartez, dokumentuan leku ezberdinetan dauden bi hitz edo bi esaldi lotu ahal ditugu. Aipatutako hitz hori sakatzean, beste leku batera egiten dugu salto. Honi esker, irakurketa egitean salto egiteko aukerak ditugu, eta ez gaude irakurketa lineala egitera behartuta.

Ezaugarriok kontutan izanik, bi dokumentazioen abantailak ere aipatu beharra daukagu:

- Nire ustez, dokumentu tradizionala erosotasun handiko dokumentua da. Izan ere, liburu edo aldizkari bat irakurtzea oso erreza eta erosoa da. Eskuetan hartu eta irakurtzea nahikoa dugu. Horrez gain, gure artean elkarri pasatu ahal diogu eta besteekin modu sinplean konpartitu, baita modu fisiko baten ukitu eta eduki.

Dokumentu digitalak, ordea, ez du horrelako erosotasunik eskaintzen: dokumentu hauek irakurri eta esploratzeko, euskarri elektroniko bat behar dugu beti, eta honek zailtasunak eragiten ditu: euskarri elektronikoa ez baita hain erreza leku batetik bestera eramateko.

- Bestalde, dokumentu digitalak askoz ere aukera gehiago eskaintzen ditu. Izan ere, aurretik aipatutako izaera multimediatiko eta hipertextualitateari esker, aukera ugari ditugu testuaren barnean murgiltzeko baita beste testu batzuekin loturak ezartzeko.

Era berean, dokumentu tradizionala, zelanbait esateko, “testu itxia” da, alegia, ez du aldaketarako biderik ematen. Ez da gauza bera pasatzen, ordea, dokumentu digitalarekin. Dokumentu digitalak oso dinamikoak dira, erabiltzaileari parte hartzeko aukera ematen baitiote. Beraz, dokumentu hauek ere maiz aldatzen dira, eta iritziekin aktualizatzen dira.

Amaitzeko, gai honen inguruko nire iritzi laburra eman nahiko nuke. Izan ere, nire ustez, ez ditugu dokumentu tradizionalak ordezkatu behar eta jarraian dokumentu digitalak erabiltzen hasi. Bien arteko oreka aurkitzeko gai izan beharko ginateke. Dokumentu tradizionalak eskaintzen duten erosotasunaz baliatuz, dokumentu digitalen abantailak erabili kontsultak egiteko etab.

Bibliografia:





Social bookmarking-aren inguruan

28 10 2009

Social bookmarking delakoa, web orriak erabili, bilatu, antolatu eta konpartitzeko metodo bat da, Internet erabiltzaileei zuzendurik dagoena.

Social boomarking sistema batean, erabiltzaileek Internetetik hartutako errekurtso ugari gordetzeko aukera daukate. Hortaz, erabiltzaile batek gustoko gai baten inguruko errekurtsoak, informazioa eta loturak gordetzeko aukera du. Izan ere, gordetako informazio honekin, zerrenda edo hautaketak egin daitezke, publikoak zein pribatuak , erabiltzailearen nahiaren arabera. Beraz, antzeko interesak dauzkaten erabiltzaileak aipatutako estekez baliatu daitezke, interesatzen zaien informazioa jasotzeko.

Gaur egun, asko dira Interneten murgiltzen direnak, lana errazteko asmoz. Unibertsitateko irakasleak, esaterako, ikasteko materiala Interneten eskegiten dute, eta informazio berria aurkitzeko ere Internet dute jomuga. Bestalde, enpresa asko ere Internetez baliatzen dira, klienteekin harremanetan jartzeko, baita negozioak sortzeko bideak esploratu.

Orain dea gutxirarte, erabiltzaileok favoritos delako horren barruan sailkatu izan ditugu gogoko eta intereseko web-ak. Honek, ordea, erabilera pertsonala besterik ez du errazten. Nola konpartitu, hortaz, beste erabiltzaileekin (direla lagunak, direla ezezagunak) gogoko informazioa? Social bookmarking dugu arazoaren soluzioa.

Honi esker, informazio interesgarri eta zehatza aurki dezakegu, inongo arazo gabe, eta modu arinean. Ez daukagu Google edo bestelako bilatzaileen beharrik.

Nola erabili?

Aurretik esan bezala, markatzaile sozialak (social bookmarking) erabiltzea, gustoko informazioa aukeratzean datza, besteekin konpartitzeko. Aukeratutako informazio hau, era berean, antolatu egin beharra dago. Orokorrean, etiketa edo tag bidez egiten da, hau da, aukeratutako informazioa “gaika” sailkatzen dela esan genezake.

Esate baterako, literaturaren gaineko informazioa sailkatzean edo etiketatzean, horrelako etiketak (tag-ak) jarri ahal izango genituzke: literatura, eleberria, poesia…

Etiketa hauek publikatzerakoan, gaian interesatuta dauden beste erabiltzaile batzuk modu eraginkor batean aurkituko dute informazioa.

Abantailak eta desabantailak

Abantaileen artean, bat aipatu beharra dago, duda barik: erabiltzaileek sailkatzen dute informazio guztia, beraz modu eraginkorrean dago bananduta. (ez dago makinen beharrik informazioa prozesatzeko).

Bestalde, tag sistema hau erabiltzeak ere arazoak sortu ahal ditu. Izan ere, ez dago aldez aurretik ezarritako sistema bat tag-ak edota etiketak erabiltzeko. Beraz, nekeza izna daiteke informazioa aurkitzea, erabiltzaileen araberakoa baita etiketa bat edo beste erabiltzea.

Hona hemen gaztelainazko zenbait markaitzaile sozial; gure artean arrakastatsuenak:

  • Sare-sozialak: Tuenti, Facebook…
  • Faboritoak gehitzekoak: Memorizame.com, Mister Wong, Favelink, Miselegidos.com…
  • Delicious, Citeulike….

Iturriak:





Itzulpengintzarekin lotutako kontzeptuen azalpena [3.galdeketa]

28 04 2008

Artikulu honetan, hurrengo gaien inguruan arituko naiz, definizio zehatzak emanez: makina-itzulpengintza (machine translation), makinaz lagundutako itzulpengintza (machine aided translation), eduki eleanitzeko kudeaketa (multilingual content management) eta itzulpen-teknologia (translation technology).
Makina-itzulpengintza edo machine translationari dagokionez, askotan MT laburdura ere erabiltzen da horren inguruan aritzeko. Ordenagailu-linguistikaren arloaren barruko azpieremu bat da, eta lengoaia natural batetik besterako itzulpenak egiteko ordenagailu softwarea arabiltzen du.

Makinaz lagundutako itzulpengintza edo machine aided translation, CAT laburduraz ezaguna ere, itzulpengintza modu bat da. Gizakiak testuak itzultzen ditu ordenagailu-software delakoa erabiliz, itzulpengintza prozesua lagundu eta errezteko. Askotan CATari machine-assisted (makinaz lagunduta) esaten zaio.

Eduki eleanitzeko kudeaketa edo multilingual content management, hizkuntza ugaritan egindako itzulpengintzari dagokion definizioa da. Gaur egunean garrantzia handikoak dira horrelako testuak eta ahalik eta informazio gehien helaraztea ahalik eta hizkuntza gehiagotan da helburua.

Itzulpen-teknologia edo translation technology, hizkuntzen arteko teknologia automatiko eta simultaneoa. Momentuan momentuko ahozko itzulpenak egiten ditu, eta soinuez gain idatziak ere egin daitezke (titulu, azpitituloak etab. erabiliz)





MT sistema erabiliz egindako itzulpenak [3.galdeketa]

16 04 2008

Honako hauek dira MT sistemaren arabera egindako itzulpenen emaitzak:
1.- Hurbiltasun gutxiko hizkuntzen arteko itzulpena : Ingelesa – Gaztelaina : BBCko webguneko albiste bat, Instituto Cervantes-eko itzulpengintza zerbitzua erabiliz.
· Izenburuko akatsa aditza idazterakoan. Ingelesez: “Israel soldiers die in Gaza clash”. Gaztelainaz: “Dado de los soldados de Israel en el choque de Gaza”.
· Bigarren mailako izenburua idazterakoan, bi hiztegi arazo aurki daitezke. Inglesez: “Three injured in heavy clashes in the Gaza Strip“. Gaztelainaz: “Tres se han dañado en choques pesados en la tira de Gaza”
· Testua idazterakoan, aditzaren egituran akats bat aurki daiteke. Inglesez: “Four Hamas militants were also killed in the fighting”. Gaztelainaz: “Mataron a cuatro militantes de Hamas también en luchar”
· Testua idazterakoan, genero arazo bat agerian dago. Ingelesez: “The clashes took place near the border terminal”. Gaztelainaz: “Los choques ocurrieron cerca del terminal”
· Azkenengo paragrafoetan ere orden aldaketa larri bat ematen da, eta informazio falta bat ere ikus daiteke. Ingelesez: “Had destroyed a large area of agricultural land, knocking down olive and fruit trees”. Gaztelainaz: “Habían destruido un área grande de la región agrícola, golpeando abajo de árboles frutals de la aceituna y.”

2.- Hurbiltasun handiko bi hizkuntzen arteko itzulpena: Gaztelaina-Katalana : Katalunyako AVUI katalanez idatzitako egunkaritik hartutako artikulu baten itzulpena gaztelainera, Comprendium Translator itzulpengintza zerbitzua erabiliz.

Katalanez:

Setmana de la cultura catalana, a Madrid

Madrid acollirà a partir d’aquest dilluns la celebració de la Setmana de la Cultura Catalana, impulsada per la delegació de la Generalitat de Catalunya a la capital espanyola, l’Institut Ramon Llull i Caixa Catalunya.Madrid acollirà a partir d’aquest dilluns la celebració de la Setmana de la Cultura Catalana, impulsada per la delegació de la Generalitat de Catalunya a la capital espanyola, l’Institut Ramon Llull i Caixa Catalunya.

Entre els dies 21 i 28 d’abril s’organitzaran diverses activitats literàries i culturals a la capital espanyola amb la finalitat de promocionar-hi la cultura catalana i el dia de Sant Jordi.

La Setmana de la Cultura Catalana a Madrid, organitzada pel Centre Cultural Blanquerna i l’IRL, té la participació del Teatro Español, el Cercle Català i l’Escola Oficial d’Idiomes Jesús Maestro.

Gaztelainaz:

Madrid acogerá a partir de este lunes la celebración de la Semana de la Cultura Catalana, impulsada por la delegación de la Generalitat de Catalunya en la capital española, el Instituto Ramon Llull i Caixa Catalunya.Madrid acogerá a partir de este lunes la celebración de la Semana de la Cultura Catalana, impulsada por la delegación de la Generalitat de Catalunya en la capital española, el Instituto Ramon Llull i Caixa Catalunya.

Entre los días 21 y 28 de abril se organizarán diversas actividades literarias y culturales en la capital española con la finalidad de promocionar la cultura catalana y el día de Sant Jordi.

La Semana de la Cultura Catalana en Madrid, organizada por el Centro Cultural Blanquerna y el IRL, tiene la participación del Teatro Español, el Círculo Catalán y la Escuela Oficial de Idiomas Jesús Maestro.

Ondorio gisa esan beharra dago hurbiltasun handiko hizkuntzetan eginiko itzulpenak oso zorrotzak direla, akats gabekoak. Bestalde, hurbiltasun gutxiko hizkuntzen arteko itzulpenetan oso ohikoak dira akatsak: gramatikalak, ortografikoak, hitzen ordenarenak. . .





Itzulpengintzaren ezaugarri nagusienak FEMTIren arabera [3.galdeketa]

9 04 2008

FEMTIren arabera, honako hauek dira itzulpengintzaren ezaugarri nagusienak:

1.- Asimilazioa (barneratzea) : Asimilazioaren helburu nagusiena (itzulpengintzaren parte dena), organizaziotik kanpoko norbaitek idatzitako testu kopuru handi bat aurrera eramatea da; hizkuntza anitzetan (normalean).

2.- Zabalkuntza: bere xedea organizazioaren barnean ekoizitako dokumentuen itzulpena besteei helaraztea da.

3.- Komunikazioa: helbururik aipagarriena hizkuntza desberdinak hitz egiten dituzten pertsonen arteko elkarrizketak laguntzea da. Itzulpenen kalitatea altua izan behar da elkarrizketak zailtasun gabekoak izan daitezen; aportazio sintaktikoak eta hitz idiosinkratikoak izanda ere.





Hiru gaien azalpena [2.galdeketa]

29 03 2008

Artikulu honetan, eskatutako hiru gaien azalpenak jorratuko ditut:

Lehendabizi, SEPL (Sociedad Española para el Procesamiento del Lenguaje Natural) elkarteak aztertzen duen gai errekurrente bati buruz arituko naiz: “testu eleanitzen topaketarako teknika linguistikoak”. Azkenaldian, topaketa sistemak garrantzia handia lortu dute ordenagailuen ohiko erabileran. Giza-lengoaiaren elkarte honek, anbiguetate lexikoaren, aldaketa terminologikoaren eta translinguismoaren arazoak lantzen ditu. Era berean, dokumentuen ordenazio eta berreskurapenean teknika linguistikoak duten eginkizuna ere badu aztergai SEPL-ek. Helbururik garrantzitsuena marko berri bat sortzea da, sistema interaktiboen ebaluaziorako. Horrela, sistemak informazio eleanitza berreskuratzeko gauza izango da, eta erabiltzaileentzat ere garrantzia handikoa izan daiteke.

Bigarrenez, Alemaniako DFKI-LT ikerketa-guneak “elkar operatzen duten baliabide eta sistemetarako azpiegitura linguistikoa” (LIRICS) bezala definitzen den gaia lantzen du. LIRICS programa honek gaur egungo informazio eta komunikazio gizarte honen beharrak aztertzen ditu; globalizazio eta lokalizazioak komunikazio multilinguistikoa behar baitute, estandarizazio berri baterako behar handi bat sortuz. Ezinbestekoa da, era berean; standar eta eraldaketa horien garapena bertatik bertara ezagutzea. Hortaz, LIRICS proiektuak ISO kalitate standarren ezarpena erraztu nahi ditu Lengoaia-teknologiaren esparruan.

Hirugarrenez, eta bukatzeko; Irlandako National Centre for Language Technology ikerketa zentruak “galtzeko arriskuan dauden hizkuntzak” gai erabat interesgarria lantzen du. Euren esanetan, munduko hizkuntza guztien %90a baino gehiago galtzeko zorian edo arriskuan daude; 100 urteko epean. Horietako asko eta asko ez dira inoiz idatzi eta literaturan guztiz ezezagunak dira. Era berean, hizkuntza batzuk 20 hiztun baino gutxiago dituzte. Ezin daiteke ukatu hizkuntza hauek ere munduaren ondarearen parte direla, eta haien galera kultura eta zientzia aldetik izugarrizko galera izango litzateke. Nazioarteko elkarteek dioten arabera, zerbait egitea beharrezkoa da, eta National Centre for Language Technology ikerketa gune hau bi ildotan dihardu lanean: hizkuntza irakasteko moduak eta hizkuntza-dokumentazioa garatu.





Inbestigazio Gai Berriak (Recent Research Topics) [2.galdeketa]

27 03 2008

Artikulu honetan, Giza Lengoaiaren Ikerkuntzan azkenaldian gehien jorratzen diren gaiak aipatuko dira:

Ikerketa-guneei dagokienez, honako hauek dira aipagarrienak:

- Alemaniako DFKI – LT (Language Technology Laboratory-Lengoaiaren Teknologia Laborategia)-n honako gaiak lantzen dira aspaldian:

· Dokumentazio-aurkibideak inglesez eta alemanez.

· Informazio prozesamendua hainbat hizkuntzatan (Txinatarra + Japoniera).

· Hizkuntza-azterketa eta estruktura baliabideen konbinazioa.

· Informazioaren estrukturalizazio eta bisualizazio automatikoa.

- Euskal Herriko IXA TALDEAk hurrengo gaietan murgilduta dabil aspaldian:

· Semantikoki etiketatutako corpusa euskaraz.

· Emozioen errekonozimendu mixtoa euskaraz.

· Euskal hizkuntzaren atlas linguistiko bat sortzea.

· Baliabide linguistiko eta tresnen ustartzea XML erabiliz.

- EEBBetako California estatuko STANDFORD NATURAL LANGUAGE PROCESIG GROUP esparru ugaritan dihardu:

· Ikerketa basikoa linguistika-konputazionalean.

· Gramatika indukzioa.

· Hitzen esanahiaren argitzea/desanbiguazioa.

· Galderen erantzun automatizatua.

Ikerketa-sarerik aipagarrienetan hurrengo gaiak lantzen dira:

- European Network of Excellence in Human Language Technologies (ELSNET) Giza-lengoaiaren teknologiarako Europako Sarea, giza-lengoaiaren ikerkuntzaren inguruan honako helburuak lortzeko sortutako plataforma da:

· Orainaren analisiak egin eta etorkizuneko ikuspegiak landu.

· Jakintza eta esperientzia landu, konpartitu eta ustiatu.

· Ekintza innobatzaileak bideratu.

· Ingurugiro eta azterketa bateratu bat sustatu.

· Giza-lengoaiaren teknologiak bateratu Europako ikerkuntza eta garapena bideratuz.

Elkarteen artean, Espainiako SOCIEDAD ESPAÑOLA PARA EL PROCESAMIENTO DEL LENGUAJE NATURAL-SEPLN ere garrantzia handikoa da; eta honako gaiak jorratzen ditu:

· Anbiguetate lexikoaren konponketa.

· Zorroztasun handiko informazioa berreskuratzea.

· Etiketazio eta desanbiguazio morfosintaktikoa gazteleran.

· Multilinguismoa lantzeko teknika linguistikoak.

· Ezagutza linguistikoa desanbiguazio semantikoa bideratzeko.





Giza-lengoaia teknologiarako ikerkuntza guneak Europan [1.galdeketa]

17 03 2008

Honako hauek dira Europa mailako ikerkuntza gunerik garrantzitsuenetarikoak:

· Edinburgoko Lengoiaren ikerkuntzarako taldea

http://www.ltg.ed.ac.uk/

· Finlandiako Lengoaiaren ikerkuntzarako dokumentazio-zentroa

http://www.ling.helsinki.fi/filt/info/index-en.shtml

· Austriako ikerkuntza gunea

http://www.ofai.at/research/nlu/





Hans Uszkoreit-i buruz [1.galdeketa]

12 03 2008

Hans Uszkoreit, Saarland-eko Unibertsitatean Linguistika Konputazionaleko irakaslea izateaz gain, zuzendari zientifikoa ere bada German Research Center for Artificial Intelligence (DFKI) ikerketa guneko laborategian. Era berean, Computer Science Department-eko irakaslea ere bada. Uszkoreit-ek Linguistika eta Konputagailuen Zientzia ikasi zituen Berlineko Unibertsitate Teknikoan, baita Texas-eko(EEBB) Unibertsitatean ere. EEBBetan egon zen bitartean, itzulpengintza proiektu askotan murgidu zen.

Alemaniara bueltan, Stuttgart-eko IBM enpesan lana egiteari ekin zion. Horren ondoren, Saarland-eko Unibertsitatean lanean hasteko eskaintza onartu zuen eta Linguistika eta Fonetika Konputazionalaren departamentuan hasi zen.

Honetaz gain European Academy of Sciences, European Language Resources Association (ELRA)ko kidea da eta XtraMind Technologies GmbH eta beste hainbat elkarteko sortzaileetako bat da.

Bere publikaziorik garrantsitzuenen artean honako hauek aipagarri dira:

· Uszkoreit, H. (1982), “German Word Order and Constituent Structure in GPSG” In: Flickinger, Macken and Wiegand (Hrsg.) Proceedings of the West Coast Conference on Formal Linguistics, Stanford, Januar 1982.

· Shieber, S., S. Stucky, H. Uszkoreit and J. Robinson (1983) “Formal Constraints on Metarules” In: Proceedings of the 1983 Annual Meeting of the Association of Computational Linguistics, Cambridge, Massachusetts.

· Uszkoreit, H. “A Framework for Processing Partially Free Word Order” (1983), In: Proceedings of the 1983 Annual Meeting of the Association of Computational Linguistics, Cambridge, Massachusetts.

· Uszkoreit, H. (1986): “Linear Precedence in Discontinous Constituents.” In: Syntax and Semantics 20, Academic Press, 1986.

Hans Uszkoreit