Fuentes web
Entradas
Comentarios

La definición que aporta la UNESCO sobre el Patrimonio Digital orientada a la educación y a la cultura es la siguiente:

El Patrimonio Digital consiste  en “recursos únicos que son fruto del saber o la expresión de los seres humanos.  Comprende recursos de carácter cultural, educativo, científico o administrativo e información técnica, jurídica, médica y de otras clases, que se generan directamente en formato digital o se convierten a éste a partir de material analógico ya existente.”

Por otro lado,  la preservación digital queda definida por la misma organización como” el conjunto de procesos destinados a garantizar la continuidad de los elementos de patrimonio digital durante todo el tiempo que se consideren necesarios.” Su objetivo es mantener  “la capacidad de tener acceso a su mensaje o propósito esencial y auténtico.

Debido a los grandes avances realizados en el ámbito tecnológico en los últimos años, encontramos en la actualidad que  gran parte de la  información actual  se recoge en formas digitalizadas. La labor de los  profesionales se convierte de esta forma en un proceso de  selección de los  documentos digitales más notables para su  realizar su posterior recopilación.

 Una vez se ha llevado a caboel proceso de  la recopilación, los programas de preservación deben tratar los objetos digitales de diferentes formas:

  • Objetos digitales, (CD-ROM, DVD…) cuyas tareas para ser ingresado son las mismas que las llevadas a cabo con los documentos convencionales.
  • Objetos en linea, donde podemos diferenciar dos formas de transferir la publicación. La primera, donde el sujeto obligado transmite la publicación al repositorio. Y, la segunda, en la que le autoriza a acceder a su sistema informático para descargar el documento.

A pesar de todo esto, es importante destacar que el patrimonio digital presenta algunas dificultades a la hora de recopilar dichos documentos, como por ejemplo:

  • La  cantidad de material a evaluar es relativamente elevada.
  • Hay numerosos medios que son utilizados para producir y difundir los materiales digitales.
  • El tiempo de realización es decisivo.
  • Algunos objetos digitales son difíciles de definir.
  • Puede ser difícil establecer la procedencia de los materiales digitales.

Además, es necesario añadir la conveniencia de que el repositorio disponga de garantías de seguridad informática y contra las catástrofes naturales, sin olvidar las incidencias electromagnéticas que pueden afectar al normal funcionamiento de los equipos y a las distintas clases de memorias masivas en las que se almacenan los datos. Por ello, es aconsejable que  se realicen copias de seguridad de la información que serán almacenadas en lugares diferentes de la sede del repositorio digital.

 

FUENTES:

Glosario

Autenticidad. Garantía del carácter genuino y fidedigno de ciertos materiales digitales, es decir, de que son lo que se afirma de ellos, ya sea objeto original o en tanto que copia conforme y fiable de un original, realizada mediante procesos perfectamente documentados.

Certificación. Proceso de evaluación del grado en que un programa de preservación cumple con un conjunto de normas o prácticas mínimas previamente acordadas. 

Protección de datos. Operaciones destinadas a resguardar los dígitos binarios que constituyen los objetos digitales de pérdidas o de modificaciones no autorizadas.

Objetos conceptuales. Objetos digitales con los que el ser humano interactúa de manera comprensible para él.

Patrimonio digital. Conjunto de materiales digitales que poseen el suficiente valor para ser conservados para que se puedan consultar y utilizar en el futuro.

Preservación digital. Acciones destinadas a mantener la accesibilidad de los objetos digitales a largo plazo.

Identidad de objetos digitales. Característica que permite distinguir un objeto digital del resto, incluidas otras versiones o copias del mismo contenido.
Ingesta. Operación consistente en almacenar objetos digitales, y la documentación relacionada, de manera segura y ordenada.
Integridad de objetos digitales. Estado de los objetos que se encuentran completos y que no han sufrido corrupción o alteración alguna no autorizada ni documentada.

Metadatos de preservación. Metadatos destinados a ayudar a la gestión de la preservación de materiales digitales documentando su  identidad, características técnicas, medios de acceso,  responsabilidad, historia, contexto y objetivos de preservación.
Derechos. Facultades o poderes legales que se tienen o ejercen con respecto a los materiales digitales, como son los derechos de autor, la privacidad, la confidencialidad y las restricciones nacionales o corporativas impuestas por motivos de seguridad.

Verificación. Acción de comprobar si un objeto digital, en un formato de fichero dado, está completo y cumple
con la especificación de formato.

FUENTES:

En el siguiente artículo abordaré las diferencias existentes entre lo que hoy en dia se conoce como documentación digital y la llamada documentación tradicional.

Empezemos pues por la Documentación digital:

Se habla de documentos digitales cuando” la información, no importa su forma: texto, sonido, imagen fija o en movimiento, se registra en un medio electrónico a través de codificaciones que se basan en el uso de combinaciones de señales eléctricas positivas y negativas, las cuales se representan por medio de los dígitos “0” ,señal negativa, y “1” ,señal positiva”. Es decir, cuando un documento  no recibe su nombre de la forma mediática en que se presenta la información, sino directamente de la manera particular en la que se registra.

Pueden ser:

  • Impresos digitalizados, aquellos que son el resultado de escanear un documento impreso.
  • Digitales para imprimir: elaborados directamente por medio de programas como “Word”.
  • Digitales multimediáticos, pensados para ser consultados en un ordenador y beneficiarse de  posibilidades electrónicas comoel hipertexto.

Sin embargo, es necesario también tener en cuenta :

  • Computabilidad: cuando la información puede ser procesada vía ordenador.
  • Virtualidad: cuando la información digital no está sujeta a las limitaciones propias de la analógica.
  • Capacidad.

Por otro lado y en cuanto a Documentos Tradicionales debemos mencionar que no disponen de las mismas características que los anteriores: se refieren a cualquier unidad de información registrada en un soporte que permita su almacenamiento y su posterior recuperación, y por tanto, que permita también una consulta ilimitada. Al  ofrecer solo texto e imagen estática, ni sonido ni imagen animada, la documentación traicional presenta una gran cantidad de limitaciones si realizamos una breve comparación con el tipo de documentación  mencionado anteriormente.

Por último y para finalizar y teniendo en cuenta todo lo mencionado anteriormente, podemos anotar las siguientes conclusiones:

  1. La documentación digital presenta  varias ventajas con respecto a la documentación tradicional como:

-Disponer de información multimedia: imagenes, textos y sonido. Lo que se conoce como “carácter multimediático del documento digital

-Hacer  posible la recuperación de la información perdida en un momento determinado.

-Ser virtual y  tener facilidad para ser reproducido, transmitido y almacenado.

-Interactividad, es decir, permitir al lector preguntar por contenidos, comentarios… ofreciendo incluso la posibilidad de modificar de forma sencilla el formato del texto.

-Propiciar  una relación muy directa con los usuarios de este tipo de edición.

-Hacer posible que la cantidad de información por unidad de volumen sea “infinita”.

-La hipertextualidad, permitiendo así al lector la libre navegación por el documento y rompiendo con el ordén natural que debería ser seguido en un texto tradicional.

-La mutabilidad y volatilidad:  haciendo igual de sencilla la posibilidad tanto de hacer desaparecer un texto cualquiera como el efectuar cambios en el sin la necesidad de tener que reproducirlo entero de nuevo. 

       2. Sin embargo, no todo son ventajas en la edición digital, ya que:

-Es necesario el poseer un ordenador personal mediante el que realizar la edición de documentos.

-La existencia de aparatos de lectura considerable es aún muy reducida.

-Además, como el medio de trabajo es informatizado esto conlleva a posibles problemas con la red u otros de caracter técnico.

-Poca ergonomía.

Para finalizar, hay señalar dos de las ventajas más notables de la edición tradicional: la confortabilidad y lo practico del formato ya que siempre se puede llevar y leer en cualquier lugar.

 

FUENTES DE INFORMACION EXTRAIDAS DE:

-http://www.msinfo.info/propuestas/documentos/documentos_digitales.html

-http://www.elprofesionaldelainformacion.com/contenidos/2001/diciembre/5.pdf

Social Bookmarking

Social bookmarking is a  new technology that has changed the way you surf on the Net.It  allows you to store links to websites or blogs, classify, evaluate, and to make a comment on them or find them from any computer.

When you keep an item on the server of one of these portals: Digg, Yigg, del.icio.us, My Yahoo or Google, you can make it available to other Internet users or to add your comment. Instead of using the search engine, you find the information through the members of the community of users (Usercomunnity) of a social bookmarking page. In that way, the network browsing experience becomes a “social” one because it is not the search engine algorithm that determines the importance of web content, but the number of system users that can access to it.

Visit the websites mentioned in the previous lines and find out more information about their social bookmarking service. Each portal has its own design to meet the needs of Web search.

However when we are using this type of system based on “tags”, we can find also some disadvantages, like:

 - There is no pre-established system of keywords or categories
 - There is no predefined structure for the tags (eg plural / singular, upper, accents, etc.). This can create spelling mistakes.
-  Tags can have more than one meaning and provide inaccurate results due to confusion between synonyms or antonyms.
- There is no way of structuring the ‘tags’ in a hierarchical way
SOURCES:

The main characteristics of the translation task according with a FEMTI´S report are the following :

  • Assimilation: The ultimate purpose of the assimilation task (of which translation forms a part) is to monitor a (relatively) large volume of texts produced by people outside the organization, in (usually) several languages.

 

  • Document routing or sorting: The purpose of document routing / sorting is to scan incoming translated documents quickly in order to send them to the appropriate points for further processing or storage.

 

  • Information extraction or summarization: The purpose of information extraction or summarization is to extract some portion(s) of the translated text, either manually or automatically, for subsequent processing or storage. Information extraction is typically concerned with filling templates by identifying atomic elements of events. In contrast, summarization aims to provide a self-contained and internally cohesive text which serves as a selective account of the original.

 

SOURCES:

  • http://www.issco.unige.ch:8080/cocoon/femti/st-home.html

In that article I am going to explain some concepts which are very closely relationated with the translation world, nad these terms are the following:

  • Machine translation: MT performs simple substitution of words in one natural language for words in another. Using corpus techniques, more complex translations may be attempted, allowing for better handling of differences in linguistic typology, phrase recognition and translation of idioms, as well as the isolation of anomalies. Improved output quality can also be achieved by human intervention: for example some systems are able to translate more accurately if the user has unambiguosly identified which words in text are names . With the assitance of these techniques, MT has proven useful as a tool to assist human translators, and in some cases can even produce output that can be used “as is”.
  • Computer-assisted translation: is a form of translation where in a human translator translates texts using computer software designes to support and facilitate the translation process. CAT is some times called machine-assisted, or machine-aidded translation.
  • Translation technology: Translation is the action of interpretation of the meaning of a text, and a subsequent production of an equivalent text, also called a translation, that comunicates the same message in another language. The text to be translated is called the “source text” and the language it is to be translated into is called the “target language” and the final product is sometimes called the “target text”.
  • Multilingual content management:A multilingual website is usually a mixture of global and local content. Local content presents no particular content management issues; global content-which has to be translated across all languages locales-does. Deciding where multiple versions of content are going to be required and where content can be maintained separately for different locales is a critical decison that will affect how a site should be maintained and what it will cost.

SOURCES:

As a broad subfield of artificial intelligence, machine learning is concerned with the design and development of algorithms and techniques that allow computers to “learn”. At a general level, there are two types of learning: inductive, and deductive. Inductive machine learning methods extract rules and patterns out of massive data sets.

The major focus of machine learning research is to extract information from data automatically, by computational and statistical methods. Hence, machine learning is closely related not only to data mining and statistics, but also theoretical computer science.

  • Applications

Machine learning has a wide spectrum of applications including natural language processing, syntactic pattern recognition, search engines, medical diagnosis, bioinformatics and cheminformatics, detecting credit card fraud, stock market analysis, classifying DNA sequences, speech and handwriting recognition, object recognition in computer vision, game playing and robot locomotion.

  • Human interaction

Some machine learning systems attempt to eliminate the need for human intuition in the analysis of the data, while others adopt a collaborative approach between human and machine. Human intuition cannot be entirely eliminated since the designer of the system must specify how the data is to be represented and what mechanisms will be used to search for a characterization of the data. Machine learning can be viewed as an attempt to automate parts of the scientific method.

Some statistical machine learning researchers create methods within the framework of Bayesian statistics.

SOURCES:

  • http://en.wikipedia.org/wiki/Machine_learning

In that article we are going to talk about the different and the most important research topics which are relationated with the Human Language Technologies.

The German Research Center for Artificial Intelligence elaborates that themes in their research:

  • Exploiting -and automatically extending-ontologies for content processing.
  • tighter integration of shallow and deep techniques in processing.
  • Enriching deep processing with stadistical methods.
  • Combining language checking with structuring tools in document authoring.
  • Document indexing for German and English.
  • Automatically associating recognized information with related information and thus buiding up collective knowledge.
  • Automatically structuring and visualizing extracted information.
  • Processing information encoded in multiple languages, among them Chinese and Japanese

 

The Edimburgh Language Technology Group researh mainly in the following areas:

  • Combining Shallow Semantics and Domain knowledge (EASIE).
  • Text Mining for Biomedical Content Curation (TXM).
  • Cross-retail multi-agent Retail Comparison (CROSSMARC).
  • Smart Qualitative Data: Methods and Community tools for Data  Mark-up (SQUAD).
  • Machine Learning for named Entity Recognition (SEER).
  • Integrated Models and Tools for Fine-Grained Prosody in Discourse (Synthesis).
  • Joint Action Science and Technology (JAST).
  • Study of how pairs colaborate when in plannig a route on a map (Collaborating using diagrams) 

 

The Austrian Research Institute for Artificial Intelligence (OFAI) develop linguistic resources and processes as well as application prototypes:

  • LINGUISTIC RESOURCES AND PROCESSES
    • Typed unification-based grammar formalisms.
    • Development of a HPSG-based grammar for German.
    • Natural Language Generation.
    • Speech Synthesis.
    • Computational morphology.
  • APPLICATION PROTOTYPES
    • Natural Language interfaces and advisory systems.
    • concept-to-speech systems.

 

SOURCES:

Hans Uszkoreit (Q1)

Uszkoreit is Professor of Computational Linguistics at Saarland University. He serves also as Scientific Director at the German Research Center for Artificial Intellingence (DFKI) where he heads the DFKI Language Technology Lab.  At the same time, by cooptation he is Professor of the Computer Science Department.

He studied Linguistics and Computer Science at The Technical University of Berlin and the University of Texas at Austin. During his time in Austin he also worked as a research associate in a large machine translation projects at the Linguistics Research Center. In 1984 he received his Ph.D in linguistics from The University of Texas. From 1982 until 1986, he worked as a computer scientist at the Artificial Intelligence Center of SRI International in Menlo Park, Ca. During this time he was also afilliated with the Center of the Study of Language and Information at Standford University as a senior researcher and later as a project leader. in 1986 he spent six months in Stuttgart to work for IBM Germany as a project leader in the project LILOG. During this time he also taught at the University of Stuttgart. 

in 1988 he was appointed to a newly created chair of Computational Linguistics at Saarland University and started the Deparment of Computational Linguistics and Phonetics. in 1989 he became the head of the newly founded Language Technology Lab. at DFKI. He has been a co-founder and principal investigator of the Special Collaborative Research Division “Resource-Adaptive Cognitive Processes” of the DFG. He is co-founder and professor of the of the “European Posgraduate Program Language Technology and Cognitive Systems”, a joint Ph.D. program with the University of Edinburgh.    

Some of his publications:

  • Uszkoreit, H. (2007) Methods and Applications for Relation Detection. In: Proceedings of the Third IEEE International Conference on Natural Language Processing and Knowledge Engineering, Beijing, 2007.
  • Uszkoreit, H., V. Kordoni, V. Kubon, M. Rosner and S. Kirchmeier-Andersen. (2005). ‘Language Technology from a European Perspective’. In Chris Brew and Dragomir R. Radev (eds.), Proceedings of the Second ACL Workshop on Effective Tools and Methodologies for Teaching NLP and CL, pp. 43 – 48, University of Michigan – Ann Arbor, June 2005, Association for Computational Linguistics.
  • Uszkoreit, H. & B. Joerg (2003 A Virtual Information Center for Language Technology: Ontology, Datastructure, Realization, In: Nordic Language Technology Yearbook,  Museum Tusculanums Forlag, Copenhagen.

 Sources:

There are a lot of research Centres, europeans and internationals, which tell us more things about the Human Languages Technologies and which are available on the Net. These are some of them:

  • National Centre for Language Technology (NCLT): Language is the key modality in communication. The National Centre for Language Technology conducts research into the processing of human language by computers such as speech recognition and synthesis, machine translation, human-computer interfaces, information rhltcetrieval and extraction, the teaching and learning of languages using computers and software localization and globalization. Research in Human Language Technology (HLT) is interdisciplinary and includes Natural Language Processing (NLP) and Computational Linguistics (CL). HLT has substantial economic implications and potential. The centre carries out basic research and develops applications. Director :P rof. Josef van Genabith. Administrator :D r. Yafa Al-Raheb.
  • HKUST Human Language Technology Center: Is a multidisciplinary research center  at the hong Kong University of Science and Technology (HKUST) whose mission is to lead state-of-the-art research directions that drive the development of new applications in both text and spoken language technology. HLTC is led by seven faculty members from de EE and the CS departments: Oscar Au, Roland Chin, Pascale Fung, Brian Mak, Bertram Shi, Manhung Siu and Dekai Wu, specializing in speech adn signal processing, stadistical and corpus-based natural language processing, machine translation, text mining, information extraction, Chinese Language processing, knowledge management, and related fields. Special emphasis is given to machine processing of Chinese language and Chinese information. Sistems built at HLCT include automated language translation for the Internet, speech-based web browsing, and speech recognition for the telephone.
  • Language Technology Group: Language Technology (LT) forms a major research area at the Austrian Research Institute for Artificial Intelligence (OFAI) since its inception in 1984. We conduct research in modeling and processing human languages, especially for German. This includes constructing linguistic resources, processing algorithms, and application prototypes. The language technology Group at OFAI is a member of the EU´s European Network of Excellence in Human Language Technologies (ELSNET).

 Sources:

Entradas antiguas »