About: ALTO (XML)

An Entity of Type: programming language, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

ALTO (Analyzed Layout and Text Object) is an open XML Schema developed by the EU-funded project called METAe. The standard was initially developed for the description of text OCR and layout information of pages for digitized material. The goal was to describe the layout and text in a form to be able to reconstruct the original appearance based on the digitized information - similar to the approach of a lossless image saving operation. The standard is hosted by the Library of Congress since 2010 and maintained by the Editorial Board initialized at the same time.

Property Value
dbo:abstract
  • ALTO (Analyzed Layout and Text Object) is an open XML Schema developed by the EU-funded project called METAe. The standard was initially developed for the description of text OCR and layout information of pages for digitized material. The goal was to describe the layout and text in a form to be able to reconstruct the original appearance based on the digitized information - similar to the approach of a lossless image saving operation. ALTO is often used in combination with Metadata Encoding and Transmission Standard (METS) for the description of the whole digitized object and creation of references across the ALTO files, e.g. reading sequence description. The standard is hosted by the Library of Congress since 2010 and maintained by the Editorial Board initialized at the same time. In the time from the final version of the ALTO standard in June 2004 (version 1.0) ALTO was maintained by CCS CCS Content Conversion Specialists GmbH, Hamburg up to version 1.4. (en)
  • ALTO (Analyzed Layout and Text Object) ist ein offenes XML Schema zur Beschreibung von Layoutinformationen digitalisierter Objekte. Der Standard wurde ursprünglich für die Beschreibung von OCR-Erkennungsergebnissen Text und Layout auf Seitenebene von digitalisierten Materialien entwickelt. Ziel war es, den Text und das Layout so zu beschreiben, dass eine Rekonstruktion auf Basis digitalisierten Materials möglich wäre. ALTO wird oft in Kombination mit Metadata Encoding and Transmission Standard (METS) für die Beschreibung des gesamten digitalisierten Objektes und die Erzeugung von Referenzen innerhalb der ALTO-Datei verwendet, z. B. um die Lese-Abfolge festzulegen. ALTO wurde in dem von der EU geförderten Projekt METAe entwickelt. Seit 2010 wird der Standard durch die Library of Congress und ein Herausgeber-Team gepflegt. Durch die Empfehlung in einer DFG-Richtlinie ist ALTO ein de facto-Standard für Text-Digitalisierungsprojekte in Deutschland und wird beispielsweise vom DFG-Viewer unterstützt. (de)
  • ALTO (Analized Layout and Text Object) es un esquema XML (usado para almacenar información en forma electrónica) que detalla los metadatos técnicos para describir el diseño gráfico y el texto de las imágenes digitales -ej. páginas de un libro o periódico-, obtenido por medio de un reconocimiento óptico de caracteres. Se inició en un proyecto europeo denominado METAe.​ Su finalidad es describir el texto y su disposición en la página de una forma que haga posible reconstruir la apariencia original basándose en la información de la página digitalizada; un enfoque similar al de una operación de guardar la imagen sin pérdida de información por compresión. Comúnmente se utiliza como un esquema de extensión dentro la sección de metadatos administrativos del esquema METS (Metadata Encoding and Transmission Standard) que sirven para la descripción de la totalidad del objeto digitalizado y la creación de referencias a través de los distintos archivos que lo componen. Su uso es más que conveniente para la conservación y búsqueda de la información textual a largo plazo, como resultado de un proceso de digitalización, por ser un estándar abierto XML frente al PDF/A, que también permite la superposición de la imagen y texto. (es)
  • ALTO (Analysed Layout and Text Object) est un standard XML permettant de rendre compte de la mise en page physique et de la structure logique d'un texte transcrit par reconnaissance optique de caractères (OCR). Le format est issu du projet européen METAe. Ce schéma maintenu par la Bibliothèque du Congrès et la Bibliothèque nationale de France, est très utilisé pour la conversion en mode texte (OCR) en France et à l’étranger.Il est très adapté à la conservation à long terme des données issues de la conversion ; il permet une réutilisation ultérieure du mode texte, dans la mesure où il contient pour chaque boîte de texte : * les coordonnées, * le taux de confiance de reconnaissance * des éléments de forme (police par ex.). Le format s'adapte tout particulièrement aux politiques de numérisation actuelles, il permet la superposition de l’image et du texte (en PDF par ex.). La Bibliothèque nationale de Finlande a développé un éditeur en ligne permettant aux utilisateurs de corriger le texte reconnu de façon logiciel et d'ainsi améliorer le résultat de façon collaborative. (fr)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 33593073 (xsd:integer)
dbo:wikiPageLength
  • 3577 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1079026937 (xsd:integer)
dbo:wikiPageWikiLink
dbp:date
  • 2014-09-04 (xsd:date)
dbp:url
dbp:wikiPageUsesTemplate
dcterms:subject
gold:hypernym
rdf:type
rdfs:comment
  • ALTO (Analyzed Layout and Text Object) is an open XML Schema developed by the EU-funded project called METAe. The standard was initially developed for the description of text OCR and layout information of pages for digitized material. The goal was to describe the layout and text in a form to be able to reconstruct the original appearance based on the digitized information - similar to the approach of a lossless image saving operation. The standard is hosted by the Library of Congress since 2010 and maintained by the Editorial Board initialized at the same time. (en)
  • ALTO (Analized Layout and Text Object) es un esquema XML (usado para almacenar información en forma electrónica) que detalla los metadatos técnicos para describir el diseño gráfico y el texto de las imágenes digitales -ej. páginas de un libro o periódico-, obtenido por medio de un reconocimiento óptico de caracteres. Se inició en un proyecto europeo denominado METAe.​ (es)
  • ALTO (Analyzed Layout and Text Object) ist ein offenes XML Schema zur Beschreibung von Layoutinformationen digitalisierter Objekte. Der Standard wurde ursprünglich für die Beschreibung von OCR-Erkennungsergebnissen Text und Layout auf Seitenebene von digitalisierten Materialien entwickelt. Ziel war es, den Text und das Layout so zu beschreiben, dass eine Rekonstruktion auf Basis digitalisierten Materials möglich wäre. ALTO wurde in dem von der EU geförderten Projekt METAe entwickelt. Seit 2010 wird der Standard durch die Library of Congress und ein Herausgeber-Team gepflegt. (de)
  • ALTO (Analysed Layout and Text Object) est un standard XML permettant de rendre compte de la mise en page physique et de la structure logique d'un texte transcrit par reconnaissance optique de caractères (OCR). Le format est issu du projet européen METAe. * les coordonnées, * le taux de confiance de reconnaissance * des éléments de forme (police par ex.). Le format s'adapte tout particulièrement aux politiques de numérisation actuelles, il permet la superposition de l’image et du texte (en PDF par ex.). (fr)
rdfs:label
  • Analyzed Layout and Text Object (de)
  • ALTO (XML) (en)
  • ALTO (XML) (es)
  • ALTO (XML) (fr)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:wikiPageDisambiguates of
is dbo:wikiPageWikiLink of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License