hig.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard-cite-them-right
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • sv-SE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • de-DE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Spotting Words in Medieval Manuscripts
Centrum för bildanalys, Uppsala universitet/Sveriges lantbruksuniversitet.
Inst. för lingvistik och filologi, Uppsala universitet.
Högskolan i Gävle, Akademin för utbildning och ekonomi, Avdelningen för humaniora, Svenska språket.ORCID-id: 0000-0001-5072-4961
Centrum för bildanalys, Uppsala universitet/Sveriges lantbruksuniversitet.
2014 (Engelska)Ingår i: Studia Neophilologica, ISSN 0039-3274, E-ISSN 1651-2308, Vol. 86, nr 1, s. 1-16Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

This article discusses the technology of handwritten text recognition (HTR) as a tool for the analysis of historical handwritten documents. We give a broad overview of this field of research, but the focus is on the use of a method called ‘word spotting’ for finding words directly and automatically in scanned images of manuscript pages. We illustrate and evaluate this method by applying it to a medieval manuscript. Word spotting uses digital image analysis to represent stretches of writing as sequences of numerical features. These are intended to capture the linguistically significant aspects of the visual shape of the writing. Two potential words can then be compared mathematically and their degree of similarity assigned a value. Our version of this method gives a false positive rate of about 30%, when the true positive rate is close to 100%, for an application where we search for very frequent short words in a 16th-Century Old Swedish cursiva recentior manuscript. Word spotting would be of use e.g. to researchers who want to explore the content of manuscripts when editions or other transcriptions are unavailable.

Ort, förlag, år, upplaga, sidor
Routledge, 2014. Vol. 86, nr 1, s. 1-16
Nyckelord [en]
Medieval manuscript, Word spotting
Nationell ämneskategori
Humaniora
Identifikatorer
URN: urn:nbn:se:hig:diva-16163DOI: 10.1080/00393274.2013.871975ISI: 000335850200012Scopus ID: 2-s2.0-84900845419OAI: oai:DiVA.org:hig-16163DiVA, id: diva2:690693
Projekt
Sökning och informationsutvinning i stora samlingar av historiska handskrivna dokument
Forskningsfinansiär
VetenskapsrådetTillgänglig från: 2014-01-24 Skapad: 2014-01-24 Senast uppdaterad: 2018-03-22Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Person

Mårtensson, Lasse

Sök vidare i DiVA

Av författaren/redaktören
Mårtensson, Lasse
Av organisationen
Svenska språket
I samma tidskrift
Studia Neophilologica
Humaniora

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 386 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard-cite-them-right
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • sv-SE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • de-DE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf