Wenn Algorithmen Zeitschriften lesen
Open access
Date
2018-12-10Type
- Journal Article
ETH Bibliography
yes
Altmetrics
Abstract
In Zusammenarbeit mit dem Institut für Computerlinguistik der Universität Zürich (ICL UZH) lancierte die ETH-Bibliothek Zürich ein Pilotprojekt im Bereich automatisierter Textanreicherung. Grundlage für den Piloten bildeten Volltextdateien der Schweizer Zeitschriftenplattform E-Periodica. Anhand eines ausgewählten Korpus dieser OCR-Daten wurden mit automatisierten Verfahren Tests in den Bereichen OCR-Korrektur, Erkennung von Personen-, Orts- und Ländernamen sowie Verlinkung identifizierter Personen mit der Gemeinsamen Normdatei GND durchgeführt. Insgesamt wurden sehr positive Resultate erzielt. Das verwendete System dient nun als Grundlage für den weiteren Kompetenzausbau der ETH-Bibliothek auf diesem Gebiet. Das gesamte bestehende Angebot der Plattform E-Periodica soll automatisiert angereichert und um neue Funktionalitäten erweitert werden. Dies mit dem Ziel, Forschenden einen Mehrwert bei der Informationsbeschaffung zu bieten. Im vorliegenden Beitrag werden Projektinhalt, Methodik und Resultate erläutert sowie das weitere Vorgehen skizziert. Show more
Permanent link
https://doi.org/10.3929/ethz-b-000310357Publication status
publishedExternal links
Journal / series
o-bib. Das offene BibliotheksjournalVolume
Pages / Article No.
Publisher
VDBSubject
Bibliothekswesen; COMPUTERLINGUISTIK; Named entity recognition (NER); Named entity linking (NEL); OCROrganisational unit
00060 - Abt. ETH-Bibliothek / ETH-Bibliothek
More
Show all metadata
ETH Bibliography
yes
Altmetrics