Wenn Algorithmen Zeitschriften lesen

Open access
Datum
2018-12-10Typ
- Journal Article
ETH Bibliographie
yes
Altmetrics
Abstract
In Zusammenarbeit mit dem Institut für Computerlinguistik der Universität Zürich (ICL UZH) lancierte die ETH-Bibliothek Zürich ein Pilotprojekt im Bereich automatisierter Textanreicherung. Grundlage für den Piloten bildeten Volltextdateien der Schweizer Zeitschriftenplattform E-Periodica. Anhand eines ausgewählten Korpus dieser OCR-Daten wurden mit automatisierten Verfahren Tests in den Bereichen OCR-Korrektur, Erkennung von Personen-, Orts- und Ländernamen sowie Verlinkung identifizierter Personen mit der Gemeinsamen Normdatei GND durchgeführt. Insgesamt wurden sehr positive Resultate erzielt. Das verwendete System dient nun als Grundlage für den weiteren Kompetenzausbau der ETH-Bibliothek auf diesem Gebiet. Das gesamte bestehende Angebot der Plattform E-Periodica soll automatisiert angereichert und um neue Funktionalitäten erweitert werden. Dies mit dem Ziel, Forschenden einen Mehrwert bei der Informationsbeschaffung zu bieten. Im vorliegenden Beitrag werden Projektinhalt, Methodik und Resultate erläutert sowie das weitere Vorgehen skizziert. Mehr anzeigen
Persistenter Link
https://doi.org/10.3929/ethz-b-000310357Publikationsstatus
publishedExterne Links
Zeitschrift / Serie
o-bib. Das offene BibliotheksjournalBand
Seiten / Artikelnummer
Verlag
VDBThema
Bibliothekswesen; COMPUTERLINGUISTIK; Named entity recognition (NER); Named entity linking (NEL); OCROrganisationseinheit
00060 - Abt. ETH-Bibliothek / ETH-Bibliothek
ETH Bibliographie
yes
Altmetrics