Show simple item record

dc.contributor.author
Wanger, Regina
dc.contributor.author
Gasser, Michael
dc.date.accessioned
2018-06-19T12:35:10Z
dc.date.available
2018-06-19T12:26:05Z
dc.date.available
2018-06-19T12:35:10Z
dc.date.issued
2018-06-13
dc.identifier.uri
http://hdl.handle.net/20.500.11850/270809
dc.identifier.doi
10.3929/ethz-b-000270809
dc.description.abstract
Mit der Plattform E-Periodica (www.e-periodica.ch) stellt die ETH-Bibliothek rund 280 retrodigitalisierte Schweizer Fachzeitschriften mit insgesamt über 6 Mio. Seiten online zur Verfügung. Diese Menge an OCR-erkannten Texten bieten sich an, um dank automatisierter Textanreicherung zusätzlichen Mehrwert für die bessere Nutzbarkeit der Daten zu generieren. Vor diesem Hintergrund führte die ETH-Bibliothek gemeinsam mit dem Institut für Computerlinguistik der Universität Zürich im Jahr 2017 ein entsprechendes Pilotprojekt durch. Als Testkorpus wurden zwei umfangreiche Architekturzeitschriften (ab 1874 bis in die Gegenwart) mit computerlinguistischen Methoden aufbereitet, strukturiert und verlinkt. Im Vortrag werden zum einen die methodischen Schwerpunkte der verbesserten Texterkennung (durch die automatische Korrektur von OCR-Fehlern) und der Textanreicherung - durch die Erkennung, die Aggregierung und die Verlinkung von Personen- und Ortsnamen - ausgeführt. Zum anderen wird gezeigt, welche Resultate sich für Bibliothek und Forschungspartner aus dem Pilotprojekt ergeben. Auf Seite der Bibliothek gehören dazu sowohl die Nutzung der angereicherten Daten für optimierte Suchfunktionen und Informationsangebote in E‑Periodica als auch der Kompetenzaufbau in der Bereitstellung maschinenlesbarer Textkorpora. Der Nutzen für den Forschungspartner liegt in der Weiterentwicklung semantischer Erschliessungsmethoden. Diese neuen Formen der Inhaltserschliessung werden die Nutzung und Verarbeitung digitalisierter Bibliotheksinhalte in den kommenden Jahren entscheidend beeinflussen und voranbringen.
en_US
dc.format
application/pdf
en_US
dc.language.iso
de
en_US
dc.publisher
ETH Zürich
en_US
dc.rights.uri
http://creativecommons.org/licenses/by/4.0/
dc.subject
Automatische Textanreicherung
en_US
dc.subject
Named entity recognition (NER)
en_US
dc.subject
Named entity linking (NEL)
en_US
dc.subject
Optical character recognition (OCR)
en_US
dc.subject
COMPUTERLINGUISTIK
en_US
dc.title
Wenn Algorithmen Zeitschriften lesen - vom Mehrwert automatisierter Textanreicherung
en_US
dc.type
Other Conference Item
dc.rights.license
Creative Commons Attribution 4.0 International
ethz.size
18 p.
en_US
ethz.version.deposit
publishedVersion
en_US
ethz.event
107. Deutscher Bibliothekartag
en_US
ethz.event.location
Berlin, Germany
en_US
ethz.event.date
June 12-15, 2018
en_US
ethz.publication.place
Zürich
en_US
ethz.publication.status
published
en_US
ethz.leitzahl
ETH Zürich::00002 - ETH Zürich::00003 - Schulleitung und Dienste::00025 - Bereich VP Infrastruktur / Domain VP Infrastructure::00060 - Abt. ETH-Bibliothek / ETH-Bibliothek
en_US
ethz.date.deposited
2018-06-19T12:26:07Z
ethz.source
FORM
ethz.eth
yes
en_US
ethz.availability
Open access
en_US
ethz.rosetta.installDate
2018-06-19T12:35:14Z
ethz.rosetta.lastUpdated
2021-02-15T00:25:20Z
ethz.rosetta.versionExported
true
ethz.COinS
ctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.atitle=Wenn%20Algorithmen%20Zeitschriften%20lesen%20-%20vom%20Mehrwert%20automatisierter%20Textanreicherung&rft.date=2018-06-13&rft.au=Wanger,%20Regina&Gasser,%20Michael&rft.genre=unknown&rft.btitle=Wenn%20Algorithmen%20Zeitschriften%20lesen%20-%20vom%20Mehrwert%20automatisierter%20Textanreicherung
 Search print copy at ETH Library

Files in this item

Thumbnail

Publication type

Show simple item record