Digitales Archiv und Webseiten archivieren

Digitale Bestände archivieren: Archivieren von Websites, digitales Archiv für Dokumente, eigene digitale Bibliothek und Mediathek

Tutorien

Empfehlungen aus meinen Bookmarks:

  • Tesseract OCR

    Automatische Texterkennung (OCR) zur Extrahierung von Text aus Grafikformaten (z.B. eingescannte Dokumente)
Software

Eigenentwicklungen:

  • OpenSemanticSearch

    Semantische Suchmaschine für große Fileserver, umfangreiche digitale Archive und Intranet (z.B. CMS und Wiki). Ermöglicht Suche nach verschiedenen Kriterien und einfache Navigation auch in sehr umfangreichen Datenbeständen alleine oder im Team. Die Daten können heterogen (verschiedene Datei- und Datenformate) und verteilt (verschiedene Server und vernetzte Systeme) sein. Ermöglicht um von Menschen generierte Metadaten erweiterte und ständig verbesserte Suchergennisse durch Social Search Features wie Tagging, Annotation und Bewertung sowie auch von Software wie automatischer Texterkennung oder durch automatische Schlüsse aus dem Vorliegen anderer Kriterien erkannter Zusatzinformationen.

Empfehlungen aus meinen Bookmarks:

  • Mozilla Archive Format

    Speichert die gerade in Firefox aufgerufene Webseite in einem auch angezeigte Multimediaelemente umfassenden komprimierten und standardisierten Archivformat
  • ScrapBook

    Firefox Plugin zum Archivieren der geladenen Website und zur Verwaltung eines kleinen privaten Webarchivs
  • Heritrix

    Crawler zum Archivieren von Websites im WARC File Format (kann von Wayback zugänglich gemacht werden).
  • Zotero

    Verwaltung kleiner bis mittlerer Webarchive, Dateiarchive, Zitate, Quellen, Notizen und Verknüpfungen
  • Wayback

    Software zum Betrieb einer WaybackMaschine zum Navigieren durch die verschiedenen Stände von Webseiten im eigenen Webarchiv.
  • Tesseract OCR

    Automatische Texterkennung (OCR) zur Extrahierung von Text aus Grafikformaten (z.B. eingescannte Dokumente)
Seminare
  • Datenberge erschließen: Eigene Suchmaschine betreiben

    Wie kann selbst im Rahmen kleinerer Vereine, Redaktionen, Nichtregierungsorganisationen oder Bildungseinrichtungen eine eigene Suchmaschine betrieben werden? Wie können die im Laufe der Zeit wild gewachsenen und in großen Teilen ungeordneten Datenberge erschlossen werden, die zudem noch über verschiedenste Systeme, Softwarelösungen und Speicherorte verteilt sind?
  • Dokumente und Medien verwalten: Dokumentenmanagement in Redaktion oder Verein

    Digitale Dokumente und digitale Medien verwalten, einordnen, bewerten und (wieder)finden: Methoden, Strategien und Lösungen mittels Dokumentenmanagementsystemen (DMS) für kleine und große Dokumentensammlungen, digitales Archiv der Redaktion, digitale Bibliothek oder Mediathek der Bildungseinrichtung, Fotoverwaltung oder Dokumentenverwaltung für Korrespondenz von Verein oder NGO.
Bookmarks

Onlinedienste: