wissens- und content managementasv.informatik.uni-leipzig.de/uploads/document/file_link/...wissens-...
TRANSCRIPT
Institut für Informatik
Wissens- und
Content Management
Gerhard Heyer
Universität Leipzig [email protected]
Einführung
Grundlagen, Konzepte, Definitionen
2 Prof. Dr. G. Heyer Modul Wissens- und Contentmanagement
Einführung
3 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Content Management
Content Management CM:
Systematische und strukturierte Beschaffung,
Erzeugung, Aufbereitung, Verwaltung, Präsentation,
Verarbeitung, Publikation, Wiederverwendung von
Inhalten.
Vgl. G. Rothfuss, C. Ried: Content Management mit XML
Einführung
4 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Grundkonzept Content Management
Publikation
Formatierung
Distribution
Sammlung und
Produktion von
Inhalten
Montage
Bearbeitung
Einführung
5 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Zwei Definitionen von CMS
1. Software-basiertes CM befasst sich mit der
systematischen Sammlung und Verwaltung von
Informationsbausteinen in einem einzigen (logischen)
Bestand.
2. Software-basiertes CM befasst sich mit der
systematischen Sammlung, Erstellung, Speicherung
und Veredelung von strukturierten Inhalten und
Mediendaten in einem einzigen, fein granulierten
Bestand.
Einführung
6 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Content Management Systeme erster Ordnung
Protokoll-
Funktionen
Check-in
Check-out
Daten-
sicherung
Rollback
Zugangs-
kontrolle
Massen-
Operationen
Mehrplatz-
Fähigkeit
Strukturierte
Speicherung von
typisiertem Inhalt
Meta-Information
Einführung
7 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Content Management Systeme zweiter Ordnung
Bearbeitung
Verifikation
Daten-
sicherung
Rollback
Mehrplatz-
Fähigkeit
Gestaltung
Aufzeichnung
atom.
Änderung
Strukturierte Speicherung von
typisiertem Inhalt
Meta-Information
Workflow
check-in
check-out
Anfrage-
Funktionen
Mehr-
sprachigkeit
Massen-
operationen
Versions-
Verwaltung
Protokoll-
Funktionen
Verarbeitung
Verwaltung
Zugangs-
kontrolle
Aggregierung
Beziehungen
Fremd-
formate
Einführung
8 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Content Management Systeme zweiter Ordnung (2)
Zusätzlich: Bearbeitung und Verifikation, Aufzeichnung
atomarer Änderungen, Aggregierung und Beziehungen,
Versionsverwaltung, Mehrsprachenfähigkeit, Workflow,
Gestaltung, Verarbeitungsfunktionen und die
Fremdformat-Verwaltung
All diese Funktionen in keinem kommerziell verfügbarem
Produkt perfekt realisiert, wenn auch High End Redaktions-
systeme dem Ideal sehr nahe kommen.
Durch Kombination von spezialisierten, modularen Program-
men, XML-Technologien und / oder intelligente Program-
mierung kann die beschriebene Funktionalität gut abgedeckt
werden.
Einführung
9 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Zielmärkte
1. Publishing-orientiert
hoher Aktualisierungsbedarf, typisch für Intranet und Internet basierte
Informationsseiten
2. Business-orientiert
Interaktions und Transaktions orientiert (B2B), (B2C)
Voraussetzung: Sicherheitskonzept
3. Dokumentenbasiert
Endprodukt sind vor allem Papier und CD-ROM Produkte, z. B. aktuelle
technische Dokumentationen für Produkte mit Endnutzern
(Produkthaftungsgesetz) entsprechend der Landessprache, Verlage
Einführung
10 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Was sind Contents?
Für unsere Zwecke zunächst (wird in Vorlesung 2 vertieft)
• Text (unstrukturiert, strukturiert)
• Datenbankinformation
• Bilder, Animationen
• Audio-Clips
• Videos
Einführung
11 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Die historischen Anfänge der Entstehung von Inhalten (Content)
• Seit den Anfängen der Verschriftlichung sind Informationen in Dokumentform kodiert und weitergegeben worden
• Verschiedene technologische Verfahren über die Jahrtausende entwickelt
• Charakteristische Eigenschaften aller Verfahren: zunehmende Flexibilität in Herstellung und Verwendung
Hieroglyphen in Ägypten (4.000 v. Chr.) Keilschrift im Reich der Sumer in
Mesopotamien (3500 v. Chr. )
Einführung
12 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Die historischen Entwicklung der Produktion von Publikationen
Buchdruck im Jahr 1568
Quelle: wikicommons
Schreibender Mönch
Quelle:www.uni-ulm.de
Offsetdruck im Jahr 2002
Quelle: pixelquelle.de
ePaper
Einführung
13 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Zentrale Aspekte der historischen Entwicklung
• Herstellungsverfahren
– Individuelle Herstellung (Keilschrift)
– Handwerklich / Manufakturen
– Industriell / Massenproduktion
– Digitalisierung, e-Paper
• Dokumentenformate
– Einzeldokument (Papyrusrolle)
– Umfangreiche homogene Dokumente (Buchdruck)
– Komplexe Dokumente aus einer Vielzahl von Quellen (Zeitschriften, Webseiten)
• Benutzungsdauer
– Ewig: Erfassung des zentralen Wissens (Hieroglyphen, Keilschrift)
– Langlebig: Speicherung relevanter Informationen (Bücher)
– Kurzlebig: Übermittlung von Nachrichten (Tageszeitung)
• Klassische Verwaltung (Management) von Dokumenten
– Bibliotheken (kirchlich, öffentlich, privat)
Einführung
14 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Trennung von Erstellung und Produktion der Dokumente
• Klassische Trennung der Kernprozesse
– Erstellung der Inhalte für Dokumente (z.B. Autor, Dichter)
– Produktion der Dokumente (z.B. Redaktion, Verlag, Buchdruck)
• Entwicklung verschiedener Berufsfelder
• Technologische Weiterentwicklung führt Kernprozesse zusammen
– Digitalisierung der Prozessschritte als Schlüssel für die Verbindung der Prozesse (Inhalteerstellung Redaktion Herstellung)
– Vorteil: Geschwindigkeit, Flexibilität in der Erstellung der Inhalte
– Nachteil: Verschwimmen der Grenzen, komplexere Rollendefinition klare Prozessdefinition notwendig
Einführung
15 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Gegenwart in der Produktion von Inhalten
• Früher war die Trennung der Prozesse technologiebedingt
– Verschiedene Techniken für Erstellung, Redaktion und Produktion
– Medienbrüche als Hemmer für die automatische Übergabe von Inhalten
• Heute laufen alle Kernprozesse digitalisiert ab
– Höhere Effizienz in der Abarbeitung
– Flexibilität in Bezug auf (kurzfristigen) Änderungen am Inhalt
– Kürzere Produktionszyklen für eine Publikation (im klassischen Printbereich), bis hin zur Echtzeit (Nachrichtenredaktionen)
– Autor auch mit einbezogen, gibt Artikel / Werke elektronisch ab
– Einbeziehung von externen Dienstleistern (z.B. Satz, Druck, Übersetzung)
– Beispiel: Erstellung eines wissenschaftlichen Tagungsbandes
• Redaktionsprozess ist zentraler Bestandteil Bündelungsfunktion
– Contentmanagement ist die Verwaltung des Redaktionsprozesses
Einführung
16 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Zukunft in der Produktion von Inhalten
Trends, die Einfluss auf die Produktion und die Präsentation von Inhalten haben werden
• Neue Medien in der Publikation – Digitalisierung im Medienbereich (Foto, Film, Musik) zeigen ähnliche Entwicklung wie der
klassische Content-Bereich ähnliche Folgen für die Prozesse absehbar
– Multimediale Elemente ermöglichen neue Publikationsformen
• Entstehung komplexerer Content-Produkte – Setzen sich aus vielen „Einzelteilen“ zusammen
(Content Aggregation / Content Syndication)
– Höhere Prozesskomplexität (viele Zulieferer, viele Redaktionen, viele Kunden)
– Kooperative Prozesse
• Publikationen werden „flüchtig“ (Möglichkeitsraum von Publikationen)
– Fast-Food Charakter: Schnell und billig?
– Klassischer Print als „Wissensbewahrer“ • reflektiver Charakter / Kommentare
– Wie kann dieser „Möglichkeitsraum“ bewahrt / archiviert werden
• Dezentrale Erstellung von Content – Wikipedia ist nur ein prominentes Beispiel
Einführung
17 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Content als Wirtschaftsfaktor
• Content Creation
– ist das Erstellen von inhaltlichen Basiskomponenten.
• Beschreibung einer Methode, eines Prozesschritts, eines Produkts, …
• Content Aggregation
– ist das Sammeln und kontextspezifische Integrieren von
Basiskomponenten aus verschiedenen Quellen zu komplexen Content.
• Rekombination von Inhalten schafft Mehrwert
• Mehrwert liegt in der kontextspezifischen Kombination von Bausteinen
• Content Syndication
– ist der Handel und Austausch von Content.
• Mehrwert wird durch Management von Angebot und Nachfrage
• Mehrwert durch technische Integration (RSS)
Einführung
18 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Content ist das Gedächntis unserer Zeit
„Das kulturelle Gedächtnis um 1900 ist ein «Bibliotheksphänomen»
(Foucault). Dieses Gedächtnis ist auf die Alphabetschrift und die
Druckkultur gegründet, auf deren Basis im Medium von Bibliothek und
Kanon die Vision eines stabilen Gedächtnisraums entstanden ist. Das
kulturelle Gedächtnis um 2000 hingegen ist diffus geworden. Dieser
Strukturwandel hat mediale und soziale Voraussetzungen.“ [Aleida Assmann in NZZ, 6.11.2001]
• Content als Kulturtechnik – Digitalisierung im Medienbereich fördert medialen und technologischen
Strukturwandel
– Konsum und Produktion von Content ist Teil der Gegenwartskultur
• Handhabung von Content impliziert Kulturelle Verantwortung – Langlebigkeit, Quellentreue, Nachvollziehbarkeit … Content als Kulturtechnik
muss sich diesen Fragen stellen Möglichkeitsraum
– Dokumentieren wir unsere kulturelle Leistung ausreichend? • Reicht uns Google Cache?
Einführung
19 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Zusammenfassung
• Technologische Entwicklung ist der Treiber der Veränderung
bei der Erstellung und Nutzung von Content
– Digitalisierung
• Management des Redaktionsprozesses ist zentrale
Kernaufgabe des Content Managements
• Content ist Gedächtnis unserer Zeit
– Handhabung des „Möglichkeitsraums von Publikationen“ ist eine zu
erlernenden uns sich entwickelnde Kulturtechnik
Einführung
20 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Definition Wissensmanagement
Aufgabe des Wissensmanagements ist es, das Wissen der in einem
Unternehmen beschäftigten Personen, das für einen Erfolg des
Unternehmens relevant ist, zu erfassen, zu strukturieren und zum
Nutzen des Unternehmens einzusetzen. Zu den konkreten
Aufgaben des Wissensmanagements gehören dabei nach von
Krogh und Venzin [1995] die folgenden Aufgaben:
– Erschließen von Wissen (Erfahrungen, Best Practices) für alle, die
dieses Wissen im Rahmen ihrer organisatorischen Rolle benötigen,
– Verfügbarmachen von Wissen am Ort und zur Zeit der Entscheidung,
– Erleichtern des effektiven und effizienten Entwickelns von neuem
Wissen,
– Sicherstellen, dass jeder in der Organisation weiß, wo Wissen
verfügbar ist, und
– Umsetzen dieser Kompetenzen
Einführung
21 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Kernprozesse im Wissensmanagement
Quelle: Bodendorf: Daten- und Wissensmanagement
• Primärer Fokus auf einer
Unterstützungstechnologie
• Möglichst durchgängige
Unterstützung aller
Wissensprozesse
Einführung
22 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Treiber und Dimensionen des betrieblichen Wissensmanagement
• Sensibilisierung der Unternehmen für WM durch
– riesige Informationsmengen,
– flexible Rahmenbedingungen,
– Fluktuation von Wissen (Intellectual Capital)
– dynamische und kooperative Entwicklungen sowie neue, moderne
Prozesse zur Leistungserbringung (Produkt / Service)
• WM ist ein übergreifendes und interdisziplinäres Thema und
teilt sich in
– eine organisatorische Sicht,
– eine (unternehmens)kulturelle Sicht und
– eine technische Sicht auf (sollte nicht überbetont werden)
Einführung
23 Prof. Dr. G. Heyer Modul Content und Wissensmanagement Daten / Informationssysteme
Informationen, Wissen und IT-gestütztes Wissensmanagement
Wissensträger
Informationsarten Informationsorganisation
Strukturell/Inhaltliche Analytik
Integrationsebene
Informationsmangagement
Wissen & Kompetenzen
Wissensarten
Wirkungsbereich des IT-gestützten
Wissensmanagements
Prozesswissen
Arbeitsweisen/Projektwissen
Einzelkompetenz/Expertenwissen
Gruppe/Team
Individueller Benutzer
Unternehmen
Unstrukturierte Daten (Text)
Strukturierte Daten (Datenbanken)
Semistrukturierte Daten (XML)
Einführung
25 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Technologieübersicht für IT-gestütztes Wissensmanagement
Quelle: Bodendorf: Daten- und Wissensmanagement
Rolle von CMS/DMS:
• Speicherung, Beschreibung, Zugriff, Verteilung
und Präsentation von Informationen, die zu
Wissen aggregiert werden können
• Enabler für ein informationsgetriebenenes
Wissensmanagement
• Querschnittsfunktion für WM
Einführung
26 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Abgrenzung von Systemen zum Dokumentenmanagement,
Contentmanagement und Wissensmanagement
Einführung
27 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Die vier Kernbereiche relevanter Technologien
Dokumenten-
verwaltung
Prozess-
organisation
Content-
verwaltung Wissensvermittlung
Papierdokumente digitalisieren,
verwalten und archivieren
Steuerung der Informationsflüsse
im Rahmen der Geschäftsprozesse
Auffinden von Informationen,
Unterstützung des Umwandlungs-
prozesses von Informationen
in Wissen
Flexible Verwaltung von Inhalten
ohne Medienbezug
Einführung
28 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Dokumentenorientierung (document related technologies – DRT)
• Dokumentenmanagementsysteme (DMS) sind
document related technologies (DRT) mit folgenden
Eigenschaften:
– eingescannte Papierdokumente
• elektronische Akte
– keine Trennung von Struktur, Layout und Inhalt (max. Legende)
– abgeschlossene Einheit, die Zweck gebunden erstellt wird
– single source, single media
– Verfügbarkeit zur weiteren Verarbeitung (selten automatisch)
• DRT wird durch die Etablierung des Begriffs Content erweitert
und flexibilisiert führt zu content oriented technologies (CMS)
Einführung
29 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
DMS
• historisch gesehen ausgereifteste Technologie
• Ziel: Papierdokumente am Arbeitsplatz „auf Knopfdruck
bereitstellen“.
– Umwandlung in elektronische Dokumente
– Archivierung und Verwaltung
– Verteilungsfunktionen, Recherche
– Workflowunterstützung
• Grenzen zwischen den einzelnen Komponenten verschwimmen
Einführung
30 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Bedarfe und Enabler für Dokumentenmanagementsysteme
• Ursachen für den Einsatz von DMS:
– 2,6 Mrd. Seiten Papier pro Tag (Tendenz stark steigend)
– Dezentralisierung, Notwendigkeit für standortübergreifenden Zugriff
• Nachvollziehbarkeit im Umgang mit dem Dokumenten
– längere Suchzeiten durch Wachstum der Archive
– zeitnahe Bereitstellung von Dokumenten als Anforderung von Kunden und überwachenden Organisationen
– Verkürzung der Entscheidungswege durch Kopplung von DMS und betrieblichen Abläufen (z.B. Genehmigungsworkflows)
– Medienbrüche innerhalb eines Vorgangs
– Mehrfachablage von Dokumenten vermeiden
• Enabler:
– Preisverfall für digitale Speicher macht umfangreiche Archive möglich
– Internettechnologien ermöglichen den system-, technologie- und ortsübergreifenden Zugriff auf Dokumente
Einführung
31 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Merkmale und Funktionen von DMS
• wichtige Merkmale dieser Systemkategorie sind:
– dynamische Ablage
– durch Versionsmanagement kontrollierter Änderungsdienst
– kooperative Bearbeitung von Dokumenten durch mehrere Bearbeiter
– Zugriff auf Dokumente mittels Datenbank über Suchmerkmale oder Strukturen
ähnlich denen eines Dateimanagers
– Speicherung von Dokumenten und Verwaltungsinformationen auf optischen und
magnetischen Speichermedien
• Archivierungsfunktion
– kontrollierter Datenaustausch über Check- in- und Check- out- Mechanismen
• weitere Funktionen, die in den letzten Jahren hinzukamen
– Groupware-Funktionalitäten
– Imaging (Archivierung)
– Diskussionsforen
– Internetdienste
Einführung
32 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Techniken im Dokumentenmanagement (Digitalisierung)
• Digitalisierung von Dokumenten (auch
Capturing)
– Erfassen der Originalvorlagen (Scannen)
– Erkennen des Inhaltes mit automatischen Verfahren
OCR – Optical Character Recognition
– Überführen in ein digitales Format (Rasterbild,
Bitmap), das mit den erkannten Texten verbunden
ist (z.B. Plain-Text, PDF)
Einführung
33 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Techniken im Dokumentenmanagement (Indexierung)
• Indexierung von Dokumenten
– Grundlage für das Wiederauffinden von Dokumenten
– ermöglicht Einteilung in Kategorien und Cluster
– Referenzierung von Dokumenten (z.B. Verweis auf Anlagen)
• Berücksichtigung typischer Identifikationsmerkmale:
– Datum,
– Autor,
– Dokumenttypen (z.B. Rechnungen etc.)
– laufende Nummern (Posteingangsnummern, Rechnungsnummern)
• Arten der Indexierung:
– Manuell: Benutzer kategorisiert vorliegende Dokumente anhand von Taxonomien
oder Schlagworten
– Automatisch: Aufbau eines Volltextindex mit automatischen Verfahren, Extraktion
typischer Merkmale und Kategorisierung von Dokumententypen
Einführung
34 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Techniken im Dokumentenmanagement (Speicherung/Archiv)
• Speicherung von Dokumenten kritisch für dauerhafte Verwendung
– Systeme sind jedoch kommerziell verfügbar
• Unterscheidung nach Art des Mediums:
– Magnetische Medien: Festplatten, Bandlaufwerke
– Optische Medien: CD, DVD, WORM
• Unterscheidung nach Geschwindigkeit des Zugriffs:
– Optisch – langsam, aber dauerhaft
– Magnetisch – schneller Zugriff, Veränderungen möglich
• Verwaltung oft in Datenbankmanagementsystemen
– gemeinsam mit den Dokumenten (BLOB)
– Nur für die Zusatzinformation mit Verweis auf den (externen) Dokumentenlagerort
• Verwaltung der verschiedenen Speichermedien wird als Information Management Lifecycle bezeichnet
– kurz- mittel und langfristige Speicherung (Archivierung)
Einführung
35 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Techniken im Dokumentenmanagement (Suchen)
• Suchen und Finden von Dokumenten zentral für den Zugriff auf
gespeicherte und archivierte Dokumente
• zwei Zielstellungen:
– Wiederauffinden von Dokumenten auf dem „eigenen Schreibtisch“
– Wiederauffinden von Dokumenten irgendwo im System bzw. der Organisation
(also auch auf „anderen Schreibtischen“ und im Archiv)
• zwei Aspekte:
– Arbeitsorganisation: strukturiertes Ablegen und Wiederauffinden (Analogie zu
traditionellen Ablagesystemen)
– Recherche: Auffinden der entsprechenden Dokumente durch Formulierung einer
Suchanfrage (Analog der Internetrecherche)
• zwei Verfahren:
– Volltextsuche (Indexbasiert, Boolsche Verknüpfungen)
– strukturierte Suche auf der Basis von Metadaten (Erstellungsdatum, Autor …)
Einführung
36 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Das papierlose Büro – ein Traum?
• ursprüngliche Vision:
– Einsparung von Kosten (Porto, Personal, Platz, Material)
– Beschleunigung der Abläufe
• war so nicht umsetzbar
– datenschutzrechtliche Gründe für (private) postalische Post
– Widerstände des Managements
– Wechselwirkungen des Unternehmens mit der Umwelt (Austausch von Papierdokumenten mit Kunden und Partnern)
• ABER:
– Digitalisierung der Kommunikation (E-Mail) ist ein starker Akzeptanztreiber für elektronische Dokumente
– Effizienz der Abläufe bei digitaler Dokumentenverarbeitung (Electronic Banking, Steuererklärungen, Produktdaten, e-Goverment) ist erkennbar
Einführung
37 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Die vier Kernbereiche relevanter Technologien
Dokumenten-
verwaltung
Prozess-
organisation
Content-
verwaltung Wissensvermittlung
Papierdokumente digitalisieren,
verwalten und archivieren
Steuerung der Informationsflüsse
im Rahmen der Geschäftsprozesse
Auffinden von Informationen,
Unterstützung des Umwandlungs-
prozesses von Informationen
in Wissen
Flexible Verwaltung von Inhalten
ohne Medienbezug
Einführung
38 Prof. Dr. G. Heyer Modul Content und Wissensmanagement
Grundlegende Funktionen von Content Management Systemen
Integration
• getrennte Betrachtung
von Inhalt, Layout,
Struktur und Legende
• Strukturdefinitionen
(auch Rubrik- und
Navigationsstrukturen)
• Informations-
klassenbildung
• Workflow Prozesse
(QS, Redaktion,
Pflege, Lifecycle)
• Link- und
Changemanagement
• Benutzer, Rollen,
Rechte
• Kommunikations-
sicherheit
• Distribution
(Webserver, Offline,
Print, ePaper, ...)
• Funktionsprinzipien
(Staging, Live, Misch)
• Architektur
• Technologien
( HW / SW / DBMS)
• Rohdaten / Rohinformationen
• Legacy- / ERP- Systeme
• EAI – Enterprise Applikation Integration
• Componentware
• Middleware
Content Management Systeme