Datenanalyse
1. Abgrenzen der Miniwelten
Datenmodellierung heißt Umsetzen der Wirklichkeit auf die Ebene der Datenverarbeitung. Ein Datenmodell als Abbild der gesamten realen Welt eines Unternehmens ist aber weder sinnvoll noch möglich, vielmehr kann nur ein Ausschnitt aus der realen Welt, die sogenannte Miniwelt des Datenverarbeitungs - Anwenders beschrieben werden. Deswegen muss ein Abgrenzungs- prozeß einem jeden Datenmodellierungsprojekt vorausgehen, in dem möglichst präzise festgelegt wird
welcher Ausschnitt aus der realen Umwelt in das Datenmodell eingehen soll
für welche existierenden oder geplanten Datenverarbeitungs - Verfahren das Datenmodell als Grundlage dienen soll
Dabei sind möglichst eindeutige Kriterien festzulegen, die im Zweifel bei der nachfolgenden Datenmodellierung eine Entscheidung ermöglichen, ob ein bestimmtes Detail Bestandteil der Miniwelt (somit des Datenmodells) ist oder nicht. Je klarer ein Unternehmen von seiner Umwelt abgegrenzt ist, desto einfacher ist die Miniwelt festzulegen. In der Regel muss man jedoch die zahlreichen Beziehungen zu Kunden, Partnerfirmen, Behörden, Dienstleistungsunternehmen, usw. mit berücksichtigen. Eine problemlose Ausweitung des Datenmodells in weitere Projekte ist möglich, wenn die Schnittstellen zu anderen Miniwelten (Verfahren, Unternehmensteile, Außenwelt, usw.) genauestens untersucht und dokumentiert werden.
Ein nicht zu weit gefaßter und klar abgegrenzter Realitätsausschnitt ist die entscheidende Voraussetzung für den Erfolg eines Datenmodellierungsprojektes. Nur durch die Abgrenzung ist die Voraussetzung gegeben, dass das Datenmodell eine detailgenaue und wirklichkeitsgetreue Vorlage für den praktischen Aufbau einer physischen Datenbasis liefert. Nach dem Grundsatz "small but successful" ist im Zweifelsfall immer zu verfahren, um umfangreichere Vorhaben gegebenenfalls in mehrere aufeinanderfolgende Einzelprojekte aufzulösen. Das Ergebnis dieses Abgrenzungsprozesses ist eine Beschreibung der fachlichen Arbeitsweise des Systems und der funktionalen Zusammenhänge, dass den gewählten Realitätsausschnitt abbildet.
Als Beispiel kann man ein Lager nehmen. Die Miniwelt wären nur die Räume eines Lagers und die Artikel in diesem Lager.
2. Erstellen des Datenmodells
In einem zweiten Schritt ist die Miniwelt auf die enthaltenen Daten und deren Beziehungen hin zu analysieren. Diese Informationen werden anschließend zu sinnvollen Strukturkomponenten zusammengesetzt und im Rahmen eines Datenmodells angeordnet. Dieser Prozeß ist vorwiegend fachlich organisatorisch orientiert und berücksichtigt
lösungstechnische Aspekte zunächst nicht. Im Vordergrund steht die Frage, was das Datenmodell leisten soll, und nicht, wie das Modell zu realisieren ist. Ziel dieses Entwurfsschrittes ist die Erarbeitung eines systemneutralen Datenmodells, das die Miniwelt vollständig, widerspruchsfrei, konsistent und redundanzfrei auf einer rein logischen Ebene beschreibt und das sich gegenüber Änderungen oder Erweiterungen der Miniwelt flexibel verhält. Dieses Ergebnis wird allgemein als ,,konzeptionelles Schema" bezeichnet. Da in dieser Phase bei der Erstellung von Datenstrukturen überwiegend von Fachproblemen ausgegangen wird, sind zum Verständnis in aller Regel detaillierte Fachkenntnisse und nicht Datenverarbeitungs-Kenntnisse erforderlich. Gerade die Konzipierung des konzeptionellen Schemas aus logischer Sicht bietet die Gewähr dafür, dass die ersten Datenmodelle von Mitarbeitern der Fachabteilungen erstellt werden können, die das Problem am besten kennen. Voraussetzung für den Erfolg des
gesamten Designvorganges ist, dass das von den betroffenen Fachabteilungen ohne spezielle DV-Kenntnisse entwickelte Datenmodell auch vom Datenverarbeitungs - Bereich verstanden und akzeptiert werden kann. Denn es liegt in der Verantwortung dieses Bereiches, das logische Datenmodell optimal auf ein bestimmtes physisches Datenbanksystem umzusetzen. Eine möglichst frühzeitige kooperative Zusammenarbeit von Fachabteilungen und Datenverarbeitungs - Bereich kann dieses Problem zumeist entschärfen.
Das konzeptionelle Schema dient somit als Basis für die Kommunikation zwischen Anwendern und Datenverarbeitungs - Bereich. Für den Datenverarbeitungs - Bereich stellt das logische Datenmodell die Grundlage für die Ableitung eines zugriffs- und speicherplatzoptimierten physischen Datenmodells im Rahmen eines konkreten Datenbanksystems dar. Die Fachbereiche müssen das Datenmodell als Arbeitsgrundlage für die Diskussion fachlicher Datenzusammenhänge verwenden können, wobei jeder Fachbereich eine unterschiedliche Sicht auf die Daten und deren Zusammenhänge haben kann, d.h. es kann eine beliebige Zahl sogenannter ,,user-views" existieren. Schließlich soll das Datenmodell Basis für die unternehmensweite Planung und Realisierung strategischer Informationssysteme sein, angefangen von der individuellen Datenverarbeitung bis hin zur Informationsdrehscheibe eines integrierten Bürokommunikations - Systems.
Somit lässt sich jedes Informationssystem aus 3 Ebenen heraus betrachten:
die Ebene der Miniwelt als Teilausschnitt der realen Welt
die Ebene des konzeptionellen Schemas als logische Gesamtsicht der transformierten Miniwelt. Das konzeptionelle Schema ist die Summe aller logischen Benutzersichten ("user-views")
die rechnerinterne Ebene als technische Sicht des auf ein bestimmtes physisches Datenbanksystem transformierten konzeptionellen Schemas.
Strukturebenen von Informationssystem
Die beiden Säulen des Datenbankentwurfs sind die Informationsanalyse und die Funktionsanalyse.
Danach muss man die Artikel analysieren, welche Artikelnummer, Inhalt, Standort innerhalb des Lagers, usw. sie besitzen. Weiters klärt man in welcher Beziehung die Artikel stehen könnten, zB Computertastatur mit Rechner oder Computerpaket mit Softwarepaket.
3. Funktionsanalyse
Die Funktionsanalyse beschäftigt sich mit den elementarsten Strukturelementen, den Attributen und deren Beziehungen zueinander. Dabei stellt das Verfahren von all jenen Anwendungen, die in Zukunft mit der geplanten Datenbank zusammenarbeiten sollen, fest, welche Daten in welcher Form (lesend oder schreibend) benötigt werden. Die gewünschten Zugriffe zu den Datenelementen aus der Sicht der
unterschiedlichen Anwendungen sind Basis dieser Methode. Eine Benutzersicht kann beispielsweise darin bestehen, dass von der Kundennummer ausgehend über die bestellten Auftrage zu den entsprechenden Artikeldaten zugegriffen wird. Nach Sammlung aller benötigten Attribute werden diese in einem weiteren Schritt nach bestimmten Regeln, den Normalisierungsregeln, zu größeren Informationseinheiten, den Objekttypen, zusammengesetzt. Da ähnlich einem Puzzlespiel die elementaren Datenelemente zu größeren Bausteinen zusammengefügt werden, um schließlich ein umfassendes Bild, d.h. eine gemeinsame, integrierte Datenstruktur, zu erhalten, wird auch oft von einem ,,Bottom-up-Ansatz" gesprochen. Das Problem dieses Verfahrens liegt daran, dass eine möglichst umfassende Kenntnis der geplanten Anwendungen vorliegen muss, um mit dem Datenbankentwurf beginnen zu können. Die Funktionsanalyse ist nur dann zielführend, wenn Anwendungen bereits im Hinblick auf benötigte Attribute und deren Verarbeitungsarten genauestens analysiert wurden. Benutzersichten bestehender Anwendungen werden aus existierenden Dokumenten, wie z.B. EDV-Listen Masken, Formularen, abgeleitet. Bei neu zu realisierenden Funktionen muss im Rahmen von Interviews die Unterstützung der entsprechenden ,,Know-how-Träger", zumeist in den Fachabteilungen angesiedelt, in Anspruch genommen werden.
Da dieser Ansatz von den elementaren Datenfeldern ausgeht, ist in aller Regel am Beginn des Verfahrens mit einer großen Datenmenge zu rechnen. Daher kommt eine manuelle Abwicklung dieses Verfahrens aus Gründen des Zeitaufwandes, der Fehleranfälligkeit und der mangelnden Übersichtlichkeit zumeist nicht in Betracht.
Jetzt stellt man fest für wen die Daten interessant sein könnten. Für das Lager wäre es interessant zu wissen, welche Artikel sie bekommen und verschicken müssen. Außerdem braucht die Verkaufsabteilung die Daten, um die Artikel verkaufen zu können und die Einkaufsabteilung benötigt die Daten, um neue Artikel nachzubestellen.
4. Informationsstruktur - Analyse
Dieses Verfahren geht von einem, zunächst noch sehr groben, Informationsmodell der Miniwelt aus. In einem ersten Schritt müssen im Rahmen eines Abstraktionsprozesses die wesentlichen Informationsobjekte erkannt und definiert werden, wobei es auf dieser Stufe des Designvorganges auf eine weitere Detaillierung nicht ankommt. Entsprechend den wechselseitigen, zumeist komplexen, Beziehungen der abzubildenden Wirklichkeit sind die definierten Informationseinheiten im Datenmodell zu verknüpfen.
Beispielsweise wird im Rahmen eines Auftrags- und Bestell- Abwicklungssystems festgelegt, dass Kunden, Auftrage, Artikel, Lieferanten und Bestellungen die tragenden Informationsobjekte des für
diesen Aufgabenbereich zu definierenden Datenmodells sind. Ãœber Bestellungen und Lieferungen stehen Kunden bzw. Lieferanten innerhalb der Miniwelt in Beziehungen zu den bestellten bzw. gelieferten Artikeln. Diese Beziehungen werden in Form von Beziehungstypen in das Datenmodel1 eingebracht.
Ausgehend von einem Grobentwurf werden die Informationsobjekte stufenweise bis auf Attributebene verfeinert. Da man im Gegensatz zur Funktionsanalyse mit groben Strukturkomplexen beginnt und schrittweise zu detaillierten Datenstrukturen gelangt, wird diese Systementwicklungsmethode auch als ,,Top-down-Ansatz" bezeichnet. Der Anstoß dieses Verfahrens kommt sehr oft aus der dispositiven oder strategischen Ebene eines Unternehmens, da Mittel- bzw. Topmanagement aufgrund ihrer umfassenden, gesamtheitlichen Sicht des Unternehmens am ehesten die erforderlichen Informationen zur Verfügung stellen können. Dieses Verfahren geht von einer vorwiegend statischen Sicht der Miniwelt aus, da die zu betrachtenden Daten und Informationen sowie deren wechselseitige, vielfältige Beziehungen in aller Regel nur einem geringfügigen Änderungsprozeß unterworfen sind. In Anbetracht der strategischen, längerfristigen Zielsetzung eines unternehmensweiten Datenmodells ist es bei Analyse von Einzelproblemen häufig zweckmäßig, beim Designprozeß immer zuerst auf dem ,,Top-down-Verfahren" aufzusetzen. Die zunehmende Verfeinerung grober Informationskomplexe führt zu einem Modell, das mit dem aus dem ,,Bottom-up-Ansatz" entstandenen Modell in Abgleich gebracht werden muss. Dabei kann sich herausstellen, dass das ,,Bottom-up-Modell" zu vervollständigen, beziehungsweise das ,,Top-down-Modell" zu verfeinern ist. Der ,,Top-down-Ansatz" hat den Vorteil, dass mit dem Datenbankdesign schon in einer frühen Phase des Projektablaufs bei der Erstellung des Grobkonzeptes begonnen werden kann und dass in Anbetracht der überschaubaren Menge von Strukturelementen auch auf manueller Basis relativ rasch ein befriedigendes Ergebnis erreicht werden kann.
Wesentlich ist, dass das Datenmodell grafisch in ein Strukturdiagramm umgesetzt werden muss, als einheitliches und allgemein verständliches Kommunikationsmittel für jenen Personenkreis, der an der Konzipierung und Nutzung des geplanten Informationssystems beteiligt ist.
In unserem Beispiel bedeutet das, dass man festlegt, dass die Artikelnummer, die erfüllten Lieferungen, die noch ausstehenden Lieferungen, die Kunden, die Lieferanten, usw. für die einzelnen Artikel und Artikelgruppen notwendig sind. Die Informationsstruktur - Analyse und die Funktionsanalyse werden weiter verfeinert bis man den gewünschten Grad erreicht hat. Anschließend gleicht man die beiden aufeinander ab und bringt sie in eine visuelle Darstellung.
5. Zusammenfassung
Bei der Datenanalyse setzt man die Wirklichkeit auf eine Ebene der Datenverarbeitung um. Da eine Abbildung der Wirklichkeit zu umfangreich wäre, wird nur ein Ausschnitt verwendet, die Miniwelt. Es wird präzise festgelegt, welcher Ausschnitt verwendet wird und für welches DV - Verfahren das Datenmodell dienen soll. Ein nicht zu weit gefaßter und klar abgegrenzter Realitätsausschnitt ist entscheidend für den Erfolg. Auch hier gilt die Devise "small but successfull" .
Im zweiten Schritt wird die Miniwelt auf ihre Daten und Beziehungen hin analysiert. Diese Informationen werden anschließend zu Strukturkomponenten zusammen gefaßt und im Rahmen eines Datenmodells angeordnet. Dieses Schema dient als Basis für die Kommunikation zwischen DV-Bereich und den Anwendern. Die beiden Säulen der Datenanalyse sind die Informationsanalyse und die Funktionsanalyse.
Die Funktionsanalyse beschäftigt sich mit den Strukturelementen, den Attributen und deren Beziehungen zueinander. Hier wird festgestellt welche Daten in welcher Form von den Anwendungen, die in Zukunft mit der geplanten Datenbank zusammenarbeiten sollen, benötigt werden. Nachdem alle Attribute gesammelt wurden werden sie zu Objekttypen zusammengefaßt. Dies ist nötig, um sie als umfassendes Bild, d.h.. eine gemeinsame, integrierte Datenstruktur, zu erhalten. Man spricht von einem "Bottom-up-Ansatz". Da dieser Ansatz von elementaren Datenfeldern ausgeht, ist in aller Regel mit einer hohen Datenmenge zu rechnen. Daher kommt eine manuelle Abwicklung dieses Verfahrens aus Gründen des Zeitaufwandes, der Fehleranfälligkeit und der mangelnden Übersichtlichkeit meist nicht in Frage.
Die Informationsanalyse geht von einem zunächst noch sehr groben Modell der Miniwelt aus. Zu erst müssen die wesentlichen Informationsobjekte erkannt und definiert werden. Entsprechend den wechselseitigen, komplexen Beziehungen der abzubildenden Wirklichkeit sind die Informationseinheiten im Datenmodell zu verknüpfen. Ausgehend von diesem Grobentwurf werden die Objekte bis in die Attributebene verfeinert. Deswegen wird diese Methode auch "Top-down-Ansatz" bezeichnet. Dieser "Top-down-Ansatz" hat den Vorteil, dass schon bei einer Frühen Phase des Projektablaufes bei der Erstellung des Grobkonzeptes begonnen werden kann und wegen der überschaubaren Menge von Strukturelementen auch auf manueller Basis ein befriedigendes Ergebnis erreicht werden kann.
Zum Schluß setzt man das Datenmodell in ein Strukturgram um, um ein einheitliches und allgemein verständliches Kommunikationsmittel für den Personenkreis, der an der Konzipierung und Nutzung des Informationssystem beteiligt ist.
1796 Worte in "deutsch" als "hilfreich" bewertet