INDEX und SELECT in SQL


INDEX UND SELECT IN SQL

1. Beispiel DATENBANK


create table Ware
(Artikel# SmallInt,
Bezeichnung CHAR(20),
Preis SmallInt,
ME CHAR(3),
Bestand SmallInt
);

create table Kunde
(Kunden# SmallInt,
Name CHAR(20),
Adresse CHAR(40),
PLZ SmallInt,
Ort CHAR(20)
);

create table Auftrag
(Re# SmallInt,
Kunden# SmallInt,
Datum date,
status CHAR(3)
);

create table Pos
(Re# SmallInt,
Pos# SmallInt,
Artikel SmallInt,
Menge SmallInt
);

2. Der Index


2.1. Allgemeines


Wird eine Zeile in einer realen Tabelle gesucht, die in einer Spalte bzw. Spaltenkombination vorgegebene Werte enthält, so muss die gesamte Tabelle durchsucht werden. die realen Implementationen sind bemüht, die Zugriffe auf den externen Speicher möglichst gering zu halten, da diese Zugriffe langsam sind. Deshalb sind üblicherweise Methoden implementiert, die es gestatten, Zeilen direkt zu adressieren. Dies erreicht man durch Errichtung eines Indexes. Ist für die betrachtete Tabelle ein Index auf die Spalte bzw. Spaltenkombiantion errichtet worden, so muss nur im Index nachgeschaut werden, wo die betreffende Zeile steht (es können auch mehrere Zeilen sein, die die Bedingung erfüllen). ein Index ist in der Regel wesentlich kleiner als
die Tabelle und zudem so organisiert, dass er schnell durchsucht werden kann. Dadurch
wird beim Suchen die Zahl der Zugriffe auf den externen Speicher erheblich verringert.

2.2. Syntax







Die Länge der einzelnen Spalten hängt von ihren Datentypen ab.

Datentyp
Länge
Character
pro Zeichen 1 Byte
Numeric
12 Bytes
Date/Time
12 Bytes

Ein Beispiel für die Berechnung von Indexes.

Nachname CHAR(20)
Vorname CHAR(20)
Geschl CHAR(1)
41
daraus ergibt sich:

6 + 3 + 41 = 50


SEHR_GROSS CHAR(249)

6 + 1 + 249 = 256

256> 255

Es kommt zur Fehlermeldung:

Index key is too large

2.2.1. index - name


Der Indexname muss in der gesamten Datenbank eindeutig sein.

2.2.2. table - name


Auf Views können keine Indexe gelegt werden.

2.2.3. UNIQUE


Erzeugt einen Schlüssel - Index. Die Wertekombination der einzelnen Elemente darf in der Tabelle nur ein einziges mal vorkommen. Existieren bereits zur Indexerstellung doppelte Werte kommt es zu einer Fehler Meldung. Ebenso bei Update oder Insert.

2.2.4. CLUSTERED HASHED


Ein Clustered Hashed Index erlaubt einen schnellern Zugriff auf die Daten. Besteht ein Index aus unique und clustered hashed kann mit einem Plattenzugriff eine Zeile ausgelesen werden.

Ist kein clustered hashed definiert wird der Index als B - Baum erzeugt.

2.2.5. ASC,DESC


Definiert ob der index aufsteigend oder Absteigend sortiert wird. Diese Klausel ist nur für B - Bäume interessant. Wird die Klausel nicht angeben wird default mäßig ASC genommen.

2.2.6. PCTFREE


Die PCTFREE (prozent frei) klausel definiert, wieviel Platz in jeder Indexseite sein muss wenn der Index erstellt wird. Wird diese klausel nicht angegeben ist der default Wert 10%

2.2.7. SIZE integer - constatnt ROWS


Diese Angabe kontrolliert die größe des Indexes und wird in Anzahl der Reihen angegeben. Ist diese größe zu klein angeben kann es overflow pages kommen. Ist die angebene größe zu groß, wird das overflow page nicht verwendet, aber der Platz auf der Platte ist verbraucht. Diese Klausel wird nur bei clustered hashed Indexe benötigt. und ist dort unbedingt erforderlich.

2.3. Funktionen in Index


Ein Index kann für mehrere Spalten gebildet werden. Diese Spalten können durch Funktionen verbunden werden. Es können jedoch nicht alle Funktionen in Index eingebaut werden.

@CHAR
@CODE
@DATEVALUE
@DAY
@HOUR
@LEFT
@LENGTH
@LICS
@LOWER
@MICROSECOND
@MID
@MINUTE
@MONTH
@MONTHBEG
@PROPER
@QUARTER
@QUARTERBERG
@RIGHT
@SECOND
@STRING
@SUBSTRING
@TIMEVALUE
@TRIM
@UPPER
@VALUE
@WEEKBEG
@WEEKDAY
@YEAR
@YEARBEG
@YEARNUM

2.4. Beispiele

CREATE UNIQE INDEX sWare ON Ware (Artikel#)
CREATE UNIQE INDEX sKunde ON Kunde (Kundenl#)
CREATE UNIQE INDEX sAuftrag ON Auftrag(RE#)
CREATE UNIQE INDEX sPos ON Pos (RE#,POS#)

CREATE INDEX KUINDEX ON KUNDE (@UPPER(name))

SELECT name FROM KUNDE
WHERE @UPPER(name) = 'HUBER'

3. SELECT


3.1. Syntax





Im Prinzip besteht das SELECT Statement aus sechs Komponenten

SELECT
FROM
WHERE
GROUP BY
HAVING
ORDER BY

Zwei Punkte sind äußerst wichtig und sollten immer vor Augen gehalten werden:

• Die Reihenfolge der Kompnenten ist fix vorgegben; eine GROUP BY Komponente darf nicht vor einer WHERE oder vor einer FROM Klausel stehen.

• Eine HAING - Komponente darf nur dann verwendet werden wenn eine GROUP BY Komponente verwendet wird.


FROM
definiert die Ausgangstabellen

WHERE
selektiert die Reihen, die der Bedingung genügen

GROUP BY
gruppiert Reihen auf Basis gleicher Werte in Spalten

HAVING
selektiert Gruppen, die der Bedingung genügen

SELECT
selektiert Spalten

ORDER BY
sortiert Reihen auf der Basis von Spalten

3.2. Verarbeitung einer SELECT ANWEISUNG


Ausgabe aller Kundennummer die 1993 mehr als einen Einkauf getätigt haben.

SELECT Kunden#
FROM Auftrag
WHERE DATUM> 01011993
GROUP BY Kunden#
HAVING COUNT(RE#)>1
ORDER BY Kunden#

3.2.1. FROM

In der FROM - Komponente wird nur die Tablle Auftrag genannt. Die bedeutet für SQL, dass mit der Tabelle AUFTRAG gearbeitet werden muss. Das Zwischenergebnis dieser Operation ist eine exakte Kopie der Tabelle AUFTRAG

Zwischenergebnis:
RE#
Kunden#
Datum
status
1
1
1990 - 01 - 01
fa
2
1
1993 - 05 - 19
fa
3
3
1993 - 05 - 19
fa
4
2
1993 - 05.17
fa
5
3
1993 - 07 - 19
fa





3.2.2. WHERE

In der WHERE Komponente ist die Bedingung 'DATUM> 01011993' angeben. Alle Reihen, in denen der Wert der Spalte DATUM größer als 01011993 ist, genügen dieser Bedingung. alle diese Reihen zusamen bilden das Zwischenergebnis der WHERE Komponente.

RE#
Kunden#
Datum
status
2
1
1993 - 05 - 19
fa
3
3
1993 - 05 - 19
fa
4
2
1993 - 05.17
fa
5
3
1993 - 07 - 19
fa

3.2.3. GROUP BY


Die GROUP BY Komponennte gruppiert alle Reihen im Zwischenerbnis. Das Gruppieren erfolgt auf der Basis von Werten in der Spalte KUNDEN#. Reihen werden gruppiert wenn sie in der Betreffenden Spalte den gleichen Wert haben

Zwischenergbnis

RE#
Kunden#
Datum
status
2
1
1993 - 05 - 19
fa
3,5
3
1993 - 05 - 19,1993 - 07 - 19
fa,fa
4
2
1993 - 05.17
fa


3.2.4. HAVING


Die vierte Komponente kann in gewissen Sinne mit der WHERE Komponente verglichen werden. Der Unterschied liegt darin, dass WHERE sich auf das Zwischenergbnis der FROM Komponete bezieht, während HAVING auf das gruppierte Zwischenergbnis der GROUP BY Komponente Bezug nimmt. Der Effekt ist jedoch der gleiche, auch in der HAVING - Komponente werden Reihen mit Hilfe einer Bedingung selektiert. In diesem Fall handelt es sich dabei um die Bedinung:

COUNT(RE#)>1

Das bedeutet: Alle Reihen, die mehr als eine Rechnungsnummer enthalten, genügen der Bedinung.

Zwischenerbnis:

RE#
Kunden#
Datum
status
3,5
3
1993 - 05 - 19,1993 - 07 - 19
fa,fa

3.2.5. Select


In der SELECT Komponente wird angegeben welche Spalten im endgütigen Ergebnis wiedergeben werden müssen. Die Select - Kompontente wählt also die Spalten aus.

Kunden#
3

3.2.6. Order by


Hier wird am Inhalt des Zwischenerbnisses nichts mehr verändert. Die Ergbniszeilen werden lediglich noch in die angegeben Reihenfolge sortiert. Da aber Aufgrund der Beispieldaten nur eine Zeile überig bleibt, ist die Order by Komonente in diesem Fall belanglos

Die Where - Komponente


Die Where Komponente kann folgende Formen haben

• der einfache Vergleich
• Bedingungen mit AND, OR, oder NOT aneinanderkoppeln
• der BETWEEN - Operator
• der IN - Operator
• der LIKE Operator
• der NULL Operator
• der IN - Operator Unterabfrage (Subquery)
• der Vergleichsoperator mit Unterabfrage

Der einfache Vergleich


Ein einfacher Vergleich wird durch einen Ausdruck gebildet, auf den ein Operator und Wiederum ein Ausdruck folgt. Der Wert auf der linken Seite des Operators wird mit dem Ausdruck auf der rechten Seite verglichen. Vom Operator hängt es ab, ob die Bedingung WAHR, UNWAHR oder NULL ist

SQL kennt folgende Vergleichsopeatoren:

Vergleichsoperator
Bedeutung
=
gleich
<
kleiner als
>
größer als
<=
kleiner als oder gleich
>=
größer als oder gleich
<>
nicht gleich

(Der Vergleichsoperator <> wird in einigen SQL - Implementierungen auch als - = oder != wiedergegeben.)

Beispiele

Gib die Kundennummer aller Kunden an, die in Perchtoldsdorf wohnen.

SELECT Kunden#
FROM Kunde
WHERE PLZ = 2380

Gib die Bezeichnung, den Preis, die Menge der einzelnen Artikel an wo der Lagerwert 1.000 S übersteigt

SELECT Bezeichnung, Preis, Bestand
FROM Artikel
WHERE Preis * Bestand> 1000

Bedingungen mit AND, OR, oder NOT aneinanderkoppeln


Eine WHERE - Komponente kann mehrere Bedingungen enthalten, wenn die Operatoren AND, OR und NOT verwendet werden.

Beispiele

Gib die Kundennummer aller Kunden an die in Wien wohnen oder deren Kundennummer kleiner 100 ist.

SELECT Kunden#
FROM Kunde
WHERE PLZ>=1010 AND PLZ<=1239
OR Kunden#<100

Gib die Kundennummer und den Namen aller Kunden an die nicht in der Ortschaft "Groß Enzersdorf " wohnen.

SELECT Kunden#, Name
FROM Kunde
WHERE NOT Ort = 'Groß Enzersdsorf'

oder

SELECT Kunden#, Name
FROM Kunde
WHERE Ort <> 'Groß Enzersdorf'

Der BETWEEN - Operator


Der Between Operator lässt sich am Besten anhand eines Beispiels erklären.

Gib die Kunden# aller Kunden an, die zwischen März 1993 und Juni 1993 einen Einkauf getätigt haben.

SELECT Kunden#
FROM Auftrag
WHERE Datum Between 01031993 AND 30061993

Der IN - Operator


Auch hier sagt ein Beispiel mehr als 1000 Worte

Gib den Namen aller Kunden an, die in Wien, St.Pölten, Eisenstadt, Graz, Klagenfurt, Salzburg, Linz, Insburck oder Bregenz ihren Frimensitz haben.

SELECT Name
FROM Kunde
WHERE ORT IN ('Wien','St. Pölten', 'Eisenstadt', 'Graz', 'Klagenfurt', 'Salzburg',
'Linz', 'Innsbruck','Bregenz')

Der LIKE Operator


Gib den Namen aller Kunden an, die mit H beginnen

SELECT Name
FORM Kunde
WHERE Name LIKE 'H%'

Hinder dem LIKE Operator können zur Bildung von sogenannten Masken 2 Zeichen als Jokerzeichen stehen

% für kein, ein oder mehrere Zeichen (Vergleiche DOS *)
_ für genau ein zeichen (Vergleiche DOS ?)

Der NULL Operator


Der Null operator gibt alle jene Zeilen an, die keinen Wert besizten.

Gib alle Artikel# an, die derzeit nicht lagernd sind

SELECT Artikel#
FROM Ware
WHERE Bestand is NULL

Der IN - Operator Unterabfrage (Subquery)


Der IN - Operator mit Unterabfrage wird dann verwendet, wenn die Menge von einer anderen Tabelle abhängt.

Beispiel

Gib die Bezeichnung aller Artikel an, die schon mindestens einmal verkauft wurden.

SELECT Bezeichnung
FROM WARE
WHERE Artikel# IN
(SELECT Artikel
FROM POS)

Gib die Bezeichnung aller Artikel an, die noch nie verkauft wurden.

SELECT Bezeichnung
FROM WARE
WHERE Artikel# NOT IN
(SELECT Artikel
FROM POS)

Der Vergleichsoperator mit Unterabfrage


Unterabfragen können nicht nur nach dem IN - Operator verwendet werden, sondern auch nach Vergleichsoperatoren.

Gib alle Kundennummern an, die vor der Rechnung 5 eingekauft haben.

SELECT kunden#
FROM Auftrag
WHERE datum<
(SELECT datum
FROM Auftrag
WHERE re = 5)

Die GROUP BY Komponente


Mit Hilfe der GROUP - BY Komponente werden die Zwischenergebnisse gruppiert.

Gib die Verkauften Artikeln an.

SELECT Artikel
FROM pos
GROUP BY Artikel


SELECT re#,pos#,artikel,menge
FROM pos
GROUP BY re#,pos#,artikel,menge

ANMK: Alle spalten der Select Anweisung müssen in der Group by Anweisunge enthalten sein.

Die Having - Klausel


Die Having Klausel entspicht im Prinzip der WHERE klausel, nur das diese auf Gruppen die mittels GROUP BY erstellt wurden angewendet wird.

In der HAVING Komponente sind alle bei WHERE besprochenen Funktionen erlaubt sowie fünf weitere Funktionen

COUNT Ermittelt die Anzahl der Werte einer Spalte oder die Anzahl der
Reihen einer Tabelle

MIN Ermittelt den kleinsten Wert der Spalte

MAX Ermittelt den größten Wert der Spalte

SUMME Ermittelt die Summe der Werte in einer Spalte

AVG Ermittelt das arithmetische Mittel der Werte in einer Spalte

Beispiele

Gib alle Rechnungsnummern an die mehr als eine Position haben

SELECT re#
FROM pos
GROUP BY re#
HAVING count(re#)>1

Gib alle Kundennummern an, die an mindestens zwei Tagen eingekauft haben.

SELECT Kunden#
FROM Auftrag
GROUP BY Kunden#
HAVING count(distinct datum)>1

Gib die Rechnungsnummen an, bei welchlen die größte menge die Eingekauft wurde 20 überstiegen hat.

SELECT re#
FROM pos
GROUP BY re#
HAVING max(Menge)>20;

Gib die Rechnungsnummern an, bei welchen die Summe der Menge die Gekauft wurde größer 100 war

SELECT re#
FROM pos
GROUP BY re#
HAVING SUM(MENGE)>100

Gib die Rechnungsnummern an, wo der durchschnitt der eingkauften ware kleiner 10 war

SELECT re#
FROM pos
GROUP BY re#
HAVING AVG(MENGE)<10

Select mit UNION verbinden


Bei Union werden die Ergbnisse der einzelnen SELECT anweisungen aneinander gefügt.

Bei der Arbeit mit dem UNION Operator gibt es vier wichtige Regeln

• Die SELECT anweisungen müssen alle die Gleiche Anzahl an Spalten aufweisen.

• Die Spalten, die aneinandergefügt werden, müssen denselben Datentyp aufweisen.

• Nur die letzte SELECT anweisung darf eine Order By Komponente enthalten, Sortiert wird erst auf der Grundlage es Endergebnisses, also erst nachden alle Zwischenergbnisse aneinandergefügt worden sind.

• DISTINCT dar in den SELECT - Komponenten nicht vorkommen. Wenn UNION verwendet wird, löscht SQL automatisch alle doppelten Werte

Beispiel

Angenommen es gäbe zwei Kunden dateien. Eine mit Stammkunden und eine mit "Laufkunden" und wir wollen nun alle Kunden wissen die Huber heißen.

SELECT name
FROM Stammkunde
WHERE name='Huber'
UNION
SELECT name
FROM Laufkunde
WHERE name='Huber'

Unterabfragen


Bei Unterabfragen wie sie schon verwendet wurden sind noch folgende Punkte zu beachten:

1. Das Unterselect darf nur einen Spaltenausdruck enthalten
2. Die SELECT Komponente darf nicht DISTINCT enthalten
3. Eine ORDER BY Komponente ist nicht erlaubt.


JOINEN von Tabllen


Das Joinen von Tabellen ist ja bereits aus der Relationenalgebra bekannt

Beispiel

SELECT

1421 Worte in "deutsch"  als "hilfreich"  bewertet