Zeichensetzung
Typografisch korrekte Interpunktion mit HTML
Unter Interpunktion (oder Zeichensetzung) versteht man das Setzen von Satzzeichen oder Wortzeichen. In diesem Artikel soll erläutert werden, welche typografischen Möglichkeiten hierzu auf Webseiten existieren und wie die korrekten Zeichen gesetzt werden.
Sonderzeichen lassen sich auf vier verschiedene Arten im Quelltext definieren:
- Ist die Webseite UTF‑8 codiert, lassen sich die Sonderzeichen direkt eingeben. Jedoch tauchen hier gelegentlich Probleme bei bestimmten Browsern oder Servern auf, so das die Sonderzeichen nicht korrekt angezeigt werden. Es ist also ratsam auf eine der drei anderen Methoden zurück zu greifen.
- für mache Sonderzeichen liegt eine HTML-Kennung vor. So wird das scharfe »ß« als
ßdefiniert. Die HTML-Kennung ist eine Abkürzung des typografischen Fachausdruckes für das entsprechende Zeichen. Nicht alle Sonderzeichen lassen sich über diese Kennung einfügen. - Sonderzeichen können auch per Unicode definiert werden. Dabei handelt es sich um einen Zahlencode, dem immer »&#« vorangestellt ist. Das scharfe »ß« wird hier als
ßdefiniert. - Eine weitere Variante ist die hexadezimale Schreibweise des Unicodes. Das Präfix lautet hier »&#x« gefolgt von der hexadezimalen Schreibweise des Codes. Beim scharfen »ß« würde diese Schreibweise
ßlauten.
Alle Schreibweisen lassen sich innerhalb eines Dokumentes beliebig kombinieren.
Anführungszeichen
Die Anführungszeichen wurden ursprünglich dazu genutzt, Textpassagen aus anderen europäischen Sprachen zu kennzeichnen. Heute benutzen wir sie zur Auszeichnung von Zitaten, wörtliche Rede und zur Hervorhebung von bestimmten Wörtern.
Keines der auf der Tastatur verfügbaren Zeichen wie das gemeine Anführungszeichen ("), Apostroph ('), Akut (´), Gravis (`) oder das Komma ist ein typografisch korrektes Anführungszeichen. Diese Zeichen werden darum als „falsche Freunde“ bezeichnet. Auch die spitzen Klammern auf der Tastatur sind keine Anführungszeichen, Konstrukte wie >>Zitat<< sind nicht erlaubt und schlichtweg falsch.
„ “ ‚ ‘ » « › ‹
Im Deutschen gibt es verschiedene Formen von Anführungszeichen. Die gebräuchlichsten sind die doppelten normalen Anführungszeichen („…“). Sie werden auch Gänsefüßchen oder Hasenöhrchen genannt. Das einleitende Anführungszeichen steht dabei immer unten und das abschließende oben. Als Merkhilfe für die Form im Deutschen eignet sich 99–66–Regel. Das einleitende Anführungszeichen sieht aus wie die Zahl 99, das abschließende wie die Zahl 66. Ebenso können doppelte spitze Anführungszeichen, so genannte ›Guillemets‹ eingesetzt werden (»…«). Sie zeigen immer nach innen zum Textabschnitt. Zusätzlich gibt es noch jeweils die halben Ausführungen (‚…‘ und ›…‹). Sie werden verwendet bei verschachtelten Zitaten, sowie bei Eigennamen und Begriffsdefinitionen.
Anführungszeichen stehen immer ohne Leerraum zwischen ihnen und der auszuzeichnenden Textpassage.
Im HTML-Quelltext werden sie folgendermaßen deklariert:
„ — doppeltes linkes Anführungszeichen unten
“ — doppeltes linkes Anführungszeichen oben
‚ — einfaches linkes Anführungszeichen unten
‘ — einfaches rechtes Anführungszeichen oben
» — doppeltes linkes spitzes Anführungszeichen
« — doppeltes linkes spitzes Anführungszeichen
› — einfaches linkes spitzes Anführungszeichen
‹ — einfaches rechtes spitzes Anführungszeichen
In manchen Schriften sehen die deutschen Anführungszeichen eigenartig aus, da die englischen Schriftgestalter keine Rücksicht auf die deutschen Eigenarten genommen haben. Stören diese Anführungszeichen den Textfluss, sollte man auf die spitzen Anführungszeichen zurück greifen.
“ ” ‘ ’
Im englischsprachigen Raum werden andere Anführungszeichen genutzt. Das einleitende Anführungszeichen steht hier immer oben. Ansonsten sind sie gegenüber den deutschen Anführungszeichen genau umgedreht, so das hier die 66–99–Regel gilt (“…”). Selbiges trifft auf die einfachen Anführungszeichen zu (‘…’).
“ — doppeltes linkes Anführungszeichen oben
” — doppeltes rechtes Anführungszeichen oben
‘ — einfaches linkes Anführungszeichen oben
’ — einfaches rechtes Anführungszeichen oben
« » ‹ ›
In Spanien, Frankreich, Italien und der Schweiz werden die spitzen Anführungszeichen verwendet. Doch Achtung: Die Spitze ragt hier nach außen, so dass die Anführungszeichen den Text einklammern. Sie sind also genau umgekehrt zu denen, die im Deutschen verwendet werden («…»).
Bei kurzen fremdsprachigen Zitaten werden die deutschen Anführungszeichen genutzt. Bei längeren Passagen nutzt man die jeweils gültigen Anführungszeichen.
Auf das automatische Setzen von Anführungszeichen in HTMl gehe ich im CSS-Grundlagenartikel weiter ein.
Waagerechte Striche

In der Typografie werden für Bindestriche, Bis-Striche, Streckenstrich und Minuszeichen unterschiedliche Zeichen verwendet. Die Verwendung dieser Zeichen ist auch in HTML möglich und sollte berücksichtigt werden.
Diese Striche orientieren sich jeweils am Geviert einer Schrift. Dabei handelt es sich um eine typographische Maßeinheit, die noch aus dem Bleisatz stammt. Das Geviert bezeichnet im Bleisatz eine quadratische Fläche, deren Kantenlänge der Kegelhöhe eines Bleiletter entspricht. Also definiert das Geviert den Mindestzeilenabstand im Bleisatz. Zwei neben einander stehende Nullen entsprechen meistens einem Geviert.
In der Abbildung links sind die Strichlängen von Viertelgeviertstrich, Bindestrich-Minus, Geviertstrich und Halbgeviertstrich (von oben nach unten) in der Schriftart Adobe Garamond Pro gegenüber gestellt (die vertikale Position der Zeichen ist hier verschoben).
Der leicht gekippte Viertelgeviertstrich ist historisch bedingt. Im Mittelalter wurde ein Schrägstrich für ein Komma geschrieben, ein Doppelschrägstrich repräsentierte den Bindestrich (ähnlich einem leicht gekippten Gleichheitszeichen). Mit der Zeit entwickelten sich aus diesen Zeichen das Komma und der Bindestich.
Bindestrich / Viertelgeviertstrich (-)
Der normale auf der Tastatur vorhandene Bindestrich wird zur Gliederung von zusammengesetzten Wörtern oder für Wortverbindungen und –trennungen verwendet. So z.B. bei H-Milch, S-Bahn-Wagen, Rheinland-Pfalz oder Kaffee-Ersatz. Er wird auch zur standardisierten Schreibweise des Datums verwendet (2010–07–28).
Er steht nie zwischen zwei Leerzeichen.
Bindestrich-Minus (−)
Innerhalb von mathematischen Gleichungen kommt nicht der normale Bindestrich als Minuszeichen zum Einsatz, sondern der Bindestrich-Minus. Er liegt etwas höher als der normale Strich und passt somit zum Plus‑Zeichen.
Im HTML-Quelltext wird er mit − deklariert.
Gedankenstrich / Halbgeviertstrich (–)
Er wird als Gedankenstrich, Bis-Strich und Streckenstrich eingesetzt. Der Halbgeviertstrich kann zusätzlich auch bei Gegenüberstellungen als Gegenstrich (Werden Bremen – Bayern München) eingesetzt werden. Bei Geldbeträgen (10,–) wird er als Auslassungszeichen eingesetzt.
Im HTML-Quelltext wird er als – deklariert.
Spiegelstrich / Geviertstrich (—)
Er kann als Spiegelstrich vor einzelnen Elementen von Aufzählungen verwendet werden, ist aber häufig zu lang und wird durch den Halbgeviertstrich ersetzt. Innerhalb von Tabellen kann er bei Währungsbeträgen als Ersetzungszeichen für 00 verwendet werden (10,— €). Im Englischen wird er als Gedankenstrich genutzt, allerdings ohne Leerraum zu den angrenzenden Wörtern.
Im HTML-Quelltext wird er als — deklariert.
Leerzeichen und Zwischenräume
Leerzeichen ist nicht gleich Leerzeichen. Neben dem normalen Leerzeichen, das direkt über die Tastatur eingegeben wird, gibt es weitere mögliche Leerzeichen die unterschiedliche Breiten haben oder über weitere Eigenschaften verfügen.
Nicht alle Leerzeichen sind in jeder Schriftfamilie verfügbar. Es muss daher vor dem Einsatz getestet werden, welche Möglichkeiten bestehen. In den meisten Fällen wird im Falle der Nichtverfügbarkeit auf das normale Leerzeichen zurückgegriffen.
Sind die Leerräume in der verwendeten Schriftfamilie nicht verfügbar, obwohl sie gebraucht werden, kann man per CSS tricksen. Dazu definiert man eine Klasse für diese Zeichen und umschließt sie im Quelltext mit einem entsprechenden span-Tag:
span.leerraum {
font-family: Verdana, Arial, sans-serif;
font-weight: normal;
font-size: 14px;
letter-spacing: 0;
}
€ 10,–
Werden im Quelltext mehrere flexible Leerzeichen nacheinander eingegeben, fasst der Browser diese bei der Darstellung zu einem Leerzeichen zusammen. Dieses Verhalten tritt allerdings nur beim normalem Leerzeichen auf. Die anderen Leerzeichen werden nicht zusammengefasst.
▕ ▏ Geviert ▕ ▏ Halbgeviert ▕ ▏ Flexibles Leerzeichen ▕ ▏ Geschütztes Leerzeichen ▕ ▏ Dünnraum ▕▏ Haarraum ▕▏ Kein Leerraum
Flexibles Leerzeichen ▕ ▏
Das normale über die Tastatur eingegebene Leerzeichen variiert in der Breite abhängig von der gewählten Schriftgröße.
Geschütztes Leerzeichen ▕ ▏
Besitzt die selbe Breite wie das normale Leerzeichen. Allerdings trennen Browser bei diesem Leerzeichen nicht falls ein automatischer Zeilenumbruch erfolgt. Kann genutzt werden um unschöne Trennungen z.B. zwischen 10 und Euro zu verhindern.
Wird im HTML-Quelltext als deklariert;
Geviert ▕ ▏
Leerzeichen mit der Breite von einem Geviert.
Wird im HTML-Quelltext als   deklariert;
Halbgeviert ▕ ▏
Leerzeichen mit der Breite von einem Halbgeviert. Wird z. B. beim Gedankenstrich genutzt. auch Tabellenziffern stehen auf Halbgeviert. Der Platz, den jede Ziffer einnimmt, ist also immer gleich. Dadurch stehen sie in einer Tabelle untereinander. Somit kann das Halbgeviert genutzt werden, um Ziffern einzurücken.
Wird im HTML-Quelltext als   deklariert;
Dünnraum ▕ ▏
Leerzeichen mit der 3/18 Breite eines Gevierts. Wird zum Beispiel zwischen Zahlen und Maßeinheiten genutzt (256 kB/s oder € 45,—). Gibt es leider nicht in einer geschützten Variante.
Wird im HTML-Quelltext als   deklariert;
Haarraum ▕▏
Sehr dünner Leerraum, der eventuell zwischen Zahlen wie 1000000 oder zum Einrücken genutzt werden kann.
Wird im HTML-Quelltext als ​ deklariert;
Kein Leerraum ▕▏
Leerzeichen ohne Breite. Kann in HTML eingesetzt werden, um lange Wörter für Zeilenumbrüche zu trennen, ohne das dies im Text sichtbar ist. Dies führt aber bei Blocksatz zu falschen Zwischenräumen in Wörtern.
Kann auch eingesetzt werden um z.B. Entities im Text aufzunehmen ohne das dies interpretiert werden. Auf diesen Seiten sind die ausgeschriebenen Entities teilweise mit zero width spaces versehen.
Wird im HTML-Quelltext als ​ deklariert;
Offene Schachtel ␣
Kein Leerzeichen im eigentlichem Sinne. Wird aber in Dokumentationen oder Bedienungsanleitungen als Platzhalter für das normale Leerzeichen verwendet.
Wird im HTML-Quelltext als ␣ deklariert;
Zeilenumbrüche
Gelegentlich kann es vorkommen das der Browser Text an Stellen umbricht, an denen dies nicht gewünscht ist – oder aber nicht umbricht, obwohl es nötig wäre. Dies kann z.B. bei Preisen am Ende einer Zeile der Fall sein. Der Browser würde in diesem Fall „100 €“ so umbrechen, dass die „100“ am Ende der Zeile stehen bleibt und das Euro-Zeichen in die nächste Zeile wandert. Das liegt daran, das der HTML-Standard vorsieht, das Fließtext bei Leerzeichen automatisch umgebrochen wird.
Ein anderes Problem, besonders in der deutschen Sprache, sind sehr lange Wörter. Hier bricht der Browser das Wort nicht automatisch um, sondern verschiebt es in die nächste Zeile, wodurch sehr große Lücken entstehen können.
Erwünschte Zeilenumbrüche erzwingen
An dieser Stelle
soll umgebrochen werden.
Möchte man einen Zeilenumbruch erzwingen, obwohl der Browser an dieser Stelle noch nicht automatisch umbrechen würde, gibt es dafür das ‹br /›-Tag.
<p> An dieser Stelle <br /> soll umgebrochen werden. </p>
Silbentrennung auf Webseiten ist nicht ganz unproblematisch.
Bei langen Wörtern gibt es die Möglichkeit, diese mit unsichtbaren Sollbruchstellen zu versehen. Diese werden im HTML-Quelltext als ­ angegeben. Inzwischen funktioniert dies auch bei allen Browsern. Wird an einer solche Stelle umgebrochen, zeigt der Browser ­ als Bindestrich an.
Silbentrennung auf Webseiten ist nicht ganz unproblematisch.
Silbentrennung auf Webseiten ist nicht ganz unproblematisch.
Eine weitere Möglichkeit ist es, einen Umbruch bei langen Wörtern per CSS zu erzwingen. Dabei werden aber keine Bindestriche angezeigt.
p {
word-wrap: break-word;
}
Unerwünschte Zeilenumbrüche verhindern
Zu einem Preis von 100 €.
Zu diesem Zweck gibt es ein geschütztes Leerzeichen, bei dem Text nicht umbricht. Im HTML-Quelltext wird es mit angegeben.
Zu einem Preis von 100 €.
Zu einem Preis von 100 €.
Zusätzlich lässt sich das Umbrechen von ganzen Zeilen per CSS mit der Eigenschaft white-space verhindern. Dies wirkt sich aber immer auf die ganze Zeile aus.
.nowrap {
white-space: nowrap;
word-spacing: -0.2em;
}
Zu einem Preis von 100 €.
Die Angabe von word-spacing führt in diesem Fall zusätzlich dazu, dass sich der Abstand zwischen Zahl und Maßeinheit verringert. Das halbbreite geschützte Leerzeichen   wird leider nicht in allen Browsern unterstützt.
Möchte man die Trennung von zusammengesetzten Wörtern wie H-Milch verhindern, lässt sich dafür ein geschützter Bindestrich einsetzen. Der geschützte Bindestrich wird im HTML-Quelltext als ‑ definiert.
Alternativ könnte man hier auch eine entsprechende Klasse per CSS definieren.
.komposita {
white-space: nowrap;
}
Wir müssen noch H-Milch kaufen.
Hängende Interpunktion
Unter hängender Interpunktion versteht man das Bestreben, eine gleichmäßigere Textkante zu erreichen. Dazu werden Interpunktionszeichen am Zeilenanfang oder Zeilenende über den Spaltenrand geschoben. Dadurch schließen Buchstaben vor oder hinter dem Interpunktionszeichen wieder mit dem Spaltenrand ab.
Ein voller optischer Randausgleich ist per CSS nicht möglich. Dazu müssten unter anderem auch die Kanten mancher Buchstaben (z. B. W und A) über den Spaltenrand hinaus ragen. Die hängende Interpunktion kann aber z. B. bei Zitaten und Aufzählungen auf Webseiten sinnvoll sein.
Zitate
Beispiel ohne hängende Interpunktion:
„Typographie ist die Kunst des feinen Maßes. Ein Zuwenig und Zuschwach entfernt sie ebenso von der Meisterschaft wie ein Zuviel und Zustark.“
Beispiel mit hängender Interpunktion:
„Typographie ist die Kunst des feinen Maßes. Ein Zuwenig und Zuschwach entfernt sie ebenso von der Meisterschaft wie ein Zuviel und Zustark.“
Korrekt hängende Anführungsstriche sind per CSS derzeit leider nicht möglich. Es fehlt die Möglichkeit, den schließenden Anführungsstrich zu hängen. Bei linksbündigen Texten erreicht man aber schon ein erheblich ruhigeres Schriftbild, wenn zumindest das öffnende Anführungszeichen gehängt wird.
Um diesen Effekt zu erreichen, definiert man eine entsprechende Klasse per CSS und verschiebt den Text mit der Eigenschaft text-indent nach links aus dem Container. Der Wert unterscheidet sich dabei bei unterschiedlichen Schriftfamilien und muss entsprechend justiert werden.
.hanging {
text-indent: -0.5em;
}
Alternativ kann der erste Buchstabe eines Absatzes per CSS über einen pseudo-Selector angesprochen werden. Dies funktioniert aber nur auf neueren Browsern:
.zitat:first-letter {
text-indent: -0.5em;
}
Aufzählungen
Beispiel ohne hängende Interpunktion:
- Erster Punkt
- Zweiter Punkt
- Dritter Punkt
Beispiel mit hängender Interpunktion:
- Erster Punkt
- Zweiter Punkt
- Dritter Punkt
Listenpunkte lassen sich in aktuellen Browsern genauso einfach mit hängender Interpunktion versehen:
ul.hanging {
list-style-position: outside;
}
Will man diesen Effekt manuell erreichen, wird es ein wenig komplizierter. Dafür setzen wir den linken Rahmen auf 0 und den linken Textabstand zum Rahmen auf 1.5em. Das ganze Element verschieben wir nun um den Textabstand nach links:
ul.hanging {
position: relative;
margin-left: 0;
padding-left: 1.5em;
left: -1.5em;
}
Zukünftig kommt mit CSS3 noch eine weitere Möglichkeit hinzu:
/* values: start, end, end-edge */
p {
hanging-punctuation: start;
}
Diese Eigenschaft wird bisher von keinem Browser unterstützt.
Apostroph
„Heute ist ’s kalt.“
Da auf der Tastatur vorkommende Apostroph ist typographisch keines. Auch die Zeichen ´ (Akut) und ‚ (Gravis) sind falsch. Stattdessen sollte das Zeichen ’ (’) eingesetzt werden.
Auslassungspunkte
F… dich selber, du …! Sonst…
Auslassungen werden mit drei aufeinander folgenden Punkte angezeigt. Diese werden jedoch nicht mit drei einzelnen Punkten eingegeben, sondern erhalten ein eigenes Zeichen, welches in HTML mit … deklariert wird. Bei der Verwendung des Auslassungszeichens ist zu beachten dass Leerzeichen und Satzzeichen immer mit angegeben werden. Einzig der Punkt fällt weg. Bei Auslassungen innerhalb von Wörtern werden keine Leerzeichen gesetzt.
Das Mal-Zeichen ×
5 × 10 = 50
Bei der Angabe von Maßen oder in Rechnungen wird das Mal-Zeichen benötigt. Häufig wird hierzu das kleine »x« eingesetzt. Dies ist typografisch falsch. für das Mal-Zeichen existiert ein eigenes Zeichen, dies hat z. B. in Serifen-Schriften keine Serifen.
Im Quelltext wird das Mal-Zeichen als × deklariert.