Follow

Was ist eigentlich der Unterschied zwischen U+200B (Zero Width Space) und U+200C (Zero Width Non-Joiner)?

@L12C Ein Zero width Space ist genau das was der Name sagt. Ein Leerzeichen welches aber eine Breite von Null hat.

Hat aber sonst alle Eigenschaften eines Leerzeichens. Word boundaries, Delimiter, Umbruch und so.

Ein Zero-Width-Joiner Kombiniert die Zeichen davor und danach und sagt dem Font, daß es diese beiden Zeichen als *einen* Glyphen darstellen soll.
(Sofern der Font das kann, falls nicht werden sie aneinandergereiht.)

@eest9

@eest9 Ja, Du musst warten bis ich mim Tippen fertig bin und *dann* fertig lesen. :-) @L12C

@L12C @eest9 Die meisten Textsysteme erkennen auch, wenn zwei Zeichen grundsätzlich gejoined werden müssen.

ZB Regional Indicator Symbols.
Da werden aus zwei „Buchstaben im Kastl“ dann Flaggen draus.

Wenn Du jetzt aber *explizit* diese Symbole darstellen willst, dann ginge das nicht.

Daher diese mit einem Zero-Width-NON-Joiner verbinden. Bleibt semantisch *ein* Wort, wird aber vom Font *nicht* zu einem Glyphen zusammengefasst. (Sprich, wird beim Umbruch nicht getrennt und so.)

@eest9 Typografische Untat, aber technisch müsste das gehen. @L12C

@pludikovsky Ich konnte am Telefon grad keine guten Beispiele eingeben.
Abgesehen davon, daß ich zu jedem Beispiel Screenshots mitliefern müsste weil i h ha davon ausgehen muß, daß das auf vielen Betriebssystemen schlecht bis garnicht funktioniert und in manchen Browsern, insbesondere Firefox, überhaupt nicht. (Sogar wenn das OS das an sich kann und tut.)

Ich hab‘ das ja mit Emoji schon mal recht weit getrieben.

@eest9 @L12C

@pludikovsky @eest9 @L12C

Hab' das jetzt mal in ein Beispiel mit f, und ff, ffi, fi Ligaturen gegossen.
Linke Spalte ist die Ligatur die der Font macht, mittlere Spalte ist mit einem Zero-Width-Non-Joiner nach dem ersten Buchstaben, rechte Spalte ist Referenz.

Damit ist auch klar, wenn das Textsystem und der Font es können, lässen sich Ligaturenbildungen mit Zero-Width-Non-Joinern beeinflussen.

@eest9 wobei… unsicher. ff oder fi ffl tt sind Ligaturen, das sind eigene Glyphen. Müsste eins konkret probieren wobei ich ziemlich sicher bin, daß drei Buchstaben Ligaturen auf Linux generell sehr schwierig werden und von der meisten Software sowieso überhaupt nicht unterstützt sind. (Geile Effekte bei Cooy/Paste.)

Am ehesten wirst Du das bei Enoji nachvollziehen können.

@L12C

@L12C
Vergleiche
Untergrif​fig (Zero Width Space)
vs.
Untergrif‌fig (Zero Width Non-Joiner)

ZWS zeigt Stellen für z.B. den Umbruch an, ZWNJ macht keinen Umbruch sondern trennt Ligaturen (im "ffi", abhängig ob vom Font unterstützt)

Sign in to participate in the conversation
chaos.social

chaos.social – a Fediverse instance for & by the Chaos community