-
Notifications
You must be signed in to change notification settings - Fork 13
/
Strings.md
180 lines (121 loc) · 7.89 KB
/
Strings.md
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
# Strings 🆎<!-- omit in toc -->
(auch: *Zeichenketten*)
`String` ist eine Klasse in Java. Ein Objekt vom Typ `String` repräsentiert eine Zeichenkette - also eine Sequenz von Symbolen (characters / `char`s).
- [Erzeugen von Strings ...](#erzeugen-von-strings-)
- [... mit dem `new`-Operator](#-mit-dem-new-operator)
- [... mit String-Literals](#-mit-string-literals)
- [Verkettung von Strings](#verkettung-von-strings)
- [Unveränderlichkeit von Strings](#unveränderlichkeit-von-strings)
- [Vergleichen von Strings](#vergleichen-von-strings)
- [Zugriff auf einzelne Zeichen und andere Tokens](#zugriff-auf-einzelne-zeichen-und-andere-tokens)
- [Spezial-Zeichen](#spezial-zeichen)
- [String-Formatierung](#string-formatierung)
## Erzeugen von Strings ...
### ... mit dem `new`-Operator
Da ein String ein Objekt, also eine Instanz der Klasse `String` ist, lässt er sich wie alle anderen Objekte mit dem `new`-Operator erzeugen:
``` java
String s = new String();
```
Dies ist aber unsinnig, da es einen leeren String erzeugt. Da Strings **unveränderlich** sind (_siehe unten!_), bleibt dieser String leer!
> Die Klasse `String` bietet auch noch andere Konstruktoren an, deren Nutzen im Zusammenhang mit der Unveränderlichkeit von Strings (siehe unten!) deutlicher werden sollte!
### ... mit String-Literals
Da es eine Möglichkeit braucht, eine Zeichenkette auch direkt im Quelltext zu notieren, kann man ihren Inhalt in Anführungszeichen setzen, um so ein neues String-Objekt mit dem gewünschten Inhalt zu erzeugen:
``` java
String name = "El Duderino";
```
## Verkettung von Strings
Strings lassen sich mit Hilfe des `+`-Operators verketten. Das gilt sowohl für Referenzen auf String Objekte, als auch für String-Literals und sogar beides gemischt (Achtung, sinnleeres Beispiel!):
``` java
String s1 = "Hello";
String s2 = "!";
String s3 = s1 + " World " + s2;
```
Das `+` wird im Kontext von String-Verkettungen automatisch vom Rechenoperator zum String-Verkettungs-Operator. Man sollte also vorsichtig sein, in welchem Kontext man es verwendet:
``` java
System.out.println( "Die Zahl ist " + 4 );
System.out.println( "Die Zahl ist " + 4 + 1 );
System.out.println( "Die Zahl ist " + (4 + 1) );
```
Hier wäre die Ausgabe auf der Konsole wie folgt:
```
Die Zahl ist 4
Die Zahl ist 41
Die Zahl ist 5
```
## Unveränderlichkeit von Strings
Die Klasse `String` ist ein 👉 [Wrapper](../Glossar.md#wrapper) um das, was in Java wirklich hinter einer Zeichenkette steckt: Ein Array aus `char`-Werten. Und weil Arrays in ihrer Größe unveränderlich sind, sind auch Strings unveränderlich.
Was im Code wie das Ändern eines bestehenden Strings aussieht ...
``` java
String name = "Raul";
name = name + " Duke";
```
... sorgt in Wirklichkeit dafür dass ein **neues** `String`-Objekt erzeugt und der Variable `name` zugewiesen wird! Diese Operation kostet relativ viel Rechenleistung. Es mag bei einer einzelnen String-Verkettung noch nicht auffallen, aber es ist nicht zu empfehlen (und wirklich *bad practice*), String-Verkettungen in Schleifen vorzunehmen - etwa beim zeilenweise Einlesen einer Datei. Um dieses Problem zu lösen, gibt es die Klasse `StringBuilder`, die mittels Pufferung die Verkettung von Strings enorm beschleunigt!
## Vergleichen von Strings
Äußerste Vorsicht ist beim Vergleichen von Strings geboten! Dieser Code hier ...
```
String s1 = "Hallo";
String s2 = "Hallo";
if (s1 == s2){
System.out.println("s1 und s2 sind gleich!");
}
```
... sieht zwar so aus, als würde er überprüfen, ob beide Strings `"Hallo"` sind, aber das stimmt nicht! Strings sind Objekte. Und wenn Objekte mit `==` verglichen werden, wird **nicht** überprüft, ob irgendwelche Eigenschaften gleich sind, sondern ob es sich um _**das selbe Objekt**_ handelt!
> ⚠️ Dass dieser Code _trotzdem_ funktioniert, liegt in diesem Fall am [String interning](https://en.wikipedia.org/wiki/String_interning) von Java und bedeutet **nicht**, dass die hier getroffene Aussage falsch ist!
Meistens möchte man aber etwas ganz anderes wissen: Nämlich ob die Strings den gleichen (lexikalischen) Inhalt haben! Dies **muss** stattdessen mit Hilfe der [`.equals()` Methode](Objekte-II-Repraesentation-Identitaet-Gleichheit.md#equals) geschehen:
```
String s1 = "Hallo";
String s2 = "Hallo";
if (s1.equals(s2)){
System.out.println("s1 und s2 sind gleich!");
}
```
## Zugriff auf einzelne Zeichen und andere Tokens
Wie oben erwähnt, handelt es sich bei einem `String` um ein Array von `char`-Werten - oder, genauer gesagt, um eine `CharacterSequence`, die wiederum ein Array von `char`-Werten ist.
Deshalb ist es keine Überraschung, dass die Klasse `String` Methoden anbietet, die sich auf diese tiefere Strukturebene beziehen. So gibt `toCharArray()` ein `char[]` mit den Zeichen des Strings zurück; oder `charAt(int index)` gibt das Zeichen an der gewünschten Stelle des Strings zurück (wobei einfach auf den entsprechenden Index im internen Array zugegriffen wird).
Für den Zugriff auf größere Einheiten als einzelne Zeichen, lässt sich etwa die Methode `split(String regex)` benutzen, die ein String-Array mit den Teilen des Strings zurückgibt, die übrig bleiben, nachdem der String an allen Stellen "zerteilt" wurde, die dem [regulären Ausdruck](https://de.wikipedia.org/wiki/Regul%C3%A4rer_Ausdruck) `regex` entsprechen:
``` java
String s = "Eins und zwei und drei und vier und";
// zerteilen bei "und"
System.out.println(Arrays.toString(s.split("und")));
// zerteilen bei Leerzeichen und anderen whitespaces
System.out.println(Arrays.toString(s.split("\\s")));
// zerteilen bei Wörtern, die ein "r" enthalten
System.out.println(Arrays.toString(s.split("\\w*r\\w*")));
```
Ergibt folgende Ausgabe:
```
[Eins , zwei , drei , vier ]
[Eins, und, zwei, und, drei, und, vier, und]
[Eins und zwei und , und , und]
```
## Spezial-Zeichen
(oder: _special characters_)
Es gibt einige Zeichen, die sich ohne eine spezielle 👉 [Syntax](../Glossar.md#syntax) nicht in String-Literals unterbringen ließen, wie etwa Zeilenumbrüche oder die doppelten Anführungszeichen (die ja dazu da sind, ein String-Literal zu begrezen!). Um diese Zeichen doch benutzen zu können, müssen sie mit einem vorangestellten `\` maskiert (in diesem Fall engl: _escaped_) werden.
Es folgt eine Liste dieser Spezial-Zeichen:
Zeichen | Bedeutung
--- | ---
`\'` | Einfache Anführungszeichen
`\"` | Doppelte Anführungszeichen
`\\` | Backslash
`\t` | Tab
`\b` | Backspace
`\n` | Newline / Zeilenumbruch
`\r` | Carriage return / Zeilenumbruch
`\f` | Formfeed
`\u0123` | Das Unicode-Zeichen für `0123`
So gibt diese Anweisung ...
``` java
System.out.println( "Hallo,\n\t\"liebe\"\nWelt!" );
```
... folgendes auf der Konsole aus:
```
Hallo,
"liebe"
Welt!
```
> ⚠️ Da der Backslash `\` die Funktion der Maskierung erfüllt, muss er selbst maskiert werden, wenn er als Zeichen im String auftauchen soll. Also so: `"\\"`. Wenn nun aber der String selbst `"\\"` lauten soll, dann wäre das String-Literal dazu `"\\\\"`, usw.
## String-Formatierung
Da es häufig vorkommt, dass Daten verschiedener Art als Teil eines Strings dargestellt (oder gespeichert) werden sollen, bietet Java (wie die meisten anderen Programmiersprachen auch) umfangreiche Möglichkeiten zur Formatierung von Strings an. Die offensichtlichste ist die Methode `String.format(...)`. Dies führt nicht nur zu saubererem Code, weil es lange Verkettungen von Strings mit anderen Datentypen wie z.B. `String s = "The number " + x + " is greater than " + y + ".";` o.ä. vermeidet, sondern ermöglicht auch _Padding_ (z.B. `42` mit führenden Nullen: `"0004"`) und vieles mehr.
Das Internet ist voll von guten, übersichtlichen Ressourcen zu diesem Thema. Deshalb sei an dieser Stelle beispielhaft auf zwei Artikel zu diesem Thema verwiesen:
👉 [How to format a string in Java (attacomsian.com)](https://attacomsian.com/blog/java-string-format)
👉 [Java String format() (programiz.com)](https://www.programiz.com/java-programming/library/string/format)