Soundex-Berechnung
Nach einem festgelegten System wird jeder Nachname in eine Kombination von einem Buchstaben und 3 Ziffern kodiert. Diese Buchstaben/Ziffernkombination ist der sogenannte Soundex-Code. Viele US-Archive sind nach dem Soundex-System organisiert und haben sich bewährt. Die Ähnlichkeit zwischen Originalnamen und den "anglisierten" Namen wird von dem Soundex-System nachvollzogen.
Das Soundex-Verfahren
- Der Code besteht aus dem Anfangsgroßbuchstaben des Nachnamens und 3 Ziffern.
- Für die Ermittlung der 3 Ziffern werden alle Buchstaben durch folgende Zahlen ersetzt:
- 1 = B P F V
- 2 = C S K G J Q X Z ß
- 3 = D T
- 4 = L
- 5 = M N
- 6 = R
- Die Vokale (A E I O U Y) und die Umlaute (Ä Ö Ü) werden ignoriert, ebenso die Buchstaben (H W).
- Jeder doppelte Buchstabe wird als 1 Buchstabe kodiert.
- Haben 2 Buchstaben, die unmittelbar nebeneinander stehen, die selbe Codezahl, so werden beide Buchstaben als 1 kodiert.
- Haben 2 Buchstaben, die durch eines der ignorierten Buchstaben (A E I O U Y Ä Ö Ü) voneinander getrennt sind, die selbe Codezahl, so werden beide Buchstaben kodiert.
- Haben 2 Buchstaben, die durch eines der ignorierten Buchstaben (H W) voneinander getrennt sind, die selbe Codezahl, so werden beide Buchstaben als 1 kodiert.
Wird diese Regel angewendet, so erhält man einen Soundex-Dialekt.
- Die verbliebenen Ziffern, von links nach rechts gelesen, werden zu einem Block mit 3 Ziffern zusammengesetzt. Wenn Ziffern übrigbleiben, so werden diese ignoriert. Wenn weniger als 3 Ziffern vorhanden sind, so wird mit Nullen aufgefüllt.
- Ist der Anfangsbuchstabe des Nachnamens eins er ignorierten Buchstaben (Ä Ö Ü), so wird dieser aufgelöst.
- Ä wird zu A
- Ö wird zu O
- Ü wird zu U
- Ist in dem Nachnamen eine Vorsilbe (von, van, de, di, le, zur, zum, ...) enthalten, so sollte der Nachname einmal mit und einmal ohne Vorsilbe kodiert werden.
- Mac und Mc werden nicht als Zusätze, sondern als Teil des Nachnamens behandelt.