Soundex-Berechnung

Nach einem festgelegten System wird jeder Nachname in eine Kombination von einem Buchstaben und 3 Ziffern kodiert. Diese Buchstaben/Ziffernkombination ist der sogenannte Soundex-Code. Viele US-Archive sind nach dem Soundex-System organisiert und haben sich bewährt. Die Ähnlichkeit zwischen Originalnamen und den "anglisierten" Namen wird von dem Soundex-System nachvollzogen.


Nachname:
Soundex-Code:

Das Soundex-Verfahren

  1. Der Code besteht aus dem Anfangsgroßbuchstaben des Nachnamens und 3 Ziffern.
  2. Für die Ermittlung der 3 Ziffern werden alle Buchstaben durch folgende Zahlen ersetzt:
  3. Die Vokale (A E I O U Y) und die Umlaute (Ä Ö Ü) werden ignoriert, ebenso die Buchstaben (H W).
  4. Jeder doppelte Buchstabe wird als 1 Buchstabe kodiert.
  5. Haben 2 Buchstaben, die unmittelbar nebeneinander stehen, die selbe Codezahl, so werden beide Buchstaben als 1 kodiert.
  6. Haben 2 Buchstaben, die durch eines der ignorierten Buchstaben (A E I O U Y Ä Ö Ü) voneinander getrennt sind, die selbe Codezahl, so werden beide Buchstaben kodiert.
  7. Haben 2 Buchstaben, die durch eines der ignorierten Buchstaben (H W) voneinander getrennt sind, die selbe Codezahl, so werden beide Buchstaben als 1 kodiert.
    Wird diese Regel angewendet, so erhält man einen Soundex-Dialekt.
  8. Die verbliebenen Ziffern, von links nach rechts gelesen, werden zu einem Block mit 3 Ziffern zusammengesetzt. Wenn Ziffern übrigbleiben, so werden diese ignoriert. Wenn weniger als 3 Ziffern vorhanden sind, so wird mit Nullen aufgefüllt.
  9. Ist der Anfangsbuchstabe des Nachnamens eins er ignorierten Buchstaben (Ä Ö Ü), so wird dieser aufgelöst.
  10. Ist in dem Nachnamen eine Vorsilbe (von, van, de, di, le, zur, zum, ...) enthalten, so sollte der Nachname einmal mit und einmal ohne Vorsilbe kodiert werden.
  11. Mac und Mc werden nicht als Zusätze, sondern als Teil des Nachnamens behandelt.