Professional Documents
Culture Documents
Haye Hinrichsen
Universitt Wrzburg
Fakultt fr Physik und Astronomie
D-97074 Wrzburg, Germany
E-mail: hinrichsen@physik.uni-wuerzburg.de
Zusammenfassung. Das menschliche Gehr empfindet eine Kombination von Tnen als zueinander passend wenn die entsprechenden Obertonspektren korreliert sind,
wenn also das neuronale Anregungsmuster im Innenohr eine erhhte Ordnung aufweist.
Ausgehend von dieser Hypothese wird vorgeschlagen, dass Musikinstrumente wie z.B.
Klaviere durch Minimierung der Entropie ihrer Fourierspektren gestimmt werden knnen. Diese Methode liefert eine Stimmkurve, die nicht nur die korrekte Spreizung reproduziert, sondern auch hnliche Fluktuationen wie beim Stimmen nach Gehr.
bersetzung des engl. Originalartikels in Rev. Bras. Ens. Fis. 34, 2301 (2012).
1. Einfhrung
Westliche Tonsysteme basieren auf der gleichfrmigen Stimmung, in der sich benachbarte
Halbtne um ein konstantes Frequenzverhltnis von 21/12 unterscheiden [1]. Das
Stimmen von Tasteninstrumenten in gleichfrmiger Stimmung nach Gehr ist eine
anspruchsvolle Aufgabe und wird erreicht durch eine zyklische Iteration ber bestimmte
Intervalle, die systematisch gestaucht oder gestreckt werden. Heutzutage bernehmen
elektronische Stimmgerte diese Aufgabe, die automatisch den angeschlagenen Ton
erkennen, seine Frequenz messen und die Abweichung vom theoretischen Wert der
gleichfrmigen Stimmung anzeigen. Benutzt man allerdings ein solches Gert, um z.B.
ein Klavier exakt in gleichfrmiger Stimmung zu stimmen, wird sich das Instrument
danach verstimmt anhren, obwohl die Frequenz eines jeden Tons exakt eingestellt ist.
Dieser berraschende Effekt wurde zuerst von O. L. Railsback erklrt, der 1938 zeigte,
dass dieser Eindruck durch die Inharmonizitt des Obertonspektrums des Instruments
verursacht wird [2]. Professionelle Klavierstimmer kompensieren diesen Effekt durch
kleine Abweichungen von der gleichtemperierten Stimmung, eine Vorgehensweise,
die man als Spreizung bezeichnet. Die Spreizung hngt vom jeweiligen Grad der
Inharmonizitt ab und kann als eine Stimmkurve dargestellt werden (siehe Abb. 1).
Da sich die Inharmonizitt von Instrument zu Instrument unterscheidet, ist
es uerst schwierig, die korrekte Spreizung durch Berechnung vorherzusagen und
Abbildung 1. Typische Stimmkurve eines Flgels [3]. Die senkrechte Achse gibt an,
wie stark sich jeder Ton vom mathematischen Wert der gleichtemperierten Stimmung
unterscheidet. Die Abweichungen werden, wie in der Stimmpraxis blich, in Cent
angegeben, wobei ein Cent als als 1/100 eines Halbtons definiert ist, was einem
Frequenzverhltnis von 21/1200 1.0005778 entspricht.
(1)
Abbildung 2.
(a)
(b)
(c)
300
400
440
500
(a)
(b)
(c)
10
20
30
50
100
f [Hz]
200
300
500
Die Inharmonizitt entsteht dadurch, dass eine Saite ein Mittelding zwischen
einer idealen Saite und einem Stab ist. Eine ideale Saite gehorcht der partiellen
Differentialgleichung y y 00 mit einer linearen Dispersionsrelation f |k|, whrend
die Schwingung eines steifen Stabs durch die Differentialgleichung vierter Ordnung
y y 0000 mit einer quadratischen Dispersionsrelation f k 2 gegeben ist. Daraus folgt,
dass die Steifigkeit einer realen Saite zu einer Korrektur niedrigster Ordnung von der
Form
y y 00 y 0000
f 2 k 2 + k 4
fn n f1 1 + Bn2 ,
n = 1, 2, . . .
(2)
(3)
gegeben ist, wobei f1 die Grundfrequenz und fn die Obertonfrequenzen bezeichnet. Die
10
Inharmonicity B
(a)
-2
10
-3
10
-4
10
-1
(b)
10
-2
10
-3
10
-4
10
-5
10
-6
10
-7
100
1000
f [Hz]
10
200
400
600
f [Hz]
800
1000
Darstellung. Die Oktave wird als klanglich angenehm empfunden, weil jeder
zweite Oberton des hheren Tons mit einem Oberton des tieferen Tons exakt
bereinstimmt.
dimensionslose Konstante B ist der sogenannte Inharmonizittskoeffizient, der von physikalischen Parametern wie Lnge, Durchmesser, Spannung und Materialeigenschaften
der Saite abhngt. In einem Flgel bzw. Klavier variiert der Wert von B etwa von 0.0002
im Bass bis zu 0.4 im Diskant (siehe linke Tafel in Abb. 4). Eine starke Inharmonizitt
verursacht einen unangenehmen fremdartigen Klang, wie man ihn von einem Hackbrett
kennt. Ein wesentlicher Aspekt in der Kunst des Klavierbaus ist es, die Inharmonizitt
so gleichmig wie mglich zu halten.
4. Wie Stimmung wahrgenommen wird
Wie bereits eingangs erwhnt wurde, empfindet das menschliche Gehr Intervalle mit
einfachen rationalen Frequenzverhltnissen als angenehm. In diesem Zusammenhang ist
es wichtig zu verstehen, dass das menschliche Ohr berhaupt nicht in der Lage ist, die
harmonic:
B=0
inharmonic:
B=0.02
A3
A2
A3
A2
A3 (stretched)
110
220
330
440
550
660
770 880
f [Hz]
Abbildung 6. Ausgleich der Inharmonizitt durch das Spreizen von Oktaven
(siehe Text).
(k+12)
f1
(k)
f1
(k)
r4
(k+12)
(4)
r2
(k)
wobei rnk = fn /f1 das Verhltnis der n-ten Harmonischen in Bezug auf die
Grundfrequenz der Saite ist. Durch Logarithmierung erhlt man so ein System von
(k)
K 12 linearen Gleichungen fr K unbekannte Grundfrequenzen f1 . Die brigen
12 Unbekannten werden durch den Kammerton A440 und die Wahl des jeweiligen
Temperaments bestimmt. Eine gleichtemperierte Stimmung kann man z.B. erzeugen, in
dem man eine quadratische Kostenfunktion fr variierende Frequenzabstnde zwischen
Halbtnen hinzufgt. Durch das Lsen dieser Gleichungen kann man also die gemessenen
Inharmonizitten direkt in eine Stimmkurve bersetzen. Wenn die Inharmonizitt (als
Funktion des Tastenindex) eine stckweise glatte Funktion ist (wie die in Abb. 4 gezeigte
Kurve), wird die Stimmkurve ebenfalls stckweise glatt sein. Ebenso kann man ein 6:3Stimmschema verwenden, das zu einer noch ausgeprgteren Spreizung fhrt. Die Gre
der Spreizung insgesamt ist also nicht strikt festgelegt, sondern vielmehr eine Frage des
musikalischen Geschmacks. Einige Computerprogramme interpolieren sogar zwischen
dem 4:2- und 6:3-Verfahren, um so zu einem akzeptablen Kompromiss zu gelangen.
Indem man also die Spreizung direkt durch Vergleich bestimmter Obertne
berechnet, erhlt man wie bereits erwhnt stckweise glatte Stimmkurven. Menschliche
Klavierstimmer produzieren dagegen Stimmkurven mit ausgeprgten Fluktuationen in
der Spreizkurve, insbesondere im Bass und im Diskant. Die wesentliche Botschaft dieser
Arbeit ist die Vermutung, dass diese Fluktuationen nicht zufllig sind, sondern im
Gegenteil eine wesentliche Rolle fr eine hochqualitative Stimmung spielen.
Die Fluktuationen haben vermutlich verschiedene Grnde. Einerseits ist jede Oberschwingung unterschiedlich stark mit dem Resonator (Klangboden) des Instruments
gekoppelt, was zu kleinen unterschiedlichen Frequenzverschiebungen im Vergleich zu
Gleichung (3) fhren kann. Ein weiterer Grund mag die unterschiedliche Intensitt der
Obertne sein. Wie man auf der rechten Tafel von Abb. 4 erkennen kann, umfasst das
Spektrum einer Klaviersaite eine Vielzahl von Obertnen, wobei benachbarte Obertne in ihrer Intensitt durchaus um mehr als eine Grenordnung schwanken knnen.
Darber hinaus sind bestimmte Obertne (markiert durch die blauen Pfeil in der Abbildung) stark unterdrckt, was man damit erklren kann, dass der Hammer den Knoten
der entsprechenden Vibrationsmode der Saite trifft. Dies alles legt nahe, dass in realen
Situationen der Eindruck einer guten Stimmung nicht nur von den Frequenzen, sondern
auch von den Intensitten der Obertne abhngt.
6. Psychoakustische Aspekte
Da das Stimmen eines Musikinstruments als Suche nach einem Kompromiss fr
mglichst gute bereinstimmung von Obertnen interpretiert werden kann, wird
dieser Vorgang wesentlich von akustischen und psychoakustischen Eigenschaften des
Innenohres abhngig sein. Die Psychoakustik ist ein eigenes Forschungsgebiet (siehe
z.B. [68]) und spielt eine entscheidende Rolle z.B. in der Entwicklung verlustbehafteter
Kompressionsmethoden wie z.B. MP3. Im Folgenden werden hier einige wichtige
Elemente aus diesem Bereich, die zum Verstndnis des Stimmens wichtig sind, skizziert.
Betrachten wir zunchst den Frequenzgang des Ohrs. Ausgangspunkt ist zunchst
eine Schallwelle, also eine zeitabhngige Vernderung des Luftdrucks p(t). Deren
komplexwertige Fouriertransformation ist durch
Z
1
dt e2if t p(t) ,
(5)
p(f ) =
2
gegeben, wobei p(f ) = p (f ) ist. Das entsprechende Leistungsspektrum
I(f ) = |
p(f )2 |
(6)
beschreibt die Energiedichte des Spektrums in Abhngigkeit von der Frequenz f . Als
eine technologisch bliche Gre definiert man den logarithmischen Schalldruck (sound
pressure level SPL)
L(f ) = 10 log10
I(f )
I0
(7)
122002 f 4
p
(f 2 + 20.62 )(f 2 + 122002 ) (f 2 + 107.72 ) (f 2 + 737.92 )
(8)
(9)
in Einheiten von A-gewichteten Dezibel (dBA). Dieser gewichtete Schalldruck kann als
ungefhres Ma der in der Cochlea deponierten Energie als Funktion der Frequenz
interpretiert werden.
10
11
12
Dieser einfache Vorgang wird wiederholt, bis keine weitere Verbesserung erreicht wird,
bis also der Algorithmus ein lokales Minimum der Entropie gefunden hat. Man beachte,
dass durch das Aufaddieren aller 88 Tne die Methode alle Intervalle und Tonlagen
gleichberechtigt behandelt, sich also nicht nur auf das Stimmen ausgewhlter Oktaven
beschrnkt.
8. Diskussion
Abb. 9 zeigt die resultierende Stimmkurve im Vergleich mit dem Resultat einer
Stimmung nach Gehr fr ein Klavier. Wie man sehen kann, wird nicht nur die globale
Spreizkurve in etwa richtig reproduziert, sondern man erhlt auch Fluktuationen, die
in beiden Kurven hochgradig korreliert sind, insbesondere im Bass und im Diskant.
Anscheinend ist die entropiebasierte Methode in der Lage, hnliche Abweichungen von
der durchschnittlichen Spreizung zu produzieren wie bei einer Stimmung nach Gehr.
Dies ist berraschend und noch nicht wirklich verstanden, aber es zeigt, dass diese
Fluktuationen in gewissen Grenzen reproduzierbar sind und deshalb eine wesentliche
Rolle in der Praxis des Stimmens spielen knnten.
Die Implementierung der Methode ist verhltnismig einfach. Die Tne des
Instruments werden aufgenommen, Fourier-transformiert, wie oben beschrieben auf
geeignete Weise gefiltert, logarithmisch diskretisiert, aufaddiert und von deren Summe
schlielich die Entropie bestimmt. Eine explizite Identifizierung der Obertne und eine
Messung der Inharmonizittskoeffizienten ist nicht erforderlich. Vielmehr bercksichtigt
die Methode die Unregelmigkeiten des Instruments automatisch auf implizite Weise.
40
20
-20
-40
20
40
60
80
key index k
13
Allerdings ist die hier vorgestellte Methode unausgereift. Sie kann in vielfacher
Weise modifiziert werden und eine systematische Untersuchung steht noch aus. Darber
hinaus wurde die Methode bislang nur mit einem einzigen Instrument getestet. Die
wichtigsten offenen Fragen sind folgende:
Es gibt anscheinend eine groe Anzahl lokaler Minima, so dass der oben skizzierte
zufllig arbeitende Algorithmus zwar hnliche aber nicht reproduzierbare Resultate
liefert.
Die vorgestellten Monte-Carlo-Resultate basieren auf dem A-gewichteten Schalldruck (SPLA) in Gleichung (9). Wenn man anstatt dessen die Lautheit in Gl. (10)
benutzt, erhlt man unsinnig berspreizte Stimmkurven im Bass.
Die Spektren wurden logarithmisch diskretisiert in Einheiten von einem Cent. Dies
modelliert eine Frequenzauflsung von einem Cent, was unter dem (jnd ) liegt. Faltet
man allerdings die Daten mit einer frequenzabhngigen Gaukurve gem dem
erwarteten jnd in Gl. (11) erhlt man keine besseren Resultate.
Fortgeschrittene Monte-Carlo-Methoden z.B. mit adiabatischer Abkhlung wurden
bislang nicht getestet.
Anstatt die Spektren aller 88 Tne aufzuaddieren, kann man versuchen, nur eine
Teilmenge aus Oktaven, Quarten und Quinten aufzuaddieren, womit die Praxis
des Klavierstimmens nach Gehr imitiert wird. Dies destabilisiert die Methode und
zerstrt die gleichtemperierte Grundstimmung. Vermutlich wird durch die Summe
ber alle Tne sichergestellt, dass man in der gleichtemperierten Stimmung bleibt.
Als mgliche technische Realisierung wre es interessant, eine hybride Methode zu
entwickeln, mit der zuerst die glatte Stimmkurve durch Vergleich von Obertnen auf
herkmmliche Weise ermittelt wird und anschlieend die Fluktuationen durch die
hier beschriebene entropische Methode optimiert werden. Damit vermeidet man das
Problem, dass der Algorithmus in falschen lokalen Minima hngen bleibt.
Danksagung
Ich danke der Universidade Federal do Rio Grande do Sul (UFRGS) in Porto Alegre,
Brasilien, wo Teile dieser Arbeit entstanden sind, fr die herzliche Gastfreundschaft.
Diese Arbeit wurde finanziell durch den Deutschen Akademischen Austausch Dienst
(DAAD) im Rahmen des Brasilianisch-deutschen Kooperationsprogramms PROBRAL
untersttzt.
Appendix A. Technische Details
Datenaufnahme und Vorverarbeitung
(i) Zunchst werden alle Tne k = 1 . . . K im WAV-Format einzeln aufgezeichnet.
Die binren PCM-Amplituden werden extrahiert und in eine Folge von
14
(k)
wobei [] die Rundung auf eine ganze Zahl bezeichnet. In dieser Darstellung unterscheiden sich benachbarte Diskretisierungspositionen um ein Frequenzverhltnis
von einem Cent.
(k)
15
References
[1] J. G. Roederer, Introduction to the Physics and Psychophysics of Music, Springer, New York
(1973).
[2] O. L. Railsback, Scale Temperament as Applied to Piano Tuning. Journal of the Acoustical Society
of America 9 (3): 274 (1938).
[3] Figure taken from: http://en.wikipedia.org/wiki/File:Railsback2.png (March 2012).
[4] Figure taken from: http://en.wikipedia.org/wiki/File:Harmonic-partials-on-strings (March 2012).
[5] N. H. Fletcher and T. D. Rossing, The Physics of Musical Instruments, Springer, New York (1991).
[6] H. Fastl and E. Zwicker, Psychoacoustics: facts and models, Springer, New York (2007).
[7] C. J. Plack, A. J. Oxenham, and R. F. Richard, eds. Pitch: Neural Coding and Perception. Springer,
New York (2005).
[8] B. C. Moore and B. R. Glasberg, Thresholds for hearing mistuned partials as separate tones in
harmonic complexes. J. Acoust. Soc. Am., 80, 479483 (1986).