|
|||||||||||||||||||||||||||||||||||||||
| ISBN: 3000035532 ISBN: 3000035532 ISBN: 3000035532 ISBN: 3000035532 | |||||||||||||||||||||||||||||||||||||||
|
|
Wir empfehlen: | ||||||||||||||||||||||||||||||||||||||
|
Zum Inhaltsverzeichnis
"Die Wahrnehmung ist die Brücke des Menschen zur Außenwelt." Diese Aussage ist einleuchtend, und doch überfordert der Begriff "Außenwelt" unsere Vorstellungskraft. Die Annahme einer Welt außerhalb unseres Denkens, die mehr beinhaltet
als wir durch unsere fünf Sinne erfahren, finden wir schon in der
griechischen Antike. Platon veranschaulicht diese Idee in seinem Höhlengleichnis,
worin er der realen Welt ihre Schattenbilder gegenüberstellt (Platon
1994, Band 2, "Politeia").
Dies ist jedoch nur der erste Verarbeitungsschritt im Wahrnehmungsprozeß. Die nächst höhere Leistung besteht darin, anhand solcher Merkmalen Objekte zu erkennen. Als Merkmale werden Eigenschaften bezeichnet, die an Objekte gebunden
sind. Abgesehen von der Verbindung zwischen Objekten und Eigenschaften
bedarf es auch noch einer Verbindung mit Tätigkeiten, die sich auf
diese Objekte beziehen. Über all diese Verbindungen verfügen
wir, wenn wir sagen, es sei uns etwas ein Begriff. Ein Begriff ist somit
wesentlich mehr als nur ein Wort. Er schließt Sinnesdaten, Handlungen
und assoziierte Lebenssituationen mit ein.
Abbildung 1 Aber nicht einmal das Gehirn eines so einfachen Lebewesen wie eine Amsel kann so direkt verschaltet sein wie in diesem Schema. Die Wahrnehmung der Kirsche wird nicht immer dazu führen, daß die Amsel sie frißt. Ob auf den Reiz die Reaktion folgt, wird auch von inneren Faktoren des Tieres abhängen. Das körperliche Gleichgewicht und die momentane triebliche Situation des Tieres haben einen Einfluß auf sein Verhalten. Wäre dem Tier dieser Einfluß bewußt, so müßte man ihn als seinen "Willen" bezeichnen. Beim Menschen kommt hier noch der Zeitbegriff hinzu. Er benützt vergangene Erfahrungen, um eine Zukunft zu prognostizieren, auf die er sein Verhalten ausrichtet. Er kalkuliert nicht nur momentane, sondern auch zukünftige Bedürfnisse mit ein. Einen weiteren Einfluß spielen festgesetzte Prinzipien, wie zum Beispiel eine Moralordnung, an die er sich hält. Solche Schemata sind notwendig, um nicht in jeder Situation alles neu überdenken zu müssen. Diese Faktoren führen bereits über das Thema Erkennen hinaus. Indirekt haben sie allerdings Einfluß auf das, was wir von der Welt sehen, denn sie lenken unsere Aufmerksamkeit. Die vorliegende Arbeit wird sich aber nicht bis in diese Ebene vorbewegen. Diese Ankündigung mag manchen Leser enttäuschen, denn es scheint so, als würde das Thema Wahrnehmung erst dort interessant, wo Einstellungen, Absichten und Aufmerksamkeit ins Spiel kommen. Das Reiz-Reaktionsschema von Abbildung 1 wirft demgegenüber kaum eine Frage auf. Es zeigt nichts weiter als einige Begriffe und deren Bezug zueinander. Weit weniger klar erscheint die Sache, sobald man versucht, dieses Modell in Form einer Computersimulation praktisch umzusetzen. Es ergibt sich dann die Frage, wie ein System von Wörtern, die sich gegenseitig definieren, die visuelle Wahrnehmung erklären kann? Das kann es eben nicht, denn die eigentlichen Fragen ergeben sich schon vor der Bewußtwerdung einer Wahrnehmung und damit vor aller Begrifflichkeit. Die visuellen Vorstellungen und die ihnen zugeordneten Begriffe, mit denen das bewußte Denken agiert, mögen das Resultat bestimmter Wahrnehmungen sein, aber niemals deren Erklärung. So ist zum Beispiel die Wahrnehmung farbigen Lichtes ein visuelles Erlebnis, das wir durch den richtigen Farbbegriff zwar zu beschreiben, aber nicht zu erklären vermögen. Erst heute ist neben dieser subjektiven Ebene noch eine andere Art der Beschreibung des Ereignisses möglich: Ein Neurophysiologe kann die Aktivität einzelner Gehirnzellen messen und notieren, ohne irgend einen Farbbegriff zu benützen. Damit ist er dem Zirkelschluß eines Systems sich gegenseitig erklärender Begriffe (Abbildung 1), das insgesamt kaum einen Erklärungswert hat, entkommen. Wesentlich dabei ist, daß er völlig farbenblind sein könnte, und, trotzdem ihm der Begriff von Farbe fehlt, das Ereignis richtig zu schildern vermag, wenn er feststellt, daß der Mensch, dessen Netzhaut er untersucht, über drei Zapfensorten verfügt, die auf verschiedene Frequenzlängen des Lichtes ansprechen und diesen Menschen zur Differenzierung von Objekten befähigen, die er selbst, als Farbenblinder, für gleich erachtet. Der letzten Überlegung zufolge ist die (objektive?) Beschreibung des Neurologen von seinem subjektiven Farberleben unabhängig. Auch in bezug auf die Amsel von Abbildung 1 wäre eine solche Schilderung der Zusammenhänge sinnvoller als eine sprachliche. Die Darstellung ist voll mit Worten während das Tier über kein sprachliches Begriffssystem verfügt. Aber nicht nur zur Beschreibung tierischen Denkens ist Sprache vielfach
ungeeignet. Auch in unserem Gehirn gibt es nicht-verbale Denkprozesse.
Manche davon erleben wir sogar bewußt. Ein Denken ohne Sprache, wie
es vielleicht ein Taubstummer erlebt, ist schwer nachzuvollziehen, und
doch scheint es vernünftig, anzunehmen, daß alles Denken im
Ursprung sprachlos ist. Manchmal passiert es, daß man etwas sagen
will, aber das Wort nicht findet. In diesem Moment steht man vor dem reinen
Gestaltbegriff. Ich verstehe Sprache als ein Codierungssystem, das sich
auf der Grundlage von Gestaltbegriffen entwickelt hat und dessen Leistung
darin besteht, Wissen besser vermittelbar zu machen. Das Denken eines Handwerkers,
Technikers oder Komponisten kann nicht rein sprachlich sein.
Die vorliegende Arbeit widmet sich fast ausschließlich dem nicht-sprachlichen
Teil des Denkens. Es geht um die Vorarbeit, die das Gehirn leistet, bevor
überhaupt eine visuelle Wahrnehmung in unser Begriffsbewußtsein
kommt. Die Zwischenergebnisse dieser Gehirnleistungen sind noch keine Begriffe
sprachlicher Form und sollten auch noch nicht benannt werden. Ich werde
daher, wie bereits erwähnt, eine visuelle Form der Beschreibung wählen,
nämlich die Darstellung durch neuronale Netze.
Die Frage, wie Objektmerkmale erfaßt werden können, ist im
Prinzip nicht neu. Schon die Denker der Antike, die sich dem Problem des
Welterlebens genähert haben, sind bis zu dieser Frage vorgedrungen.
Allerdings suchten sie die Antwort am verkehrten Ende. Sie blieben im begrifflichen
Zirkel von Abbildung 1 gefangen, in dem eins am andern definiert wird,
der aber über den Ursprung des Ganzen nichts verrät. Natürlich
ist es kein Zufall, daß die Erforschung der Wahrnehmung im begrifflichen
Denken begann. Die Bewußtwerdung der Begrifflichkeit des Denkens
hat überhaupt erst die Frage erlaubt, wie all die Dinge in unseren
Geist kommen. Der Anfang lag somit in einer rein argumentativen Auseinandersetzung.
Doch Antworten konnten auf diese Weise kaum gefunden werden, denn die begriffliche
Bewußtwerdung bildet das Ende einer Wahrnehmung. Alles was das Gehirn
davor leistet passiert völlig unbewußt und ist der introspektiven
Erforschung nicht zugänglich. So blieb Platon im sprachlichen Hantieren
mit jenen Dingen verhaftet, die er doch erklären wollte. Allerdings
hat er erkannt, und auch überliefert, warum keine Erklärung gelingen
konnte. Vielleicht sind die folgenden Überlegungen dem Leser verständlicher
als alles bisher Gesagte.
Bereits Platon macht sich Gedanken darüber, woher wir die Begriffe
haben. Er kommt zu dem Schluß, daß sie sich aus den Einzelerlebnissen
nicht erklären lassen (Platon 1994, Band 2, "Phaidon"). Platons Argumentationslinie
ist etwas verworren, deshalb will ich versuchen mit eigenen Worten am Begriff
"Pferd" darzustellen, wieso Erfahrung alleine noch nichts erklärt:
Um den aufgetretenen Problemen zu entrinnen, wollen wir annehmen, der Mensch habe von Geburt an die Fähigkeit, Ähnliches als ähnlich zu erkennen und werde deshalb von vornherein Pferde mit Pferden und nicht mit Bäumen vergleichen. Um Ähnlichkeit zu messen, bedarf es aber irgendwelcher Kriterien bzw. Merkmale. Diese müßten auch von Geburt an mitgegeben sein, um die besagte Fähigkeit zu ermöglichen. Das Problem ist: Wenn wir dies voraussetzen, ist es gar nicht mehr nötig, Pferde zu vergleichen, um die Merkmale zu erhalten, weil wir sie ja schon haben. Wenn es nicht nötig ist zu vergleichen, kann aber auch nicht mehr behauptet werden, es sei möglich, die Fähigkeit zur Objekterkennung durch vergleichen von Erfahrungen zu erwerben. Wir können demnach nicht erkennen, was wir nicht schon kennen! Platon löst dieses Problem, indem er annimmt, die Seele habe die
"Ideen" (Begriffe) vor unserem Erdendasein schon einmal geschaut.
Im Mittelalter findet diese Problemstellung im Universalienstreit ihren Höhepunkt und leitet schließlich über zum Empirismus/Rationalismus-Konflikt. Die Frage lautet nun, ob der Ursprung unserer Begriffswelt bei den Sinnen oder dem Verstand zu suchen ist (vergl. Liessmann 1992, S. 27). Den wesentlichen nächsten Schritt finden wir bei Kant. Er stellt
nicht mehr fertige Objektbegriffe an den Anfang, sondern die Kategorien
der Qualität, Quantität, Relation und Modalität (Kant 1781,
S. 118). Sie dienen der Beschreibung von Objekten (Begriffen) und schlagen
eine Brücke zu dem, was ich später mit dem vielleicht unzureichenden
Begriff "Objekteigenschaften" zusammenfassen will.
Aber wie liefern die Sinne das Mannigfaltige? Betrachten wir einen einzelnen Rezeptor der Netzhaut, so informiert er darüber, wieviel Licht einer bestimmten Wellenlänge an einem bestimmten Platz des Sehfeldes vorhanden ist. Diese Information ist alles andere als mannigfaltig. Die anderen Rezeptoren rundherum leisten auch nichts anderes als dieser eine Rezeptor. Selbst wenn wir alle ihre Nerven zu einem Strang verbinden informiert uns deren Summe nur über die vorhandene Lichtmenge. So bleibt die Frage wie die Rezeptoren verbunden werden könnten, damit daraus Mannigfaltigkeit entspringt. Sicher sind diese Verbindungen komplex und entstehen in ihrer Fülle erst im Gehirn. Die Ausgangsposition Kants, daß die Sinne das Mannigfaltige einfach liefern, ist, so gesehen, nicht haltbar. Die Frage, wie denn aus den monotonen Informationen der Sinnesrezeptoren
Mannigfaltigkeit der Wahrnehmungen hervorgeht, sollte eigentlich nicht
in diesem Kapitel namens "erste Fragen" aufgeworfen werden. Die Erforschung
der Gehirnleistungen, die dem begrifflichen Denken vorausgehen, ist eher
die "letzte Frage", denn sie hat erst am Ende des vergangenen Jahrhunderts
begonnen, als die Neuroanatomie entstand. Seither wurde versucht, mit den
Erklärungen an der Netzhaut zu beginnen. Was man dort fand, waren
einfache Rezeptoren, die einzeln betrachtet über nichts weiter informierten
als die Lichtmenge. Ein magerer Start. Allerdings gibt es einen guten Grund,
an dieser Stelle anzufangen: Auch die Evolution des Sehsinnes begann mit
dem Erkennen von mehr oder weniger Licht.
Vom
Einfachen zum Differenzierten,
Mit dem Versuch, die Erklärungen bei den unbewußten Leistungen des Gehirns zu beginnen, die im Auge ihren Anfang nehmen, hat sich die Ansicht über das Wesen des gesamten Wahrnehmungsprozesses in einem wesentlichen Punkt geändert. Während Kant noch der festen Überzeugung sein konnte, daß der Weg der Erkenntnis in einem Ordnen des Mannigfaltigen zu Begriffen und Überbegriffen voranschreitet, erscheint es heute vernünftiger, von einer Grobeinteilung der Welt auszugehen, die eine zunehmende Differenzierung erfährt, sozusagen vom Abstrakten zum Konkreten (vergl. Riedl 1987, S. 52). Einen wesentlichen Beitrag dazu, den Prozess in dieser Richtung zu durchdenken,
kommt von seiten der Biologie, ein Zugang, der Kant noch nicht offenstand.
1809, fünf Jahre nach Kants Tod, erscheint die erste zoologische Abstammungslehre
von Lamark. 1859 veröffentlicht Darwin. Er erkennt die treibende Kraft:
das Selektionsprinzip (Meyers Lexikon 1992). Erst in unserem Jahrhundert
tritt die Evolutions-theorie an Stelle von Adam und Eva in die Köpfe
der breiten Masse. 1949 gründet Konrad Lorenz ein Institut für
vergleichende Verhaltensforschung. Damit ist ein Zugang zur Erforschung
der Evolution des Gehirns und auch der Wahrnehmung gefunden. Dem Neurophysiologen
Gerald Edelmann verdanken wir die Theorie des neuronalen Darwinismus (Edelman
1993). Ich will im folgenden kurz skizzieren, wie die Welt in den Köpfen
der Lebewesen evolutionsgeschichtlich zunehmend Gestalt annahm.
Die einfachste vorstellbare Verschaltung der Lichtrezeptoren der Netzhaut bestünde darin, sie zu einem Strang bzw. zu einem einzigen Signal zu verbinden, das lediglich darüber informiert ob die Umgebung vor dem Auge hell oder dunkel ist. Mit einer solch einfachen Leistung hat die Entwicklung des Lichtsinnes auch begonnen, allerdings bedarf es dazu weder eines Auges, noch seiner 125 Millionen Lichtrezeptoren. Der evolutionsgeschichtlich älteste, aktiv auf Licht reagierende
Organismus ist Euglena, ein im Wasser lebender Einzeller, der zu den Pflanzen
zählt und Licht benötigt. Euglena bewegt sich mittels einer Geißel,
deren Aktivität davon bestimmt wird, ob auf ihre Wurzel Licht oder
Schatten fällt. Die Pflanze treibt damit zum Licht (vergl. Ditfurth
1980, S. 113). Aus chemischer Sicht verwendete Euglena bereits das selbe
Sehpurpur, das durch die ganze Evolutionsgeschichte beibehalten wurde.
Auch zeigt dieses Beispiel sehr klar, daß Erkennen von Anfang an
mit dem Verhaltet verschalten war. Der Einzeller erkennt hell und dunkel
und reagiert mit Bewegung oder Ruhe.
Die erste wesentliche Weiterentwicklung bringt das Becherauge etwa einer Schnecke. Ihre Lichtrezeptoren befinden sich in einer becherförmigen Vertiefung der Haut. Sie reagieren lediglich auf Intensitätsänderung. Zieht ein Schatten vorüber, so meldet das System Bewegung (Ditfurth 1980, S. 120). Mit der Nadellochpupille des Nautilus wurde schließlich aus den
vagen Schatten ein projiziertes Bild. Im Grunde trifft das dahinterstehende
Prinzip auch auf unser Linsenauge zu. Siehe Abbildungen 2 und 3.
Wenn Licht auf die Oberfläche von Gegenständen
trifft, so reflektiert jeder Punkt dieser Oberfläche das Licht nach
allen Richtungen. Von jedem dieser Punkte trifft somit auch ein Lichtstrahl
durch die Lochpupille auf die Netzhaut des Nautilusauges. Jeder Punkt hat
seinen eigenen Platz. So kommt es zu einer am Kopf stehenden Projektion.
Ein größeres Loch bringt zwar mehr Licht, führt
aber zu einer unscharfen Projektion. Die Lösung bestand in der Entwicklung
der Linse, mit der mehrere, aus der gleichen Richtung kommende Lichtstrahlen
auf einen Brennpunkt gebracht werden (Abb. 3).
Eine Schlange hat bereits ein Linsenauge. Doch bedeutet dies noch lange
nicht, daß sie wesentlich mehr erkennt als Bewegung. Wie schon bei
der Schnecke melden ihre Netzhautzellen nur Intensitätsänderungen
des Lichts. Verhält sich die Schlange ruhig, und ein Tier bewegt sich
in ihrem Blickfeld, so wird die von diesem Objekt eingenommene Netzhautfläche
reagieren, weil Bewegung und somit Veränderung der Lichtintensität
vorliegt. Aus der reagierenden Fläche kann nun zusammen mit der Entfernung
des wahrgenommen Tieres, die durch die Linsenfokussierung bekannt ist,
dessen Größe ermittelt werden. Die Schlange unterscheidet die
Beute und den Feind an der Größe. Aus dem Wahrnehmungsprozeß
erklärt sich auch die typische starre Haltung des Tieres 3*
(vergl. Ditfurth 1980, S. 133).
Die angeführten Beispiele sollten reichen um zu belegen, daß
die Entwicklung mit einer Grobunterteilung der Welt begann, und erst nach
und nach differenziertere optische Wahrnehmungen möglich wurden. Wiedererkennen
von konkreten Einzeldingen war am Anfang nicht möglich, und auch nicht
notwendig. Ein Wesen, das nur fünf verschiedene Handlungen ausführen
kann, braucht auch nur fünf verschiedene Situationen unterscheiden
zu können.
So wurde bereits mit der Lichtempfindlichkeit der Keim für die Unterscheidung zwischen Himmel (All) und Erde gelegt. Das Bewegungssehen bringt die Unterscheidung von lebendig und tot. Das Farbsehen bringt die Unterscheidung zwischen Pflanzen und Tieren. Die Größenverarbeitung dient schließlich
dem Erkennen von Räuber und Beute.
So sieht sie aus, die Liste der großen Worte. Sie bilden die Überbegriffe
unseres heutigen Begriffssystems. In ihnen ist alles Wahrnehmbare enthalten.
Es sollte nicht verwundern, daß diese ersten Trennungen in Hell und
Dunkel, in Himmel und Erde, Lebendig und Tot auch die Basis für viele
Schöpfungsmythen bilden. In einer Welt von Blinden, die auf ihren
Tastsinn angewiesen sind, hätten Schöpfungsmythen vielleicht
mit einer Trennung von Gasen, Flüssigkeiten, und Festkörpern
begonnen.
Ein Säugling kann uns noch nicht sprachlich mitteilen, welche ersten Unterscheidungen er zu treffen vermag. Doch dieses Problem hat sich auch bei der Erforschung der Wahrnehmungsleistungen von Tieren gestellt. Dort wurden die größten Fortschritte durch Experimente mit Attrappen erbracht. Kröten jagen bewegte Kartonstreifchen, Insekten halten eine Glühbirne für Sonne oder Mond, eine gestreifte Walze für ein Weibchen usw. Den Biologen sind unzählige derartige Beispiele bekannt (vergl. Ditfurth 1980, S. 88). Je niedriger das Differenzierungsvermögen eines Wesens, desto abstrakter
können diese Attrappen ausgeführt sein. Dies trifft auch auf
den Menschen zu. Ein drei Monate alter Säugling reagiert zum Beispiel
auf einen hautfarbenen Luftballon mit aufgemalten Augen und Haaren genauso
wie auf den Kopf seiner Mutter. Am Ende des ersten Lebensjahres können
aber bereits Abbildungen von vertrauten Personen und Objekten erkannt werden.
Das Kind verhält sich ihnen gegenüber jedoch so, als handle es
sich um reale Personen oder Objekte (vergl. Fleisch 1988, S. 25 u. 27).
Natürlich läßt sich darüber streiten, ob diese Überbegriffe noch irgend etwas mit mangelnder Wahrnehmung zu tun haben, oder lediglich ein Zeichen mangelnden Sprachvermögens sind. Ich glaube jedoch zeigen zu können, daß sich diese beiden Fähigkeiten aneinander entwickeln. Würde ein Kind die Dinge von Anfang an voll differenziert erkennen, und wir erklärten ihm, daß dieses Objekt vor ihm ein "Tütü" sei, was sollte das Kind dann dazu bewegen, dieses Wort auf mehr als dieses eine Auto vor ihm anzuwenden? Das Kind braucht auf der Ebene der Gestalt zuerst die Überbegriffe, um Sprache überhaupt sinnvoll zuordnen zu können (Konditionierungslernen) und auch, um sich sinnvoll zu orientieren. Wenn am Anfang keine Grobunterteilung der Wahrnehmungen stünde, dann könnte das Kind Dinge, die es noch nicht kennt, überhaupt nicht erfassen. So aber nimmt es von Anfang an alles wahr, nur erscheint vorerst vieles als identisch, das später als verschieden erkannt wird. Dieser Differenzierungsprozeß kommt nie wirklich zum Stillstand,
und es finden sich auch in der Welt der Erwachsenen noch Beispiele dafür.
Nehmen wir an, unser Nachbar habe Schlittenhunde, so kann es sein, daß
wir diese vorerst gar nicht unterscheiden können. Wenn wir dies dann
mit der Zeit erlernen, können wir ihnen auch Namen zuordnen. Die sprachliche
Trennung entwickelt sich somit parallel zu unserem Gestaltdifferenzierungsvermögen.
Wenn sowohl die Evolutionsgeschichte der Wahrnehmung, als auch die Entwicklung im Individuum von groben Unterteilungen zu weiterer Differenzierung fortschreitet, so liegt die Annahme nahe, daß sich über die Evolution, dieses Nacheinander der Verarbeitungs-prozesse auch in den Aufbau unseres Wahrnehmungsapparates (Auge, Gehirn) übertragen hat. Da Objekterkennung in Sekundenbruchteilen stattfindet ist diese Hypothese über Verhaltensbeobachtung schwer nachzuprüfen. Wir können in diesem kurzen Zeitraum nicht oft genug fragen "Was siehst du gerade?". Außerdem muß angenommen werden, daß ein Großteil der Verarbeitung nicht bewußt zugänglich ist. Bei Kurzdarbietung von Bildern und nachherigem Abfragen besteht wiederum
die Gefahr, daß damit eher das Merkvermögen einer Person überprüft
wird als deren Wahrnehmung.
Es scheint, als wäre die Frage nach der Erkenntnisabfolge nicht
der ideale Beginn, um den Ablauf der vorbewußten Gehirnleistungen
zu ergründen. Warum ist es überhaupt wesentlich, zu wissen, ob
die Wahrnehmungsverarbeitung in ihrer zeitlichen Abfolge im Gehirn einen
Weg zunehmender Differenzierung beschreitet oder den gegenteiligen Weg
der Generalisierung?
Stellen wir demgegenüber die Theorie auf, daß Objekte zu
Erkennen soviel bedeutet, wie Objekte differenzieren zu lernen, so ergibt
sich das Problem, daß am Anfang des Wahrnehmungsprozesses die Netzhaut
steht, auf welche die konkreten Einzelerscheinungen der Außenwelt
projiziert werden. "Konkret" bedeutet das Gegenteil von "abstrakt" oder
"allgemein". Die Theorie, daß Wahrnehmen ein Prozeß der Differenzierung
sei, bedarf aber des obersten Allgemeinen als Ausgangspunkt. Wo ist dieses
zu suchen, wenn nicht auf der Netzhaut?
Der Weg vom Abstrakten zum Konkreten ist also, wenn auch nicht nachvollziehbar,
zumindest logisch nicht ausgeschlossen. Daß sowohl die Entwicklungsgeschichte
der Fragen wie auch die Geschichte der bildenden Kunst mitunter in die
Gegenrichtung verlaufen sind, ist verständlich, denn beide beginnen
im bewußten Denken, dort, wo der Prozeß der Wahrnehmungsverarbeitung
endet.
Erste
Theorie der Objekterkennung
Eine Theorie der Objekterkennung muß somit erklären können, was uns dazu befähigt, zu differenzieren. Es muß erklärt werden, wie die Sinne das Mannigfaltige liefern. Was die visuelle Wahrnehmung betrifft, geht es darum darzustellen, wie Verbindungen der Rezeptorzellen aussehen könnten, die auf verschiedenartige Objektmerkmale ansprechen, und nicht bloß auf die Menge des vorhandenen Lichtes. Die Verschiedenartigkeit visueller Objektmerkmale, die der Mensch empfängt, muß sich also aus jener Verschiedenartigkeit erklären, mit der diese relativ gleichartigen Zellen verschaltet bzw. kombiniert sind. Jede Verbindungsart, die für ein bestimmtes Merkmal steht, wird natürlich nur dann aktiv, wenn möglichst alle ihre Ausgangszellen senden. Aus einer weiteren Kombination der Merkmale miteinander geht schließlich die noch größere Zahl an Gestaltbegriffen von Objekten hervor. Letztere bilden somit das Ende der Verarbeitung und nicht deren Anfang. Wahrnehmung wird damit zu einer Lehre von den Verbindungen. Es wird sich zeigen, daß sogar Eigenschaften wie die Form eines Objektes durch Verbindungen erklärt werden. Eindrucksvolle Beweise, daß in der Verbindung der Bildpunkte der Schlüssel zum Verständnis der visuellen Wahrnehmung liegt, kommen aus der Neurophysiologie. Das Netzhautbild wird über den Sehnerv auf die Gehirnrinde übertragen, wo es mehrere Zellschichten durchfließt. Jede dieser Zellschichten schafft neue zusätzliche Verbin-dungen. Gleichzeitig reagieren die Zellen von Schicht zu Schicht auf komplexere Auslöser (Hubel 1989.). Auf die Art der Verbindungen komme ich später noch zu sprechen. Vorerst soll nur die Richtung dargestellt werden, in die der Verarbeitungsprozess verläuft. Differenzierung wird oft mit einem Prozeß des Trennens und Zerteilens
gleichgesetzt. Es scheint widersprüchlich, wenn jetzt ausgesagt wird,
Wahrnehmen und Erkennen sei ein Prozeß des Verbindens. Dieser Widerspruch
ist nur ein scheinbarer:
Die Innenwelt, also die Welt wie sie der Mensch erlebt, hat ebenfalls den Beginn in ihren kleinsten Bausteinen, den Rezeptoren. Sie werden in der visuellen Verarbeitung zu kurzen linearen Elementen verbunden, aus ihrer Aneinanderreihung bestehen Strukturen und Kanten. In variabler Kombination verschiedener Seitenkanten ergeben sich schließlich Grundformen, wie Rechteck, Kreis oder Dreieck, und aus deren Zusammenfügung entstehen ganze Gestalten. Die Begrenztheit der dargestellten Analogie ist vergleichbar mit der begrenzten Überein-stimmung eines Landschaftsbildes mit der Landschaft selbst. Wird uns nur ein winziger Ausschnitt des Bildes gezeigt, so ist darauf nur Farbe auf Leinwand und vielleicht eine Pinselstruktur zu erkennen. Die Übereinstimmung ist dahin. Sie gilt in diesem Maßstab nicht mehr. Wenn wir die visuelle Wahrnehmung als ein System verstehen, das eine
Analogie zu dieser Welt aufbaut, so fragt sich, wie die Außenwelt
sich gegenüber dieser Analogie verhält. Die Antwort würde
uns der Außenwelt ein Stück näher bringen. Vielleicht sind
viele verschiedene Analogien zur Außenwelt möglich. So können
zum Beispiel Schallereignisse in einer analogen Form festgehalten werden,
eine Möglichkeit ist die Schallplatte, eine
andere die Magnetaufzeichnung.
Abgrenzung von Wahrnehmung gegenüber
Vorstellungen:
Um Wiedererkennung von Objekten zu ermöglichen, brauchen Lebewesen auch die Fähigkeit, die wesentlichen Elemente einer Wahrnehmung zu speichern. Sie müssen Gestaltbegriffe im Kopf behalten. Der Mensch verfügt zusätzlich über die Fähigkeit zur selbständigen Aktivierung solch gespeicherter Informationen. Allerdings darf angenommen werden, daß ein Großteil der potentiell verfügbaren Information nicht jederzeit in Form einer Vorstellung abrufbar ist. Vorstellung darf nicht mit Wahrnehmung gleichgesetzt werden, denn ihre Selbstgesetztheit ist dem gesunden Menschen bewußt. Eine besondere Form der Fremdgesetztheit besteht in der Aktivierung von Gehirnzellen durch eine Mikroelektrode, wie dies zu Testzwecken bei Gehirnoperationen notwendig ist. Dabei können unter anderem Wahrnehmungserlebnisse provoziert werden, die der Patient wie Halluzinationen erlebt (vergl. Gershon u. Rieder 1993, S. 80). Zusammen mit dem Phänomen des Traums und der Vorstellungswelt geben
solche Experimente Auskunft darüber, was der Mensch von den visuellen
Sinneseindrücken geistig zu behalten vermag. Wir vermögen das
Bild vor unseren Augen nicht abzuspeichern wie dies eine Videokamera kann.
Es ist schwer zu beschreiben, was von einer Wahrnehmung überbleibt,
wenn wir die Augen schließen und versuchen uns das Wahrgenommene
weiter vorzustellen. Das Bild zerfällt dann in Objekte, und diese
zerfallen in ihre Eigenschaften.
Im visuellen Vorstellungsvermögen werden Objektinformationen also
durch Eigenschaften vermerkt. Dazu kommen noch Regeln, die beschreiben,
auf welche Weise alles zusammenhängt. Die Information ist somit nicht
mehr in ihrer bildhaften Form vorhanden. Das erklärt, warum es so
schwer ist, eine Zeichnung des Gesehenen anzufertigen. Wir verfügen
nur über Merkmale. Wir wissen, ob etwas dreieckig, recht-eckig, kreisförmig
oder oval, lang oder kurz war. Eine aus diesem Wissen hervorgehende Zeichnung
ist weit weg vom Original. Es erfordert viel Mühe, über solche
schematische Skizzen hinaus zu kommen. Auch hier führt der Weg über
zunehmende Differenzierung vom Abstrakten zum Konkreten.
Rechtfertigung
der Vorgangsweise
Ich habe auf den vergangenen Seiten begründet, warum ich die Erklärungen
zum visuellen Erkennen des Menschen nicht an der bewußten Seite des
Denkens, sondern an der Netzhaut beginnen will. Den "Top down-Einfluß
4*
von Erwartungen und Wünschen auf die Wahrnehmung will ich vorerst
unbehandelt lassen. Damit stelle ich mich gegen den Zeitgeist, der darin
besteht, angelehnt an den Konstruktivismus, diese Einflüsse besonders
zu betonen. Arbeiten wie der vorliegenden wird eine reduktionistische Vorgangs-weise
vorgeworfen. Angesichts solcher Vorwürfe stellt sich die Frage, wie
wesentlich es ist, mit den Erklärungen an der richtigen Stelle zu
beginnen. Ich will im folgenden zeigen, daß es von der Erklärungsrichtung
abhängt welcher Ausschnitt des Ganzen betrachtet wird, die Exaktheit
von Beobachtungen jedoch von der Richtung der Betrachtung unbeeinflußt
bleibt:
Die
Erklärungsrichtung bestimmt den Ausschnitt der Betrachtung
Rupert Riedl zeigt in seinem Buch "Die Spaltung des Weltbildes", daß dem Menschen unabhängig davon, was erklärt werden soll, immer zwei Wege der Erklärung offen stehen: Der eine Weg achtet darauf, was eine Sache antreibt bzw. aus welchen Untersystemen sie besteht; im anderen Erklärungsweg wird darauf Wert gelegt zu erfahren, welchem Zweck die Sache dient bzw. welchen Obersystemen sie zugeordnet werden kann. Ein ideales Beispiel, um dies zu veranschaulichen, findet sich in evolutionstheoretischen
Erklärungen über den Werdegang des Lebens.
Riedl weist anhand von Beispielen nach, daß diese beiden Erkenntniswege in allen Wissensgebieten möglich sind 5*, jedoch nur nacheinander gedacht werden können. Das ist möglicherweise deshalb so, weil die Wirkeinflüsse in der Natur auch nur Wechselweise tätig sind, sonst würde Evolution keine Zeit benötigen. Viele Wissenschaften vernachlässigen einen der beiden Erklärungswege. Das Beispiel der Evolutionstheorie zeigt, wie bei der Erklärung von Prozessen wechselweise sowohl auf die Wirkeinflüsse aus den Untersystemen als auch auf den Einfluß des jeweiligen Obersystems geachtet werden kann. Aufschlußreich ist auch die absolute Grenze zu welcher der jeweilige
Erklärungsweg führt: Die letzte Antriebsursache, auf die die
Naturwissenschaft alles zurückführt ist ungeordnete Energie
(wenngleich inzwischen die Erkenntnis um sich greift, daß das Ganze
meist mehr ist als die Summe seiner Teile und diese Ursache nicht ausreicht),
die letzte Zweckursache der Geisteswissenschaft (oder deren "oberstes System")
ist ein ordnender Gott. Was die Beschreibung der Welt betrifft,
macht es aber eigentümlicherweise nicht viel Unterschied ob absolute
Ordnung oder Unordnung am Anfang des Weltbildes eines Beobachters steht.
6*
Denn obwohl ein Zugleich der beiden Erklärungswege nicht denkbar scheint,
führen sie doch zum selben Resultat, was das Ergebnis von Beob-achtungen
betrifft. Wenn wir Materialisten und Finalisten zum Beispiel über
die Richtung befragen, in die die Evolution bisher verlaufen ist, so werden
beide erkennen, daß der Prozeß von der Einfachheit zur Vielfalt
geführt hat, von einem Universum des Wasserstoffs zum Reichtum des
Lebens. Allerdings führen die Erklärungswege zu unterschiedlichen
Interessen, was den Ausschnitt betrifft, der beobachtet wird. Für
Materialisten ist die kleinste Einheit der Schlüssel für alles
Weitere, Finalisten hingegen suchen die Lösung in den Obersystemen.
Das führt auch zu Unterschieden bei Zukunftsprognosen.
7*
Für
und Wider der Konzentration auf einen Ausschnitt
Wenn wissenschaftliche Erklärungen zu ungewollten Ergebnissen führen, so liegt dies meist nicht daran, daß die wissenschaftlichen Aussagen unexakt waren, sondern daran, daß sie nur einen Ausschnitt der Gesamtzusammenhänge behandelt haben. So kann zum Beispiel ein Energietechniker zeigen, welche Vor- und Nachteile der Bau eines bestimmten Staukraftwerkes bringen wird. Trotz der Exaktheit seiner Voraussagen wird keine sinnvolle Entscheidung möglich sein, wenn das Projekt nicht auch von Ökologen, Biologen, Verkehrsplanern u. a. beurteilt wird. Diese sagen andere Aspekte des Ganzen ebenso richtig voraus, wie der Techniker den technischen Teil. Wer wissenschaftliche Ergebnisse als Orientierungshilfe für lebenspraktische
Entscheidungen nützt, sollte wissen, daß es verhängnisvolle
Konsequenzen hat, nur einen Teil des Ganzen zu betrachten. Der Mensch begeht
Fehler meist nicht aufgrund von unexakten, sondern aufgrund von unvollständigen
Erkenntnissen.
Kurze
programmatische Vorschau
Die wissenschaftliche Erforschung der Wahrnehmung ist also zum Teil durch die empiristische Betrachtungsweise beeinflußt, die mit dem Reiz/Reaktions-Schema die Antriebsursachen in den Vordergrund stellen. Demgegenüber beginnt die konstruktivistisch gesinnte Gestaltpsychologie den Erklärungsweg sehr finalistisch bei der fertigen Gestalt. Das in diesem Buch vorgestellte Modell des Erkennens soll die beiden Positionen sinnvoll zusammenführen. Wenn auch in empiristischer Tradition an der Netzhaut begonnen wird (Untersystem), muß doch erkannt werden, daß die Form und Beschaffenheit einer Wahrnehmung durch das verarbeitende System (Obersystem) bestimmt ist. Es ist das Medium, in dem Wahrnehmung entsteht. Die Gehirnleistungen, die im folgenden besprochen werden, verlaufen
allesamt unbewußt. Das bedeutet, man kann sie nicht an sich selbst
beobachten. Allerdings wird in den Exkursen zu den Buchteilen ein erlebbarer
Zugang zu diesem dunklen Teil des Gehirns gefunden, der jedem offen steht.
Im gestalterischen Tun des Menschen wird Sehen und Handeln rückgekoppelt,
und ein Spiegel der Innenwelt tritt zutage. Diese Rückkopplung verläuft
folgendermaßen:
Eine Zeichnung kann nur einen Bruchteil der Information enthalten, die das Gehirn von der Umwelt aufzunehmen vermag, und zwar jenen Teil, den wir bewußt aufzurufen und wiederzugeben vermögen. Die Art und Weise, in der sich Zeichnung und Realität unterscheiden, wird ersichtlich, da die Zeichnung als Objekt der Außenwelt wieder über die Wahrnehmung aufgenommen wird. Die auftretende Differenz verrät etwas über die Arbeitsweise des Gehirns. Um herauszufinden was sie verrät, ist zuvor eine Hürde zu nehmen. Es muß eine Begrifflichkeit für die auftretenden Unterschiede entwickelt werden. Dazu ist es notwendig, sich ein Modell zu schaffen, das zeigt, wie Objekterkennung vor sich geht. Ob die einzelnen Leistungen vom Gehirn ähnlich oder nur irgendwie analog zu diesem Modell erbracht werden, ist vorerst nicht so wesentlich. Fest steht, daß wir es in jenen Bereichen, wo es gelingt ein Modell zu erstellen, mit nichts Unerklärlichem zu tun haben. Die Erklärung der Fähigkeit zur Objekterkennung ist ein Teilbereich
des Erkenntnisproblems, welches lange genug von seiten der Philosophie
mit dem Schleier der Unergründbarkeit verhängt war. Ich denke,
dieser Teilbereich hat den Schleier nicht mehr nötig.
Der Begriff "Bildinformation" im Titel ist unzureichend, aber es war
kein besserer zu finden. Unter Bildinformation werden hier Daten verstanden,
die noch nicht den abgebildeten Objekten zugeordnet werden können.
Bildinformationen bzw. bildspezifische Daten beschreiben die gegenwärtige
Netzhautprojektion. Objektinformationen sind im Gegensatz dazu objektbezogen
und müssen die gleichen bleiben, egal in welchem Bild ein Objekt in
welcher Weise dargestellt wird.
Das Erfassen von Objektumrissen scheint somit eine Grundbedingung für das Erkennen zu sein. Bei genauer Betrachtung ist dies jedoch gar nicht so selbstverständlich. So erkennt zum Beispiel ein Einleseprogramm Buchstaben, ohne diese zu konturieren, am Helligkeitsunterschied und an den Koordinaten der Pixel des aufgerasterten Buchstabens. Allerdings stehen solche Programme vor einer viel einfacheren Situation, als sie die Betrachtung eines Bildes mit sich bringt. Eine exakte Eingrenzung ist zum Auseinanderhalten von Buchstaben nicht notwendig, da ihre Position (in einer Linie aufgereiht) klar vorgegeben ist. Es genügt, einen rechteckigen Bildausschnitt geeigneter Größe zu definieren (vergl. Hinton 1993, S. 99). Die Natur, an der sich unsere visuelle Wahrnehmung entwickelt hat, liefert keine fein säuberlich vorsortierten Einzelreize. Um den Erscheinungen der Natur gerecht zu werden, verfügt unser visuelles System über eine ganze Palette von Abgrenzungsverfahren. Wir konturieren nicht nur Helligkeitsgrenzen, sondern auch Farbwechsel, Entfernungsbrüche, Struktur- und Texturgrenzen sowie Verschiebungen des Projektionsbildes durch Bewegung und Eigenbewegung. Durch Kombination dieser Abgrenzungen können zum Beispiel Objektkonturen von Schlagschatten oder Objektumrisse von Objektkanten unterschieden werden. In den nächsten Kapiteln geht es um solche Konturerstellungen. Es werden Zellverschaltungen beschrieben, mit denen diese Abgrenzungen erreicht werden können. Sie geben eine Vorstellung davon, wie eine Verarbeitung in Hinsicht auf das Erkennen von Objekten möglich ist. Es ist heute auch schon teilweise erforscht, welche konkreten Prozesse im Gehirn ablaufen. So werde ich mich vor allem in den Anfangskapiteln immer wieder an Ergebnisse der Neurophysiologie anlehnen. Um spätere ausschweifende Erklärungen zu vermeiden, will ich
vor den einzelnen Konturkapiteln noch eine Vorstellung von der Reizleitung
im Gehirn vermitteln. (Grundlagen aus: Hubel 1989, ab S. 43)
Die
optische Reizleitung im Gehirn
Wenn Gehirnzellen Signale weitergeben, so ist neben der Signalherkunft und dem Signalrhythmus auch die Signaldichte ausschlaggebend. Daß Signale im Gehirn an ihrer Dichte und nicht an ihrer Stärke unterschieden werden hat einen einfachen Grund: Bei jeder Weitergabe eines Signals von Zelle zu Zelle muß dieses neu reproduziert werden. Wäre die Signalstärke ein ausschlaggebender Faktor, so wäre jeder Widerstand in der Leitung und jede ungenaue Weitergabe ein Problem (Stille-Post-Effekt). Deshalb wird die Signalmenge sozusagen in kleine Einheiten oder bildlich gesprochen, in "Pakete" zerlegt. Widerstände wirken sich in einem solchen System nicht mehr aus. Es muß am anderen Ende der Leitung lediglich erkannt werden wie viele "Pakete" gesendet wurden. Genau dieselbe Zahl wird dann produziert und weitergeschickt. Die "Pakete" werden also bei jeder Weiterübertragung erneuert. Das bedeutet, daß das Signal durch die Übertragung nicht an Qualität verliert, sondern diese sogar wieder zurückgewinnt (vergl. Hubel 1989, S. 30). Genau dasselbe gilt für digital aufgezeichnete Informationen am
Computer. Wenn ein Magnetband alt ist und die Null/Eins-Informationen darauf
langsam undeutlich werden, so sollte es rechtzeitig überspielt werden.
Beim Überspielen werden die Nuller und Einser, soweit sie noch erkannt
werden können, durch frische ersetzt, und die Daten haben wieder ihre
ursprüngliche Qualität. Im Unterschied dazu wird eine analoge
Aufnahme durch jeden Überspielvorgang nur schlechter.
Die
Anatomie des optischen Systems
Abbildung 4 zeigt eine vereinfachte Darstellung der drei Zellschichten in der Netzhaut. Die Rezeptorzellen bilden die lichtempfindliche Schicht. Sie geben die Signale weiter an die Bipolarzellen, und diese geben sie weiter an die Ganglienzellen. Die Axone (Nervenfasern) der Ganglienzellen bilden den Sehnerv. Interessanterweise trifft das Licht die Netzhaut auf der Seite der Ganglienzellen
und muß alle drei Schichten durchstrahlen, um die lichtempfindliche
Spitze der Rezeptorzellen zu treffen. Dies hat damit zu tun, daß
die Rezeptoren von der anderen Seite her ständig mit dem lichtempfindlichen
Sehpurpur versorgt werden müssen.
Der Film liegt sozusagen verkehrt in der Kamera. An der Stelle, wo die
Sehnerven aus dem Augapfel treten, muß die Netzhaut somit unterbrochen
werden. An diesem Punkt ist das Auge blind.
Interessanterweise geht uns dieses Stück Bild im täglichen Leben nie ab. Die Abwesenheit von Information kann uns nur in Zusammenhängen bewußt sein, wo wir gewohnt waren, solche zu erhalten. Es ist notwendig, zwischen der Abwesenheit von Information und dem Bewußtsein über die Abwesenheit von Information zu unterscheiden. Dies trifft auch auf die weiteren Kapitel zu. Alles, was im folgenden über die Verarbeitung der Signale im Gehirn geschrieben wird, erscheint angesichts unseres eigenen Welterlebens absurd oder zumindest weit hergeholt, denn nichts davon geschieht unter Aufsicht unseres Bewußtseins. Der blinde Fleck kennzeichnet also jene Stelle, an der der Sehnerv das Auge verläßt. Abbildung 5 zeigt die weitere optische Reizleitung im Gehirn. Das Netzhautbild jedes Auges wird vertikal in zwei Hälften geteilt. Die beiden linken Bildhälften werden in der linken, die rechten in der rechten Gehirnhälfte verarbeitet. Da die Netzhautprojektion seitenverkehrt ist, werden Gegenstände, die im rechten Bereich des Gesichtsfeldes zu sehen sind in der linken Gehirnhälfte verarbeitet, und Objekte, die sich links befinden landen im Gehirn rechts. Nicht nur die Bildverarbeitung, sondern auch die Motorik der linken
und rechten Körperhälfte findet in der jeweils anderen Hemisphäre
statt. Das hat sich vermutlich deshalb so entwickelt, weil es günstig
für die optische Kontrolle der Motorik ist und weil kürzere Nervenleitungen
die Reaktionszeit verkürzen. Natürlich gibt es auch den Weg über
eine Gehirnhälfte in die andere. Geisteskranke (hauptsächlich
Epileptiker), denen aus medizinischen Gründen diese Verbindung zwischen
den Gehirnhälften durchtrennt wurde (split Brain), sind verblüffenderweise
dadurch unter normalen Lebensumständen nicht auffällig benachteiligt.
Gezielte Testverfahren bringen jedoch eine große Zahl an Problemen
ans Tageslicht (Kolb 1996, S. 151).
Die erste Zusammenführung der Bildsignale beider Augen erfolgt, wie aus Abbildung 5 zu entnehmen ist, in den seitlichen Kniekörpern. Hier enden die Sehnerven. Jedes Auge spaltet seine Information in drei Zellschichten pro Kniekörper auf, die den drei Schichten des anderen Auges deckungsgleich gegenüberstehen; es gibt also sechs Lagen pro Kniekörper. Es ist anzunehmen, daß die drei Schichten das Bild in unterschiedliche Verarbeitungsprozesse trennen (Hubel, Wiesel 1987, S.40). Die Kniekörper leiten die Signale schließlich zum primären Sehfeld. Die Bildzentren, in denen unser Sehvermögen schärfer ist, beanspruchen hier mehr Platz als das Umfeld. Abgesehen von dieser Verzerrung bleibt aber der Bildzusammenhang, wie auch schon in den Kniekörpern, erhalten. Das primäre Sehfeld ist ein Teil der Großhirnrinde. Es besteht aus Schichten und bietet genug Platz für komplexere Verarbeitungsschritte. Letztendlich ergibt sich allerdings die Frage, warum diese Verarbeitung gerade im Hinterkopf stattfindet und die Sinnesreize somit vorher das ganze Gehirn durchqueren müssen. Der Grund dafür ist wahrscheinlich kein rationaler. Es dürfte sich eher um eine der vielen entwicklungsgeschichtlichen Notlösungen handeln, die die Biologie zu nennen weiß. Für unsere frühesten tierischen Vorfahren war kein exaktes Anvisieren, sondern ein Rundumblick wichtig. Die Augen waren seitlich, und dahinter hat sich der Gehirnbereich für die visuelle Ausarbeitung entwickelt. Die Evolution kann nur langsam verwandeln, nicht aber radikal umändern. So wanderten die Augen nach vorne, das Gehirn jedoch konnte sich nicht umdrehen (Riedl 1984, S. 173). Die langen Sehnerven können bei einem Signalfluß von etwa
5 m/s (vergl. Hubel 1989, S. 28) durchaus als eine Notlösung bezeichnet
werden, (so ist die Reaktionszeit eines Menschen gegenüber einer Fliege,
welche nur über kurze Nervenleitungen verfügt, vergleichsweise
lang). Sie sind ein Hinweis darauf, daß die Evolution kein Endziel
kennt und somit immer nur mit dem Vorhandenen weiterbauen kann. In dieser
Hinsicht hat der Mensch als Schöpfer einen Vorteil. Deswegen baut
er auch nicht krumm, sondern geradlinig.
1.
Konturkapitel: Helligkeitsgrenzen
Die erste Konturausarbeitung findet bereits auf der Netzhaut statt.
Es handelt sich hierbei vor allem um Helligkeits- und Farbgrenzen, und
es wird auch schon Vorarbeit zur Bewegungswahrnehmung geleistet.
Wird die Automatik abgeschaltet und für beide Bilder die gleiche mittlere Einstellung gewählt, so wird ein dunkles und ein helles Foto entstehen. (Der Versuch sollte mit Diapositiven gemacht werden, da Fotos im Entwicklungsprozeß gegengefiltert werden.) Dies entspricht zwar den wahren Lichtverhältnissen, aber nicht die Lichtverhältnisse, sondern die Objekte sollen erkannt werden, und in dieser Hinsicht ist es günstig, daß deren Eindruck konstant gehalten wird. Objektivität hat zwei Gesichter. Wäre unser Auge so "objektiv" wie ein Belichtungsmesser, so könnten wir die meiste Zeit gar keine Objekte erkennen. Deshalb verfügt auch das Auge über eine Blende, die die Menge des einfallenden Lichtes regelt, bekannt als Iris. Legen wir die Buchseite halb in den Grenzbereich von Schatten und Sonnenbestrahlung,
so ist es dem Fotoapparat nicht mehr möglich, den Objekteindruck unabhängig
von den Lichtverhältnissen aufzuzeichnen. Unser visuelles System kann
diesbezüglich mehr. Uns erscheint die Buchseite auch in dieser Situation
immer noch als durchgehend weiß mit schwarzer Schrift. Bereits in
den drei Zellschichten der Netzhaut wird eine erste Vorarbeit zur getrennten
Verarbeitung von Beleuchtungseffekten und Objektgrenzen geleistet. Wie
diese funktioniert soll im folgenden Kapitel erläutert werden:
1.1.
Vorbereitung des Bildes für die Kontursysteme
Wie kann die Schrift auf einer Buchseite, über die ein unscharfer Schatten fällt, richtig abfotografiert werden? Belichtet man den Schattenbereich richtig, so erscheint im Licht die Schrift unleserlich blaß, belichtet man die hellen Bereiche richtig, so erscheint das Papier im Schattenbereich grau. Noch größere Probleme treten oft bei Landschaftsfotos auf, insbesondere bei schönen Himmelsstimmungen im Gegenlicht. Belichtet man den Himmel richtig, so erscheint die Landschaft am Foto schwarz, im umgekehrten Fall ist der Himmel weiß. Es gibt jedoch eine relativ einfache Lösung, um die beiden Extreme
zu vereinen:
Auch die Fotorezeptoren des Auges können kein beliebig großes Helligkeitsspektrum verarbeiten. Es ist inzwischen bekannt, daß das Auge dieses Problem ebenfalls mit Hilfe einer Unscharfmaske löst. Im Zellsystem der Netzhaut wird Unschärfe dadurch erreicht, daß jede Zelle jener Ebene auf der das unscharfe Reaktionsbild entstehen soll jeweils Signale von einer Gruppe benachbarter Rezeptorzellen erhält und diese Signale mittelt. In Frage kommen hierbei die sogenannten Horizontalzellen der Netzhaut. Sie stehen in direktem Kontakt mit den Fotorezeptoren und könnten somit deren Lichtempfindlichkeit beeinflussen. Außerdem entspricht ihr rezeptives Feld von der Größe her dem rezeptiven Feld innerhalb dessen ein bereichsspezifischer Helligkeitsabgleich stattfindet (Hubel 1989, S. 61). Bekannt geworden ist dieser Helligkeitsabgleich unter dem Begriff "Simultankontrast", weil ursprünglich angenommen wurde, der Kontrast werde zur Kontur hin erhöht. Meiner Ansicht nach handelt es sich jedoch eher um einen Prozeß, der dazu dient, die Helligkeit größerer Flächen anzugleichen, so daß, wenn wir auf das Beispiel mit dem stimmungsvollen Himmel zurückgreifen, der Himmel nicht mehr so weiß, und die Landschaft nicht mehr so schwarz erscheint. So werden innerhalb der Fläche "Himmel" und der dunkleren Fläche "Landschaft" wieder Helligkeitsdifferenzierungen möglich, das bedeutet, es kann etwas wahrgenommen werden. Daß diese beiden Interpretationen des Simultankontrastes sich keineswegs wider-sprechen ergibt sich aus deren Simulation. Farbtafel 1 zeigt unter anderem ein Bild, das zu 45% mit seinem unscharfen Negativ überblendet wurde, wobei es an Kontrast verliert, der ihm nachträglich wieder zugeführt wurde. Das Ergebnis ist auf Bild 4 zu sehen. Dieses Ergebnis kann auch erreicht werden, indem man den Kontrast des Bildes vorher um 50% reduziert und dann nur im Umfeld von Konturen verstärkt. Letzteres Verfahren ist im Bereich der computerisierten Bildbearbeitung als Unscharfmaske bekannt. Es entspricht der Vorstellung, die man bisher vom Simultankontrast hatte. Die erste Variante erscheint mir jedoch wahrscheinlicher, da sie direkt im Kontakt mit den Rezeptorzellen zustandekommen könnte, und bei diesem Verfahren der Informationsreichtum des Bildes erheblich erhöht würde. Um diese Erhöhung des Informationsreichtums zu simulieren, hätte ich allerdings zwei Belichtungen des Versuchsbildes gebraucht. Eine mit richtig belichteten Figuren, und eine mit richtig belichtetem Hintergrund. Ich hätte dann über das Bild mit den richtig belichteten Figuren ein unscharfes Positiv legen können, so daß der Hintergrund völlig abgedunkelt ist; über das Bild mit dem richtig belichteten Hintergrund hätte ich ein unscharfes Negativ gelegt, so daß die Figuren völlig abgedunkelt sind. Die erhaltenen Bilder müssen dann übereinanderbelichtet, bzw. additiv zusammengeführt werden. Das Ergebnis hätte sich von Bild 4 insofern unterschieden, als dort der Hintergrund keine ordentlichen Kontraste mehr aufweist. Im Original ist der Hintergrund so dunkel, daß dort nur mehr Farbvariationen zwischen Schwarz und Dunkelgrau vorkommen. Der nachträgliche Helligkeitsabgleich hat zu einer Aufhellung geführt, das verminderte Kontrastspektrum ist jedoch gleich geblieben. Wenn, wovon ich überzeugt bin, der Simultankontrast bereits vor jeder Weiterverarbeitung durch selektive Beeinflussung der Lichtempfindlichkeit der Lichtrezeptoren zustandekommt, so entsteht ein solcher Kontrastverlust erst gar nicht. Bei Betrachtung des Motivs von Farbtafel 1 würde die Lichtempfindlichkeit der Rezeptorzellen im Bereich des Hintergrundes sofort erhöht, und es könnte dort das gesamte vorhandene Kontrastspektrum wahrgenommen werden. Unsere Videokameras und digitalen Fotoapparate sind heute noch nicht so weit entwickelt, daß sie einen bereichspezifischen Abgleich direkt an den Rezeptoren vornehmen könnten. So ergibt sich die Frage, wie der Kontrast in den ungünstig belichteten Bereichen nachträglich wieder hergestellt werden kann. Die Antwort darauf ist einfach. Zu helle oder zu dunkle Bereiche dürfen nicht dadurch ausgebessert werden, daß man Licht wegnimmt oder zufügt, vielmehr müssen die in diesen Bereichen zu schwachen oder zu kräftigen Reaktionswerte der Rezeptoren multipliziert oder dividiert werden. Die richtige Simulation des Simultankontrastes ist also mit Addition oder Subtraktion von Reaktions-werten nicht zu erhalten. Dieser Erkenntnis entsprechend habe ich auf Farbtafel
2 einen neuen Weg der Simulation beschritten. Es zeigt sich, daß
der Kontrast im Hintergrund des Versuchsbildes wieder hergestellt wird.
So entsteht eine gute Vorlage für spätere Konturverfahren. Natürlich
wäre es besser, den Simultankontrast direkt durch Einflußnahme
auf die Lichtempfindlichkeit der Rezeptoren zu bewerkstelligen, denn ein
nachträglicher bereichspezifischer Kontrastabgleich führt in
Bereichen wo zu schwache Reaktionen vorliegen zwar zu einer Verstärkung,
es wird aber das Rauschen, das sich durch Ungenauigkeiten in jedem sensorischen
System ergibt, mitverstärkt. Dies führt bei späteren Konturverfahren
zum Ausfransen der Konturen. Bilderkennende Apparate würden besser
mit Videokammeras funktionieren, die über einen eingebauten Simultankontrast
verfügen. Nur so könnten sie die Schrift auf einer Buchseite,
über die ein unscharfer Schatten fällt, an jeder Stelle optimal
lesen.
Warum dies ohne Simultankontrast nicht möglich ist, läßt sich am besten grafisch darstellen. Abbildung 6 zeigt in der Originalkurve A) schematisch was passiert, wenn ein Schatten über ein beschriebenes Blatt Papier fällt. Die abrupten Wechsel zwischen dem hellen Papier und der dunklen Schrift sind durch die kleinen Wellen in der Linie dargestellt. Man spricht in diesem Fall von einer hohen Raumfrequenz. Die großflächige allmähliche Helligkeitsänderung durch den Schatten zeigt sich in der Darstellung am Schwung der gesamten Kurve. Es handelt sich hierbei um eine niedrige Raumfrequenz. Der Aufzeichnungsbereich des Films mit dem wir fotografieren ist durch das graue Rechteck dargestellt. Er kennzeichnet den Bereich vom Schwarz bis zum Weiß. Die Kurve übertrifft diesen Bereich jedoch, denn das Schwarz der Buchstaben im Schatten ist sozusagen schwärzer als schwarz, und das Weiß der Buchseite in der Sonne ist weißer als weiß. Dort, wo die Kurve aus dem Aufzeichnungsbereich tritt, werden am Foto Flächen entstehen, die entweder zu dunkel oder zu hell sind um noch lesbar zu sein. Eine Möglichkeit die Lesbarkeit zu verbessern bestünde darin, einen Film zu verwenden der weniger kontrastreich zeichnet. Was dann entsteht zeigt Kurve B). Nun ist zwar alles lesbar, aber nur schlecht, weil der Kontrast zwischen Schrift und Papier schwächer dargestellt wurde als er in der Realität ist. Das Auge verfügt mit dem Simultankontrast über eine bessere Strategie. Es kann durch das beschriebene Unscharf-Negativ-Verfahren über die Horizontalzellen der Netzhaut grobflächig direkt die Lichtempfindlichkeit der Rezeptoren beeinflussen. Diese werden dadurch in dunklen Bildbereichen empfindlicher als in hellen. Dabei wird zwar das Wahrnehmungsvermögen für niedrige Raumfrequenzen beeinträchtigt, aber der größte Informationsreichtum liegt ja ohnehin in den Konturen. Für solche hohen Raumfrequenzen ist nun mehr Platz innerhalb des Aufzeichnungsbereiches (bzw. innerhalb des Reaktionsbereiches der Rezeptorzellen). Das ist aus Kurve C) zu erkennen. Die Schrift kann jetzt auch dann gut gelesen werden, wenn ein Schatten über die Buchseite fällt. Die Theorie findet ihre Entsprechung in Versuchen zur Wahrnehmung am Menschen. Der Mensch kann mittlere Raumfrequenzen auch noch bei einem geringeren Kontrast wahrnehmen. Niedrige und sehr hohe sind bei niedrigem Kontrast bald schon nicht mehr zu erkennen. Das bedeutet, die gezeigte Fläche wirkt regelmäßig grau (Cambell 1987, S. 138). Hohe Frequenzen (zum Beispiel ein feiner Raster) verschwimmen aufgrund der Auflösungsgrenzen des Auges. Für die mangelnde Verarbeitung niedriger Raumfrequenzen dürfte der Simultankontrast zuständig sein. Ein analoger Prozeß zum Simultankontrast kommt in der Hifi-Technik
schon lange zum Einsatz. Es handelt sich um die Dolby-Rauschunterdrückung.
Um zu verstehen wie diese funktioniert, können wir wieder die obige
Grafik heranziehen. Der Aufzeichnungsbereich eines Tonbandes ist genauso
begrenzt wie jener eines Films. Deshalb muß die Lautstärke so
abgestimmt werden, daß sie in den Aufzeichnungsbereich paßt
(B). Nun gibt es aber keine unendlich genauen Aufzeichnungsmaterialien.
Auf die obige Grafik umgelegt bedeutet das, daß die dargestellten
Linien bei der Aufnahme alle auf sagen wir einen Millimeter Höhe verzittert
werden. Zu hören ist dieses Zittern als Rauschen. Die Feinheiten der
Kurve B) werden in diesem Rauschen untergehen. In Kurve C) sind hingegen
die hohen Frequenzen lauter aufgezeichnet als die niedrigen und können
in dem Zittern nicht völlig verschwinden. Wird die Dolby-Aufzeichnung
abgespielt, so müssen die niedrigen Frequenzen stärker verstärkt
werden, um wieder das Originalverhältnis zwischen hohen und niedrigen
Frequenzen herzustellen.
2. Konturkapitel: Konturierung nach Helligkeit 2.1.
Konturausarbeitung durch rezeptive Felder
Im primären Sehfeld der Großhirnrinde ist das auf die Netzhaut
projizierte Bild immer noch in Form eines zusammenhängenden Reaktionsbildes
präsent. Allerdings nimmt das Zentrum des Bildes, in dem wir besonders
scharf sehen, im Vergleich zum Umfeld wesentlich mehr Platz ein. Das Reaktionsbild
ist sozusagen verzerrt. Jeder Zelle der Sehrinde kann eine kleine Gruppe
von benachbarten Netzhautzellen zugeordnet werden, auf deren Reizung sie
mit bestimmten Reaktionen antwortet. Diese kleine Gruppe von Netzhautzellen
mit der die Gehirnzelle verbunden ist, nennt man ihr rezeptives Feld (Zimbardo
1995, S. 175).
Es wurde bereits bei der Behandlung des Simultankontrastes erwähnt, daß Zellen mit größeren rezeptiven Feldern ein Bild unschärfer auflösen als solche mit kleineren rezeptiven Feldern. Ein unscharfes unterscheidet sich von einem scharfen Bild nur an den Konturen, denn im inneren gleichmäßig gefärbter Flächen ändert die Unschärfe nichts. Wenn wir ein Bild mit seinem Negativ zu 50% überdecken, gleichen sich die Bilder vollständig aus. Es entsteht ein gleichmäßig graues Bild. Verwenden wir jedoch ein unscharfes Negativ, kommt es an den Konturen nicht zu einer vollständigen Aufhebung. Es entstehen Ränder. Im Grunde haben wir genau diesen Effekt bereits bei der Besprechung des Simultankontrasts kennengelernt, nur wurde dort das Bild nicht vollständig aufgehoben. Außerdem wurde mit größeren Unschärfen gearbeitet. Es gehört heute zum gut fundierten Wissen, daß auf der Sehrinde
ein solches Unscharfverfahren zur Konturfindung genützt wird. In der
Neurophysiologie spricht man von Zentrum/Umfeld-Zellen. Auch den Simultankontrast
hätte ein Neurophysiologe durch das Zentrum/Umfeld-Modell erklärt.
Die Zentrum/Umfeld-Zellen der Netzhaut unterscheiden allerdings von jenen
der Sehrinde darin, daß erstere auch innerhalb von hellen Flächen
Reaktionen zeigen, wenn auch weniger stark als an der Kontur. Die Z/U-Zellen
der Sehrinde reagieren hingegen nur an Konturen. Das zugrundeliegende Verschaltungsprinzip
mag in beiden Fällen das gleiche sein, die Funktion der Netzhaut ist
jedoch nur eine Bildaufbereitung, während die Z/U-Zellen der Sehrinde
Konturfindung leisten. Deshalb will ich den Prozeß hier noch einmal
behandeln, doch diesmal in jener Weise erklären, wie er aus der Neurophysiologie
bekannt ist.
Die Zentrum/Umfeld-Verschaltung Man geht davon aus, daß eine Zentrum/Umfeld-Zelle von einem Umfeld von Zellen beliefert wird, das auf sie hemmend wirkt, während die Zellen im Zentrum des rezeptiven Feldes erregend wirken. Das Umfeld ist größer und entspricht mit seiner groben Auflösung und seiner hemmenden Wirkung dem unscharfen Negativ in der obigen Beschreibung zum Simultankontrast. Das Zentrum hingegen entspicht mit seiner feinen Auflösung dem scharfen Positiv. Nehmen wir an, das gesamte rezeptive Feld erhält Licht. Dieses Licht führt zu Signalen, die zum Teil über die erregenden Verbindungen des Zentrums, zum anderen Teil über die hemmenden Verbindungen des Umfeldes hereinkommen. Die Z/U-Zelle bleibt so insgesamt ausgeglichen. Das bedeutet, sie reagiert auf helle Flächen nicht. Bei dunklen Flächen kommt es zu einer umgekehrten Polung. Diese bleibt aber ebenfalls insgesamt ausgeglichen, so daß die Zelle auch auf dunkle Flächen nicht reagiert. Aktiv wird die Zelle jedoch an einer Kontur werden. Die Abbildung zeigt schematisch was dort passiert. (vergl. Bierbaumer 1996, S. 321 u. 390, Hubel 1989 S. 50). Zu einer Erregung der Z/U-Zelle kommt es im Fall einer On-Off-Verschaltung, wenn sich das Zentrum des rezeptiven Feldes im hellen Bereich, aber das Umfeld noch teilweise im dunklen Feld befindet, weshalb es nicht voll hemmen kann. In der umgekehrten Situation kommt es zu einer Hemmung. Befindet sich die Zelle auf der Mitte einer Kontur, so kommt es genauso zu einer Ausgleichssituation wie innerhalb von Flächen. Die Randbereiche der rezeptiven Felder überlappen sich, so daß ihre Zentren dicht aneinander liegen. Dies ist möglich weil das Signal von Rezeptoren mehrere Z/U-Zellen beliefern kann. So ergibt sich eine Bildauflösung mit der Pixelgröße der Zentren.
Das System konturiert Helligkeitsgrenzen sozusagen beidseitig. Die On-Off-Zentren an der dunklen Seite einer geradlinigen Helligkeitsgrenze werden erregt, während die Zentren an der hellen Seite gehemmt werden. Das Ausmaß der Hemmung und Erregung steigt mit der Kontraststärke der Kontur, bleibt aber bei geraden Konturabschnitten ausgewogen. An Winkelstellen der Kontur kommt es zu einem unausgewogenen Verhältnis. Die Differenz zwischen Erregung und Hemmung bleibt dabei erhalten, allerdings verschiebt sich beides zu einer Seite hin. Zusammenfassend läßt sich sagen, daß das System über die Helligkeitsdifferenz, die an einer Kontur vorliegt, informiert, unabhängig von der Gesamtbeleuchtung an dieser Stelle. Wenn wir uns noch einmal das Beispiel der Buchseite vor Augen führen, über die ein Schatten fällt, so wird die Helligkeitsdifferenz von Schrift und Hintergrund im Schatten genauso groß sein wie in der Sonne. Das Z/U-Kontursystem wird dementsprechend gleich reagieren. In Abbildung 8 ist die idealisierte Signalschwankung dargestellt, die sich an einer Helligkeitsgrenze ergibt. Die Hemmung der Zellen ist allerdings im Gehirn nie so ausgeprägt wie die Erregung. Es ist anzunehmen, daß nur der erregende Teil im Gehirn weitergegeben wird. So entsteht im vorliegenden Fall nur an der hellen Seite der Helligkeitsgrenze eine Kontur. Die andere Seite übernehmen gegengleich verschaltete Zentrum-Umfeld-Zellen, deren Zentrum hemmend, und deren Umfeld erregend wirkt. Sie reagieren an der dunklen Seite der Helligkeitsgrenze (vergl. Poggio 1986). Auf der folgenden Seite wurde das Versuchsbild aus Farbtafel
2 mittels eines Zentrum /Umfeld-Filters konturiert, der helle Flächen
mit einer Außenkontur versieht (vergl. Pinz 1994, S. 63). Die Abbildung
beweist, daß ein wesentlich besseres Ergebnis zustandekommt, wenn
das Bild vorher einen Simultankontrast durchlaufen hat. Allerdings funktioniert
dies nur, wenn der Simultankontrast mit größeren Umfeldern (größerer
Unschärfe) arbeitet als das Konturverfahren, ansonsten käme es
bei der nachträglichen Konturierung zu Doppelkonturen.
Da Kameras keinen bereichspezifischen Einfluß auf die Lichtempfindlichkeit
ihrer Rezeptoren ausüben, konnte ich den Simultankontrast nur nachträglich
simulieren. So kann das Rauschen nicht verhindert werden, weshalb die Konturen
in der Abbildung zittrig und oft unterbrochen erscheinen. Dies wäre
bei gleicher Informationsdichte nicht der Fall, wenn man eigene Kameras
für bildverarbeitende Computersysteme bauen würde.
2.2. Konturausarbeitung durch Augenzittern
?
Das ständige geringfügige Zittern des Augapfels ist ein Phänomen, das zumindest im Verdacht steht etwas mit der Konturausarbeitung zu tun zu haben. Es dürfte aus einer Notlösung hervorgegangen sein durch die sich die Möglichkeit eröffnet hat, die auf Bewegungswahrnehmung ausgelegten Netzhäute unserer tierischen Vorfahren, auch für die Wahrnehmung starrer Objekte zu nützen. Wie schon weiter oben beschrieben, erkennen die Schlange und auch andere Reptilien Beute und Feind vor allem an deren Bewegung. Ihre Netzhaut reagiert vorwiegend auf Veränderungen (Dithfurth 1980, S. 132). Interessanterweise trifft dies auch auf unsere Netzhäute zu, wir verfügen jedoch über einen Mechanismus, der ununterbrochen für die nötige Veränderung sorgt. Unser Auge führt mit einer Frequenz von 30 bis 150 Herz ständig mikroskopisch kleine Zitterbewegungen aus (Gilchrist 1986). Als Augenärzte dieses Zittern entdeckten, wußte man noch nicht, wozu es dient. Die einfachste Methode dies festzustellen bestand darin, es auszuschalten. Dies kann geschehen indem das Zittern durch eine optische Vorrichtung kompensiert wird, oder indem die Augenmuskeln durch Injektion von Novokain einige Stunden gelähmt werden. Wir können uns die Verblüffung der Wissenschafter vorstellen, als sie diese ersten Versuche an sich selbst vornahmen. Sie hatten Einblick in eine völlig andere Welt. Es ist nur noch ein heller Nebel zu sehen, aus dem abrupt immer wieder bewegte Dinge und Gestalten auftauchen, kaum zu erkennen und oft erschreckend, weil der Zusammenhang fehlt (Ditfurth 1980, ab S. 128). Viele Besitzer von Linsenaugen aus dem Tierreich dürften ihre Umwelt auf eine ähnliche Art sehen, da sie nicht über dieses Augenzittern verfügen. Allerdings können sie sich im Gegensatz zu den Wissenschaftern keiner fehlenden Information bewußt sein. Wird das Netzhautbild exakt stabilisiert, so kommt es nach etwa einer halben Minute zu dem beschriebenen Sehverlust (Ditfurth 1980, S. 129). Neueren Experimenten von Gilchrist (1987, S. 142) zufolge bereits nach drei Sekunden. Dieser Widerspruch in der Zeitangabe kommt meines Erachtens dadurch zustande, daß im Ultrakurzzeitgedächtnis das Bild noch eine Zeit lang weiter existiert, während auf der Netzhaut bereits keine Reaktion mehr vorliegt. 8* Die folgenden Überlegungen zeigen, daß ein solches Abschalten von Netzhautbereichen auch unter normalen Bedingungen stellenweise eintreten müßte: Das Bild zittert normalerweise um zirka eine Rezeptorzellbreite hin und her. Dadurch sind die Zellen an den Flächenrändern ständiger Veränderung ausgesetzt. Für Zellen in der Flächenmitte herrschen jedoch dieselben Bedingungen wie beim ruhiggestellten Bild. Sie senden dementsprechend auch in der normalen Situation bald nichts mehr. Adaptionsprozesse dieser Art sind neurobiologisch nachgewiesen. (Kolb 1996, S. 86; vergl. Bierbaumer 1996, S. 322). Es ist jedoch keineswegs so, daß in unserem Bewußtsein im Zentrum regelmäßiger Farbflächen die Farbe nach einiger Zeit verschwindet. Ist ein Bild erst einmal analysiert, so bleibt im Gehirn die Information aufrecht, bis der Blick auf einen neuen Gegenstand fällt und neue Informationen hereinkommen. So gesehen ist anzunehmen, daß Augenzittern und die Adaption der Sehzellen eher der Erholung der Zellen dienen, als der Erfassung von Konturen. Vielleicht ist es auch einfach als Ausweg der Evolution aus einer Sackgasse zu verstehen. Unsere frühen kaltblütigen Vorfahren waren vor allem am Erfassen von Bewegung interessiert. So entstanden Netzhäute, die vorwiegend auf Veränderung in der Lichtintensität reagieren. Um mit solchen Netzhäuten den unbewegten Teil der Welt erfassen zu können mußte das Augenzittern "erfunden" werden. Als Kontursystem (als solches wird es bei Gilchrist 1987 behandelt) wäre es mit mindestens drei Sekunden Anpassungszeit (Adaptionszeit) zu langsam. Allerdings könnte es im peripheren Bereich zur Bestätigung der Schärfe von Konturen dienen, denn durch die Feinheit der Zitterbewegung, die das Projektionsbild nur über etwa eine Rezeptorbreite schwingen läßt, reagiert das System nur auf scharfe Helligkeitsbrüche. Das bedeutet scharfe Konturen bleiben noch aktiv, wenn überall sonst bereits Adaption eingetreten ist. Es wäre sinnvoll dieses Phänomen auszunützen, denn das Zentrum/Umfeld-System ermöglicht vor allem im peripheren Bereich, wo die rezeptiven Felder einige tausend Zellen beinhalten, keine Unterscheidung von scharf und unscharf mehr. Schärfeninformation ist wichtig. An ihr werden sich neben anderen Faktoren Objektgrenzen von Beleuchtungsgrenzen (Schatten) unterscheiden lassen. Dazu mehr im letzten Kapitel dieses Abschnittes, wo gezeigt werden soll, wie die Konturerkennungssysteme miteinander in Zusammenhang stehen und wie jedes System seinen Beitrag zu einer komplexeren Verarbeitung leistet, wie sie zum Beispiel die Ausfilterung von Schatten darstellt. In Hinblick auf diese Zusammenführung der Kontursysteme werde ich hier noch einmal zusammenfassen, welche Leistungen das Modell bisher erbracht hat. · Schwache Negativ-Gegenfilterung mit großer Unschärfe bringt einen Ausgleich unterschiedlicher Beleuchtungsbereiche (Simultankontrast). · Das Zentrum/Umfeld-System reagiert an Konturen bzw. Helligkeitsübergängen und zwar beidseitig. So entsteht eine Seitenzuweisung von hell und dunkel. · Das Augenzittersystem könnte für die Kennzeichnung scharfer Konturen sorgen. 3.
Konturkapitel: Die Farbgrenzen
Wie allgemein bekannt, gibt es für die Farberkennung eigene Rezeptoren
auf der Netzhaut, die Zapfen. Den größeren Teil der Lichtrezeptoren
der Netzhaut bilden allerdings die farbunempfindlichen Stäbchen. Sie
arbeiten im Gegensatz zu den Zapfen auch noch bei schwachem Licht. Deshalb
sehen wir in der Dämmerung nur schwarz/weiß.
Die Zapfen teilen sich nach der Art ihrer höchsten Empfindlichkeit in drei Sorten: Rot-, Grün- und Blaurezeptoren. Sie reagieren damit jeweils besonders gut auf einen spezifischen Wellenbereich des Lichtes. Warum sich gerade diese Empfindlichkeitsbereiche entwickelt haben, läßt sich nur vermuten. Die Wahl hat wahrscheinlich mindestens ebensoviel mit den Bedürfnissen des sehenden Individuums zu tun wie mit den Eigenschaften der Außenwelt. Nicht alle Tiere sehen Farben. Die Stärke von Beutetieren liegt meist im Bewegungssehen. Unsere frühesten Vorfahren waren Pflanzenfresser. Ein Grünrezeptor mag ihnen hilfreich gewesen sein für die Futtersuche. Brauntöne sind am zweithäufigsten in der Natur. Sie kennzeichnen Erde, Rinde und vor allem Tiere, die Pflanzenfressern gefährlich werden können. Auf sie reagiert der Rotrezeptor, und noch stärker reagiert er auf das satte Rot frischen Blutes. Blaue Objekte kommen in der Natur selten vor. Allerdings erkennen wir große Entfernungen am atmosphärischen Verblauen. Im Wasser, wo die Farbwahrnehmung vielleicht entstanden ist, tritt der Effekt des Verblauens noch stärker auf. Der Blaurezeptor hilft somit bei der Orientierung. Wer sich mit bildender Kunst beschäftigt weiß, daß derartige Farbbedeutungen auch im Menschen noch verankert sind. Rot gilt als aggressive, aktive Farbe und sticht hervor, während Blau passiv in den Hintergrund tritt. Grün gilt als ausgewogen. Grünliches Licht soll sogar die Konzentrationsfähigkeit fördern. Farbbedeutung ist nur eines von vielen ästhetischen Phänomenen, die sich aus der Beschaffenheit unseres Wahrnehmungsapparates erklären lassen. Das ästhetische Empfinden wird in dieser Arbeit somit noch eine wichtige Rolle spielen. Als nächstes gilt es zu beantworten, wie es von den drei Rezeptoren
zu jener Fülle von Farben kommt, die wir wahrnehmen.
Auf natürliche Verhältnisse angewandt hat dieses System wenig Wert. Gegenstände reflektieren nicht jeweils eine einzelne Wellenlänge, sondern oft eine bunte Mischung verschiedener Längen mit unterschiedlicher Intensität. Dies muß in dem Zwei-Rezep-toren-System zu Fehldeutungen führen. Zum Beispiel würde ein Mischlicht aus extrem langen und kurzen Wellen die selbe Reaktion auslösen wie Licht mittlerer Wellenlänge. In einem Drei-Rezeptoren-System, wie unserem Auge, gibt es einen eigenen Rezeptor für mittlere Wellenlängen. Der letztgenannte Fehler mangelnder Differenzierung kann dort somit nicht passieren. Im Gegensatz zum Zwei-Rezeptoren-System bringt das Drei-Rezeptoren-System aus dem oben genannten Grund einen wesentlichen Vorteil. Es unterscheidet die Mitte des sichtbaren Spektrums von seinen Enden. Weitere Rezeptoren bringen keine so wesentlichen Differenzierungsleistungen mehr und machen das System nur aufwendig. Deshalb hat die Natur meiner Ansicht nach so oft das Drei-Rezeptoren-System gewählt. Allerdings können auch hier in Überlappungsbereichen von jeweils zwei der drei Rezeptoren keine Einzelwellen von Wellenmischungen unterschieden werden. Darin liegt die Basis für die Möglichkeit von Farbmischungen. 9* Wenn in Farbtafel 5 das Farbspektrum abgebildet ist, so besteht diese Abbildung aus übereinandergedruckten Farben, also Farbmischungen. Diese Abbildung sieht nur für unser Auge, auf das die Mischungen abgestimmt sind, und für Farbfilme, die unserem Auge nachempfunden sind, dem echten Spektrum ähnlich. Ein Physiker, der die dargebotenen Lichtwellen untersucht, wird feststellen, daß im Farbspektrum die Wellenlängen säuberlich nebeneinanderliegen, während die Abbildung aus Mischwellen besteht. Doch bevor ich näher auf Farben und deren Mischung eingehe, muß
noch ein einfacheres Problem gelöst werden: Die Frage, wie es zur
Farbhelligkeit kommt.
3.1.
Warum haben Spektralfarben eine verschiedene Helligkeit?
Unser Auge verfügt über keinen Fixpunkt, zu dem es die empfangene Helligkeit in bezug stellen könnte. Wir nehmen somit nur die relative Helligkeit von Gegenständen zueinander wahr. Auf den Vorteil, den dies für das Wiedererkennen hat, bin ich bereits im vorigen Kapitel eingegangen (Beispiel mit der Buchseite im Licht und im Schatten). Experimentell ist die Relativierung von Helligkeit leicht nachprüfbar. Ein Lichtfleck in einem dunklen Raum erscheint weiß. Wird ein zweiter, hellerer Lichtfleck danebenprojiziert, so erscheint der erste Lichtfleck grau. Führt man diesen Versuch mit orangem Licht durch, so erscheint der erste Lichtfleck letztlich braun. Das sind altbekannte Versuche. Mir geht es hier aber um etwas mehr.
In der Frage nach der Helligkeit von Spektralfarben äußert sich
auf elementarste Weise der Unterschied zwischen dem objektiv Vorhandenen
und dem subjektiv Erfahrenen. Es geht um die im Vorwort angesprochene Differenz
zwischen Innen- und Außenwelt.
Nehmen wir an, wir haben mit einem Glasprisma weißes Licht gespalten und die einzelnen Wellenlängen, aus denen es besteht, liegen säuberlich getrennt vor uns. Beim Blick auf dieses Lichtspektrum erscheinen uns einige Farben heller als andere. Die Frage ist nun, ob in diesen Wellenbereichen wirklich mehr Licht da ist, oder ob wir nur mehr Licht sehen. Wenn wir das Spektrum mit einem Schwarzweißfilm fotografieren, so wird der gelbe Bereich nicht mehr durch seine Helligkeit hervorstechen. Noch besser kann der Unterschied zwischen dem, was zu sehen ist, und den physikalischen Gegebenheiten veranschaulicht werden, wenn wir die empfundene Lichtmenge in einer Kurve darstellen, und dieser Kurve die reale Lichtmenge (Hubel 1992, S. 166), welche die Menge der eintreffenden Photonen pro Zeiteinheit mißt, gegenüberstellen. Beides zeigt schematisch Farbtafel 3, Fig. a und Fig. c. Zu Figur c muß bemerkt werden, daß die Kurve, welche die
empfundene Lichtmenge veranschaulicht, nicht durch Befragung von Testpersonen
ermittelt wurde, sondern auf das Wissen um die Empfindlichkeit der der
Zapfen zurückgeht. Fig. d zeigt, auf welchen Frequenzbereich des Lichtes
die drei Zapfensorten ansprechen (aus Farbe in Theorie und Praxis 1994,
S. 8). Addiert man die drei Kurven zu einer einzigen, so kommt man zu Fig.
c, die in etwa dem subjektiven Farbhelligkeitserlebnis des Farbspektrums
entspricht. Damit haben wir an diesem Beispiel erstmals eine Brücke
zwischen neurophysiologischen Beobachtungen an einzelnen Rezeptoren (Zapfen)
und dem subjektiven Erleben geschlagen. Es kann klar gezeigt werden, warum
Gelb, aber auch Cyanblau als helle Farben empfunden werden.
3.2. Die Grundfarben
Eine im Farbspektrum nicht enthaltene Farbe ist Magentarot. Sie entsteht dann, wenn gleichzeitig der Rot- und der Blaurezeptor angesprochen werden. Dies geschieht, wenn kurze und lange Wellenlängen gemischt vorkommen. Magentarot, Cyanblau und Gelb sprechen also jeweils zwei der drei Rezeptorzellen an, der dritte aber nicht. Diese Rezeptorenmischreaktion mag verwundern, denn alle drei werden als besonders reine Farben empfunden. Auf Weiß, welches uns am allerhellsten erscheint, sprechen sogar alle drei Rezeptoren gleichzeitig an. Es gilt also: Umso heller eine Farbe ist, desto mehr Reaktion wird sie bei den Rezeptorzellen bewirken. Magenta, Cyan und Gelb sind die drei Grundfarben der subtraktiven Farbmischung. Dieses Mischverfahren arbeitet mit Überlagerung von Farbfiltern oder Farbschichten. Wenn das Licht Farbschichten durchdringt, wandelt sich ein Teil des Spektrums in Wärme um. Es geht also bei jeder Filterung Licht verloren. Bei der subtraktiven Farbmischung durchläuft das Licht mehrere Filter, und so ist die gemischte Farbe immer dunkler als deren Ausgangsfarben. Konträr dazu entsteht die additive Farbmischung durch Übereinanderstrahlen von farbigem Licht, zum Beispiel bei Spiegelungen, oder wenn sich die Lichtkegel bunter Scheinwerfer überlappen. Im Überlappungsbereich addiertsich das Licht. Die Mischfarbe ist in letzterem Fall also immer heller. Sie läßt sich aber aus der subtraktiven Mischung ableiten, wenn man dem Mischergebnis den Schwarzgehalt entzieht (siehe Farbtafel 4). Was den Zusammenhang der additiven und subtraktiven Farbmischung betrifft treten bis heute immer wieder Irrtümer auf, die sich meines Erachtens sogar in moderne Computerprogramme zur Bildbearbeitung geschlichen haben. Die additive Farbmischung wird meistens korrekt simuliert. Man kann zum Beispiel zwei graue Flächen erstellen, diese übereinanderschieben und eine additive Überlagerung wählen. Sind die beiden Grauwerte negativ zueinander, so entsteht insgesamt Weiß. Um verständlich zu machen, warum das so richtig ist, will ich kurz erklären, was unter einem negativen Grauwert verstanden wird. Nehmen wir an, alle Grauwerte werden in Zahlen von null bis eins beschrieben (0= Schwarz, 1= Weiß), so kann der jeweilige negative Grauwert einfach dadurch berechnet werden, daß man den Ausgangsgrauwert von 1 abzieht. Das negative Grau zu einem Grauwert von 0,7 ist also 1-0,7=0,3. Additiv ergibt jede Farbe mit ihrem Negativ Weiß. Zum Beispiel: 0,7+0,3=1. Die Verwirrung beginnt bei der subtraktiven Farbmischung. Angeblich sollte eine Farbe die mit ihrem Negativ subtraktiv gemischt wird Schwarz ergeben. 0,7-0,3 ist aber nicht 0! Die Programmierer sind dieser Verwirrung offensichtlich damit begegnet, daß sie unter dem Begriff der subtraktiven Mischung eine invertierte additive Mischung eingegeben haben. (Das entnehme ich aus Ergebnissen, die ich beim Test mehrerer Computer-programme erhalten habe.) Dabei werden die beiden zu mischenden Farben erst einmal beide invertiert, dann addiert und das Ergebnis wird wieder invertiert. (Zahlenwerte unter 0 und über 1 sind nicht darstellbar.) Das Endergebnis simuliert die subtraktive Farbmisch-ung aber keineswegs korrekt: Bei der subtraktiven Mischung ist das Ergebnis zwar immer dunkler als die Ausgangs-farben, genaugenommen wird dabei aber kein Licht abgezogen, sondern wegdividiert. Man kann sich das wie bei der Überlagerung von Zufallspunktmustern vorstellen. Nehmen wir an, ein Zufallspunktmuster enthält zur Hälfte schwarze und weiße Punkte und entspricht von der Ferne betrachtet einem mittleren Grau. Nun drucken wir mit schwarzer Farbe ein weiteres solches Muster über das erste. Es ist danach keineswegs alles schwarz. Vielmehr wird die Lichtmenge ein weiteres Mal halbiert. Die subtraktive Farbmischung sollte also genaugenommen "divisionale Farbmischung" heißen. Wenn zwei mittlere Grau zusammen nicht Schwarz ergeben, so gibt es auch keine subtraktive Komplementärfarbe zu Grau (wohl aber eine additive). Auch in Computerprogrammen zur Fotoretusche kann man Farben miteinander dividieren und multiplizieren. Allerdings stößt man hier gleich auf die nächste unglück-selige Verwirrung. Die Farben werden beim Dividieren heller, und beim Multiplizieren dunkler. Der Grund dafür liegt darin, daß im Basisprogramm Farben in Zahlen von 0 bis 1 beschrieben werden. Multipliziert man zwei solche Bruchzahlen, so ist das Ergebnis immer kleiner als die Ausgangszahlen. 0,5*0,5=0,25. Das entspricht der subtraktiven Farbmischung. Diese wird in solchen Programmen also nicht durch Subtraktion oder Division, sondern Multiplikation richtig simuliert. Wenn man im Programm eine Farbe auswählt bekommt man Zahlenangaben für den roten, grünen und blauen Kanal, wobei hier ganze Zahlen von 0 bis 255 verwendet werden. Meines Erachtens ist das widersinnig, denn intern arbeitet das System mit Zahlen von 0 bis 1. So erhält der User völlig unverständliche Zahlenergebnisse bei Multiplikationen und Divisionen. Ich bedaure solche Ungereimtheiten, denn Bildpro-gramme wären ein perfektes Medium, um darin eine korrekte Farb-theorie umzusetzen. Eine Farbenlehre mit Beschreibungen von selbst durchführbaren Experimenten zum Lichtspalten findet sich im Anhang. Ich habe sie dieser Arbeit beigefügt, weil sie zum Verständnis des folgenden Abschnitts notwendig ist. Falls dem Leser im folgenden Textabschnitt einiges widersprüchlich erscheint, bitte ich, im Anhang nachzuschlagen. An dieser Stelle möchte ich mich auf eine kurze Erläuterung des Frabenmischens beschränken. Die Darstellungen dazu befinden sich auf Farbtafel 5. Es gibt drei Arten der Farbmischung: die additive, die subtraktive und die Optische Farbmischung. Das Ergebnis einer optischen Mischung zweier Ausgangsfarben liegt im Farbwert immer zwischen der additiven und subtraktiven Mischung. Während die subtraktive Mischung, die Überlagerung von Farbfiltern, mit einem Helligkeitsverlust einhergeht, wird bei der additiven Mischung, der Überlagerung von Lichtkegeln, die Mischfarbe heller erscheinen, und bei der optischen Mischfarbe wird es zu einer Durchschnittshelligkeit der beiden Ausgangsfarben kommen. Die Farbtagel zeigt, was passiert, wenn man die Grundfarben verlaufend mischt. 10* Die additive Mischung hat Grundfarben auf die jeweils nur ein Zapfen anspricht (Rot, Grün und Violettblau) und durch Mischung werden Töne erreicht, auf die mehrere Zapfen reagieren, während auf die subtraktiven Grundfarben (Gelb, Cyan und Magenta) jeweils zwei Zapfen ansprechen und durch Mischung Töne erreicht werden, auf die immer weniger Reaktion erfolgt. So lassen sich additiv die subtraktiven Grundfarben mischen und umgekehrt. Die Abbildung zeigt auch, wie die Farbmischungen mit dem RGB-Würfel in Zusammenhang stehen, der auf Farbtafel 8 abgebildet ist. 6 Ecken des Farbwürfels repräsentieren die Grundfarben, die restlichen Beiden bleiben für Weiß und Schwarz. Der Wellenbereich einer additiven Grundfarbe deckt sich nicht notwendigerweise mit dem Spektralbereich an dem der jeweilige Zapfen seine größte Empfindlichkeit hat ! (siehe Anhang). Daß es hier eine Differenz gibt wird selten berücksichtigt und hat zu viel Verwirrung in der Farbenlehre geführt. Übrigens beweist die Darstellung zur subtraktiven Farbmischung
auf Farbtafel 5, daß jede beliebige Farbe auch mit den richtigen
zwei der drei Grundfarben und Schwarz und Weiß nachgemischt
werden kann. Da ja ohnehin die zugeführte dritte Farbe mit einem bestimmten
Prozentsatz der ersten beiden zu Schwarz würde kann man sie gleich
durch Schwarz ersetzen? Jeder kann beim Farben nachmischen ausprobieren,
daß dies möglich ist.
3.3.
Die Trennung von Farbe und Helligkeit
Die meisten Konstanzleistungen basieren auf folgendem Prinzip: Es werden im Gehirn nicht einfach die Meßwerte, also die Reaktonsintensitäten der Sinneszellen verzeichnet, sondern Sinnesdaten, die der gleichen Inkonstanz erliegen, werden im Verhältnis zueinander erfaßt. Am Beispiel von Licht und Schatten kann gezeigt werden, warum dies zu konstanten Daten führt. Schatten und Licht führen auf einem Objekt räumlich verteilt
zu unterschiedlichen Helligkeitswerten. Die Eigenbewegung vieler Objekte
bringt auch noch eine zeitliche Varianz der Helligkeit hinzu. Solche Helligkeitsinkonstanz
betrifft alle drei Zapfensorten gleichermaßen. Das Verhältnis
ihrer Reaktionswerte zueinander bleibt daher über das ganze Objekt
hinweg gleich. Das bedeutet:
Genaugenommen genügen zwei Werte um die Reaktionsverhältnisse der drei Zapfensorten vollständig zu beschreiben. So wurden in den seitlichen Kniekörpern Gegenfarbenzellen gefunden, die das Verhältnis zwischen benachbarten Rot- und Grünrezeptoren erfassen (auf manche wirken Grünrezeptoren erregend und Rotrezeptoren hemmend, auf andere umgekehrt), andere Gegenfarbenzellen erfassen das Reaktionsverhältnis von Rot+Gün gegenüber den blauen Zapfen (auch wieder gegenpolig). Rot+Grün ergibt additiv Gelb. Die letztgenannten Gegenfarbenzellen erfassen also das Verhältnis von gelben zu blauen Lichtanteilen (vergl. Hubel 1989, S. 184 und Goldstein 1997, S. 139). Im Quadrat von Farbtafel 6 wurden die
Farben schematisch so angeordnet, daß auf die horizontalen Farbunterschiede
nur die Rot/Grün-Gegenfarbenzellen unterschiedlich reagieren, während
die Gelb/Blau-Gegenfarbenzellen nur auf die vertikale Achse ansprechen.
Damit beschreibt die Reaktion der beiden Gegenfarbenzelltypen auf ein empfangenes
farbiges Licht genau die Koordinaten, welche die empfangene Lichtfarbe
im dargestellten Farbrechteck einnimmt. Zur Mitte des Farbrechtecks hin
verlieren die Farben an Sättigung. Dies wird symbolisch durch das
Grau dargestellt. Ich hätte hier genauso gut in Schwarz oder Weiß
übergehen können, die ebenfalls keine Sättigung aufweisen,
und daher zumindest theoretisch ebenfalls dazu führen, daß die
Gegenfarbenzelle weder gehemmt noch aktiviert wird. 11*
Gegenfarbenzellen
eignen sich also nicht dazu Helligkeit zu unterscheiden. Darin liegt aber
auch ihr Wert, denn sie erfassen Sättigung und Farbton unabhängig
von Beleuchtungsschwankungen. So können Objekte trotz ihrer Schattierung
als Einheit erkannt und unter verschieden hellem Licht wiedererkannt werden.
3.3.2. Die zwei Arten von Komplementäreffekten:
Die Gegenfarbenzellen wurden gelegentlich für den Komplementäreffekt verantwortlich gemacht. Ich stimme mit Hubel (1989, S. 187) überein, daß dies ein Irrtum ist, wenngleich ich meine Ansicht anders begründe. Wir müssen zwischen zwei Komplementärirritationen unterscheiden: Zum einen sind da die Komplementärnachbilder. Es handelt sich dabei um ein Adaptionsphänomen der Netzhaut, die die Empfindlichkeit der Zapfen lokal darauf abstimmt, wieviel Licht sie in den letzten Minuten erhalten haben. Wir haben dieses Adaptionsphänomen schon bei dem Phänomen des Augenzitterns behandelt. Es arbeitet langsam. Die Anpassung erreicht erst nach einer Minute oder mehr ihr Maximum. Die Gegenfarbenzellen hingegen geben Farbinformationen an das Gehirn weiter und arbeiten somit schnell. Außerdem schließt die aus neurophysiologischen Studien ergründete Reaktionsweise der Gegenfarbenzellen genaugenommen eine Beteiligung dieser Zellen an den Komplementär-Nachbildern aus: Gegenfarbenzellen, die auf rotes licht ansprechen reagieren nämlich gegenpolig auf grünes Licht (vergl. Goldstein 1997, S. 138). Rot löst aber einen cyanblauen Komplementäreffekt aus, weil sowohl die grünen als auch die blauen Rezeptoren arbeitsfähig bleiben. Dies kann jeder beobachten, der eine Taschenlampe und bunte Klarsichthüllen zu Hause hat. Leuchtet man sich damit eine Minute in ein Auge, so sieht man mit diesem Auge danach weiße Wände deutlich in der jeweiligen Komplementärfarbe. Schwach, aber doch bemerkbar ergeben sich diese Komplementärfarbenpaare auch bei den Versuchen zur Kontrastüberhöhung auf Farbtafel 7. Dieses gänzlich andere Phänomen, das ebenfalls meist unter dem Begriff "Komplementäreffekt" behandelt wird, betrifft keine zeitliche, sondern eine räumliche Irritation des Auges. Eine lange Adaptionszeit ist für diesen Effekt nicht nötig. Er kommt sofort zustande. Verantwortlich für die Irritation der Farbempfindung ist diesmal das Umfeld, das die Farbe umgibt. Im Gegensatz zu dem vorhin behandelten Effekt, der wahrscheinlich auf die Adaption der einzelnen Rezeptorzellen zurückzuführen ist, kann dieser Effekt nur auf Kontakt der Zellen zueinander zurückzuführen sein. Es liegt nahe, dafür eine Verschaltung verantwortlich zu machen, die wir bereits kennengelernt haben: den Simultankontrast der Netzhaut. Dort kommt die früheste Verbindung zwischen benachbarten Zellen zustande. Wie bereits erklärt wurde, wird dabei zur Kontur hin der Kontrast verstärkt. Wenn wir annehmen, daß dies für jede Zapfensorte einzeln geschieht, so ergäbe sich daraus, daß sich zur Kontur hin auch die Farben komplementär verschieben. Genau das ist auf Farbtafel 7 zu beobachten. Mit den Gegenfarbenzellen in den Kniekörpern und den Doppelgegenfarbenzellen in der Großhirnrinde hat es meiner Ansicht nach nichts zu tun. Letztere dienen wie andere Z/U-Zellen wahrscheinlich der Erfassung von Konturen und haben zu kleine rezeptive Felder als daß sie dafür verantwortlch gemacht werden könnten, daß es auf Farbtafel 7 zu einer Farbverschiebung in den Quadraten kommt (Hubel 1989, S. 83). Fest steht jedenfalls, daß der Komplementäreffekt keine Qualität
der Wirklichkeit ist. Es gibt weder komplementäre Wellenlängen
noch eine komplementäre Lichtintensität außerhalb unseres
Kopfes.
3.3.3. Die Zentrum/Umfeld-Orgsanisation
der Gegenfarbenzellen
Ich habe bisher unerwähnt gelassen, daß die Gegenfarbenzellen auch eine Zentrum/Umfeld-Organisation aufweisen. In der mir zur Verfügung stehenden Literatur wurde kein schlüssiger Grund für diese Organisation angegeben. Die Zellen dienen der flächenübergreifenden Vermittlung von helligkeitsunabhängigen Farbwerten. Da Zentrum und Umfeld nicht auf die gleichen Reize ansprechen, zeigen sie keine spezifischen Konturreaktionen. Trotzdem hat die Z/U-Organisation meines Erachtens einen Sinn: Je größer das rezeptive Feld ist, das zu einer Farbmessung herangezogen wird, desto genauer wird die Farberfassung sein, da die zufälligen Abweichungen einzelner Zellen sich im Durchschnitt ausgleichen werden. Andererseits haben große rezeptive Felder den Nachteil, daß das Bild an Auflösungsdichte verliert und damit unscharf wird. Die Zentrum-Umfeld-Organisation bietet hier eine Lösung. Bereits bei der Simulation des Simultankontrastes haben wir ein unscharfes Bild, sozusagen ein Bild aus lauter Umfeldern, mit einem scharfen Bild, sozusagen einem Bild aus lauter Zentren vereint. Das Ergebnis auf Farbtafel 2 war keineswegs unscharf. Das unscharfe Bild diente nur als Bezugsrahmen, zu dem die Information des scharfen Bildes gemessen wurde. Genauso verhält es sich bei den Gegenfarbenzellen. Die Zellen des Zentrums brauchen das Umfeld als Bezugspunkt, zu dem sie die Farbe relativ messen. Nahe an Konturen kommt es zu Abweichungen des Messergebnisses, weil bereits ein wenig von der gegenüberliegenden Farbe in das rezeptive Umfeld hineinragt. Diese Abweichungen verhalten sich aber diesmal umgekehrt zu jenen Verfälschungen, die der Simultan-kontrast an den Konturen entstehen ließ (Hubel 1987, S.187), so daß im Endeffekt auch dort eine brauchbare Farbmessung entsteht, wenngleich die Zurücknahme nicht vollständig ist, wie sich auf Farbtafel 7 zeigt. Der Gewinn, den das System aus dieser erstgen Übersteigerung und nachherigen Zurücknahme der Farbwerte an den Konturen zieht, wurde schon genannt: Durch die großen Umfelder wird Information aus einem größeren Bereich bezogen, und das macht die Farberfassung genauer und vermindert das Rauschen. Diesen Informationsgewinn bezahlen wir, wie bei der Besprechung der Helligkeitskonturierung bereits erwähnt, mit einem Informations-verlust im Bereich der niedrigen Raumfrequenzen, die aber ohnehin für die Objekterkennung nicht von Vorteil sind. Wichtig ist mir an dieser Stelle der Hinweis darauf, daß solange die rezeptiven Felder so dicht gepackt sind, daß deren Zentren aneinanderstoßen, kein Verlust an der Bildauflösung eintritt. Sie entspricht weiterhin der Größe der Zentren. Das Bild bleibt also scharf.
3.4. Die Farbkonturierung durch die Doppelgegenfarbenzellen
Das Reaktionsbild, das die Gegenfarbenzellen an die weitere Verarbeitung
übertragen, enthält nur Farb- und Sättigungsinformationen.
Die Helligkeit wird getrennt verarbeitet, wie dies auf Farbtafel
8 zu sehen ist. Die Abspaltung von Farbe und Helligkeit ist damit bewältigt.
Die Farbauszüge müßten nun nur noch konturiert werden.
Es mag vorerst so aussehen, als ließe sich die Reaktion einer Doppelgegenfarbenzelle durch Zusammenführung von jeweils zwei Gegenfarbenzellen erhalten, die auf das gleiche rezeptive Feld zugreifen. Bei genauer Überlegung erfordert die neue Funktion der Zellen aber auch eine völlig neue Verschaltung. Umfeld und Zentrum müssen Signale von der jeweils gegenpoligen Sorte von Gegenfarbenzellen bekommen. Wir haben nun bereits vier Zentrum/Umfeld-Verschaltungen kennengelernt: den Simultan-kontrast, die Helligkeitskonturzellen, die Gegenfarbenzellen und die Doppelgegenfarben-zellen. Natürlich ergibt sich da die Frage, ob diese Filter nicht auf die gleichen Umfelder zurückgreifen können? Meine Antwort ist Nein! Ein solches Vorgehen würde dem Ziel der Objekterkennung nicht entsprechen. Die dazu nötige Informations-filterung ist mit einem Aussiebeverfahren vergleichbar, bei dem ein Sandkorn eine Menge verschiedener Siebe durchläuft, bis es in einen der vorhandenen Töpfe fällt. Die Töpfe erhalten ihre Bedeutung dadurch, daß sie immer nur bei der Begegnung mit identischen Situationen ein Korn erhalten. Sie sind die Objekte des Erkennungsprozesses. Würden alle bisher kennengelernten Zentrum/Umfeld-Zelltypen von
den gleichen Umfeldern der Netzhaut beliefert, so ließe sich das
mit lauter gleichartigen Sieben vergleichen. Das kann nicht funktionieren.
Deshalb bin ich der Ansicht, daß das Bild einen Filter durchläuft,
sich dabei wandelt, und in dieser Form an den nächsten Filter kommt,
der sich wieder neue Umfelder sucht, in einer Größe, die für
seine Zwecke angebracht ist. Wie schon erwähnt, tritt, solange die
Zentren der Filter gleich bleiben, kein Verlust an Schärfe ein.
3.5.
Das Farbdifferenzierungsvermögen
Um Objekte wiederzuerkennen, müssen die Daten der Objekte auch abgespeichert werden. In wissenschaftlichen Texten kommt oft die Bewunderung darüber zum Ausdruck, wie präzise die Wahrnehmung des Menschen arbeitet. Einer Untersuchung von Gouras (Goldstein 1997) zufolge kann der Mensch 2 Millionen Farbtöne unterscheiden. Auf Farbtafel 9 versuche ich zu zeigen, daß ihm dabei einige Fehler unterlaufen sind und die Untersuchung außerdem nicht das mißt, was sie vorgibt zu messen. Wenn wir von Farbdifferenzierung sprechen, so meinen wir doch damit die Differenzierungsfähigkeit des Auges zu einem bestimmten Zeitpunkt. Die Adaption an extreme Dunkelheit sollte hier nicht miterfaßt werden. In eigenen Experimenten die dies berücksichtigen komme ich nur auf 18.000 unterscheidbare Farbnuancen. Eine möglichst hohe Genauigkeit der Farbdifferenzierung ist sicher
von Vorteil, wenn es darum geht, Objekte vor ähnlich farbigem Hintergrund
zu konturieren. In bezug auf das Wiedererkennen kann eine derartige Farbgenauigkeit
nicht gewährleistet werden. Vor unterschiedlichen Hintergründen
und bei verschiedenen Lichtverhältnissen treten Irritationen auf (Komplementäreffekt),
die dazu führen, daß eine Farbe etwas anders wirkt. Die Wiedererkennungsleistung
kann unter normalen Bedingungen also nicht so gut sein wie im Versuchslabor.
Wenn wir davon ausgehen, daß sich die Helligkeitsdifferenzierung
sowie die Farb- und Sättigungsdifferenzierung unter diesen Bedingungen
schätzungsweise dreimal geringer ist, so führt dies dazu, daß
die für die Objektdifferenzierung unterscheidbaren Farbnuancen auf
700 zusammenschrumpfen (siehe Farbtafel 9).
Zusätzlich ist zu bedenken, daß das Gehirn verfügbare Information
nur dort vermerkt, wo diese für das Objekt oder die Situation kennzeichnend
ist, bzw. mit der Erscheinung des Objektes regelmäßig korreliert.
So kann es passieren, daß man im Kaufhaus zwar den Schriftzug jener
Zahnpasta erkennt, die man täglich verwendet, aber sich nicht mehr
sicher ist, ob man die grüne oder türkise Sorte hatte. Grobe,
ungenaue Speicherung scheint für den Erkennungsprozeß notwendig
zu sein, und zwar nicht nur, weil selbst der Speicherplatz des Gehirns
begrenzt ist, sondern weil Vereinfachung auch die Erkennung leicht veränderter
Objekte ermöglicht. Die richtige Art der Vereinfachung bzw. der Abstraktion
von Information ist Grundlage aller Klassifizierung.
3.6.
Der Farbabgleich und die Erfassung der Objekteigenfarbe
Eine der bewundernswertesten Leistungen der Farbverarbeitung im Gehirn besteht darin, daß wir die Farbe eines Objektes unter verschiedensten Lichtverhältnissen als identisch erkennen, obwohl unser Auge ganz unterschiedliches Licht empfängt. Um verständlich zu machen, welche Informationen das Gehirn nützen könnte, um diese Farbkonstanzleistung zu erbringen, will ich meine Ausführungen bei der einfacher zu verstehenden Helligkeitskonstanz beginnen. Dunkelheit oder Nebel und athmosphärisches Verblauen beeinflussen den Kontrastumfang und die Helligkeit der Wahrnehmung. Trotzdem vermögen wir noch verhältnismäßig gut einzuschätzen, wie hell die wahrgenommenen Objekte wirklich sind. Die Frage ist nun, wie wir es schaffen, von dem wahrgenommenen Licht auf die richtige Objekthelligkeit zu schließen. Die unteren Abbildungen von Farbtafel 6 versuchen darauf eine erste Antwort zu geben. Die ungünstigen Lichtverhältnisse werden im Kopf so gut wie möglich rückgängig gemacht. Natürlich nehmen wir den Nebel trotzdem wahr. Das bedeutet, daß uns bewußt ist, daß die Objektfarben verfälscht erscheinen und rückinterpretiert werden müssen. Interessanterweise erbringen wir diese Leistung auch bei Objekten, die wir vorher noch nie gesehen haben und von denen wir daher annehmen könnten, daß die Pastellfarbe, die durch den Nebel auf unsere Netzhaut trifft, deren Eigenfarbe ist. Meiner Ansicht nach könnte unser Gehirn dabei die Tatsache nützen, daß auch gänzlich unbekannte Objekte Schatten und Licht besitzen. Ein Bild erscheint immer dann ausgeglichen, wenn die tiefsten Schatten schwarz, und die hellsten Lichter weiß gesehen werden. Indem im Gehirn die Reaktionswerte des Bildes so verändert werden, daß diese Bedingung erfüllt ist, sind auch die Farben der am Bild befindlichen Objekte näher an die Objekteigenfarben herankommen. Weiters gilt: Die Objekteigenfarbe befindet sich immer zwischen den
Schatten- und Lichtbereichen.
Zu dem Ergebnis, daß Objekteigenfarben unabhängig von der jeweiligen Beleuchtung erkannt werden, indem das Gehirn Informationen ausnützt, die sich durch die Schattier-ung ergeben, gelangt auch Gilchrist (1987). Er ließ Versuchspersonen durch ein Loch in ein Zimmer blicken, in dem alles weiß, und in ein anderes, in dem alles schwarz gestrichen war. In einer Versuchsanordnung wurde das schwarze Zimmer um soviel heller beleuchtet, daß es durchschnittlich genausoviel Licht reflektierte wie das weiße Zimmer. Die Beleuchtungsquelle befand sich an der Wand mit dem Guckloch, so daß sie vom Betrachter nicht gesehen werden konnte. Die Versuchspersonen erkannten das weiße Zimmer trotzdem als weiß, und das schwarze Zimmer wurde zumindest durchschnittlich für dunkelgrau gehalten. Gilchrist nimmt an, daß die Versuchspersonen an den markanten Kontrastunterschieden erkennen konnten, daß ein Zimmer hell und das andere dunkel gestrichen war. In einem weißen Zimmer tritt viel indirektes Licht auf, so daß es keine wirklich schwarzen Schatten gibt. In einem schwarzen Zimmer erscheint alles schwarz, das nicht direkt beleuchtet wird. Man könnte nun vor dem schwarzen Guckloch Nebel simulieren, so
daß auch dort der Kontrastreichtum sinkt. Zum Beispiel indem man
zwischen zwei Glasplatten Wasser mit etwas Milch einschließt und
diesen Filter vor das Guckloch positioniert. Ich bin sicher, daß
die Versuchspersonen auch unter diesen Bedingungen die Farbe des Raums
noch als dunkel erleben würden. Der "Nebel" verrät sich dadurch,
daß auch die kleinen Ritzen und Löcher, die im weißen
Modell dunkel erscheinen, nun von einem Lichtschleier überzogen sind.
Meines Erachtens basiert die Einschätzung von Objektfarben darauf,
daß Flächen gesucht werden, die weder Schatten noch Glanzlichter
aufweisen. Wenn das Bild in seiner Intensität so abgeglichen ist,
daß die hellsten Glanzlichter weiß, und die tiefsten Schatten
schwarz erscheinen, dann erhält das Auge in den Bereichen ohne Schatten
und Glanz die reinen Objekteigenfarben. Der dafür nötige Intensitätsabgleich
wird auf Farbtafel 6 unten illustriert und
soll hier kurz beschrieben werden.
3.6.1. Der Intensitätsabgleich:
Ich will von Sensoren ausgehen, die nur 11 Graustufen einwandfrei unterscheiden können. Ich beschreibe diese Graustufen in Zahlenwerten von 0 bis 1. Das mag zwar verwirrender erscheinen als eine Beschreibung mit ganzen Zahlen, aber diese Schreibweise ist gebräuchlicher. Es gibt also folgende Graustufen: 0 0,1 0,2 0,3...usw bis 1. Nun nehmen wir an, das vorliegende Bild enthält nur Grauwerte von 0 bis 0,5, das bedeutet von Schwarz bis Mittelgrau. Beim Intensitätsabgleich werden nun diese Zahlenwerte auf das Gesamtspektrum von 0 bis 1 aufgeteilt, indem man sie alle mit dem hellsten vorhandenen Lichtwert dividiert. Dieser ist im vorliegenden Beispiel 0,5. Aus einem Grauwert von 0,5 wird also ein Grauwert von 0,5:0,5=1 , aus einem Grauwert von 0,4 wird 0,4:0,5=0,8 , aus einem Grauwert von 0,3 wird 0,6 , aus 0,2 wird 0,4 und aus 0,1 wird 0,2. Die Division hat sowohl die Helligkeit als auch den Kontrast des Bildes verbessert. Hätten wir ein Grau zu dem Bild dazu addiert (additive Lichtmischung), so wäre es zwar ebenfalls zu einer Aufhellung gekommen, aber am geringen Kontrast hätte sich nichts geändert. Der dargestellte Intensitätsabgleich kann in abgewandelter Form auch auf nebelige oder dunstige Bilder angewandt werden. Bei solchen Bildern erscheinen die Schatten nicht so dunkel wie sie sein sollten. Der Abgleich erfolgt in diesem Fall dadurch, daß das Bild zuerst invertiert wird. Die Schattenbereiche erscheinen dann am Negativ nicht so hell wie sie sein sollten. Das kann nun durch den Intensitätsabgleich behoben werden. Danach wird das Bild wieder zurückinvertiert. Ich werde dieses Verfahren daher im weiteren als den "inversen Intensitätsabgleich" bezeichnen. Wenn wir in Farbtafel 6 das Resultat des Intensitätsabgleichs betrachten, so ergibt sich die Frage, ob hier nicht verlorene Information zurückgewonnen wurde? Aus der Physik wissen wir, daß so etwas nicht möglich ist. Das bedeutet, der Informationsmangel ist lediglich besser versteckt als im Ausgangsbild. Er liegt in der Abstufung der Graube-reiche. In der mathematischen Beschreibung (oben) hatte unser Ausgangsbild nur 5 der 11 möglichen Graustufen besetzt. Der Intensitätsabgleich hat die Graubereiche auseinandergeschoben, aber ihre Zahl nicht erhöht. Der Intensitätsabgleich muß aber nicht notwendigerweise im
nachhinein geschehen. Er könnte genausogut bereits auf der Netzhaut
stattfinden, indem die Lichtempfindlichkeit der Rezeptoren direkt beeinflußt
würde. Durch eine solche gezielte Einstellung der Lichtempfindlichkeit
der Rezeptoren würde durchaus mehr Information aufgenommen. Es ist
bekannt, daß es zurückführende Nervenbahnen von der Sehrinde
zu den seitlichen Kniehöckern gibt (Hubel u. Wiesel 1987, S. 38).
Vielleicht gibt es von dort auch zurückführende Bahnen zur Netzhaut.
3.6.2. Der Farbabgleich
Mit dem Verständnis des Intensitätsabgleichs kann nun auch
der Farbabgleich von Farbtafel 10 besprochen
werden. Dabei geschieht nichts anderes als ein Intensitätsabgleich
für alle drei Farbkanäle. Die beiden mittleren Bilder der Farbtafel
weisen den gleichen Grünstich auf. Das linke Bild simuliert eine weniger
intensive, das rechte eine intensivere Belichtung. Unter den Bildern sind
die Farbauszüge abgebildet. Auf dem weniger intensiv belichteten Bild
erscheinen der rote und der blaue Kanal zu dunkel, der grüne Kanal
ist hingegen gut belichtet. Im rechten Bild treten am grünen Kanal
bereits Informationsverluste auf, der rote und der blaue Kanal sind hier
jedoch richtig belichtet. Wird für jeden Kanal die beste Belichtung
gewählt, so enthält das Bild die meiste Information und hat keinen
Farbstich.
3.6.3. Ausnahmen
Viele Bilder enthalten Bereiche, die verschieden abgeglichen gehören, um die Farben dort näher an die Objekteigenfarben heranzubringen. So würden zum Beispiel bei einem Bild mit zwei verschiedenfarbigen Lichtquellen auch zwei Bereiche entstehen, welche einen jeweils eigenen Intensitätsabgleich erforderten. Ein häufigeres Beispiel bietet der Dunst. Die Objektfarbe des Waldes auf den entfernteren Bergen von Farbtafel 11 kann nur dann richtig erfaßt werden, wenn für Objekte, die gleich weit entfernt sind, ein jeweils eigener inverser Intensitätsabgleich durchgeführt wird. Natürlich sind Signale von höheren Einheiten der visuellen Verarbeitung erforderlich, um die Gruppe gleich weit entfernter Objekte abgrenzen zu können. Da atmosphärische Bedingungen längere Zeit anhalten, können auch Informationen aus vorhergehenden Wahrnehmungen genützt werden, um abzuschätzen, bei welcher Entfernung der Dunstschleier an dem betreffenden Tag welches Ausmaß hat. So kann über den Kontext der Zusammenhänge einerseits von der Entfernung auf das Ausmaß der Gegenfilterung geschlossen werden, die nötig ist, damit Objektfarben richtig erscheinen, andererseits beschreibt das Ausmaß in dem gegengefiltert werden muß die Objektentfernung. Der Vorgang, der hier zum nötigen Erkenntnisgewinn führt, ist ein hermeneutischer. Es handelt sich dabei, nach Riedl (1987, S. 63), um einen Rückkopplungsprozeß, in dem durch Einschätzung des möglichen Ergebnisses auf die Richtigkeit der angenommenen Ursachen rückgeschlossen wird, die dem Ergebnis zugrundeliegen. Riedl bringt dazu das Beispiel der Entschlüsselung einer alten Schrift. Der vermutete Inhalt des Textes legt nahe, welche Worte vorkommen werden, und diese legen nahe, welche Buchstaben gebraucht werden. Mit den ersten Worten sind erste Buchstaben bekannt, die wieder genützt werden können, um Worte und Sätze zu lesen. Die Schrift ist entschlüsselt, wenn der Schreibinhalt Sinn macht. Auf Farbtafel 11 haben im rechten unteren Bild ein entfernter und ein naher Berg jeweils einen eigenen Intensitätsabgleich durchlaufen. (Der entfernte Berg durchlief einen inversen Intensitätsabgleich.) Die Berge enthalten immer noch Licht- und Schattenbereiche. Die kräftigsten Farben dazwischen bezeichnen die Objekteigenfarbe. Legen wir diese Farbe jeweils über das gesamte Objekt, so enteht eine Abbildung ähnlich einem Comic, in der nur Farbflächen vorkommen. Wird das Original durch diese Abbildung dividiert, so entsteht ein Bild ähnlich einem Relief, in dem nur Schattierungen und keine Farben vorkommen. Objekte gleicher Ausrichtung werden in einem solchen Bild den gleichen Schattierungsschatten aufweisen. Das Bild kann somit bei der Interpretation der dritten Dimension helfen. Diese wiederum kann Informationen liefern, um das Schattierungsbild zu verbessern, so daß es exakter von der Objekteigenfarbe getrennt werden kann; also wieder ein hermeneutischer Prozeß. Meiner Ansicht nach muß im Gehirn eine solche Trennung von Objektfarben
und Schattierung geleistet werden, denn der Mensch erkennt Farben auch
dann richtig, wenn sich eine Farbfläche vollständig im Schatten
befindet und somit auch bei einem abgeglichenen Bild die reine Objektfarbe
innerhalb der Fläche nirgends auftritt. Außerdem würde
der Mensch mit Comic- oder Reliefdarstellungen nichts anzufangen wissen,
wenn sie nicht seinem Denken entsprächen.
In diesem Kapitel wurden also drei Probleme gemeistert: · Der allgemeine Farbabgleich, wobei Irritationen des Auges möglich bleiben, wie der Komplementäreffekt (Farbfläche mit kleinem grauen Quadrat) zeigt. · Die Messung der beleuchtungsunabhängigen Objektfarbe.
|
|
||||||||||||||||||||||||||||||||||||||
|
Back to the topic site: StudyPaper.com/Startseite/Computer/Informatik/Bioinformatik External Links to this site are permitted without prior consent. | |||||||||||||||||||||||||||||||||||||||
| Home | deutsch | Set bookmark | Send a friend a link | Copyright © | Impressum | |||||||||||||||||||||||||||||||||||||||