Title:

Visuelles Erkennen und Bildschaffen

Home
deutsch
  
ISBN: 3000035532   ISBN: 3000035532   ISBN: 3000035532   ISBN: 3000035532 
 
  Wir empfehlen:       
  Zum Inhaltsverzeichnis

Die Suche nach dem Anfang visuellen Erkennens




"Die Wahrnehmung ist die Brücke des Menschen zur Außenwelt." Diese Aussage ist einleuchtend, und doch überfordert der Begriff "Außenwelt" unsere Vorstellungskraft.

Die Annahme einer Welt außerhalb unseres Denkens, die mehr beinhaltet als wir durch unsere fünf Sinne erfahren, finden wir schon in der griechischen Antike. Platon veranschaulicht diese Idee in seinem Höhlengleichnis, worin er der realen Welt ihre Schattenbilder gegenüberstellt (Platon 1994, Band 2, "Politeia").
Eine zeitgemäßere Version dieses Gleichnisses besteht darin, die Welt unserer Sinne mit ihren Tönen, Farben und Gerüchen der Welt der Physik gegenüberzustellen, in der die selben Phänomene mit Begriffen wie Longitudinalschwingungen, elektromagnetische Wellen oder diffundierende Moleküle beschrieben werden.
Wenn wir zu erkennen vermögen, auf welche Weise diese beiden Welten miteinander verbunden sind, so ist damit der größte Schritt zu einer Erklärung der Wahrnehmung getan. Am Beispiel des Sehens würde dies bedeuten zu verstehen, wie aus 125 Millionen weitgehend getrennt arbeitender Rezeptoren in der Netzhaut des Auges Erscheinungen wie Farben, Strukturen, Formen und deren Bewegung unabhängig von Beleuchtungssituation und perspektivischer Verzerrung erhalten werden können.

Dies ist jedoch nur der erste Verarbeitungsschritt im Wahrnehmungsprozeß. Die nächst höhere Leistung besteht darin, anhand solcher Merkmalen Objekte zu erkennen.

Als Merkmale werden Eigenschaften bezeichnet, die an Objekte gebunden sind. Abgesehen von der Verbindung zwischen Objekten und Eigenschaften bedarf es auch noch einer Verbindung mit Tätigkeiten, die sich auf diese Objekte beziehen. Über all diese Verbindungen verfügen wir, wenn wir sagen, es sei uns etwas ein Begriff. Ein Begriff ist somit wesentlich mehr als nur ein Wort. Er schließt Sinnesdaten, Handlungen und assoziierte Lebenssituationen mit ein.
Aus der Verbindung von Sinnesreizen und Tätigkeiten läßt sich letztlich erklären, was Lebewesen dazu befähigt, auf Umweltreize sinnvoll zu reagieren. Abbildung 1 zeigt solche Verbindungen am Beispiel einer Kirsche. Der angenommene Signalfluß verläuft von links nach rechts. Zuerst erhalten wir Informationen über bestimmte Eigenschaften. Diese erweisen sich als zugehörig zu einem bestimmten Objekt, das damit erkannt werden kann. Das Objekt wiederum erweist sich als verbunden mit Verhaltensweisen, die es auslöst.

Abbildung 1

Aber nicht einmal das Gehirn eines so einfachen Lebewesen wie eine Amsel kann so direkt verschaltet sein wie in diesem Schema. Die Wahrnehmung der Kirsche wird nicht immer dazu führen, daß die Amsel sie frißt. Ob auf den Reiz die Reaktion folgt, wird auch von inneren Faktoren des Tieres abhängen. Das körperliche Gleichgewicht und die momentane triebliche Situation des Tieres haben einen Einfluß auf sein Verhalten. Wäre dem Tier dieser Einfluß bewußt, so müßte man ihn als seinen "Willen" bezeichnen.

Beim Menschen kommt hier noch der Zeitbegriff hinzu. Er benützt vergangene Erfahrungen, um eine Zukunft zu prognostizieren, auf die er sein Verhalten ausrichtet. Er kalkuliert nicht nur momentane, sondern auch zukünftige Bedürfnisse mit ein. Einen weiteren Einfluß spielen festgesetzte Prinzipien, wie zum Beispiel eine Moralordnung, an die er sich hält. Solche Schemata sind notwendig, um nicht in jeder Situation alles neu überdenken zu müssen. Diese Faktoren führen bereits über das Thema Erkennen hinaus. Indirekt haben sie allerdings Einfluß auf das, was wir von der Welt sehen, denn sie lenken unsere Aufmerksamkeit. Die vorliegende Arbeit wird sich aber nicht bis in diese Ebene vorbewegen.

Diese Ankündigung mag manchen Leser enttäuschen, denn es scheint so, als würde das Thema Wahrnehmung erst dort interessant, wo Einstellungen, Absichten und Aufmerksamkeit ins Spiel kommen. Das Reiz-Reaktionsschema von Abbildung 1 wirft demgegenüber kaum eine Frage auf. Es zeigt nichts weiter als einige Begriffe und deren Bezug zueinander. Weit weniger klar erscheint die Sache, sobald man versucht, dieses Modell in Form einer Computersimulation praktisch umzusetzen. Es ergibt sich dann die Frage, wie ein System von Wörtern, die sich gegenseitig definieren, die visuelle Wahrnehmung erklären kann?

Das kann es eben nicht, denn die eigentlichen Fragen ergeben sich schon vor der Bewußtwerdung einer Wahrnehmung und damit vor aller Begrifflichkeit. Die visuellen Vorstellungen und die ihnen zugeordneten Begriffe, mit denen das bewußte Denken agiert, mögen das Resultat bestimmter Wahrnehmungen sein, aber niemals deren Erklärung. So ist zum Beispiel die Wahrnehmung farbigen Lichtes ein visuelles Erlebnis, das wir durch den richtigen Farbbegriff zwar zu beschreiben, aber nicht zu erklären vermögen. Erst heute ist neben dieser subjektiven Ebene noch eine andere Art der Beschreibung des Ereignisses möglich:

Ein Neurophysiologe kann die Aktivität einzelner Gehirnzellen messen und notieren, ohne irgend einen Farbbegriff zu benützen. Damit ist er dem Zirkelschluß eines Systems sich gegenseitig erklärender Begriffe (Abbildung 1), das insgesamt kaum einen Erklärungswert hat, entkommen. Wesentlich dabei ist, daß er völlig farbenblind sein könnte, und, trotzdem ihm der Begriff von Farbe fehlt, das Ereignis richtig zu schildern vermag, wenn er feststellt, daß der Mensch, dessen Netzhaut er untersucht, über drei Zapfensorten verfügt, die auf verschiedene Frequenzlängen des Lichtes ansprechen und diesen Menschen zur Differenzierung von Objekten befähigen, die er selbst, als Farbenblinder, für gleich erachtet.

Der letzten Überlegung zufolge ist die (objektive?) Beschreibung des Neurologen von seinem subjektiven Farberleben unabhängig. Auch in bezug auf die Amsel von Abbildung 1 wäre eine solche Schilderung der Zusammenhänge sinnvoller als eine sprachliche. Die Darstellung ist voll mit Worten während das Tier über kein sprachliches Begriffssystem verfügt.

Aber nicht nur zur Beschreibung tierischen Denkens ist Sprache vielfach ungeeignet. Auch in unserem Gehirn gibt es nicht-verbale Denkprozesse. Manche davon erleben wir sogar bewußt. Ein Denken ohne Sprache, wie es vielleicht ein Taubstummer erlebt, ist schwer nachzuvollziehen, und doch scheint es vernünftig, anzunehmen, daß alles Denken im Ursprung sprachlos ist. Manchmal passiert es, daß man etwas sagen will, aber das Wort nicht findet. In diesem Moment steht man vor dem reinen Gestaltbegriff. Ich verstehe Sprache als ein Codierungssystem, das sich auf der Grundlage von Gestaltbegriffen entwickelt hat und dessen Leistung darin besteht, Wissen besser vermittelbar zu machen. Das Denken eines Handwerkers, Technikers oder Komponisten kann nicht rein sprachlich sein.
Dies ist keine nebensächliche Bemerkung, denn wo wäre unsere Zivilisation ohne visuelle Denkleistungen geblieben? All die Gegenstände (Kunstwerke und technische Anlagen eingeschlossen), die unsere Zivilisation ausmachen, waren in den Köpfen ihrer Erfinder vorerst unbenannt. Sogar die Buchstaben dieses Textes entspringen visuellem "sprachlosem" Denken.

Die vorliegende Arbeit widmet sich fast ausschließlich dem nicht-sprachlichen Teil des Denkens. Es geht um die Vorarbeit, die das Gehirn leistet, bevor überhaupt eine visuelle Wahrnehmung in unser Begriffsbewußtsein kommt. Die Zwischenergebnisse dieser Gehirnleistungen sind noch keine Begriffe sprachlicher Form und sollten auch noch nicht benannt werden. Ich werde daher, wie bereits erwähnt, eine visuelle Form der Beschreibung wählen, nämlich die Darstellung durch neuronale Netze.
Damit ist klar, womit zu beginnen ist. Es muß geklärt werden, wie es von den Aktivitäten vieler einzelner Netzhautzellen zu jenen visuellen Merkmalen kommt, an denen wir Objekte erkennen. Das Ergebnis einer solchen Verarbeitung könnte darin liegen, daß die Wahrnehmung eines bestimmten Objektmerkmals über Zwischenstufen in irgendeinem Teilbereich des Gehirns immer zur gleichen Signalkonstellation führt, die eben für dieses Merkmal steht. Dies muß unabhängig von Beleuchtungssituation, Perspektive und Umfeld geschehen, in dem das Objekt wahrgenommen wird. Fest steht, daß, ohne vorher die Merkmale zu erfassen, auch das Objekt nicht erkannt werden kann.

Die Frage, wie Objektmerkmale erfaßt werden können, ist im Prinzip nicht neu. Schon die Denker der Antike, die sich dem Problem des Welterlebens genähert haben, sind bis zu dieser Frage vorgedrungen. Allerdings suchten sie die Antwort am verkehrten Ende. Sie blieben im begrifflichen Zirkel von Abbildung 1 gefangen, in dem eins am andern definiert wird, der aber über den Ursprung des Ganzen nichts verrät. Natürlich ist es kein Zufall, daß die Erforschung der Wahrnehmung im begrifflichen Denken begann. Die Bewußtwerdung der Begrifflichkeit des Denkens hat überhaupt erst die Frage erlaubt, wie all die Dinge in unseren Geist kommen. Der Anfang lag somit in einer rein argumentativen Auseinandersetzung. Doch Antworten konnten auf diese Weise kaum gefunden werden, denn die begriffliche Bewußtwerdung bildet das Ende einer Wahrnehmung. Alles was das Gehirn davor leistet passiert völlig unbewußt und ist der introspektiven Erforschung nicht zugänglich. So blieb Platon im sprachlichen Hantieren mit jenen Dingen verhaftet, die er doch erklären wollte. Allerdings hat er erkannt, und auch überliefert, warum keine Erklärung gelingen konnte. Vielleicht sind die folgenden Überlegungen dem Leser verständlicher als alles bisher Gesagte.
 
 

Erste Fragen
 

Bereits Platon macht sich Gedanken darüber, woher wir die Begriffe haben. Er kommt zu dem Schluß, daß sie sich aus den Einzelerlebnissen nicht erklären lassen (Platon 1994, Band 2, "Phaidon"). Platons Argumentationslinie ist etwas verworren, deshalb will ich versuchen mit eigenen Worten am Begriff "Pferd" darzustellen, wieso Erfahrung alleine noch nichts erklärt:
Wenn wir davon ausgehen, daß Erfahrung uns lehrt, an welchen Merkmalen ein Pferd zu erkennen ist, dann ist damit gemeint, daß wir vorerst Pferde vergleichen, um aus diesen Erfahrungen jene Durchschnittsmerkmale herauszufiltern, die die "Pferdheit" ausmachen. Der daraus erhaltene Begriff von "Pferdheit" befähigt uns dann dazu, Pferde zu erkennen. Um ihn zu erhalten, mußten wir aber bereits Pferde betrachten, und das können wir nur, wenn wir bereits Pferde erkennen. So stecken wir im begrifflichen Zirkel von Abbildung 1, wo sich alles gegenseitig definiert und eines ohne das andere nicht sein kann. Erkennen wird also vorausgesetzt und nicht erklärt.

Um den aufgetretenen Problemen zu entrinnen, wollen wir annehmen, der Mensch habe von Geburt an die Fähigkeit, Ähnliches als ähnlich zu erkennen und werde deshalb von vornherein Pferde mit Pferden und nicht mit Bäumen vergleichen. Um Ähnlichkeit zu messen, bedarf es aber irgendwelcher Kriterien bzw. Merkmale. Diese müßten auch von Geburt an mitgegeben sein, um die besagte Fähigkeit zu ermöglichen. Das Problem ist: Wenn wir dies voraussetzen, ist es gar nicht mehr nötig, Pferde zu vergleichen, um die Merkmale zu erhalten, weil wir sie ja schon haben. Wenn es nicht nötig ist zu vergleichen, kann aber auch nicht mehr behauptet werden, es sei möglich, die Fähigkeit zur Objekterkennung durch vergleichen von Erfahrungen zu erwerben.

Wir können demnach nicht erkennen, was wir nicht schon kennen!

Platon löst dieses Problem, indem er annimmt, die Seele habe die "Ideen" (Begriffe) vor unserem Erdendasein schon einmal geschaut.
Dies mündet in den Streit darüber, was zuerst dagewesen sei: die Begriffe und Überbegriffe, oder die visuellen Einzelerlebnisse.

Im Mittelalter findet diese Problemstellung im Universalienstreit ihren Höhepunkt und leitet schließlich über zum Empirismus/Rationalismus-Konflikt. Die Frage lautet nun, ob der Ursprung unserer Begriffswelt bei den Sinnen oder dem Verstand zu suchen ist (vergl. Liessmann 1992, S. 27).

Den wesentlichen nächsten Schritt finden wir bei Kant. Er stellt nicht mehr fertige Objektbegriffe an den Anfang, sondern die Kategorien der Qualität, Quantität, Relation und Modalität (Kant 1781, S. 118). Sie dienen der Beschreibung von Objekten (Begriffen) und schlagen eine Brücke zu dem, was ich später mit dem vielleicht unzureichenden Begriff "Objekteigenschaften" zusammenfassen will.
"Die Sinne liefern das Mannigfaltige, das durch unseren Verstand zur Einheit (dem Begriff) gebracht wird" (Kant 1781, S. 134).

Aber wie liefern die Sinne das Mannigfaltige? Betrachten wir einen einzelnen Rezeptor der Netzhaut, so informiert er darüber, wieviel Licht einer bestimmten Wellenlänge an einem bestimmten Platz des Sehfeldes vorhanden ist. Diese Information ist alles andere als mannigfaltig. Die anderen Rezeptoren rundherum leisten auch nichts anderes als dieser eine Rezeptor. Selbst wenn wir alle ihre Nerven zu einem Strang verbinden informiert uns deren Summe nur über die vorhandene Lichtmenge. So bleibt die Frage wie die Rezeptoren verbunden werden könnten, damit daraus Mannigfaltigkeit entspringt. Sicher sind diese Verbindungen komplex und entstehen in ihrer Fülle erst im Gehirn. Die Ausgangsposition Kants, daß die Sinne das Mannigfaltige einfach liefern, ist, so gesehen, nicht haltbar.

Die Frage, wie denn aus den monotonen Informationen der Sinnesrezeptoren Mannigfaltigkeit der Wahrnehmungen hervorgeht, sollte eigentlich nicht in diesem Kapitel namens "erste Fragen" aufgeworfen werden. Die Erforschung der Gehirnleistungen, die dem begrifflichen Denken vorausgehen, ist eher die "letzte Frage", denn sie hat erst am Ende des vergangenen Jahrhunderts begonnen, als die Neuroanatomie entstand. Seither wurde versucht, mit den Erklärungen an der Netzhaut zu beginnen. Was man dort fand, waren einfache Rezeptoren, die einzeln betrachtet über nichts weiter informierten als die Lichtmenge. Ein magerer Start. Allerdings gibt es einen guten Grund, an dieser Stelle anzufangen: Auch die Evolution des Sehsinnes begann mit dem Erkennen von mehr oder weniger Licht.
 
 

Vom Einfachen zum Differenzierten,
vom Abstrakten zum Konkreten
 

Mit dem Versuch, die Erklärungen bei den unbewußten Leistungen des Gehirns zu beginnen, die im Auge ihren Anfang nehmen, hat sich die Ansicht über das Wesen des gesamten Wahrnehmungsprozesses in einem wesentlichen Punkt geändert. Während Kant noch der festen Überzeugung sein konnte, daß der Weg der Erkenntnis in einem Ordnen des Mannigfaltigen zu Begriffen und Überbegriffen voranschreitet, erscheint es heute vernünftiger, von einer Grobeinteilung der Welt auszugehen, die eine zunehmende Differenzierung erfährt, sozusagen vom Abstrakten zum Konkreten (vergl. Riedl 1987, S. 52).

Einen wesentlichen Beitrag dazu, den Prozess in dieser Richtung zu durchdenken, kommt von seiten der Biologie, ein Zugang, der Kant noch nicht offenstand. 1809, fünf Jahre nach Kants Tod, erscheint die erste zoologische Abstammungslehre von Lamark. 1859 veröffentlicht Darwin. Er erkennt die treibende Kraft: das Selektionsprinzip (Meyers Lexikon 1992). Erst in unserem Jahrhundert tritt die Evolutions-theorie an Stelle von Adam und Eva in die Köpfe der breiten Masse. 1949 gründet Konrad Lorenz ein Institut für vergleichende Verhaltensforschung. Damit ist ein Zugang zur Erforschung der Evolution des Gehirns und auch der Wahrnehmung gefunden. Dem Neurophysiologen Gerald Edelmann verdanken wir die Theorie des neuronalen Darwinismus (Edelman 1993). Ich will im folgenden kurz skizzieren, wie die Welt in den Köpfen der Lebewesen evolutionsgeschichtlich zunehmend Gestalt annahm.
 
 

Erste Vorfahren
 

Die einfachste vorstellbare Verschaltung der Lichtrezeptoren der Netzhaut bestünde darin, sie zu einem Strang bzw. zu einem einzigen Signal zu verbinden, das lediglich darüber informiert ob die Umgebung vor dem Auge hell oder dunkel ist. Mit einer solch einfachen Leistung hat die Entwicklung des Lichtsinnes auch begonnen, allerdings bedarf es dazu weder eines Auges, noch seiner 125 Millionen Lichtrezeptoren.

Der evolutionsgeschichtlich älteste, aktiv auf Licht reagierende Organismus ist Euglena, ein im Wasser lebender Einzeller, der zu den Pflanzen zählt und Licht benötigt. Euglena bewegt sich mittels einer Geißel, deren Aktivität davon bestimmt wird, ob auf ihre Wurzel Licht oder Schatten fällt. Die Pflanze treibt damit zum Licht (vergl. Ditfurth 1980, S. 113). Aus chemischer Sicht verwendete Euglena bereits das selbe Sehpurpur, das durch die ganze Evolutionsgeschichte beibehalten wurde. Auch zeigt dieses Beispiel sehr klar, daß Erkennen von Anfang an mit dem Verhaltet verschalten war. Der Einzeller erkennt hell und dunkel und reagiert mit Bewegung oder Ruhe.
Auch ein Regenwurm unterscheidet mit seinen Lichtrezeptoren lediglich hell und dunkel. Er wählt jedoch die Dunkelheit.

Die erste wesentliche Weiterentwicklung bringt das Becherauge etwa einer Schnecke. Ihre Lichtrezeptoren befinden sich in einer becherförmigen Vertiefung der Haut. Sie reagieren lediglich auf Intensitätsänderung. Zieht ein Schatten vorüber, so meldet das System Bewegung (Ditfurth 1980, S. 120).

Mit der Nadellochpupille des Nautilus wurde schließlich aus den vagen Schatten ein projiziertes Bild. Im Grunde trifft das dahinterstehende Prinzip auch auf unser Linsenauge zu. Siehe Abbildungen 2 und 3.
 
 

Wenn Licht auf die Oberfläche von Gegenständen trifft, so reflektiert jeder Punkt dieser Oberfläche das Licht nach allen Richtungen. Von jedem dieser Punkte trifft somit auch ein Lichtstrahl durch die Lochpupille auf die Netzhaut des Nautilusauges. Jeder Punkt hat seinen eigenen Platz. So kommt es zu einer am Kopf stehenden Projektion.
 
 

Ein größeres Loch bringt zwar mehr Licht, führt aber zu einer unscharfen Projektion. Die Lösung bestand in der Entwicklung der Linse, mit der mehrere, aus der gleichen Richtung kommende Lichtstrahlen auf einen Brennpunkt gebracht werden (Abb. 3).
 
 

Eine Schlange hat bereits ein Linsenauge. Doch bedeutet dies noch lange nicht, daß sie wesentlich mehr erkennt als Bewegung. Wie schon bei der Schnecke melden ihre Netzhautzellen nur Intensitätsänderungen des Lichts. Verhält sich die Schlange ruhig, und ein Tier bewegt sich in ihrem Blickfeld, so wird die von diesem Objekt eingenommene Netzhautfläche reagieren, weil Bewegung und somit Veränderung der Lichtintensität vorliegt. Aus der reagierenden Fläche kann nun zusammen mit der Entfernung des wahrgenommen Tieres, die durch die Linsenfokussierung bekannt ist, dessen Größe ermittelt werden. Die Schlange unterscheidet die Beute und den Feind an der Größe. Aus dem Wahrnehmungsprozeß erklärt sich auch die typische starre Haltung des Tieres 3* (vergl. Ditfurth 1980, S. 133).
Pflanzenfresser können ihre Nahrung nicht an der Bewegung erkennen. Wahrscheinlich lag darin die Triebfeder zur Entstehung eines Grünrezeptors.
 
 

Die angeführten Beispiele sollten reichen um zu belegen, daß die Entwicklung mit einer Grobunterteilung der Welt begann, und erst nach und nach differenziertere optische Wahrnehmungen möglich wurden. Wiedererkennen von konkreten Einzeldingen war am Anfang nicht möglich, und auch nicht notwendig. Ein Wesen, das nur fünf verschiedene Handlungen ausführen kann, braucht auch nur fünf verschiedene Situationen unterscheiden zu können.
Die ersten Unterteilungen, die in der Evolutionsgeschichte hierfür vollzogen wurden, haben einen elementaren Charakter. Mit ihnen war der Grundstein einer Hierarchie gelegt, die sich später in unser Begriffssystem übertragen hat:

So wurde bereits mit der Lichtempfindlichkeit der Keim für die Unterscheidung zwischen Himmel (All) und Erde gelegt.

Das Bewegungssehen bringt die Unterscheidung von lebendig und tot.

Das Farbsehen bringt die Unterscheidung zwischen Pflanzen und Tieren.

Die Größenverarbeitung dient schließlich dem Erkennen von Räuber und Beute.
 
 

So sieht sie aus, die Liste der großen Worte. Sie bilden die Überbegriffe unseres heutigen Begriffssystems. In ihnen ist alles Wahrnehmbare enthalten. Es sollte nicht verwundern, daß diese ersten Trennungen in Hell und Dunkel, in Himmel und Erde, Lebendig und Tot auch die Basis für viele Schöpfungsmythen bilden. In einer Welt von Blinden, die auf ihren Tastsinn angewiesen sind, hätten Schöpfungsmythen vielleicht mit einer Trennung von Gasen, Flüssigkeiten, und Festkörpern begonnen.
Die Welt in uns beginnt mit Überbegriffen, auch wenn die Welt da draußen mit einem Urknall beginnt. Dabei spreche ich mit dieser "Welt in uns" nicht nur die Welt in uns Lebewesen an, sondern durchaus auch uns als Einzelpersonen, denn dieser Entstehungsprozeß der Welt, von ersten Unterscheidungen zu immer feinerer Differenzierung vollzieht sich in den ersten Wochen jedes Lebewesens von neuem.
 
 

Erste Unterscheidungen
 

Ein Säugling kann uns noch nicht sprachlich mitteilen, welche ersten Unterscheidungen er zu treffen vermag. Doch dieses Problem hat sich auch bei der Erforschung der Wahrnehmungsleistungen von Tieren gestellt. Dort wurden die größten Fortschritte durch Experimente mit Attrappen erbracht. Kröten jagen bewegte Kartonstreifchen, Insekten halten eine Glühbirne für Sonne oder Mond, eine gestreifte Walze für ein Weibchen usw. Den Biologen sind unzählige derartige Beispiele bekannt (vergl. Ditfurth 1980, S. 88).

Je niedriger das Differenzierungsvermögen eines Wesens, desto abstrakter können diese Attrappen ausgeführt sein. Dies trifft auch auf den Menschen zu. Ein drei Monate alter Säugling reagiert zum Beispiel auf einen hautfarbenen Luftballon mit aufgemalten Augen und Haaren genauso wie auf den Kopf seiner Mutter. Am Ende des ersten Lebensjahres können aber bereits Abbildungen von vertrauten Personen und Objekten erkannt werden. Das Kind verhält sich ihnen gegenüber jedoch so, als handle es sich um reale Personen oder Objekte (vergl. Fleisch 1988, S. 25 u. 27).
In diese Zeit fallen auch die ersten Worte und, wie könnte es anders sein, auch hier machen die Überbegriffe den Anfang. Das Wort "Mama" ist eine Ausnahme. Aber sogar das Wort "Papa" wird gerne auch auf andere Menschen angewandt; "Dada" kennzeichnet alle Dinge, "Wauwau" heißen vorerst alle Tiere, "Tütü" alle Fahrzeuge und "Hamham" alles Essbare.

Natürlich läßt sich darüber streiten, ob diese Überbegriffe noch irgend etwas mit mangelnder Wahrnehmung zu tun haben, oder lediglich ein Zeichen mangelnden Sprachvermögens sind. Ich glaube jedoch zeigen zu können, daß sich diese beiden Fähigkeiten aneinander entwickeln. Würde ein Kind die Dinge von Anfang an voll differenziert erkennen, und wir erklärten ihm, daß dieses Objekt vor ihm ein "Tütü" sei, was sollte das Kind dann dazu bewegen, dieses Wort auf mehr als dieses eine Auto vor ihm anzuwenden? Das Kind braucht auf der Ebene der Gestalt zuerst die Überbegriffe, um Sprache überhaupt sinnvoll zuordnen zu können (Konditionierungslernen) und auch, um sich sinnvoll zu orientieren. Wenn am Anfang keine Grobunterteilung der Wahrnehmungen stünde, dann könnte das Kind Dinge, die es noch nicht kennt, überhaupt nicht erfassen. So aber nimmt es von Anfang an alles wahr, nur erscheint vorerst vieles als identisch, das später als verschieden erkannt wird.

Dieser Differenzierungsprozeß kommt nie wirklich zum Stillstand, und es finden sich auch in der Welt der Erwachsenen noch Beispiele dafür. Nehmen wir an, unser Nachbar habe Schlittenhunde, so kann es sein, daß wir diese vorerst gar nicht unterscheiden können. Wenn wir dies dann mit der Zeit erlernen, können wir ihnen auch Namen zuordnen. Die sprachliche Trennung entwickelt sich somit parallel zu unserem Gestaltdifferenzierungsvermögen.
Differenzieren muß erlernt werden. Die Behauptung, "Die Chinesen sehen doch alle gleich aus", stammt offensichtlich von jemandem, der keine Möglichkeit gehabt hat, Chinesen unterscheiden zu lernen. Sicherlich sind ihre Gesichter objektiv betrachtet genauso unterschiedlich wie unsere.
 
 

Erste Verarbeitungsprozesse
 

Wenn sowohl die Evolutionsgeschichte der Wahrnehmung, als auch die Entwicklung im Individuum von groben Unterteilungen zu weiterer Differenzierung fortschreitet, so liegt die Annahme nahe, daß sich über die Evolution, dieses Nacheinander der Verarbeitungs-prozesse auch in den Aufbau unseres Wahrnehmungsapparates (Auge, Gehirn) übertragen hat. Da Objekterkennung in Sekundenbruchteilen stattfindet ist diese Hypothese über Verhaltensbeobachtung schwer nachzuprüfen. Wir können in diesem kurzen Zeitraum nicht oft genug fragen "Was siehst du gerade?". Außerdem muß angenommen werden, daß ein Großteil der Verarbeitung nicht bewußt zugänglich ist.

Bei Kurzdarbietung von Bildern und nachherigem Abfragen besteht wiederum die Gefahr, daß damit eher das Merkvermögen einer Person überprüft wird als deren Wahrnehmung.
 
 

Es scheint, als wäre die Frage nach der Erkenntnisabfolge nicht der ideale Beginn, um den Ablauf der vorbewußten Gehirnleistungen zu ergründen. Warum ist es überhaupt wesentlich, zu wissen, ob die Wahrnehmungsverarbeitung in ihrer zeitlichen Abfolge im Gehirn einen Weg zunehmender Differenzierung beschreitet oder den gegenteiligen Weg der Generalisierung?
Ich glaube, dies wird schnell begreiflich, wenn wir uns vor Augen führen, daß Differen-zierung vom Abstrakten zum Konkreten führt, Generalisierung aber vom Konkreten zum Abstrakten.
Alle unsere Begriffe (ausgenommen Namen) beschreiben mehr als nur eine Einzeler-scheinung und sind daher abstrakt. Es gibt viele Autos, viele Berge, viele Pferde. Wir müssen also, um ein Pferd zu erkennen, von der konkreten Erscheinung vor uns zu dem abstrakten Überbegriff kommen. Aber genau das ist nicht möglich, denn wie sollen wir wissen, welche Informationen von dieser Erscheinung abgezogen werden dürfen, wenn wir doch noch nichts erkennen. Wir befinden uns wieder am falschen Ende der Fragen. Wir haben den anhand von Abbildung 1 erläuterten Fehler begangen, die Dinge der Außenwelt mit den Begriffen zu verwechseln, die wir von ihnen "im Kopf" tragen. Passiert ist dies, weil die Sache rein verbal durchdacht wurde.

Stellen wir demgegenüber die Theorie auf, daß Objekte zu Erkennen soviel bedeutet, wie Objekte differenzieren zu lernen, so ergibt sich das Problem, daß am Anfang des Wahrnehmungsprozesses die Netzhaut steht, auf welche die konkreten Einzelerscheinungen der Außenwelt projiziert werden. "Konkret" bedeutet das Gegenteil von "abstrakt" oder "allgemein". Die Theorie, daß Wahrnehmen ein Prozeß der Differenzierung sei, bedarf aber des obersten Allgemeinen als Ausgangspunkt. Wo ist dieses zu suchen, wenn nicht auf der Netzhaut?
Die Antwort auf diese Frage ergibt sich aus der Einsicht, daß wir im Auge über keinen Beobachter verfügen, der sich das Netzhautbild als Ganzes ansehen könnte. Die einzigen "Beobachter" sind die Netzhautzellen. Sie nehmen jede einzeln für sich nur etwas sehr Allgemeines wahr, nämlich die Menge des vorhandenen Lichtes. Diese allgemeinste aller visuellen Wahrnehmungen stand auch am Anfang der Evolutionsgeschichte des Sehens, und diese Geschichte lehrt uns, daß der nächste Schritt darin liegt, die Rezeptoren zu verbinden, um so differenziertere Wahrnehmungen zu ermöglichen.

Der Weg vom Abstrakten zum Konkreten ist also, wenn auch nicht nachvollziehbar, zumindest logisch nicht ausgeschlossen. Daß sowohl die Entwicklungsgeschichte der Fragen wie auch die Geschichte der bildenden Kunst mitunter in die Gegenrichtung verlaufen sind, ist verständlich, denn beide beginnen im bewußten Denken, dort, wo der Prozeß der Wahrnehmungsverarbeitung endet.
 
 

Erste Theorie der Objekterkennung
 

Eine Theorie der Objekterkennung muß somit erklären können, was uns dazu befähigt, zu differenzieren. Es muß erklärt werden, wie die Sinne das Mannigfaltige liefern.

Was die visuelle Wahrnehmung betrifft, geht es darum darzustellen, wie Verbindungen der Rezeptorzellen aussehen könnten, die auf verschiedenartige Objektmerkmale ansprechen, und nicht bloß auf die Menge des vorhandenen Lichtes. Die Verschiedenartigkeit visueller Objektmerkmale, die der Mensch empfängt, muß sich also aus jener Verschiedenartigkeit erklären, mit der diese relativ gleichartigen Zellen verschaltet bzw. kombiniert sind. Jede Verbindungsart, die für ein bestimmtes Merkmal steht, wird natürlich nur dann aktiv, wenn möglichst alle ihre Ausgangszellen senden. Aus einer weiteren Kombination der Merkmale miteinander geht schließlich die noch größere Zahl an Gestaltbegriffen von Objekten hervor. Letztere bilden somit das Ende der Verarbeitung und nicht deren Anfang. Wahrnehmung wird damit zu einer Lehre von den Verbindungen. Es wird sich zeigen, daß sogar Eigenschaften wie die Form eines Objektes durch Verbindungen erklärt werden.

Eindrucksvolle Beweise, daß in der Verbindung der Bildpunkte der Schlüssel zum Verständnis der visuellen Wahrnehmung liegt, kommen aus der Neurophysiologie. Das Netzhautbild wird über den Sehnerv auf die Gehirnrinde übertragen, wo es mehrere Zellschichten durchfließt. Jede dieser Zellschichten schafft neue zusätzliche Verbin-dungen. Gleichzeitig reagieren die Zellen von Schicht zu Schicht auf komplexere Auslöser (Hubel 1989.). Auf die Art der Verbindungen komme ich später noch zu sprechen. Vorerst soll nur die Richtung dargestellt werden, in die der Verarbeitungsprozess verläuft.

Differenzierung wird oft mit einem Prozeß des Trennens und Zerteilens gleichgesetzt. Es scheint widersprüchlich, wenn jetzt ausgesagt wird, Wahrnehmen und Erkennen sei ein Prozeß des Verbindens. Dieser Widerspruch ist nur ein scheinbarer:
Wann immer Dinge differenziert werden, entstehen neue Begriffsgruppen. So hat Differenzierung auch ein verbindendes Element, obwohl die Zahl der Unterscheidungen zu-nimmt. Ein stetes Zunehmen von Unterscheidungen durch einen Prozeß der Verbindung kennzeichnet nicht nur die Wahrnehmung. Es liegt hier eine eigenartige Analogie mit den Entstehungsgesetzen der Außenwelt vor. Der Ursprung liegt dort ebenfalls in einer Unmenge von Gleichartigem. Die Quanten bilden die Basis, auf der eine kleine Zahl verschiedener Atome entstehen konnte, und über Moleküle und Zellen geht der Weg hinauf zu Fasern und Geweben, den sichtbaren Strukturen der uns umgebenden Materie.

Die Innenwelt, also die Welt wie sie der Mensch erlebt, hat ebenfalls den Beginn in ihren kleinsten Bausteinen, den Rezeptoren. Sie werden in der visuellen Verarbeitung zu kurzen linearen Elementen verbunden, aus ihrer Aneinanderreihung bestehen Strukturen und Kanten. In variabler Kombination verschiedener Seitenkanten ergeben sich schließlich Grundformen, wie Rechteck, Kreis oder Dreieck, und aus deren Zusammenfügung entstehen ganze Gestalten.

Die Begrenztheit der dargestellten Analogie ist vergleichbar mit der begrenzten Überein-stimmung eines Landschaftsbildes mit der Landschaft selbst. Wird uns nur ein winziger Ausschnitt des Bildes gezeigt, so ist darauf nur Farbe auf Leinwand und vielleicht eine Pinselstruktur zu erkennen. Die Übereinstimmung ist dahin. Sie gilt in diesem Maßstab nicht mehr.

Wenn wir die visuelle Wahrnehmung als ein System verstehen, das eine Analogie zu dieser Welt aufbaut, so fragt sich, wie die Außenwelt sich gegenüber dieser Analogie verhält. Die Antwort würde uns der Außenwelt ein Stück näher bringen. Vielleicht sind viele verschiedene Analogien zur Außenwelt möglich. So können zum Beispiel Schallereignisse in einer analogen Form festgehalten werden, eine Möglichkeit ist die Schallplatte, eine andere die Magnetaufzeichnung.
 
 

Abgrenzung von Wahrnehmung gegenüber Vorstellungen:
 

Um Wiedererkennung von Objekten zu ermöglichen, brauchen Lebewesen auch die Fähigkeit, die wesentlichen Elemente einer Wahrnehmung zu speichern. Sie müssen Gestaltbegriffe im Kopf behalten. Der Mensch verfügt zusätzlich über die Fähigkeit zur selbständigen Aktivierung solch gespeicherter Informationen. Allerdings darf angenommen werden, daß ein Großteil der potentiell verfügbaren Information nicht jederzeit in Form einer Vorstellung abrufbar ist. Vorstellung darf nicht mit Wahrnehmung gleichgesetzt werden, denn ihre Selbstgesetztheit ist dem gesunden Menschen bewußt.

Eine besondere Form der Fremdgesetztheit besteht in der Aktivierung von Gehirnzellen durch eine Mikroelektrode, wie dies zu Testzwecken bei Gehirnoperationen notwendig ist. Dabei können unter anderem Wahrnehmungserlebnisse provoziert werden, die der Patient wie Halluzinationen erlebt (vergl. Gershon u. Rieder 1993, S. 80).

Zusammen mit dem Phänomen des Traums und der Vorstellungswelt geben solche Experimente Auskunft darüber, was der Mensch von den visuellen Sinneseindrücken geistig zu behalten vermag. Wir vermögen das Bild vor unseren Augen nicht abzuspeichern wie dies eine Videokamera kann. Es ist schwer zu beschreiben, was von einer Wahrnehmung überbleibt, wenn wir die Augen schließen und versuchen uns das Wahrgenommene weiter vorzustellen. Das Bild zerfällt dann in Objekte, und diese zerfallen in ihre Eigenschaften.
Daß der Mensch in seiner Vorstellung nicht wirklich ein Bild, sondern lediglich die Gestaltbegriffe der wahrgenommenen Objekte zu behalten vermag, hat seinen Grund in der Aufgabe, die seinem visuellen System ursprünglich zukam. Es dient dem Erkennen und nicht dem Abbilden oder Nachbilden der Welt. Um Objekte wiederzuerkennen, ist ein Vermerk ihrer Eigenschaften und Formmerkmale sinnvoller als die Abspeicherung einer konkreten Kontur.
Bilddaten, wie zum Beispiel die Koordinaten aller Punkte, die auf einer Objektkontur liegen, werden nie wieder in identischer Weise zu empfangen sein und sind somit dem Erkennen nicht dienlich. Außerdem würde deren Aufzeichnung wesentlich mehr Speicherplatz beanspruchen als die Beschreibung eines Objektes durch die Liste einiger Eigenschaften und Formmerkmale sowie deren Ausprägungsgrad.
So gesehen verfügt das Gehirn nur über die Netzhautbilder, die präsent sind, solange wir die Augen geöffnet haben. Geistig abspeicherbar ist dieser Zustand normalerweise nicht. Nur solange etwas vor uns ist, kann das scharfe Bildzentrum nacheinander alle Details abtasten, nicht jedoch in der Vorstellung.

Im visuellen Vorstellungsvermögen werden Objektinformationen also durch Eigenschaften vermerkt. Dazu kommen noch Regeln, die beschreiben, auf welche Weise alles zusammenhängt. Die Information ist somit nicht mehr in ihrer bildhaften Form vorhanden. Das erklärt, warum es so schwer ist, eine Zeichnung des Gesehenen anzufertigen. Wir verfügen nur über Merkmale. Wir wissen, ob etwas dreieckig, recht-eckig, kreisförmig oder oval, lang oder kurz war. Eine aus diesem Wissen hervorgehende Zeichnung ist weit weg vom Original. Es erfordert viel Mühe, über solche schematische Skizzen hinaus zu kommen. Auch hier führt der Weg über zunehmende Differenzierung vom Abstrakten zum Konkreten.
 
 

Rechtfertigung der Vorgangsweise
 

Ich habe auf den vergangenen Seiten begründet, warum ich die Erklärungen zum visuellen Erkennen des Menschen nicht an der bewußten Seite des Denkens, sondern an der Netzhaut beginnen will. Den "Top down-Einfluß 4* von Erwartungen und Wünschen auf die Wahrnehmung will ich vorerst unbehandelt lassen. Damit stelle ich mich gegen den Zeitgeist, der darin besteht, angelehnt an den Konstruktivismus, diese Einflüsse besonders zu betonen. Arbeiten wie der vorliegenden wird eine reduktionistische Vorgangs-weise vorgeworfen. Angesichts solcher Vorwürfe stellt sich die Frage, wie wesentlich es ist, mit den Erklärungen an der richtigen Stelle zu beginnen. Ich will im folgenden zeigen, daß es von der Erklärungsrichtung abhängt welcher Ausschnitt des Ganzen betrachtet wird, die Exaktheit von Beobachtungen jedoch von der Richtung der Betrachtung unbeeinflußt bleibt:
 
 

Die Erklärungsrichtung bestimmt den Ausschnitt der Betrachtung
 

Rupert Riedl zeigt in seinem Buch "Die Spaltung des Weltbildes", daß dem Menschen unabhängig davon, was erklärt werden soll, immer zwei Wege der Erklärung offen stehen: Der eine Weg achtet darauf, was eine Sache antreibt bzw. aus welchen Untersystemen sie besteht; im anderen Erklärungsweg wird darauf Wert gelegt zu erfahren, welchem Zweck die Sache dient bzw. welchen Obersystemen sie zugeordnet werden kann.

Ein ideales Beispiel, um dies zu veranschaulichen, findet sich in evolutionstheoretischen Erklärungen über den Werdegang des Lebens.
Einerseits läßt sich ein Einfluß der Umwelt (Obersystem) auf die Lebewesen (Untersysteme) beobachten, andererseits entstehen neue Umwelten aus veränderten Lebewesen.
So gibt es einen materialistischen Erklärungsweg, der die Veränderungen der Umwelt auf die Aktionen der Lebewesen zurückführt und deren Verhalten aus deren Untersystemen, wie Hormonhaushalt und anderen molekularen Reaktionen, bis hin zu atomaren Gesetzmäßigkeiten ableitet =Antriebsursachen. Dem gegenüber steht der finalistische (teleo-logische) Erklärungsweg, der die genetische Veränderung der Lebewesen (molekulare Reaktion) auf die Selektion durch die Umwelt zurückführt =Zweckursachen. Dabei wird von den Obersystemen (Umwelt) auf die Untersysteme geschossen.

Riedl weist anhand von Beispielen nach, daß diese beiden Erkenntniswege in allen Wissensgebieten möglich sind 5*, jedoch nur nacheinander gedacht werden können. Das ist möglicherweise deshalb so, weil die Wirkeinflüsse in der Natur auch nur Wechselweise tätig sind, sonst würde Evolution keine Zeit benötigen. Viele Wissenschaften vernachlässigen einen der beiden Erklärungswege. Das Beispiel der Evolutionstheorie zeigt, wie bei der Erklärung von Prozessen wechselweise sowohl auf die Wirkeinflüsse aus den Untersystemen als auch auf den Einfluß des jeweiligen Obersystems geachtet werden kann.

Aufschlußreich ist auch die absolute Grenze zu welcher der jeweilige Erklärungsweg führt: Die letzte Antriebsursache, auf die die Naturwissenschaft alles zurückführt ist ungeordnete Energie (wenngleich inzwischen die Erkenntnis um sich greift, daß das Ganze meist mehr ist als die Summe seiner Teile und diese Ursache nicht ausreicht), die letzte Zweckursache der Geisteswissenschaft (oder deren "oberstes System") ist ein ordnender Gott. Was die Beschreibung der Welt betrifft, macht es aber eigentümlicherweise nicht viel Unterschied ob absolute Ordnung oder Unordnung am Anfang des Weltbildes eines Beobachters steht. 6* Denn obwohl ein Zugleich der beiden Erklärungswege nicht denkbar scheint, führen sie doch zum selben Resultat, was das Ergebnis von Beob-achtungen betrifft. Wenn wir Materialisten und Finalisten zum Beispiel über die Richtung befragen, in die die Evolution bisher verlaufen ist, so werden beide erkennen, daß der Prozeß von der Einfachheit zur Vielfalt geführt hat, von einem Universum des Wasserstoffs zum Reichtum des Lebens. Allerdings führen die Erklärungswege zu unterschiedlichen Interessen, was den Ausschnitt betrifft, der beobachtet wird. Für Materialisten ist die kleinste Einheit der Schlüssel für alles Weitere, Finalisten hingegen suchen die Lösung in den Obersystemen. Das führt auch zu Unterschieden bei Zukunftsprognosen. 7*
 
 

Für und Wider der Konzentration auf einen Ausschnitt
 

Wenn wissenschaftliche Erklärungen zu ungewollten Ergebnissen führen, so liegt dies meist nicht daran, daß die wissenschaftlichen Aussagen unexakt waren, sondern daran, daß sie nur einen Ausschnitt der Gesamtzusammenhänge behandelt haben. So kann zum Beispiel ein Energietechniker zeigen, welche Vor- und Nachteile der Bau eines bestimmten Staukraftwerkes bringen wird. Trotz der Exaktheit seiner Voraussagen wird keine sinnvolle Entscheidung möglich sein, wenn das Projekt nicht auch von Ökologen, Biologen, Verkehrsplanern u. a. beurteilt wird. Diese sagen andere Aspekte des Ganzen ebenso richtig voraus, wie der Techniker den technischen Teil.

Wer wissenschaftliche Ergebnisse als Orientierungshilfe für lebenspraktische Entscheidungen nützt, sollte wissen, daß es verhängnisvolle Konsequenzen hat, nur einen Teil des Ganzen zu betrachten. Der Mensch begeht Fehler meist nicht aufgrund von unexakten, sondern aufgrund von unvollständigen Erkenntnissen.
Wenn zur Entscheidung nur ein einziger Blickwinkel (z.B. der des Energietechnikers) herangezogen wird, und in der Durchführung des Projekts ungewollte Konsequenzen auftreten (z.B. Aussterben von Tierarten), so wird der Wissenschaft im allgemeinen vorgeworfen, sie hätte wieder versagt. Dieser Vorwurf ist nicht gerechtfertigt. Dem Wissenschafter muß es erlaubt sein, sich auf einen bestimmten Themenbereich zu spezialisieren, den er möglichst exakt behandelt. Sein Ziel ist die Erkenntnis, nicht aber die Tat.
Auch im Streit zwischen Konstruktivisten und Empiristen geht es vor allem um die zulässige Erklärungsrichtung. Wenn diese, wie gezeigt werden konnte, nur auf den betrachteten Ausschnitt, nicht jedoch auf die Exaktheit der Betrachtung Einfluß hat, so wird die ganze Streiterei aus wissenschaftlicher Sicht hinfällig.
 
 

Kurze programmatische Vorschau
 

Die wissenschaftliche Erforschung der Wahrnehmung ist also zum Teil durch die empiristische Betrachtungsweise beeinflußt, die mit dem Reiz/Reaktions-Schema die Antriebsursachen in den Vordergrund stellen. Demgegenüber beginnt die konstruktivistisch gesinnte Gestaltpsychologie den Erklärungsweg sehr finalistisch bei der fertigen Gestalt. Das in diesem Buch vorgestellte Modell des Erkennens soll die beiden Positionen sinnvoll zusammenführen. Wenn auch in empiristischer Tradition an der Netzhaut begonnen wird (Untersystem), muß doch erkannt werden, daß die Form und Beschaffenheit einer Wahrnehmung durch das verarbeitende System (Obersystem) bestimmt ist. Es ist das Medium, in dem Wahrnehmung entsteht.

 Die Gehirnleistungen, die im folgenden besprochen werden, verlaufen allesamt unbewußt. Das bedeutet, man kann sie nicht an sich selbst beobachten. Allerdings wird in den Exkursen zu den Buchteilen ein erlebbarer Zugang zu diesem dunklen Teil des Gehirns gefunden, der jedem offen steht. Im gestalterischen Tun des Menschen wird Sehen und Handeln rückgekoppelt, und ein Spiegel der Innenwelt tritt zutage. Diese Rückkopplung verläuft folgendermaßen:
Bildnerisches Schaffen entspringt Vorstellungen (Innenwelt) die gestalterisch umgesetzt werden (Außenwelt). Jeder Arbeitsschritt wird durch die Wahrnehmung verfolgt und mit den Vorstellungen verglichen (Innenwelt). Der Vergleich führt zu einem Ergebnis, welches sich auf das weitere Tun (Außenwelt) auswirkt, welches wieder wahrgenommen wird usw..

Eine Zeichnung kann nur einen Bruchteil der Information enthalten, die das Gehirn von der Umwelt aufzunehmen vermag, und zwar jenen Teil, den wir bewußt aufzurufen und wiederzugeben vermögen. Die Art und Weise, in der sich Zeichnung und Realität unterscheiden, wird ersichtlich, da die Zeichnung als Objekt der Außenwelt wieder über die Wahrnehmung aufgenommen wird. Die auftretende Differenz verrät etwas über die Arbeitsweise des Gehirns. Um herauszufinden was sie verrät, ist zuvor eine Hürde zu nehmen. Es muß eine Begrifflichkeit für die auftretenden Unterschiede entwickelt werden. Dazu ist es notwendig, sich ein Modell zu schaffen, das zeigt, wie Objekterkennung vor sich geht. Ob die einzelnen Leistungen vom Gehirn ähnlich oder nur irgendwie analog zu diesem Modell erbracht werden, ist vorerst nicht so wesentlich. Fest steht, daß wir es in jenen Bereichen, wo es gelingt ein Modell zu erstellen, mit nichts Unerklärlichem zu tun haben.

Die Erklärung der Fähigkeit zur Objekterkennung ist ein Teilbereich des Erkenntnisproblems, welches lange genug von seiten der Philosophie mit dem Schleier der Unergründbarkeit verhängt war. Ich denke, dieser Teilbereich hat den Schleier nicht mehr nötig.
 
 

1.Teil
Von Lichtreizen zu Bildinformationen




Der Begriff "Bildinformation" im Titel ist unzureichend, aber es war kein besserer zu finden. Unter Bildinformation werden hier Daten verstanden, die noch nicht den abgebildeten Objekten zugeordnet werden können. Bildinformationen bzw. bildspezifische Daten beschreiben die gegenwärtige Netzhautprojektion. Objektinformationen sind im Gegensatz dazu objektbezogen und müssen die gleichen bleiben, egal in welchem Bild ein Objekt in welcher Weise dargestellt wird.
Es geht in diesem Teil der Arbeit darum, jene Bildinformationen zu erfassen, durch deren Auswertung in einem späteren Teil Objektinformationen erhalten werden können. Objektinformationen beschränken sich auf die von einem Objekt eingenommene Bildfläche. Dementsprechend ist schon jetzt abzusehen, daß für diesen späteren Arbeitsschritt Objektkonturen benötigt werden, um solche Flächen abgrenzen zu können.

Das Erfassen von Objektumrissen scheint somit eine Grundbedingung für das Erkennen zu sein. Bei genauer Betrachtung ist dies jedoch gar nicht so selbstverständlich. So erkennt zum Beispiel ein Einleseprogramm Buchstaben, ohne diese zu konturieren, am Helligkeitsunterschied und an den Koordinaten der Pixel des aufgerasterten Buchstabens. Allerdings stehen solche Programme vor einer viel einfacheren Situation, als sie die Betrachtung eines Bildes mit sich bringt. Eine exakte Eingrenzung ist zum Auseinanderhalten von Buchstaben nicht notwendig, da ihre Position (in einer Linie aufgereiht) klar vorgegeben ist. Es genügt, einen rechteckigen Bildausschnitt geeigneter Größe zu definieren (vergl. Hinton 1993, S. 99).

Die Natur, an der sich unsere visuelle Wahrnehmung entwickelt hat, liefert keine fein säuberlich vorsortierten Einzelreize. Um den Erscheinungen der Natur gerecht zu werden, verfügt unser visuelles System über eine ganze Palette von Abgrenzungsverfahren. Wir konturieren nicht nur Helligkeitsgrenzen, sondern auch Farbwechsel, Entfernungsbrüche, Struktur- und Texturgrenzen sowie Verschiebungen des Projektionsbildes durch Bewegung und Eigenbewegung. Durch Kombination dieser Abgrenzungen können zum Beispiel Objektkonturen von Schlagschatten oder Objektumrisse von Objektkanten unterschieden werden.

In den nächsten Kapiteln geht es um solche Konturerstellungen. Es werden Zellverschaltungen beschrieben, mit denen diese Abgrenzungen erreicht werden können. Sie geben eine Vorstellung davon, wie eine Verarbeitung in Hinsicht auf das Erkennen von Objekten möglich ist. Es ist heute auch schon teilweise erforscht, welche konkreten Prozesse im Gehirn ablaufen. So werde ich mich vor allem in den Anfangskapiteln immer wieder an Ergebnisse der Neurophysiologie anlehnen.

Um spätere ausschweifende Erklärungen zu vermeiden, will ich vor den einzelnen Konturkapiteln noch eine Vorstellung von der Reizleitung im Gehirn vermitteln. (Grundlagen aus: Hubel 1989, ab S. 43)
 
 

Die optische Reizleitung im Gehirn
 

Wenn Gehirnzellen Signale weitergeben, so ist neben der Signalherkunft und dem Signalrhythmus auch die Signaldichte ausschlaggebend. Daß Signale im Gehirn an ihrer Dichte und nicht an ihrer Stärke unterschieden werden hat einen einfachen Grund: Bei jeder Weitergabe eines Signals von Zelle zu Zelle muß dieses neu reproduziert werden. Wäre die Signalstärke ein ausschlaggebender Faktor, so wäre jeder Widerstand in der Leitung und jede ungenaue Weitergabe ein Problem (Stille-Post-Effekt). Deshalb wird die Signalmenge sozusagen in kleine Einheiten oder bildlich gesprochen, in "Pakete" zerlegt. Widerstände wirken sich in einem solchen System nicht mehr aus. Es muß am anderen Ende der Leitung lediglich erkannt werden wie viele "Pakete" gesendet wurden. Genau dieselbe Zahl wird dann produziert und weitergeschickt. Die "Pakete" werden also bei jeder Weiterübertragung erneuert. Das bedeutet, daß das Signal durch die Übertragung nicht an Qualität verliert, sondern diese sogar wieder zurückgewinnt (vergl. Hubel 1989, S. 30).

Genau dasselbe gilt für digital aufgezeichnete Informationen am Computer. Wenn ein Magnetband alt ist und die Null/Eins-Informationen darauf langsam undeutlich werden, so sollte es rechtzeitig überspielt werden. Beim Überspielen werden die Nuller und Einser, soweit sie noch erkannt werden können, durch frische ersetzt, und die Daten haben wieder ihre ursprüngliche Qualität. Im Unterschied dazu wird eine analoge Aufnahme durch jeden Überspielvorgang nur schlechter.
Trotz dieser Erkenntnis werde ich im weiteren Verlauf nicht von Signaldichte, sondern von Signalstärke reden, da dieser Ausdruck mental besser vorstellbar ist. Außerdem kann das Gehirn, abgesehen von dem eben erwähnten Aspekt, durchaus als analoges System verstanden werden.
 
 

Die Anatomie des optischen Systems
 

Abbildung 4 zeigt eine vereinfachte Darstellung der drei Zellschichten in der Netzhaut. Die Rezeptorzellen bilden die lichtempfindliche Schicht. Sie geben die Signale weiter an die Bipolarzellen, und diese geben sie weiter an die Ganglienzellen. Die Axone (Nervenfasern) der Ganglienzellen bilden den Sehnerv.

Interessanterweise trifft das Licht die Netzhaut auf der Seite der Ganglienzellen und muß alle drei Schichten durchstrahlen, um die lichtempfindliche Spitze der Rezeptorzellen zu treffen. Dies hat damit zu tun, daß die Rezeptoren von der anderen Seite her ständig mit dem lichtempfindlichen Sehpurpur versorgt werden müssen.
 
 

Der Film liegt sozusagen verkehrt in der Kamera. An der Stelle, wo die Sehnerven aus dem Augapfel treten, muß die Netzhaut somit unterbrochen werden. An diesem Punkt ist das Auge blind.
Das ist leicht nachzuprüfen. Legen Sie dazu einen Bleistift so in Ihre rechte Faust, daß seine Enden hervorstehen. Dann strecken Sie den Arm durch und drehen die Faust, sodaß sich der Stift horizontal vor Ihren Augen befindet. Schließen Sie das linke Auge und fixieren Sie mit dem rechten das linke Ende des Stifts. Das andere Ende kann jetzt nicht mehr gesehen werden, da es im blinden Fleck liegt (Crick u. Koch 1993, S. 110).

Interessanterweise geht uns dieses Stück Bild im täglichen Leben nie ab. Die Abwesenheit von Information kann uns nur in Zusammenhängen bewußt sein, wo wir gewohnt waren, solche zu erhalten. Es ist notwendig, zwischen der Abwesenheit von Information und dem Bewußtsein über die Abwesenheit von Information zu unterscheiden. Dies trifft auch auf die weiteren Kapitel zu. Alles, was im folgenden über die Verarbeitung der Signale im Gehirn geschrieben wird, erscheint angesichts unseres eigenen Welterlebens absurd oder zumindest weit hergeholt, denn nichts davon geschieht unter Aufsicht unseres Bewußtseins.

Der blinde Fleck kennzeichnet also jene Stelle, an der der Sehnerv das Auge verläßt. Abbildung 5 zeigt die weitere optische Reizleitung im Gehirn. Das Netzhautbild jedes Auges wird vertikal in zwei Hälften geteilt. Die beiden linken Bildhälften werden in der linken, die rechten in der rechten Gehirnhälfte verarbeitet. Da die Netzhautprojektion seitenverkehrt ist, werden Gegenstände, die im rechten Bereich des Gesichtsfeldes zu sehen sind in der linken Gehirnhälfte verarbeitet, und Objekte, die sich links befinden landen im Gehirn rechts.

Nicht nur die Bildverarbeitung, sondern auch die Motorik der linken und rechten Körperhälfte findet in der jeweils anderen Hemisphäre statt. Das hat sich vermutlich deshalb so entwickelt, weil es günstig für die optische Kontrolle der Motorik ist und weil kürzere Nervenleitungen die Reaktionszeit verkürzen. Natürlich gibt es auch den Weg über eine Gehirnhälfte in die andere. Geisteskranke (hauptsächlich Epileptiker), denen aus medizinischen Gründen diese Verbindung zwischen den Gehirnhälften durchtrennt wurde (split Brain), sind verblüffenderweise dadurch unter normalen Lebensumständen nicht auffällig benachteiligt. Gezielte Testverfahren bringen jedoch eine große Zahl an Problemen ans Tageslicht (Kolb 1996, S. 151).
 
 

Die erste Zusammenführung der Bildsignale beider Augen erfolgt, wie aus Abbildung 5 zu entnehmen ist, in den seitlichen Kniekörpern. Hier enden die Sehnerven. Jedes Auge spaltet seine Information in drei Zellschichten pro Kniekörper auf, die den drei Schichten des anderen Auges deckungsgleich gegenüberstehen; es gibt also sechs Lagen pro Kniekörper. Es ist anzunehmen, daß die drei Schichten das Bild in unterschiedliche Verarbeitungsprozesse trennen (Hubel, Wiesel 1987, S.40).

 Die Kniekörper leiten die Signale schließlich zum primären Sehfeld. Die Bildzentren, in denen unser Sehvermögen schärfer ist, beanspruchen hier mehr Platz als das Umfeld. Abgesehen von dieser Verzerrung bleibt aber der Bildzusammenhang, wie auch schon in den Kniekörpern, erhalten. Das primäre Sehfeld ist ein Teil der Großhirnrinde. Es besteht aus Schichten und bietet genug Platz für komplexere Verarbeitungsschritte.

Letztendlich ergibt sich allerdings die Frage, warum diese Verarbeitung gerade im Hinterkopf stattfindet und die Sinnesreize somit vorher das ganze Gehirn durchqueren müssen. Der Grund dafür ist wahrscheinlich kein rationaler. Es dürfte sich eher um eine der vielen entwicklungsgeschichtlichen Notlösungen handeln, die die Biologie zu nennen weiß. Für unsere frühesten tierischen Vorfahren war kein exaktes Anvisieren, sondern ein Rundumblick wichtig. Die Augen waren seitlich, und dahinter hat sich der Gehirnbereich für die visuelle Ausarbeitung entwickelt. Die Evolution kann nur langsam verwandeln, nicht aber radikal umändern. So wanderten die Augen nach vorne, das Gehirn jedoch konnte sich nicht umdrehen (Riedl 1984, S. 173).

Die langen Sehnerven können bei einem Signalfluß von etwa 5 m/s (vergl. Hubel 1989, S. 28) durchaus als eine Notlösung bezeichnet werden, (so ist die Reaktionszeit eines Menschen gegenüber einer Fliege, welche nur über kurze Nervenleitungen verfügt, vergleichsweise lang). Sie sind ein Hinweis darauf, daß die Evolution kein Endziel kennt und somit immer nur mit dem Vorhandenen weiterbauen kann. In dieser Hinsicht hat der Mensch als Schöpfer einen Vorteil. Deswegen baut er auch nicht krumm, sondern geradlinig.
 
 

1. Konturkapitel: Helligkeitsgrenzen
 

Die erste Konturausarbeitung findet bereits auf der Netzhaut statt. Es handelt sich hierbei vor allem um Helligkeits- und Farbgrenzen, und es wird auch schon Vorarbeit zur Bewegungswahrnehmung geleistet.
Um überhaupt eine sinnvolle Helligkeitsauswertung zu erreichen, muß das Gesamtlicht, das auf die Netzhaut auftrifft, einigermaßen konstant gehalten werden. Diese Notwendigkeit trifft auch auf den Film eines Fotoapparates zu. Wenn wir eine weiße Buchseite mit schwarzer Schrift im Schatten und ein zweites Mal in prallem Sonnenlicht fotografieren, so werden die Bilder nur deshalb gleich, weil der Apparat über Blenden- und Zeitautomatik die Menge des einfallenden Lichtes relativ zur Lichtempfindlichkeit des Films konstant hält.

Wird die Automatik abgeschaltet und für beide Bilder die gleiche mittlere Einstellung gewählt, so wird ein dunkles und ein helles Foto entstehen. (Der Versuch sollte mit Diapositiven gemacht werden, da Fotos im Entwicklungsprozeß gegengefiltert werden.) Dies entspricht zwar den wahren Lichtverhältnissen, aber nicht die Lichtverhältnisse, sondern die Objekte sollen erkannt werden, und in dieser Hinsicht ist es günstig, daß deren Eindruck konstant gehalten wird. Objektivität hat zwei Gesichter. Wäre unser Auge so "objektiv" wie ein Belichtungsmesser, so könnten wir die meiste Zeit gar keine Objekte erkennen. Deshalb verfügt auch das Auge über eine Blende, die die Menge des einfallenden Lichtes regelt, bekannt als Iris.

Legen wir die Buchseite halb in den Grenzbereich von Schatten und Sonnenbestrahlung, so ist es dem Fotoapparat nicht mehr möglich, den Objekteindruck unabhängig von den Lichtverhältnissen aufzuzeichnen. Unser visuelles System kann diesbezüglich mehr. Uns erscheint die Buchseite auch in dieser Situation immer noch als durchgehend weiß mit schwarzer Schrift. Bereits in den drei Zellschichten der Netzhaut wird eine erste Vorarbeit zur getrennten Verarbeitung von Beleuchtungseffekten und Objektgrenzen geleistet. Wie diese funktioniert soll im folgenden Kapitel erläutert werden:
 
 

1.1. Vorbereitung des Bildes für die Kontursysteme
 

Wie kann die Schrift auf einer Buchseite, über die ein unscharfer Schatten fällt, richtig abfotografiert werden? Belichtet man den Schattenbereich richtig, so erscheint im Licht die Schrift unleserlich blaß, belichtet man die hellen Bereiche richtig, so erscheint das Papier im Schattenbereich grau. Noch größere Probleme treten oft bei Landschaftsfotos auf, insbesondere bei schönen Himmelsstimmungen im Gegenlicht. Belichtet man den Himmel richtig, so erscheint die Landschaft am Foto schwarz, im umgekehrten Fall ist der Himmel weiß.

Es gibt jedoch eine relativ einfache Lösung, um die beiden Extreme zu vereinen:
Spanne ich als Filter ein großformatiges, unscharfes S/W-Negativ derselben Bildsituation vor die Kamera, so ist das Problem gelöst. Am stark unscharfen Bild sind nur zwei Bereiche zu erkennen. Der helle Bereich des Himmels wird am Negativ dunkel erscheinen und nimmt in diesem Bereich Licht weg. Damit ist ein bildbereichsspezifischer Belicht-ungsabgleich erreicht worden.

Auch die Fotorezeptoren des Auges können kein beliebig großes Helligkeitsspektrum verarbeiten. Es ist inzwischen bekannt, daß das Auge dieses Problem ebenfalls mit Hilfe einer Unscharfmaske löst. Im Zellsystem der Netzhaut wird Unschärfe dadurch erreicht, daß jede Zelle jener Ebene auf der das unscharfe Reaktionsbild entstehen soll jeweils Signale von einer Gruppe benachbarter Rezeptorzellen erhält und diese Signale mittelt. In Frage kommen hierbei die sogenannten Horizontalzellen der Netzhaut. Sie stehen in direktem Kontakt mit den Fotorezeptoren und könnten somit deren Lichtempfindlichkeit beeinflussen. Außerdem entspricht ihr rezeptives Feld von der Größe her dem rezeptiven Feld innerhalb dessen ein bereichsspezifischer Helligkeitsabgleich stattfindet (Hubel 1989, S. 61).

Bekannt geworden ist dieser Helligkeitsabgleich unter dem Begriff "Simultankontrast", weil ursprünglich angenommen wurde, der Kontrast werde zur Kontur hin erhöht. Meiner Ansicht nach handelt es sich jedoch eher um einen Prozeß, der dazu dient, die Helligkeit größerer Flächen anzugleichen, so daß, wenn wir auf das Beispiel mit dem stimmungsvollen Himmel zurückgreifen, der Himmel nicht mehr so weiß, und die Landschaft nicht mehr so schwarz erscheint. So werden innerhalb der Fläche "Himmel" und der dunkleren Fläche "Landschaft" wieder Helligkeitsdifferenzierungen möglich, das bedeutet, es kann etwas wahrgenommen werden.

Daß diese beiden Interpretationen des Simultankontrastes sich keineswegs wider-sprechen ergibt sich aus deren Simulation. Farbtafel 1 zeigt unter anderem ein Bild, das zu 45% mit seinem unscharfen Negativ überblendet wurde, wobei es an Kontrast verliert, der ihm nachträglich wieder zugeführt wurde. Das Ergebnis ist auf Bild 4 zu sehen. Dieses Ergebnis kann auch erreicht werden, indem man den Kontrast des Bildes vorher um 50% reduziert und dann nur im Umfeld von Konturen verstärkt. Letzteres Verfahren ist im Bereich der computerisierten Bildbearbeitung als Unscharfmaske bekannt. Es entspricht der Vorstellung, die man bisher vom Simultankontrast hatte. Die erste Variante erscheint mir jedoch wahrscheinlicher, da sie direkt im Kontakt mit den Rezeptorzellen zustandekommen könnte, und bei diesem Verfahren der Informationsreichtum des Bildes erheblich erhöht würde.

Um diese Erhöhung des Informationsreichtums zu simulieren, hätte ich allerdings zwei Belichtungen des Versuchsbildes gebraucht. Eine mit richtig belichteten Figuren, und eine mit richtig belichtetem Hintergrund. Ich hätte dann über das Bild mit den richtig belichteten Figuren ein unscharfes Positiv legen können, so daß der Hintergrund völlig abgedunkelt ist; über das Bild mit dem richtig belichteten Hintergrund hätte ich ein unscharfes Negativ gelegt, so daß die Figuren völlig abgedunkelt sind. Die erhaltenen Bilder müssen dann übereinanderbelichtet, bzw. additiv zusammengeführt werden. Das Ergebnis hätte sich von Bild 4 insofern unterschieden, als dort der Hintergrund keine ordentlichen Kontraste mehr aufweist. Im Original ist der Hintergrund so dunkel, daß dort nur mehr Farbvariationen zwischen Schwarz und Dunkelgrau vorkommen. Der nachträgliche Helligkeitsabgleich hat zu einer Aufhellung geführt, das verminderte Kontrastspektrum ist jedoch gleich geblieben. Wenn, wovon ich überzeugt bin, der Simultankontrast bereits vor jeder Weiterverarbeitung durch selektive Beeinflussung der Lichtempfindlichkeit der Lichtrezeptoren zustandekommt, so entsteht ein solcher Kontrastverlust erst gar nicht. Bei Betrachtung des Motivs von Farbtafel 1 würde die Lichtempfindlichkeit der Rezeptorzellen im Bereich des Hintergrundes sofort erhöht, und es könnte dort das gesamte vorhandene Kontrastspektrum wahrgenommen werden.

Unsere Videokameras und digitalen Fotoapparate sind heute noch nicht so weit entwickelt, daß sie einen bereichspezifischen Abgleich direkt an den Rezeptoren vornehmen könnten. So ergibt sich die Frage, wie der Kontrast in den ungünstig belichteten Bereichen nachträglich wieder hergestellt werden kann. Die Antwort darauf ist einfach. Zu helle oder zu dunkle Bereiche dürfen nicht dadurch ausgebessert werden, daß man Licht wegnimmt oder zufügt, vielmehr müssen die in diesen Bereichen zu schwachen oder zu kräftigen Reaktionswerte der Rezeptoren multipliziert oder dividiert werden. Die richtige Simulation des Simultankontrastes ist also mit Addition oder Subtraktion von Reaktions-werten nicht zu erhalten.

Dieser Erkenntnis entsprechend habe ich auf Farbtafel 2 einen neuen Weg der Simulation beschritten. Es zeigt sich, daß der Kontrast im Hintergrund des Versuchsbildes wieder hergestellt wird. So entsteht eine gute Vorlage für spätere Konturverfahren. Natürlich wäre es besser, den Simultankontrast direkt durch Einflußnahme auf die Lichtempfindlichkeit der Rezeptoren zu bewerkstelligen, denn ein nachträglicher bereichspezifischer Kontrastabgleich führt in Bereichen wo zu schwache Reaktionen vorliegen zwar zu einer Verstärkung, es wird aber das Rauschen, das sich durch Ungenauigkeiten in jedem sensorischen System ergibt, mitverstärkt. Dies führt bei späteren Konturverfahren zum Ausfransen der Konturen. Bilderkennende Apparate würden besser mit Videokammeras funktionieren, die über einen eingebauten Simultankontrast verfügen. Nur so könnten sie die Schrift auf einer Buchseite, über die ein unscharfer Schatten fällt, an jeder Stelle optimal lesen.
 
 

Warum dies ohne Simultankontrast nicht möglich ist, läßt sich am besten grafisch darstellen. Abbildung 6 zeigt in der Originalkurve A) schematisch was passiert, wenn ein Schatten über ein beschriebenes Blatt Papier fällt. Die abrupten Wechsel zwischen dem hellen Papier und der dunklen Schrift sind durch die kleinen Wellen in der Linie dargestellt. Man spricht in diesem Fall von einer hohen Raumfrequenz. Die großflächige allmähliche Helligkeitsänderung durch den Schatten zeigt sich in der Darstellung am Schwung der gesamten Kurve. Es handelt sich hierbei um eine niedrige Raumfrequenz.

Der Aufzeichnungsbereich des Films mit dem wir fotografieren ist durch das graue Rechteck dargestellt. Er kennzeichnet den Bereich vom Schwarz bis zum Weiß. Die Kurve übertrifft diesen Bereich jedoch, denn das Schwarz der Buchstaben im Schatten ist sozusagen schwärzer als schwarz, und das Weiß der Buchseite in der Sonne ist weißer als weiß. Dort, wo die Kurve aus dem Aufzeichnungsbereich tritt, werden am Foto Flächen entstehen, die entweder zu dunkel oder zu hell sind um noch lesbar zu sein. Eine Möglichkeit die Lesbarkeit zu verbessern bestünde darin, einen Film zu verwenden der weniger kontrastreich zeichnet. Was dann entsteht zeigt Kurve B). Nun ist zwar alles lesbar, aber nur schlecht, weil der Kontrast zwischen Schrift und Papier schwächer dargestellt wurde als er in der Realität ist. Das Auge verfügt mit dem Simultankontrast über eine bessere Strategie. Es kann durch das beschriebene Unscharf-Negativ-Verfahren über die Horizontalzellen der Netzhaut grobflächig direkt die Lichtempfindlichkeit der Rezeptoren beeinflussen. Diese werden dadurch in dunklen Bildbereichen empfindlicher als in hellen. Dabei wird zwar das Wahrnehmungsvermögen für niedrige Raumfrequenzen beeinträchtigt, aber der größte Informationsreichtum liegt ja ohnehin in den Konturen. Für solche hohen Raumfrequenzen ist nun mehr Platz innerhalb des Aufzeichnungsbereiches (bzw. innerhalb des Reaktionsbereiches der Rezeptorzellen). Das ist aus Kurve C) zu erkennen. Die Schrift kann jetzt auch dann gut gelesen werden, wenn ein Schatten über die Buchseite fällt.

Die Theorie findet ihre Entsprechung in Versuchen zur Wahrnehmung am Menschen. Der Mensch kann mittlere Raumfrequenzen auch noch bei einem geringeren Kontrast wahrnehmen. Niedrige und sehr hohe sind bei niedrigem Kontrast bald schon nicht mehr zu erkennen. Das bedeutet, die gezeigte Fläche wirkt regelmäßig grau (Cambell 1987, S. 138). Hohe Frequenzen (zum Beispiel ein feiner Raster) verschwimmen aufgrund der Auflösungsgrenzen des Auges. Für die mangelnde Verarbeitung niedriger Raumfrequenzen dürfte der Simultankontrast zuständig sein.

Ein analoger Prozeß zum Simultankontrast kommt in der Hifi-Technik schon lange zum Einsatz. Es handelt sich um die Dolby-Rauschunterdrückung. Um zu verstehen wie diese funktioniert, können wir wieder die obige Grafik heranziehen. Der Aufzeichnungsbereich eines Tonbandes ist genauso begrenzt wie jener eines Films. Deshalb muß die Lautstärke so abgestimmt werden, daß sie in den Aufzeichnungsbereich paßt (B). Nun gibt es aber keine unendlich genauen Aufzeichnungsmaterialien. Auf die obige Grafik umgelegt bedeutet das, daß die dargestellten Linien bei der Aufnahme alle auf sagen wir einen Millimeter Höhe verzittert werden. Zu hören ist dieses Zittern als Rauschen. Die Feinheiten der Kurve B) werden in diesem Rauschen untergehen. In Kurve C) sind hingegen die hohen Frequenzen lauter aufgezeichnet als die niedrigen und können in dem Zittern nicht völlig verschwinden. Wird die Dolby-Aufzeichnung abgespielt, so müssen die niedrigen Frequenzen stärker verstärkt werden, um wieder das Originalverhältnis zwischen hohen und niedrigen Frequenzen herzustellen.
 
 

2. Konturkapitel: Konturierung nach Helligkeit

2.1. Konturausarbeitung durch rezeptive Felder
 

Im primären Sehfeld der Großhirnrinde ist das auf die Netzhaut projizierte Bild immer noch in Form eines zusammenhängenden Reaktionsbildes präsent. Allerdings nimmt das Zentrum des Bildes, in dem wir besonders scharf sehen, im Vergleich zum Umfeld wesentlich mehr Platz ein. Das Reaktionsbild ist sozusagen verzerrt. Jeder Zelle der Sehrinde kann eine kleine Gruppe von benachbarten Netzhautzellen zugeordnet werden, auf deren Reizung sie mit bestimmten Reaktionen antwortet. Diese kleine Gruppe von Netzhautzellen mit der die Gehirnzelle verbunden ist, nennt man ihr rezeptives Feld (Zimbardo 1995, S. 175).
Bereits Zellen der seitlichen Kniekörper aber vor allem die meisten Zellen im primären Sehfeld der Hirnrinde zeigen nur dann Reaktionen, wenn eine Kontur auf ihr rezeptives Feld fällt, oder über dieses verschoben wird. Wie sind solche Zellen verschaltet? (Hubel 1989, S. 80).

Es wurde bereits bei der Behandlung des Simultankontrastes erwähnt, daß Zellen mit größeren rezeptiven Feldern ein Bild unschärfer auflösen als solche mit kleineren rezeptiven Feldern. Ein unscharfes unterscheidet sich von einem scharfen Bild nur an den Konturen, denn im inneren gleichmäßig gefärbter Flächen ändert die Unschärfe nichts. Wenn wir ein Bild mit seinem Negativ zu 50% überdecken, gleichen sich die Bilder vollständig aus. Es entsteht ein gleichmäßig graues Bild. Verwenden wir jedoch ein unscharfes Negativ, kommt es an den Konturen nicht zu einer vollständigen Aufhebung. Es entstehen Ränder. Im Grunde haben wir genau diesen Effekt bereits bei der Besprechung des Simultankontrasts kennengelernt, nur wurde dort das Bild nicht vollständig aufgehoben. Außerdem wurde mit größeren Unschärfen gearbeitet.

Es gehört heute zum gut fundierten Wissen, daß auf der Sehrinde ein solches Unscharfverfahren zur Konturfindung genützt wird. In der Neurophysiologie spricht man von Zentrum/Umfeld-Zellen. Auch den Simultankontrast hätte ein Neurophysiologe durch das Zentrum/Umfeld-Modell erklärt. Die Zentrum/Umfeld-Zellen der Netzhaut unterscheiden allerdings von jenen der Sehrinde darin, daß erstere auch innerhalb von hellen Flächen Reaktionen zeigen, wenn auch weniger stark als an der Kontur. Die Z/U-Zellen der Sehrinde reagieren hingegen nur an Konturen. Das zugrundeliegende Verschaltungsprinzip mag in beiden Fällen das gleiche sein, die Funktion der Netzhaut ist jedoch nur eine Bildaufbereitung, während die Z/U-Zellen der Sehrinde Konturfindung leisten. Deshalb will ich den Prozeß hier noch einmal behandeln, doch diesmal in jener Weise erklären, wie er aus der Neurophysiologie bekannt ist.
 
 

Die Zentrum/Umfeld-Verschaltung

Man geht davon aus, daß eine Zentrum/Umfeld-Zelle von einem Umfeld von Zellen beliefert wird, das auf sie hemmend wirkt, während die Zellen im Zentrum des rezeptiven Feldes erregend wirken. Das Umfeld ist größer und entspricht mit seiner groben Auflösung und seiner hemmenden Wirkung dem unscharfen Negativ in der obigen Beschreibung zum Simultankontrast. Das Zentrum hingegen entspicht mit seiner feinen Auflösung dem scharfen Positiv.

Nehmen wir an, das gesamte rezeptive Feld erhält Licht. Dieses Licht führt zu Signalen, die zum Teil über die erregenden Verbindungen des Zentrums, zum anderen Teil über die hemmenden Verbindungen des Umfeldes hereinkommen. Die Z/U-Zelle bleibt so insgesamt ausgeglichen. Das bedeutet, sie reagiert auf helle Flächen nicht. Bei dunklen Flächen kommt es zu einer umgekehrten Polung. Diese bleibt aber ebenfalls insgesamt ausgeglichen, so daß die Zelle auch auf dunkle Flächen nicht reagiert. Aktiv wird die Zelle jedoch an einer Kontur werden. Die Abbildung zeigt schematisch was dort passiert. (vergl. Bierbaumer 1996, S. 321 u. 390, Hubel 1989 S. 50).

Zu einer Erregung der Z/U-Zelle kommt es im Fall einer On-Off-Verschaltung, wenn sich das Zentrum des rezeptiven Feldes im hellen Bereich, aber das Umfeld noch teilweise im dunklen Feld befindet, weshalb es nicht voll hemmen kann. In der umgekehrten Situation kommt es zu einer Hemmung. Befindet sich die Zelle auf der Mitte einer Kontur, so kommt es genauso zu einer Ausgleichssituation wie innerhalb von Flächen.

Die Randbereiche der rezeptiven Felder überlappen sich, so daß ihre Zentren dicht aneinander liegen. Dies ist möglich weil das Signal von Rezeptoren mehrere Z/U-Zellen beliefern kann. So ergibt sich eine Bildauflösung mit der Pixelgröße der Zentren.

Das System konturiert Helligkeitsgrenzen sozusagen beidseitig. Die On-Off-Zentren an der dunklen Seite einer geradlinigen Helligkeitsgrenze werden erregt, während die Zentren an der hellen Seite gehemmt werden. Das Ausmaß der Hemmung und Erregung steigt mit der Kontraststärke der Kontur, bleibt aber bei geraden Konturabschnitten ausgewogen. An Winkelstellen der Kontur kommt es zu einem unausgewogenen Verhältnis. Die Differenz zwischen Erregung und Hemmung bleibt dabei erhalten, allerdings verschiebt sich beides zu einer Seite hin.

Zusammenfassend läßt sich sagen, daß das System über die Helligkeitsdifferenz, die an einer Kontur vorliegt, informiert, unabhängig von der Gesamtbeleuchtung an dieser Stelle. Wenn wir uns noch einmal das Beispiel der Buchseite vor Augen führen, über die ein Schatten fällt, so wird die Helligkeitsdifferenz von Schrift und Hintergrund im Schatten genauso groß sein wie in der Sonne. Das Z/U-Kontursystem wird dementsprechend gleich reagieren.

In Abbildung 8 ist die idealisierte Signalschwankung dargestellt, die sich an einer Helligkeitsgrenze ergibt. Die Hemmung der Zellen ist allerdings im Gehirn nie so ausgeprägt wie die Erregung. Es ist anzunehmen, daß nur der erregende Teil im Gehirn weitergegeben wird. So entsteht im vorliegenden Fall nur an der hellen Seite der Helligkeitsgrenze eine Kontur. Die andere Seite übernehmen gegengleich verschaltete Zentrum-Umfeld-Zellen, deren Zentrum hemmend, und deren Umfeld erregend wirkt. Sie reagieren an der dunklen Seite der Helligkeitsgrenze (vergl. Poggio 1986).

Auf der folgenden Seite wurde das Versuchsbild aus Farbtafel 2 mittels eines Zentrum /Umfeld-Filters konturiert, der helle Flächen mit einer Außenkontur versieht (vergl. Pinz 1994, S. 63). Die Abbildung beweist, daß ein wesentlich besseres Ergebnis zustandekommt, wenn das Bild vorher einen Simultankontrast durchlaufen hat. Allerdings funktioniert dies nur, wenn der Simultankontrast mit größeren Umfeldern (größerer Unschärfe) arbeitet als das Konturverfahren, ansonsten käme es bei der nachträglichen Konturierung zu Doppelkonturen.
Durch die großen Umfelder des Simultankontrastes wird Information aus einem größeren Bereich bezogen, das macht die Konturfindung genauer und vermindert das Rauschen. Rauschen zu vermindern bedeutet einen Gewinn an Information. Es würde den Erhaltungsgesetzen der Physik widersprechen, den Informationsgehalt eines Bildes nachträglich zu steigern. Mit der Information verhält es sich wie mit der Energie. Sie kann nur umgeformt und in sinnvolle Bahnen gelenkt, aber nicht wirklich gewonnen werden. Jene Informationen, auf die das Gehirn zugunsten der Rauschverminderung verzichten muß, werden auf der Netzhaut erst gar nicht aufgenommen. Der Simultankontrast vermindert die Fähigkeit des Auges längere Raumfrequenzen wahrzunehmen. Das bedeutet, großflächigere Farbverläufe werden schwächer empfunden. Für die Objekterkennung ist dies von Vorteil. So erscheinen uns zum Beispiel die Zimmerwände regelmäßig weiß, obwohl sich darauf durch Schattenverläufe starke Helligkeitsdifferenzen ergeben.

Da Kameras keinen bereichspezifischen Einfluß auf die Lichtempfindlichkeit ihrer Rezeptoren ausüben, konnte ich den Simultankontrast nur nachträglich simulieren. So kann das Rauschen nicht verhindert werden, weshalb die Konturen in der Abbildung zittrig und oft unterbrochen erscheinen. Dies wäre bei gleicher Informationsdichte nicht der Fall, wenn man eigene Kameras für bildverarbeitende Computersysteme bauen würde.
 
 

2.2. Konturausarbeitung durch Augenzittern ?
 

Das ständige geringfügige Zittern des Augapfels ist ein Phänomen, das zumindest im Verdacht steht etwas mit der Konturausarbeitung zu tun zu haben. Es dürfte aus einer Notlösung hervorgegangen sein durch die sich die Möglichkeit eröffnet hat, die auf Bewegungswahrnehmung ausgelegten Netzhäute unserer tierischen Vorfahren, auch für die Wahrnehmung starrer Objekte zu nützen. Wie schon weiter oben beschrieben, erkennen die Schlange und auch andere Reptilien Beute und Feind vor allem an deren Bewegung. Ihre Netzhaut reagiert vorwiegend auf Veränderungen (Dithfurth 1980, S. 132). Interessanterweise trifft dies auch auf unsere Netzhäute zu, wir verfügen jedoch über einen Mechanismus, der ununterbrochen für die nötige Veränderung sorgt. Unser Auge führt mit einer Frequenz von 30 bis 150 Herz ständig mikroskopisch kleine Zitterbewegungen aus (Gilchrist 1986).

Als Augenärzte dieses Zittern entdeckten, wußte man noch nicht, wozu es dient. Die einfachste Methode dies festzustellen bestand darin, es auszuschalten. Dies kann geschehen indem das Zittern durch eine optische Vorrichtung kompensiert wird, oder indem die Augenmuskeln durch Injektion von Novokain einige Stunden gelähmt werden.

Wir können uns die Verblüffung der Wissenschafter vorstellen, als sie diese ersten Versuche an sich selbst vornahmen. Sie hatten Einblick in eine völlig andere Welt. Es ist nur noch ein heller Nebel zu sehen, aus dem abrupt immer wieder bewegte Dinge und Gestalten auftauchen, kaum zu erkennen und oft erschreckend, weil der Zusammenhang fehlt (Ditfurth 1980, ab S. 128).

Viele Besitzer von Linsenaugen aus dem Tierreich dürften ihre Umwelt auf eine ähnliche Art sehen, da sie nicht über dieses Augenzittern verfügen. Allerdings können sie sich im Gegensatz zu den Wissenschaftern keiner fehlenden Information bewußt sein.

Wird das Netzhautbild exakt stabilisiert, so kommt es nach etwa einer halben Minute zu dem beschriebenen Sehverlust (Ditfurth 1980, S. 129). Neueren Experimenten von Gilchrist (1987, S. 142) zufolge bereits nach drei Sekunden. Dieser Widerspruch in der Zeitangabe kommt meines Erachtens dadurch zustande, daß im Ultrakurzzeitgedächtnis das Bild noch eine Zeit lang weiter existiert, während auf der Netzhaut bereits keine Reaktion mehr vorliegt. 8*

Die folgenden Überlegungen zeigen, daß ein solches Abschalten von Netzhautbereichen auch unter normalen Bedingungen stellenweise eintreten müßte: Das Bild zittert normalerweise um zirka eine Rezeptorzellbreite hin und her. Dadurch sind die Zellen an den Flächenrändern ständiger Veränderung ausgesetzt. Für Zellen in der Flächenmitte herrschen jedoch dieselben Bedingungen wie beim ruhiggestellten Bild. Sie senden dementsprechend auch in der normalen Situation bald nichts mehr. Adaptionsprozesse dieser Art sind neurobiologisch nachgewiesen. (Kolb 1996, S. 86; vergl. Bierbaumer 1996, S. 322). Es ist jedoch keineswegs so, daß in unserem Bewußtsein im Zentrum regelmäßiger Farbflächen die Farbe nach einiger Zeit verschwindet. Ist ein Bild erst einmal analysiert, so bleibt im Gehirn die Information aufrecht, bis der Blick auf einen neuen Gegenstand fällt und neue Informationen hereinkommen.

So gesehen ist anzunehmen, daß Augenzittern und die Adaption der Sehzellen eher der Erholung der Zellen dienen, als der Erfassung von Konturen. Vielleicht ist es auch einfach als Ausweg der Evolution aus einer Sackgasse zu verstehen. Unsere frühen kaltblütigen Vorfahren waren vor allem am Erfassen von Bewegung interessiert. So entstanden Netzhäute, die vorwiegend auf Veränderung in der Lichtintensität reagieren. Um mit solchen Netzhäuten den unbewegten Teil der Welt erfassen zu können mußte das Augenzittern "erfunden" werden. Als Kontursystem (als solches wird es bei Gilchrist 1987 behandelt) wäre es mit mindestens drei Sekunden Anpassungszeit (Adaptionszeit) zu langsam.

Allerdings könnte es im peripheren Bereich zur Bestätigung der Schärfe von Konturen dienen, denn durch die Feinheit der Zitterbewegung, die das Projektionsbild nur über etwa eine Rezeptorbreite schwingen läßt, reagiert das System nur auf scharfe Helligkeitsbrüche. Das bedeutet scharfe Konturen bleiben noch aktiv, wenn überall sonst bereits Adaption eingetreten ist. Es wäre sinnvoll dieses Phänomen auszunützen, denn das Zentrum/Umfeld-System ermöglicht vor allem im peripheren Bereich, wo die rezeptiven Felder einige tausend Zellen beinhalten, keine Unterscheidung von scharf und unscharf mehr.

Schärfeninformation ist wichtig. An ihr werden sich neben anderen Faktoren Objektgrenzen von Beleuchtungsgrenzen (Schatten) unterscheiden lassen. Dazu mehr im letzten Kapitel dieses Abschnittes, wo gezeigt werden soll, wie die Konturerkennungssysteme miteinander in Zusammenhang stehen und wie jedes System seinen Beitrag zu einer komplexeren Verarbeitung leistet, wie sie zum Beispiel die Ausfilterung von Schatten darstellt.

In Hinblick auf diese Zusammenführung der Kontursysteme werde ich hier noch einmal zusammenfassen, welche Leistungen das Modell bisher erbracht hat.

· Die Blende bringt einen allgemeinen Helligkeitsabgleich.

· Schwache Negativ-Gegenfilterung mit großer Unschärfe bringt einen Ausgleich unterschiedlicher Beleuchtungsbereiche (Simultankontrast).

· Das Zentrum/Umfeld-System reagiert an Konturen bzw. Helligkeitsübergängen und zwar beidseitig. So entsteht eine Seitenzuweisung von hell und dunkel.

· Das Augenzittersystem könnte für die Kennzeichnung scharfer Konturen sorgen.

Mit diesen Kenntnissen darüber wie Helligkeitswechsel im Projektionsbild aufgespürt werden können, sollte es eigentlich nicht schwer fallen, dies auf das Farbensehen zu übertragen. Es wird sich jedoch zeigen, daß das Thema Farbe mehr Rätsel aufgibt als vorweg angenommen werden könnte.
 
 

3. Konturkapitel: Die Farbgrenzen
 

Wie allgemein bekannt, gibt es für die Farberkennung eigene Rezeptoren auf der Netzhaut, die Zapfen. Den größeren Teil der Lichtrezeptoren der Netzhaut bilden allerdings die farbunempfindlichen Stäbchen. Sie arbeiten im Gegensatz zu den Zapfen auch noch bei schwachem Licht. Deshalb sehen wir in der Dämmerung nur schwarz/weiß.
In der Mitte der Netzhaut, wo die Auflösung am besten ist, kommen nur Zapfen vor. Dieses Gebiet von einem halben Millimeter Durchmesser heißt Fovea centralis.

Die Zapfen teilen sich nach der Art ihrer höchsten Empfindlichkeit in drei Sorten: Rot-, Grün- und Blaurezeptoren. Sie reagieren damit jeweils besonders gut auf einen spezifischen Wellenbereich des Lichtes. Warum sich gerade diese Empfindlichkeitsbereiche entwickelt haben, läßt sich nur vermuten. Die Wahl hat wahrscheinlich mindestens ebensoviel mit den Bedürfnissen des sehenden Individuums zu tun wie mit den Eigenschaften der Außenwelt.

Nicht alle Tiere sehen Farben. Die Stärke von Beutetieren liegt meist im Bewegungssehen. Unsere frühesten Vorfahren waren Pflanzenfresser. Ein Grünrezeptor mag ihnen hilfreich gewesen sein für die Futtersuche. Brauntöne sind am zweithäufigsten in der Natur. Sie kennzeichnen Erde, Rinde und vor allem Tiere, die Pflanzenfressern gefährlich werden können. Auf sie reagiert der Rotrezeptor, und noch stärker reagiert er auf das satte Rot frischen Blutes. Blaue Objekte kommen in der Natur selten vor. Allerdings erkennen wir große Entfernungen am atmosphärischen Verblauen. Im Wasser, wo die Farbwahrnehmung vielleicht entstanden ist, tritt der Effekt des Verblauens noch stärker auf. Der Blaurezeptor hilft somit bei der Orientierung.

Wer sich mit bildender Kunst beschäftigt weiß, daß derartige Farbbedeutungen auch im Menschen noch verankert sind. Rot gilt als aggressive, aktive Farbe und sticht hervor, während Blau passiv in den Hintergrund tritt. Grün gilt als ausgewogen. Grünliches Licht soll sogar die Konzentrationsfähigkeit fördern.

Farbbedeutung ist nur eines von vielen ästhetischen Phänomenen, die sich aus der Beschaffenheit unseres Wahrnehmungsapparates erklären lassen. Das ästhetische Empfinden wird in dieser Arbeit somit noch eine wichtige Rolle spielen.

Als nächstes gilt es zu beantworten, wie es von den drei Rezeptoren zu jener Fülle von Farben kommt, die wir wahrnehmen.
An sich wäre es bereits mit zwei verschiedenen Rezeptortypen möglich, Licht vieler verschiedener Wellenlängen zu unterscheiden. Dazu muß sich die Empfindlichkeit der Rezeptoren nur in einem breiten Bereich überlappen. Nehmen wir an, der eine Rezeptor reagiert gut auf lange Wellenlängen, seine Empfindlichkeit nimmt aber kontinuierlich ab, je kurzwelliger das Licht ist. Der andere Rezeptor reagiert umgekehrt, also besser auf kurze Wellen. Auf Licht mit mittlerer Wellenlänge reagieren somit beide Rezeptoren halb. Licht einer etwas stärkeren Wellenlänge wird an einer stärkeren Reaktion des Langwellen-rezeptors gegenüber dem Kurzwellenrezeptor zu erkennen sein. So kann jeder Frequenzbereich innerhalb des Überlappungsfeldes zugeordnet werden (siehe Farbtafel 3). Allerdings sind die Rezeptoren auch noch außerhalb des Überlappungsbereiches empfindlich, ohne daß dort eine genaue Zuordnung von Wellenlängen möglich ist.

Auf natürliche Verhältnisse angewandt hat dieses System wenig Wert. Gegenstände reflektieren nicht jeweils eine einzelne Wellenlänge, sondern oft eine bunte Mischung verschiedener Längen mit unterschiedlicher Intensität. Dies muß in dem Zwei-Rezep-toren-System zu Fehldeutungen führen. Zum Beispiel würde ein Mischlicht aus extrem langen und kurzen Wellen die selbe Reaktion auslösen wie Licht mittlerer Wellenlänge.

In einem Drei-Rezeptoren-System, wie unserem Auge, gibt es einen eigenen Rezeptor für mittlere Wellenlängen. Der letztgenannte Fehler mangelnder Differenzierung kann dort somit nicht passieren. Im Gegensatz zum Zwei-Rezeptoren-System bringt das Drei-Rezeptoren-System aus dem oben genannten Grund einen wesentlichen Vorteil. Es unterscheidet die Mitte des sichtbaren Spektrums von seinen Enden. Weitere Rezeptoren bringen keine so wesentlichen Differenzierungsleistungen mehr und machen das System nur aufwendig. Deshalb hat die Natur meiner Ansicht nach so oft das Drei-Rezeptoren-System gewählt. Allerdings können auch hier in Überlappungsbereichen von jeweils zwei der drei Rezeptoren keine Einzelwellen von Wellenmischungen unterschieden werden. Darin liegt die Basis für die Möglichkeit von Farbmischungen. 9*

Wenn in Farbtafel 5 das Farbspektrum abgebildet ist, so besteht diese Abbildung aus übereinandergedruckten Farben, also Farbmischungen. Diese Abbildung sieht nur für unser Auge, auf das die Mischungen abgestimmt sind, und für Farbfilme, die unserem Auge nachempfunden sind, dem echten Spektrum ähnlich. Ein Physiker, der die dargebotenen Lichtwellen untersucht, wird feststellen, daß im Farbspektrum die Wellenlängen säuberlich nebeneinanderliegen, während die Abbildung aus Mischwellen besteht.

Doch bevor ich näher auf Farben und deren Mischung eingehe, muß noch ein einfacheres Problem gelöst werden: Die Frage, wie es zur Farbhelligkeit kommt.
 
 

3.1. Warum haben Spektralfarben eine verschiedene Helligkeit?
 

Unser Auge verfügt über keinen Fixpunkt, zu dem es die empfangene Helligkeit in bezug stellen könnte. Wir nehmen somit nur die relative Helligkeit von Gegenständen zueinander wahr. Auf den Vorteil, den dies für das Wiedererkennen hat, bin ich bereits im vorigen Kapitel eingegangen (Beispiel mit der Buchseite im Licht und im Schatten). Experimentell ist die Relativierung von Helligkeit leicht nachprüfbar. Ein Lichtfleck in einem dunklen Raum erscheint weiß. Wird ein zweiter, hellerer Lichtfleck danebenprojiziert, so erscheint der erste Lichtfleck grau. Führt man diesen Versuch mit orangem Licht durch, so erscheint der erste Lichtfleck letztlich braun.

Das sind altbekannte Versuche. Mir geht es hier aber um etwas mehr. In der Frage nach der Helligkeit von Spektralfarben äußert sich auf elementarste Weise der Unterschied zwischen dem objektiv Vorhandenen und dem subjektiv Erfahrenen. Es geht um die im Vorwort angesprochene Differenz zwischen Innen- und Außenwelt.
Die objektiv vorhandene Lichtmenge muß nicht mit der subjektiv empfundenen Helligkeit übereinstimmen. So kann zum Beispiel ultraviolettes oder infrarotes Licht nicht als hell empfunden werden, da es außerhalb der Reichweite unserer Rezeptoren liegt. Aber auch innerhalb des sichtbaren Bereichs kann die empfundene Helligkeit der Farben zueinander nicht automatisch gleichgesetzt werden mit der von ihnen objektiv reflektierten Lichtmenge.

Nehmen wir an, wir haben mit einem Glasprisma weißes Licht gespalten und die einzelnen Wellenlängen, aus denen es besteht, liegen säuberlich getrennt vor uns. Beim Blick auf dieses Lichtspektrum erscheinen uns einige Farben heller als andere. Die Frage ist nun, ob in diesen Wellenbereichen wirklich mehr Licht da ist, oder ob wir nur mehr Licht sehen.

Wenn wir das Spektrum mit einem Schwarzweißfilm fotografieren, so wird der gelbe Bereich nicht mehr durch seine Helligkeit hervorstechen. Noch besser kann der Unterschied zwischen dem, was zu sehen ist, und den physikalischen Gegebenheiten veranschaulicht werden, wenn wir die empfundene Lichtmenge in einer Kurve darstellen, und dieser Kurve die reale Lichtmenge (Hubel 1992, S. 166), welche die Menge der eintreffenden Photonen pro Zeiteinheit mißt, gegenüberstellen. Beides zeigt schematisch Farbtafel 3, Fig. a und Fig. c.

Zu Figur c muß bemerkt werden, daß die Kurve, welche die empfundene Lichtmenge veranschaulicht, nicht durch Befragung von Testpersonen ermittelt wurde, sondern auf das Wissen um die Empfindlichkeit der der Zapfen zurückgeht. Fig. d zeigt, auf welchen Frequenzbereich des Lichtes die drei Zapfensorten ansprechen (aus Farbe in Theorie und Praxis 1994, S. 8). Addiert man die drei Kurven zu einer einzigen, so kommt man zu Fig. c, die in etwa dem subjektiven Farbhelligkeitserlebnis des Farbspektrums entspricht. Damit haben wir an diesem Beispiel erstmals eine Brücke zwischen neurophysiologischen Beobachtungen an einzelnen Rezeptoren (Zapfen) und dem subjektiven Erleben geschlagen. Es kann klar gezeigt werden, warum Gelb, aber auch Cyanblau als helle Farben empfunden werden.
In diesen Bereichen reagieren jeweils zwei der drei Zapfensorten. Das hat bei der Addition der Kurven (von Fig. d zu Fig. c) dazu geführt, daß dort Spitzen entstehen. 
 
 

3.2. Die Grundfarben
 

Eine im Farbspektrum nicht enthaltene Farbe ist Magentarot. Sie entsteht dann, wenn gleichzeitig der Rot- und der Blaurezeptor angesprochen werden. Dies geschieht, wenn kurze und lange Wellenlängen gemischt vorkommen.

Magentarot, Cyanblau und Gelb sprechen also jeweils zwei der drei Rezeptorzellen an, der dritte aber nicht. Diese Rezeptorenmischreaktion mag verwundern, denn alle drei werden als besonders reine Farben empfunden. Auf Weiß, welches uns am allerhellsten erscheint, sprechen sogar alle drei Rezeptoren gleichzeitig an. Es gilt also: Umso heller eine Farbe ist, desto mehr Reaktion wird sie bei den Rezeptorzellen bewirken.

Magenta, Cyan und Gelb sind die drei Grundfarben der subtraktiven Farbmischung. Dieses Mischverfahren arbeitet mit Überlagerung von Farbfiltern oder Farbschichten. Wenn das Licht Farbschichten durchdringt, wandelt sich ein Teil des Spektrums in Wärme um. Es geht also bei jeder Filterung Licht verloren. Bei der subtraktiven Farbmischung durchläuft das Licht mehrere Filter, und so ist die gemischte Farbe immer dunkler als deren Ausgangsfarben. Konträr dazu entsteht die additive Farbmischung durch Übereinanderstrahlen von farbigem Licht, zum Beispiel bei Spiegelungen, oder wenn sich die Lichtkegel bunter Scheinwerfer überlappen. Im Überlappungsbereich addiertsich das Licht. Die Mischfarbe ist in letzterem Fall also immer heller. Sie läßt sich aber aus der subtraktiven Mischung ableiten, wenn man dem Mischergebnis den Schwarzgehalt entzieht (siehe Farbtafel 4).

Was den Zusammenhang der additiven und subtraktiven Farbmischung betrifft treten bis heute immer wieder Irrtümer auf, die sich meines Erachtens sogar in moderne Computerprogramme zur Bildbearbeitung geschlichen haben. Die additive Farbmischung wird meistens korrekt simuliert. Man kann zum Beispiel zwei graue Flächen erstellen, diese übereinanderschieben und eine additive Überlagerung wählen. Sind die beiden Grauwerte negativ zueinander, so entsteht insgesamt Weiß. Um verständlich zu machen, warum das so richtig ist, will ich kurz erklären, was unter einem negativen Grauwert verstanden wird. Nehmen wir an, alle Grauwerte werden in Zahlen von null bis eins beschrieben (0= Schwarz, 1= Weiß), so kann der jeweilige negative Grauwert einfach dadurch berechnet werden, daß man den Ausgangsgrauwert von 1 abzieht. Das negative Grau zu einem Grauwert von 0,7 ist also 1-0,7=0,3. Additiv ergibt jede Farbe mit ihrem Negativ Weiß. Zum Beispiel: 0,7+0,3=1.

Die Verwirrung beginnt bei der subtraktiven Farbmischung. Angeblich sollte eine Farbe die mit ihrem Negativ subtraktiv gemischt wird Schwarz ergeben. 0,7-0,3 ist aber nicht 0! Die Programmierer sind dieser Verwirrung offensichtlich damit begegnet, daß sie unter dem Begriff der subtraktiven Mischung eine invertierte additive Mischung eingegeben haben. (Das entnehme ich aus Ergebnissen, die ich beim Test mehrerer Computer-programme erhalten habe.) Dabei werden die beiden zu mischenden Farben erst einmal beide invertiert, dann addiert und das Ergebnis wird wieder invertiert. (Zahlenwerte unter 0 und über 1 sind nicht darstellbar.) Das Endergebnis simuliert die subtraktive Farbmisch-ung aber keineswegs korrekt:

Bei der subtraktiven Mischung ist das Ergebnis zwar immer dunkler als die Ausgangs-farben, genaugenommen wird dabei aber kein Licht abgezogen, sondern wegdividiert. Man kann sich das wie bei der Überlagerung von Zufallspunktmustern vorstellen. Nehmen wir an, ein Zufallspunktmuster enthält zur Hälfte schwarze und weiße Punkte und entspricht von der Ferne betrachtet einem mittleren Grau. Nun drucken wir mit schwarzer Farbe ein weiteres solches Muster über das erste. Es ist danach keineswegs alles schwarz. Vielmehr wird die Lichtmenge ein weiteres Mal halbiert. Die subtraktive Farbmischung sollte also genaugenommen "divisionale Farbmischung" heißen. Wenn zwei mittlere Grau zusammen nicht Schwarz ergeben, so gibt es auch keine subtraktive Komplementärfarbe zu Grau (wohl aber eine additive).

Auch in Computerprogrammen zur Fotoretusche kann man Farben miteinander dividieren und multiplizieren. Allerdings stößt man hier gleich auf die nächste unglück-selige Verwirrung. Die Farben werden beim Dividieren heller, und beim Multiplizieren dunkler. Der Grund dafür liegt darin, daß im Basisprogramm Farben in Zahlen von 0 bis 1 beschrieben werden. Multipliziert man zwei solche Bruchzahlen, so ist das Ergebnis immer kleiner als die Ausgangszahlen. 0,5*0,5=0,25. Das entspricht der subtraktiven Farbmischung. Diese wird in solchen Programmen also nicht durch Subtraktion oder Division, sondern Multiplikation richtig simuliert.

Wenn man im Programm eine Farbe auswählt bekommt man Zahlenangaben für den roten, grünen und blauen Kanal, wobei hier ganze Zahlen von 0 bis 255 verwendet werden. Meines Erachtens ist das widersinnig, denn intern arbeitet das System mit Zahlen von 0 bis 1. So erhält der User völlig unverständliche Zahlenergebnisse bei Multiplikationen und Divisionen. Ich bedaure solche Ungereimtheiten, denn Bildpro-gramme wären ein perfektes Medium, um darin eine korrekte Farb-theorie umzusetzen.

Eine Farbenlehre mit Beschreibungen von selbst durchführbaren Experimenten zum Lichtspalten findet sich im Anhang. Ich habe sie dieser Arbeit beigefügt, weil sie zum Verständnis des folgenden Abschnitts notwendig ist. Falls dem Leser im folgenden Textabschnitt einiges widersprüchlich erscheint, bitte ich, im Anhang nachzuschlagen. An dieser Stelle möchte ich mich auf eine kurze Erläuterung des Frabenmischens beschränken. Die Darstellungen dazu befinden sich auf Farbtafel 5. Es gibt drei Arten der Farbmischung: die additive, die subtraktive und die Optische Farbmischung. Das Ergebnis einer optischen Mischung zweier Ausgangsfarben liegt im Farbwert immer zwischen der additiven und subtraktiven Mischung. Während die subtraktive Mischung, die Überlagerung von Farbfiltern, mit einem Helligkeitsverlust einhergeht, wird bei der additiven Mischung, der Überlagerung von Lichtkegeln, die Mischfarbe heller erscheinen, und bei der optischen Mischfarbe wird es zu einer Durchschnittshelligkeit der beiden Ausgangsfarben kommen. Die Farbtagel zeigt, was passiert, wenn man die Grundfarben verlaufend mischt. 10* Die additive Mischung hat Grundfarben auf die jeweils nur ein Zapfen anspricht (Rot, Grün und Violettblau) und durch Mischung werden Töne erreicht, auf die mehrere Zapfen reagieren, während auf die subtraktiven Grundfarben (Gelb, Cyan und Magenta) jeweils zwei Zapfen ansprechen und durch Mischung Töne erreicht werden, auf die immer weniger Reaktion erfolgt. So lassen sich additiv die subtraktiven Grundfarben mischen und umgekehrt. Die Abbildung zeigt auch, wie die Farbmischungen mit dem RGB-Würfel in Zusammenhang stehen, der auf Farbtafel 8 abgebildet ist. 6 Ecken des Farbwürfels repräsentieren die Grundfarben, die restlichen Beiden bleiben für Weiß und Schwarz. Der Wellenbereich einer additiven Grundfarbe deckt sich nicht notwendigerweise mit dem Spektralbereich an dem der jeweilige Zapfen seine größte Empfindlichkeit hat ! (siehe Anhang). Daß es hier eine Differenz gibt wird selten berücksichtigt und hat zu viel Verwirrung in der Farbenlehre geführt.

Übrigens beweist die Darstellung zur subtraktiven Farbmischung auf Farbtafel 5, daß jede beliebige Farbe auch mit den richtigen zwei der drei Grundfarben und  Schwarz und Weiß nachgemischt werden kann. Da ja ohnehin die zugeführte dritte Farbe mit einem bestimmten Prozentsatz der ersten beiden zu Schwarz würde kann man sie gleich durch Schwarz ersetzen? Jeder kann beim Farben nachmischen ausprobieren, daß dies möglich ist.
Zur Mitte der Abbildung hin überlagern sich alle drei subtraktiven Grundfarben. Dort entstehen keine weiteren Spektralfarben mehr, vielmehr verlieren die Farben zur Mitte hin zunehmend an Helligkeit. Wir erleben Farbe und Helligkeit als etwas Verschiedenes. Eine getrennte Verarbeitung ist auch in Hinsicht auf die Objekterkennung notwendig. Einfärbige Objekte weisen in ihrem Projektionsbild auf der Netzhaut an ihren Licht- und Schattenseiten verschiedene Helligkeiten auf. Um das Objekt als Einheit zu erleben, muß Farbe helligkeitsunabhängig erfaßt werden. Wie aber kann eine solche Konstanzleistung erbracht werden?
 
 

3.3. Die Trennung von Farbe und Helligkeit
 

Die meisten Konstanzleistungen basieren auf folgendem Prinzip: Es werden im Gehirn nicht einfach die Meßwerte, also die Reaktonsintensitäten der Sinneszellen verzeichnet, sondern Sinnesdaten, die der gleichen Inkonstanz erliegen, werden im Verhältnis zueinander erfaßt. Am Beispiel von Licht und Schatten kann gezeigt werden, warum dies zu konstanten Daten führt.

Schatten und Licht führen auf einem Objekt räumlich verteilt zu unterschiedlichen Helligkeitswerten. Die Eigenbewegung vieler Objekte bringt auch noch eine zeitliche Varianz der Helligkeit hinzu. Solche Helligkeitsinkonstanz betrifft alle drei Zapfensorten gleichermaßen. Das Verhältnis ihrer Reaktionswerte zueinander bleibt daher über das ganze Objekt hinweg gleich. Das bedeutet:
Wenn im hellen Bereich die Reaktion des blauen Zapfens 12, die des roten 3 und die des grünen 6 ist, und im dunklen Bereich des Objekts reagiert der blaue mit 8, der rote mit 2 und der grüne Zapfen mit 4, so ist doch in beiden Fällen das Reaktionsverhältnis der Zapfen zueinander 4:1:2. Dieses Verhältnis beschreibt somit den Farbwert unabhängig von dessen Helligkeit. Auch im Gehirn gibt es Zellen, die das Verhältnis der Zapfenreaktionen zueinander erfassen, die sogenannten Gegenfarbenzellen. Wie diese arbeiten ist auf Farbtafel 8 erklärt.
 
 

3.3.1. Die Gegenfarbenzellen
 

Genaugenommen genügen zwei Werte um die Reaktionsverhältnisse der drei Zapfensorten vollständig zu beschreiben. So wurden in den seitlichen Kniekörpern Gegenfarbenzellen gefunden, die das Verhältnis zwischen benachbarten Rot- und Grünrezeptoren erfassen (auf manche wirken Grünrezeptoren erregend und Rotrezeptoren hemmend, auf andere umgekehrt), andere Gegenfarbenzellen erfassen das Reaktionsverhältnis von Rot+Gün gegenüber den blauen Zapfen (auch wieder gegenpolig). Rot+Grün ergibt additiv Gelb. Die letztgenannten Gegenfarbenzellen erfassen also das Verhältnis von gelben zu blauen Lichtanteilen (vergl. Hubel 1989, S. 184 und Goldstein 1997, S. 139).

Im Quadrat von Farbtafel 6 wurden die Farben schematisch so angeordnet, daß auf die horizontalen Farbunterschiede nur die Rot/Grün-Gegenfarbenzellen unterschiedlich reagieren, während die Gelb/Blau-Gegenfarbenzellen nur auf die vertikale Achse ansprechen. Damit beschreibt die Reaktion der beiden Gegenfarbenzelltypen auf ein empfangenes farbiges Licht genau die Koordinaten, welche die empfangene Lichtfarbe im dargestellten Farbrechteck einnimmt. Zur Mitte des Farbrechtecks hin verlieren die Farben an Sättigung. Dies wird symbolisch durch das Grau dargestellt. Ich hätte hier genauso gut in Schwarz oder Weiß übergehen können, die ebenfalls keine Sättigung aufweisen, und daher zumindest theoretisch ebenfalls dazu führen, daß die Gegenfarbenzelle weder gehemmt noch aktiviert wird. 11* Gegenfarbenzellen eignen sich also nicht dazu Helligkeit zu unterscheiden. Darin liegt aber auch ihr Wert, denn sie erfassen Sättigung und Farbton unabhängig von Beleuchtungsschwankungen. So können Objekte trotz ihrer Schattierung als Einheit erkannt und unter verschieden hellem Licht wiedererkannt werden.
 
 

3.3.2. Die zwei Arten von Komplementäreffekten:
 

Die Gegenfarbenzellen wurden gelegentlich für den Komplementäreffekt verantwortlich gemacht. Ich stimme mit Hubel (1989, S. 187) überein, daß dies ein Irrtum ist, wenngleich ich meine Ansicht anders begründe. Wir müssen zwischen zwei Komplementärirritationen unterscheiden: Zum einen sind da die Komplementärnachbilder. Es handelt sich dabei um ein Adaptionsphänomen der Netzhaut, die die Empfindlichkeit der Zapfen lokal darauf abstimmt, wieviel Licht sie in den letzten Minuten erhalten haben. Wir haben dieses Adaptionsphänomen schon bei dem Phänomen des Augenzitterns behandelt. Es arbeitet langsam. Die Anpassung erreicht erst nach einer Minute oder mehr ihr Maximum. Die Gegenfarbenzellen hingegen geben Farbinformationen an das Gehirn weiter und arbeiten somit schnell.

Außerdem schließt die aus neurophysiologischen Studien ergründete Reaktionsweise der Gegenfarbenzellen genaugenommen eine Beteiligung dieser Zellen an den Komplementär-Nachbildern aus: Gegenfarbenzellen, die auf rotes licht ansprechen reagieren nämlich gegenpolig auf grünes Licht (vergl. Goldstein 1997, S. 138). Rot löst aber einen cyanblauen Komplementäreffekt aus, weil sowohl die grünen als auch die blauen Rezeptoren arbeitsfähig bleiben. Dies kann jeder beobachten, der eine Taschenlampe und bunte Klarsichthüllen zu Hause hat. Leuchtet man sich damit eine Minute in ein Auge, so sieht man mit diesem Auge danach weiße Wände deutlich in der jeweiligen Komplementärfarbe.

Schwach, aber doch bemerkbar ergeben sich diese Komplementärfarbenpaare auch bei den Versuchen zur Kontrastüberhöhung auf Farbtafel 7. Dieses gänzlich andere Phänomen, das ebenfalls meist unter dem Begriff "Komplementäreffekt" behandelt wird, betrifft keine zeitliche, sondern eine räumliche Irritation des Auges. Eine lange Adaptionszeit ist für diesen Effekt nicht nötig. Er kommt sofort zustande. Verantwortlich für die Irritation der Farbempfindung ist diesmal das Umfeld, das die Farbe umgibt. Im Gegensatz zu dem vorhin behandelten Effekt, der wahrscheinlich auf die Adaption der einzelnen Rezeptorzellen zurückzuführen ist, kann dieser Effekt nur auf Kontakt der Zellen zueinander zurückzuführen sein. Es liegt nahe, dafür eine Verschaltung verantwortlich zu machen, die wir bereits kennengelernt haben: den Simultankontrast der Netzhaut. Dort kommt die früheste Verbindung zwischen benachbarten Zellen zustande. Wie bereits erklärt wurde, wird dabei zur Kontur hin der Kontrast verstärkt. Wenn wir annehmen, daß dies für jede Zapfensorte einzeln geschieht, so ergäbe sich daraus, daß sich zur Kontur hin auch die Farben komplementär verschieben. Genau das ist auf Farbtafel 7 zu beobachten. Mit den Gegenfarbenzellen in den Kniekörpern und den Doppelgegenfarbenzellen in der Großhirnrinde hat es meiner Ansicht nach nichts zu tun. Letztere dienen wie andere Z/U-Zellen wahrscheinlich der Erfassung von Konturen und haben zu kleine rezeptive Felder als daß sie dafür verantwortlch gemacht werden könnten, daß es auf Farbtafel 7 zu einer Farbverschiebung in den Quadraten kommt (Hubel 1989, S. 83).

Fest steht jedenfalls, daß der Komplementäreffekt keine Qualität der Wirklichkeit ist. Es gibt weder komplementäre Wellenlängen noch eine komplementäre Lichtintensität außerhalb unseres Kopfes.
 
 

3.3.3. Die Zentrum/Umfeld-Orgsanisation der Gegenfarbenzellen
 

Ich habe bisher unerwähnt gelassen, daß die Gegenfarbenzellen auch eine Zentrum/Umfeld-Organisation aufweisen. In der mir zur Verfügung stehenden Literatur wurde kein schlüssiger Grund für diese Organisation angegeben. Die Zellen dienen der flächenübergreifenden Vermittlung von helligkeitsunabhängigen Farbwerten. Da Zentrum und Umfeld nicht auf die gleichen Reize ansprechen, zeigen sie keine spezifischen Konturreaktionen. Trotzdem hat die Z/U-Organisation meines Erachtens einen Sinn:

Je größer das rezeptive Feld ist, das zu einer Farbmessung herangezogen wird, desto genauer wird die Farberfassung sein, da die zufälligen Abweichungen einzelner Zellen sich im Durchschnitt ausgleichen werden. Andererseits haben große rezeptive Felder den Nachteil, daß das Bild an Auflösungsdichte verliert und damit unscharf wird. Die Zentrum-Umfeld-Organisation bietet hier eine Lösung. Bereits bei der Simulation des Simultankontrastes haben wir ein unscharfes Bild, sozusagen ein Bild aus lauter Umfeldern, mit einem scharfen Bild, sozusagen einem Bild aus lauter Zentren vereint. Das Ergebnis auf Farbtafel 2 war keineswegs unscharf. Das unscharfe Bild diente nur als Bezugsrahmen, zu dem die Information des scharfen Bildes gemessen wurde. Genauso verhält es sich bei den Gegenfarbenzellen. Die Zellen des Zentrums brauchen das Umfeld als Bezugspunkt, zu dem sie die Farbe relativ messen. Nahe an Konturen kommt es zu Abweichungen des Messergebnisses, weil bereits ein wenig von der gegenüberliegenden Farbe in das rezeptive Umfeld hineinragt. Diese Abweichungen verhalten sich aber diesmal umgekehrt zu jenen Verfälschungen, die der Simultan-kontrast an den Konturen entstehen ließ (Hubel 1987, S.187), so daß im Endeffekt auch dort eine brauchbare Farbmessung entsteht, wenngleich die Zurücknahme nicht vollständig ist, wie sich auf Farbtafel 7 zeigt. Der Gewinn, den das System aus dieser erstgen Übersteigerung und nachherigen Zurücknahme der Farbwerte an den Konturen zieht, wurde schon genannt: Durch die großen Umfelder wird Information aus einem größeren Bereich bezogen, und das macht die Farberfassung genauer und vermindert das Rauschen. Diesen Informationsgewinn bezahlen wir, wie bei der Besprechung der Helligkeitskonturierung bereits erwähnt, mit einem Informations-verlust im Bereich der niedrigen Raumfrequenzen, die aber ohnehin für die Objekterkennung nicht von Vorteil sind. Wichtig ist mir an dieser Stelle der Hinweis darauf, daß solange die rezeptiven Felder so dicht gepackt sind, daß deren Zentren aneinanderstoßen, kein Verlust an der Bildauflösung eintritt. Sie entspricht weiterhin der Größe der Zentren. Das Bild bleibt also scharf.





3.4. Die Farbkonturierung durch die Doppelgegenfarbenzellen
 

Das Reaktionsbild, das die Gegenfarbenzellen an die weitere Verarbeitung übertragen, enthält nur Farb- und Sättigungsinformationen. Die Helligkeit wird getrennt verarbeitet, wie dies auf Farbtafel 8 zu sehen ist. Die Abspaltung von Farbe und Helligkeit ist damit bewältigt. Die Farbauszüge müßten nun nur noch konturiert werden.
Im Gehirn geschieht die Konturierung durch die Doppelgegenfarbenzellen, die (genau wie die Gegenfarbenzellen) Rot/Grün und die Blau/Gelb gepolt sind. Bei den Doppelgegenfarbenzellen handelt es sich um echte Zentrum-Umfeld Zellen, die innerhalb regelmäßiger Flächen nicht reagieren. Das heißt, das Zentrum der Zellen muß jeweils gegenpolig zu deren Umfeld reagieren, so daß sich die Werte innerhalb von Farbflächen ausgleichen. An Konturen hingegen reagiert eine solche Zelle teils mit Erregung, teils mit Hemmung, genau wie dies schon bei den Zellen zur Erfassung der Helligkeitskontur der Fall war. Ich denke, daß Hubel und Livingstone die Existenz solcher Zellen in der Großhirnrinde schon vermuten mußten, bevor sie sie 1981 entdeckten. Das Gehirn muß sich den Gesetzen der Informationstheorie beugen und so kann bei der Erforschung des visuellen Systems oft schon vorausgesehen werden, welche Arbeitsschritte im Gehirn getätigt werden.

Es mag vorerst so aussehen, als ließe sich die Reaktion einer Doppelgegenfarbenzelle durch Zusammenführung von jeweils zwei Gegenfarbenzellen erhalten, die auf das gleiche rezeptive Feld zugreifen. Bei genauer Überlegung erfordert die neue Funktion der Zellen aber auch eine völlig neue Verschaltung. Umfeld und Zentrum müssen Signale von der jeweils gegenpoligen Sorte von Gegenfarbenzellen bekommen.

Wir haben nun bereits vier Zentrum/Umfeld-Verschaltungen kennengelernt: den Simultan-kontrast, die Helligkeitskonturzellen, die Gegenfarbenzellen und die Doppelgegenfarben-zellen. Natürlich ergibt sich da die Frage, ob diese Filter nicht auf die gleichen Umfelder zurückgreifen können? Meine Antwort ist Nein! Ein solches Vorgehen würde dem Ziel der Objekterkennung nicht entsprechen. Die dazu nötige Informations-filterung ist mit einem Aussiebeverfahren vergleichbar, bei dem ein Sandkorn eine Menge verschiedener Siebe durchläuft, bis es in einen der vorhandenen Töpfe fällt. Die Töpfe erhalten ihre Bedeutung dadurch, daß sie immer nur bei der Begegnung mit identischen Situationen ein Korn erhalten. Sie sind die Objekte des Erkennungsprozesses.

Würden alle bisher kennengelernten Zentrum/Umfeld-Zelltypen von den gleichen Umfeldern der Netzhaut beliefert, so ließe sich das mit lauter gleichartigen Sieben vergleichen. Das kann nicht funktionieren. Deshalb bin ich der Ansicht, daß das Bild einen Filter durchläuft, sich dabei wandelt, und in dieser Form an den nächsten Filter kommt, der sich wieder neue Umfelder sucht, in einer Größe, die für seine Zwecke angebracht ist. Wie schon erwähnt, tritt, solange die Zentren der Filter gleich bleiben, kein Verlust an Schärfe ein.
 
 

3.5. Das Farbdifferenzierungsvermögen
 

Um Objekte wiederzuerkennen, müssen die Daten der Objekte auch abgespeichert werden. In wissenschaftlichen Texten kommt oft die Bewunderung darüber zum Ausdruck, wie präzise die Wahrnehmung des Menschen arbeitet. Einer Untersuchung von Gouras (Goldstein 1997) zufolge kann der Mensch 2 Millionen Farbtöne unterscheiden. Auf Farbtafel 9 versuche ich zu zeigen, daß ihm dabei einige Fehler unterlaufen sind und die Untersuchung außerdem nicht das mißt, was sie vorgibt zu messen. Wenn wir von Farbdifferenzierung sprechen, so meinen wir doch damit die Differenzierungsfähigkeit des Auges zu einem bestimmten Zeitpunkt. Die Adaption an extreme Dunkelheit sollte hier nicht miterfaßt werden. In eigenen Experimenten die dies berücksichtigen komme ich nur auf 18.000 unterscheidbare Farbnuancen.

Eine möglichst hohe Genauigkeit der Farbdifferenzierung ist sicher von Vorteil, wenn es darum geht, Objekte vor ähnlich farbigem Hintergrund zu konturieren. In bezug auf das Wiedererkennen kann eine derartige Farbgenauigkeit nicht gewährleistet werden. Vor unterschiedlichen Hintergründen und bei verschiedenen Lichtverhältnissen treten Irritationen auf (Komplementäreffekt), die dazu führen, daß eine Farbe etwas anders wirkt. Die Wiedererkennungsleistung kann unter normalen Bedingungen also nicht so gut sein wie im Versuchslabor. Wenn wir davon ausgehen, daß sich die Helligkeitsdifferenzierung sowie die Farb- und Sättigungsdifferenzierung unter diesen Bedingungen schätzungsweise dreimal geringer ist, so führt dies dazu, daß die für die Objektdifferenzierung unterscheidbaren Farbnuancen auf 700 zusammenschrumpfen (siehe Farbtafel 9). Zusätzlich ist zu bedenken, daß das Gehirn verfügbare Information nur dort vermerkt, wo diese für das Objekt oder die Situation kennzeichnend ist, bzw. mit der Erscheinung des Objektes regelmäßig korreliert. So kann es passieren, daß man im Kaufhaus zwar den Schriftzug jener Zahnpasta erkennt, die man täglich verwendet, aber sich nicht mehr sicher ist, ob man die grüne oder türkise Sorte hatte. Grobe, ungenaue Speicherung scheint für den Erkennungsprozeß notwendig zu sein, und zwar nicht nur, weil selbst der Speicherplatz des Gehirns begrenzt ist, sondern weil Vereinfachung auch die Erkennung leicht veränderter Objekte ermöglicht. Die richtige Art der Vereinfachung bzw. der Abstraktion von Information ist Grundlage aller Klassifizierung.
 
 

3.6. Der Farbabgleich und die Erfassung der Objekteigenfarbe
 

Eine der bewundernswertesten Leistungen der Farbverarbeitung im Gehirn besteht darin, daß wir die Farbe eines Objektes unter verschiedensten Lichtverhältnissen als identisch erkennen, obwohl unser Auge ganz unterschiedliches Licht empfängt. Um verständlich zu machen, welche Informationen das Gehirn nützen könnte, um diese Farbkonstanzleistung zu erbringen, will ich meine Ausführungen bei der einfacher zu verstehenden Helligkeitskonstanz beginnen.

Dunkelheit oder Nebel und athmosphärisches Verblauen beeinflussen den Kontrastumfang und die Helligkeit der Wahrnehmung. Trotzdem vermögen wir noch verhältnismäßig gut einzuschätzen, wie hell die wahrgenommenen Objekte wirklich sind. Die Frage ist nun, wie wir es schaffen, von dem wahrgenommenen Licht auf die richtige Objekthelligkeit zu schließen. Die unteren Abbildungen von Farbtafel 6 versuchen darauf eine erste Antwort zu geben. Die ungünstigen Lichtverhältnisse werden im Kopf so gut wie möglich rückgängig gemacht. Natürlich nehmen wir den Nebel trotzdem wahr. Das bedeutet, daß uns bewußt ist, daß die Objektfarben verfälscht erscheinen und rückinterpretiert werden müssen. Interessanterweise erbringen wir diese Leistung auch bei Objekten, die wir vorher noch nie gesehen haben und von denen wir daher annehmen könnten, daß die Pastellfarbe, die durch den Nebel auf unsere Netzhaut trifft, deren Eigenfarbe ist.

Meiner Ansicht nach könnte unser Gehirn dabei die Tatsache nützen, daß auch gänzlich unbekannte Objekte Schatten und Licht besitzen. Ein Bild erscheint immer dann ausgeglichen, wenn die tiefsten Schatten schwarz, und die hellsten Lichter weiß gesehen werden. Indem im Gehirn die Reaktionswerte des Bildes so verändert werden, daß diese Bedingung erfüllt ist, sind auch die Farben der am Bild befindlichen Objekte näher an die Objekteigenfarben herankommen.

Weiters gilt: Die Objekteigenfarbe befindet sich immer zwischen den Schatten- und Lichtbereichen.
Um Objekteigenfarben zu finden und auszugleichen muß das visuelle System also erst einmal Schatten und Lichter abgrenzen können. Dies erscheint machbar, denn Schatten und Lichter zeichnen sich durch unscharfe Konturen und auch andere komplexere Merkmale aus, an denen sie erkannt werden können (siehe Kapitel 7).

Zu dem Ergebnis, daß Objekteigenfarben unabhängig von der jeweiligen Beleuchtung erkannt werden, indem das Gehirn Informationen ausnützt, die sich durch die Schattier-ung ergeben, gelangt auch Gilchrist (1987). Er ließ Versuchspersonen durch ein Loch in ein Zimmer blicken, in dem alles weiß, und in ein anderes, in dem alles schwarz gestrichen war. In einer Versuchsanordnung wurde das schwarze Zimmer um soviel heller beleuchtet, daß es durchschnittlich genausoviel Licht reflektierte wie das weiße Zimmer. Die Beleuchtungsquelle befand sich an der Wand mit dem Guckloch, so daß sie vom Betrachter nicht gesehen werden konnte. Die Versuchspersonen erkannten das weiße Zimmer trotzdem als weiß, und das schwarze Zimmer wurde zumindest durchschnittlich für dunkelgrau gehalten. Gilchrist nimmt an, daß die Versuchspersonen an den markanten Kontrastunterschieden erkennen konnten, daß ein Zimmer hell und das andere dunkel gestrichen war. In einem weißen Zimmer tritt viel indirektes Licht auf, so daß es keine wirklich schwarzen Schatten gibt. In einem schwarzen Zimmer erscheint alles schwarz, das nicht direkt beleuchtet wird.

Man könnte nun vor dem schwarzen Guckloch Nebel simulieren, so daß auch dort der Kontrastreichtum sinkt. Zum Beispiel indem man zwischen zwei Glasplatten Wasser mit etwas Milch einschließt und diesen Filter vor das Guckloch positioniert. Ich bin sicher, daß die Versuchspersonen auch unter diesen Bedingungen die Farbe des Raums noch als dunkel erleben würden. Der "Nebel" verrät sich dadurch, daß auch die kleinen Ritzen und Löcher, die im weißen Modell dunkel erscheinen, nun von einem Lichtschleier überzogen sind. Meines Erachtens basiert die Einschätzung von Objektfarben darauf, daß Flächen gesucht werden, die weder Schatten noch Glanzlichter aufweisen. Wenn das Bild in seiner Intensität so abgeglichen ist, daß die hellsten Glanzlichter weiß, und die tiefsten Schatten schwarz erscheinen, dann erhält das Auge in den Bereichen ohne Schatten und Glanz die reinen Objekteigenfarben. Der dafür nötige Intensitätsabgleich wird auf Farbtafel 6 unten illustriert und soll hier kurz beschrieben werden.
 
 

3.6.1. Der Intensitätsabgleich:
 

Ich will von Sensoren ausgehen, die nur 11 Graustufen einwandfrei unterscheiden können. Ich beschreibe diese Graustufen in Zahlenwerten von 0 bis 1. Das mag zwar verwirrender erscheinen als eine Beschreibung mit ganzen Zahlen, aber diese Schreibweise ist gebräuchlicher.

Es gibt also folgende Graustufen: 0 0,1 0,2 0,3...usw bis 1. Nun nehmen wir an, das vorliegende Bild enthält nur Grauwerte von 0 bis 0,5, das bedeutet von Schwarz bis Mittelgrau. Beim Intensitätsabgleich werden nun diese Zahlenwerte auf das Gesamtspektrum von 0 bis 1 aufgeteilt, indem man sie alle mit dem hellsten vorhandenen Lichtwert dividiert. Dieser ist im vorliegenden Beispiel 0,5. Aus einem Grauwert von 0,5 wird also ein Grauwert von 0,5:0,5=1 , aus einem Grauwert von 0,4 wird 0,4:0,5=0,8 , aus einem Grauwert von 0,3 wird 0,6 , aus 0,2 wird 0,4 und aus 0,1 wird 0,2. Die Division hat sowohl die Helligkeit als auch den Kontrast des Bildes verbessert. Hätten wir ein Grau zu dem Bild dazu addiert (additive Lichtmischung), so wäre es zwar ebenfalls zu einer Aufhellung gekommen, aber am geringen Kontrast hätte sich nichts geändert.

Der dargestellte Intensitätsabgleich kann in abgewandelter Form auch auf nebelige oder dunstige Bilder angewandt werden. Bei solchen Bildern erscheinen die Schatten nicht so dunkel wie sie sein sollten. Der Abgleich erfolgt in diesem Fall dadurch, daß das Bild zuerst invertiert wird. Die Schattenbereiche erscheinen dann am Negativ nicht so hell wie sie sein sollten. Das kann nun durch den Intensitätsabgleich behoben werden. Danach wird das Bild wieder zurückinvertiert. Ich werde dieses Verfahren daher im weiteren als den "inversen Intensitätsabgleich" bezeichnen.

Wenn wir in Farbtafel 6 das Resultat des Intensitätsabgleichs betrachten, so ergibt sich die Frage, ob hier nicht verlorene Information zurückgewonnen wurde? Aus der Physik wissen wir, daß so etwas nicht möglich ist. Das bedeutet, der Informationsmangel ist lediglich besser versteckt als im Ausgangsbild. Er liegt in der Abstufung der Graube-reiche. In der mathematischen Beschreibung (oben) hatte unser Ausgangsbild nur 5 der 11 möglichen Graustufen besetzt. Der Intensitätsabgleich hat die Graubereiche auseinandergeschoben, aber ihre Zahl nicht erhöht.

Der Intensitätsabgleich muß aber nicht notwendigerweise im nachhinein geschehen. Er könnte genausogut bereits auf der Netzhaut stattfinden, indem die Lichtempfindlichkeit der Rezeptoren direkt beeinflußt würde. Durch eine solche gezielte Einstellung der Lichtempfindlichkeit der Rezeptoren würde durchaus mehr Information aufgenommen. Es ist bekannt, daß es zurückführende Nervenbahnen von der Sehrinde zu den seitlichen Kniehöckern gibt (Hubel u. Wiesel 1987, S. 38). Vielleicht gibt es von dort auch zurückführende Bahnen zur Netzhaut.
 
 

3.6.2. Der Farbabgleich
 

Mit dem Verständnis des Intensitätsabgleichs kann nun auch der Farbabgleich von Farbtafel 10 besprochen werden. Dabei geschieht nichts anderes als ein Intensitätsabgleich für alle drei Farbkanäle. Die beiden mittleren Bilder der Farbtafel weisen den gleichen Grünstich auf. Das linke Bild simuliert eine weniger intensive, das rechte eine intensivere Belichtung. Unter den Bildern sind die Farbauszüge abgebildet. Auf dem weniger intensiv belichteten Bild erscheinen der rote und der blaue Kanal zu dunkel, der grüne Kanal ist hingegen gut belichtet. Im rechten Bild treten am grünen Kanal bereits Informationsverluste auf, der rote und der blaue Kanal sind hier jedoch richtig belichtet. Wird für jeden Kanal die beste Belichtung gewählt, so enthält das Bild die meiste Information und hat keinen Farbstich.
 
 

3.6.3. Ausnahmen
 

Viele Bilder enthalten Bereiche, die verschieden abgeglichen gehören, um die Farben dort näher an die Objekteigenfarben heranzubringen. So würden zum Beispiel bei einem Bild mit zwei verschiedenfarbigen Lichtquellen auch zwei Bereiche entstehen, welche einen jeweils eigenen Intensitätsabgleich erforderten.

Ein häufigeres Beispiel bietet der Dunst. Die Objektfarbe des Waldes auf den entfernteren Bergen von Farbtafel 11 kann nur dann richtig erfaßt werden, wenn für Objekte, die gleich weit entfernt sind, ein jeweils eigener inverser Intensitätsabgleich durchgeführt wird. Natürlich sind Signale von höheren Einheiten der visuellen Verarbeitung erforderlich, um die Gruppe gleich weit entfernter Objekte abgrenzen zu können. Da atmosphärische Bedingungen längere Zeit anhalten, können auch Informationen aus vorhergehenden Wahrnehmungen genützt werden, um abzuschätzen, bei welcher Entfernung der Dunstschleier an dem betreffenden Tag welches Ausmaß hat. So kann über den Kontext der Zusammenhänge einerseits von der Entfernung auf das Ausmaß der Gegenfilterung geschlossen werden, die nötig ist, damit Objektfarben richtig erscheinen, andererseits beschreibt das Ausmaß in dem gegengefiltert werden muß die Objektentfernung.

Der Vorgang, der hier zum nötigen Erkenntnisgewinn führt, ist ein hermeneutischer. Es handelt sich dabei, nach Riedl (1987, S. 63), um einen Rückkopplungsprozeß, in dem durch Einschätzung des möglichen Ergebnisses auf die Richtigkeit der angenommenen Ursachen rückgeschlossen wird, die dem Ergebnis zugrundeliegen. Riedl bringt dazu das Beispiel der Entschlüsselung einer alten Schrift. Der vermutete Inhalt des Textes legt nahe, welche Worte vorkommen werden, und diese legen nahe, welche Buchstaben gebraucht werden. Mit den ersten Worten sind erste Buchstaben bekannt, die wieder genützt werden können, um Worte und Sätze zu lesen. Die Schrift ist entschlüsselt, wenn der Schreibinhalt Sinn macht.

Auf Farbtafel 11 haben im rechten unteren Bild ein entfernter und ein naher Berg jeweils einen eigenen Intensitätsabgleich durchlaufen. (Der entfernte Berg durchlief einen inversen Intensitätsabgleich.) Die Berge enthalten immer noch Licht- und Schattenbereiche. Die kräftigsten Farben dazwischen bezeichnen die Objekteigenfarbe. Legen wir diese Farbe jeweils über das gesamte Objekt, so enteht eine Abbildung ähnlich einem Comic, in der nur Farbflächen vorkommen. Wird das Original durch diese Abbildung dividiert, so entsteht ein Bild ähnlich einem Relief, in dem nur Schattierungen und keine Farben vorkommen. Objekte gleicher Ausrichtung werden in einem solchen Bild den gleichen Schattierungsschatten aufweisen. Das Bild kann somit bei der Interpretation der dritten Dimension helfen. Diese wiederum kann Informationen liefern, um das Schattierungsbild zu verbessern, so daß es exakter von der Objekteigenfarbe getrennt werden kann; also wieder ein hermeneutischer Prozeß.

Meiner Ansicht nach muß im Gehirn eine solche Trennung von Objektfarben und Schattierung geleistet werden, denn der Mensch erkennt Farben auch dann richtig, wenn sich eine Farbfläche vollständig im Schatten befindet und somit auch bei einem abgeglichenen Bild die reine Objektfarbe innerhalb der Fläche nirgends auftritt. Außerdem würde der Mensch mit Comic- oder Reliefdarstellungen nichts anzufangen wissen, wenn sie nicht seinem Denken entsprächen.
 
 

In diesem Kapitel wurden also drei Probleme gemeistert:

· Die Erstellung helligkeitsunabhängiger Farbkonturen.

· Der allgemeine Farbabgleich, wobei Irritationen des Auges möglich bleiben, wie der Komplementäreffekt (Farbfläche mit kleinem grauen Quadrat) zeigt.

· Die Messung der beleuchtungsunabhängigen Objektfarbe.

Weiter im Text
Zum Inhaltsverzeichnis

   
  
What's so funny about Microbiology?: Deutsche Ausgabe
von Joachim Czichos
Siehe auch:
Am anderen Ende des Mikroskops: Bericht vom Ers...
Der Pilz, der John F. Kennedy zum Präsidenten m...
Leben auf dem Menschen: Die Geschichte unserer Bes...
Katzenklon, Katzenklon: und andere Biotech...
Die Sache mit den Genen: Der COMIC - über das Ge...
Cell Biology in Cartoons: For Advancers!
 
   
 
     

Back to the topic site:
StudyPaper.com/Startseite/Computer/Informatik/Bioinformatik

External Links to this site are permitted without prior consent.
   
  Home  |  deutsch  |  Set bookmark  |  Send a friend a link  |  Copyright ©  |  Impressum