DE60217243T2

DE60217243T2 - Zeitverarbeitung für eine Echtzeitmodellierung vom Verhalten des menschlichen Sehvermögensystems

Info

Publication number: DE60217243T2
Application number: DE60217243T
Authority: DE
Inventors: Kevin M. Beaverton Ferguson
Original assignee: Tektronix Inc
Current assignee: Tektronix Inc
Priority date: 2001-09-18
Filing date: 2002-09-16
Publication date: 2007-10-25
Anticipated expiration: 2022-09-17
Also published as: US6941017B2; EP1294199A1; CN1409268A; JP2003158753A; JP3955517B2; CN1237486C; US20030053698A1; DE60217243D1; EP1294199B1

Description

STAND DER TECHNIK
Die vorliegende Erfindung betrifft die Beurteilung der Videobildqualität und im Besonderen die temporale Verarbeitung für die Verhaltensmodellierung des menschlichen Sehsystems in Echtzeit.
Im Allgemeinen können die eingesetzten Reize zur Erforschung des menschlichen Sehsystems (HVS als englische Abkürzung von Human Vision System) unter Verwendung der folgenden Parameter beschrieben werden: zeitliche Frequenz; räumliche Frequenz; durchschnittliche Luminanz oder laterale Maskierungseffekte; Winkelmaß oder Größe des Zielbilds auf der Netzhaut bzw. Retina; Exzentrizität oder Winkelabstand von der Sichtfeldmitte (Fovea); äquivalente Augenbewegung; Drehausrichtung und Umgebung. Ferner können viele der Reize in eine der folgenden Kategorien eingeteilt werden: stehende Wellen, Wanderwellen, temporale Impulse und Stufen, Kombinationen der vorstehenden Optionen (drehend, sowohl des Zielbildmusters als auch der Maskierung) und "natürliche" Szenen/Sequenzen. Die Reaktionen bzw. das Ansprechverhalten auf diese Reize wird parameterisiert als: Schwellenwert der Wahrnehmung wie in der Diskriminierung, die temporale Kontrastwahrnehmung oberhalb der Empfindungsschwelle, die wahrgenommene räumliche Frequenz, einschließlich Frequenz-Aliasing/Verdoppelung, die wahrgenommene temporale Frequenz, einschließlich Flickern bzw. Flackern, etc., die wahrgenommene Geschwindigkeit (Geschwindigkeit und Richtung), wahrgenommene Phantomsignale (Rauschen, Stör- bzw. Geisterbilder, zusätzliche/fehlende Impulse, etc.), die wahrgenommene Bildqualität und neuronale Reaktionen (Spannungskurvenformen, etc.)
Das Problem liegt in der Erzeugung eines Verfahrens zum Reproduzieren und Prädizieren menschlicher Reaktionen bzw. Ansprechverhalten bei gegebener entsprechender Gruppe von Reizen. Das ultimative Ziel ist es, die Bildqualität vorherzusagen bzw. zu prädizieren. Es wird angenommen, dass um dies zu erreichen, mindestens das Ansprechverhalten auf und oberhalb der Empfindungsschwelle so präzise wie möglich nachempfunden werden müssen. Darüber hinaus ist die Prädiktion visueller Illusionen, wie etwa der Raumfrequenzverdoppelung oder derer, die im Verhältnis zum Sehen zusätzlicher (Phantom) Impulse verbunden sind, wünschenswert, wobei dies jedoch als von sekundärer Bedeutung betrachtet wird. Schließlich sollten die Prädiktionen im Einklang mit neuronalen und anderen intermediären Ansprechverhalten stehen.
Die HVS-Modelle in der Literatur berücksichtigen entweder nicht das zeitliche Ansprechverhalten oder die grundlegenden Aspekte (wie etwa die bimodale räumlichtemporale Empfindlichkeitsoberfläche für stehende Wellen, die Maskierung, die räumliche Frequenzverdoppelung, etc.) und/oder sie sind zu rechenintensiv oder ineffizient für die meisten praktischen Anwendungen.
EP-A-1100278 vom Anmelder der vorliegenden Erfindung und mit dem Titel "Real Time Human Vision System Behavioral Modeling" stellt einen HVS-Verhaltensmodellierungsalgorithmus bereit, der von räumlicher Beschaffenheit ist, und der ausreichend einfach ist, so dass er in einer Echtzeit-Videoumgebung ausgeführt werden kann. Referenz- und Testbildsignale werden in separaten Kanälen verarbeitet. Jedes Signal wird räumlich tiefpassgefiltert, in entsprechende Bereiche segmentiert und weist danach die Werte der Bereiche subtrahiert von den gefilterten Signalen auf. Danach werden nach der Injektion bzw. Einführung von Rauschen bzw. Störungen die beiden verarbeiteten Bildsignale voneinander subtrahiert, und es werden Varianzen je Segment bestimmt, anhand welchen eine Metrik für die Videobildqualität bestimmt wird. Die räumliche Modellierung berücksichtigt jedoch keine temporalen Effekte.
Neuronale Reaktionen bzw. Ansprechverhalten weisen allgemein ein schnelles Einschwingen und ein langsames Ausschwingen auf, und es gibt Beweise dafür, dass einige der Retina-Ganglienzellen schneller auf positive temporale Impulse ansprechen, andere auf negative und wiederum andere auf beide. Wenn das Einschwingen schneller ist als das Ausschwingen, so tritt in jedem Fall eine Gleichrichtung auf, die von der temporalen Frequenz abhängig ist. Oberhalb einer kritischen temporalen Frequenz, auf der die Gleichrichtung dominant wird, erfolgt eine Raumfrequenzverdoppelung. Diese kritische temporale Frequenz entspricht einer sekundären Spitze des Raum-Zeit-Ansprechverhaltens, wobei die räumliche Frequenzempfindlichkeitskurve (und der zugeordneten Kontrastempfindlichkeit im Verhältnis zu der Frequenz – CSF) grob um eine Oktave von der Kurve bei 0 Hertz nach unten übersetzt wird.
Benötigt wird ein Algorithmus für eine Echtzeit-HVS-Modellierung, welche die Effizienz und die Präzision für die Voraussage bzw. Prädiktion des temporalen bzw. zeitlichen Ansprechverhaltens des HVS verbessert.
KURZE ZUSAMMENFASSUNG DER ERFINDUNG
Vorgesehen ist gemäß der vorliegenden Erfindung ein Verfahren gemäß dem gegenständlichen Anspruch 1.
Bevorzugte Merkmale der Erfindung sind durch die Unteransprüche definiert.
Die Aufgaben, Vorteile und weitere neuartige Merkmale der vorliegenden Erfindung werden aus der folgenden genauen Beschreibung deutlich, wenn diese in Verbindung mit den anhängigen Ansprüchen und den beigefügten Abbildungen der Zeichnungen gelesen wird.
KURZE BESCHREIBUN DER VERSCHIEDENEN ANSICHTEN DER ZEICHNUNGEN
Es zeigen:
1 ein Blockdiagramm eines effizienten Prädiktors für subjektive Qualitätsbeurteilungsmessungen gemäß der vorliegenden Erfindung;
2 ein Blockdiagramm des temporalen Verarbeitungsabschnitts des Prädiktors aus 1 gemäß der vorliegenden Erfindung;
3 ein Blockdiagramm eines linearen temporalen Filters für den temporalen Verarbeitungsabschnitt aus 2 gemäß der vorliegenden Erfindung; und
4 ein Blockdiagramm eines nichtlinearen temporalen Filters für den temporalen Verarbeitungsabschnitt gemäß der vorliegenden Erfindung.
GENAUE BESCHREIBUNG DER ERFINDUNG
In folgendem Bezug auf die Abbildung aus 1 ist ein Flussdiagramm für eine Vorrichtung zur Beurteilung der Bildqualität dargestellt, ähnlich der Beschreibung in EP-A-1100278. Ein Referenzbildsignal und ein beeinträchtigtes (Test) Bildsignal werden in entsprechende Anzeigemodelle 11, 12 für eine Umwandlung in Luminanzeinheiten eingegeben. Die Luminanzdaten werden in einen räumlichen Modellierungsalgorithmus 10 eingegeben, der als entsprechende zweidimensionale Tiefpassfilter 13, 14 implementiert ist, und ein implizierter Hochpassfilter (lokaler Mittelwert (Tiefpass) aus Schritt bzw. Stufe 15, 16 wird in Schritt bzw. Stufe 17, 18 entsprechend von jedem einzelnen Pixel subtrahiert). Diese Filterkombination erfüllt die Daten (Kontrastempfindlichkeit versus Frequenz), die in der Literatur vorgeschlagen werden, für jede Ausrichtung, durchschnittliche Luminanz und Segmentfläche. Aus dieser Stufe gibt es nur eine zu verarbeitende Bildausgabe durch folgende Stufen für jedes Bild im Gegensatz zu einer Mehrzahl ausgegebener Bilder von den Filterbänken gemäß dem Stand der Technik.
Blockmittelwerte werden berechnet 15, 16, wie etwa für Blöcke von drei Pixel auf drei Pixel. In beiden Kanälen wird das Bild segmentiert 20 auf der Basis des Blockmittelwertes und anderen einfachen Blockstatistiken. Zur Vereinfachung und zur Reduzierung der Rechenressourcen kann der Schritt 20 auch weggelassen werden. Zu den in dem aktuellen Segmentierungsalgorithmus verwendeten Blockstatistiken zählen die lokale (Block) mittlere Luminanz und die vorherige Varianz. Allerdings können auch einfache maximale und minimale bzw. Höchst- und Mindestwerte für das Bereichswachstum verwendet werden. Jeder Blockmittelwert wird über das Segment einer Durchschnittswertermittlung unterzogen, dem er angehört, um einen neuen Blockmittelwert zu erzeugen. Diese Mittelwerte werden von jedem Pixel in den entsprechenden Blöcken subtrahiert 17, 18, um den impliziten Hochpassfilter fertig zu stellen.
Störungen bzw. Rauschen von einem Rauschgenerator 24 werden bzw. wird an jedem Pixel über eine Coring- bzw. Kernoperation 21, 22 eingefügt, indem der größere Wert zwischen dem Absolutwert des gefilterten Eingangsbilds und dem Absolutwert eines räumlich festen bzw. stationären Musters von Störungen bzw. Rauschen ausgewählt wird, wobei folgendes gilt: Core(A, B) = {|A| – |B| für |A| > |B|; 0 für |A| < |B|}·sign(A)wobei A das Signal und B das Rauschen darstellen. Die Segmentvarianz wird für die Referenzbildsegmente und für eine Differenz 26 zwischen den Referenz- und Testbildsegmenten berechnet 27, 28. Die Zweikanal-Varianzdatenanordnungen werden kombiniert 30 für jedes Segment, indem die Differenzkanalvarianz durch die Referenzvarianz normalisiert (dividiert) wird.
Schließlich wird die N-te Wurzel des Durchschnitts der normalisierten Varianz jedes Segments berechnet 32, so dass ein Gesamtwert erzeugt wird. In dem vorliegenden Beispiel ist N = 4, wobei N jeden ganzzahligen Wert darstellen kann. Der Gesamtwert kann skaliert oder ansonsten umgewandelt 34 werden in entsprechende Einheiten, wie zum Beispiel JND, MOS, etc.
Ein weiterer Schritt bzw. eine weitere Stufe wird in jedem Kanal hinzugefügt, bevor die Eingabe in den räumlichen Modellierungsalgorithmus 10 erfolgt – temporale Verarbeitung 35, 36. Die vorstehend im Abschnitt Stand der Technik erörterten Fakten in Bezug auf neuronale Reaktionen legen nahe, dass der gleiche Mechanismus wie für die Frequenzverdoppelung auch für die Raum-Zeit-Frequenzkoordinaten der sekundären Spitze einer Raum-Zeit-Empfindlichkeitsoberfläche herangezogen werden kann. Die Bereitstellung des temporalen Prozesses 35, 36 mit neuronalem Einschwingen und Ausschwingen vor der räumlichen Verarbeitung emuliert sowohl die Verschiebung der Spitzenempfindlichkeit (räumliche Frequenzposition der Spitze als eine Funktion der temporalen Frequenz) als auch die Frequenzverdoppelungsaspekte. Dies kann mit einem nichtlinearen temporalen Filter 37, 38 realisiert werden, wie dies in der Abbildung aus 2 dargestellt ist. Danach berücksichtigt ein linearer temporaler Filter 39, 40 die verbliebenen Feinheiten der Raum-Zeit-Empfindlichkeitsfunktion. Diese Kombination aus linearen und nichtlinearen Filtern berücksichtigt ferner die Erkennungsschwellenwerte von: Impulsen als eine Funktion der Amplitude und der Dauer; Beeinträchtigungen als eine Funktion der Amplitude und der temporalen Proximität zu Szenenveränderungen; und Flackern bzw. Flickern und Fusionsfrequenz als eine Funktion der Modulationsamplitude.
Der linearare temporale Filter 39, 40 aus 2 weist die Eigenschaften der Kombination aus Tiefpass- und Hochpassfiltern auf. Die Luminanzdaten werden in eine Reihe von Feldverzögerungsmodulen 41-44 mit einer Anzapfung an jedem Feld eingegeben. Die Anzapfungsausgaben werden in entsprechende Multiplizierer 45-48 eingegeben, wob sie nach entsprechenden Koeffizienten b0, D_ec·b0, b1, D_ec·b1 gewichtet und in einer Summierungsschaltung 50 summiert werden. Im Wesentlichen handelt es sich bei dem linearen temporalen Filter 39, 40 um die gewichtete Differenz zwischen Frames, wobei jeder Frame das entsprechende Ausschwingen (D_ec) für das ältere der beiden Felder aufweist. Für jedes Pixel an der räumlichen Position (x, y) ist die Filterausgabe LTF[field] für gegebene Filtereingaben D[] gegeben durch: LTF[field] = (D[field] + D[field – 1]·Dec)·b0 + (D[field – 2] + D[field – 3]·Dec)·b1wobei field = Feldnummer in der Sequenz; LTF[field] = lineare Filterausgabe an einem bestimmten Pixel (LTF[x, y, field]); D[field] = Eingabepixel aus den Luminanzdaten an dieser speziellen Koordinate (x, y, field); b0, b1 = FIR-Filterkoeffizienten (z.B. b0 = 1; b1 = –0,5); und D_ec = Ausschwingen. Der Koeffizient b0 ist nominal 1 und der Koeffizient b1 steuert die Höhe der Verstärkung bei etwa 8 Hz. Der Parameter b1 wird nach der Kalibrierung des nichtlinearen temporalen Filters kalibriert. D_ec ist nominal gleich 1 oder niedriger, abhängig von der Abtastrate.
Der in der Abbildung aus 4 dargestellte nichtlineare temporale Filter 37, 38 weist die Eigenschaften einer Hüllkurven-Folgeeinrichtung oder eines Amplitudenmodulations-Detektors/Demodulators auf. Er weist ein schnelleres Einschwingen als Ausschwingen auf.
mit: NTF[field] = nichtlineare Filterausgabe an einem bestimmten Pixel (NTF[x, y, field]); attack = 0,9 (höherer Einschwingkoeffizient entspricht einem langsameren anfänglichen Ansprechverhalten); und decay = 0,98 (höherer Ausschwingkoeffizient entspricht einer langsameren Wiederherstellung bzw. Erholung). Die Ausgabe des nichtlinearen temporalen Filters 37, 38 wird in eine Verzögerung 51 eingegeben und in der Folge mit dem Ausschwingen in einem ersten Multiplizierer 52 multipliziert. Die ausgeschwungene Ausgabe wird danach mit der Ausgabe des linearen temporalen Filters 39, 40 in einem Komparator 54 verglichen. Das Ergebnis des Vergleichs wird multipliziert mit (1-attack) in einem zweiten Multiplizierer 56 und in einen Gleichrichter 58 eingegeben. Die Ausgabe des Gleichrichters 58 wird in einer Summierschaltung 60 kombiniert, um die Filterausgabe zu erzeugen. Die Einschwing- und Ausschwingzeiten werden bestimmt durch Kalibrieren des HVS-Modells sowohl auf die Raum-Zeit-Schwellenwertoberfläche als auch die entsprechenden oberhalb der Empfindungsschwelle liegenden Regionen der Raumfrequenzverdoppelungsillusion. Der nichtlineare temporale Filter 37, 38 ist verantwortlich für den Großteil der temporalen Maskierung und temporale verwandte visuelle Illusionen.
Die speziell abgebildete Implementierung spricht besser an auf positive Übergänge als auf negative, wobei das Ansprechverhalten bzw. die Reaktion auf negative Übergänge oder die Retina-Ganglienzellen, die normalerweise auf beide gleichermaßen ansprechen, nicht vollständig berücksichtigt wird. Eine Verbesserung in Bezug auf die Präzision bzw. die Genauigkeit kann erreicht werden, indem diese Reaktionen bzw. Ansprechverhalten an pseudozufälligen Positionen einbezogen werden, die der vorgeschlagenen theoretischen Verteilung von Photorezeptortypen entsprechen. Nur der Gleichrichter 58 muss sich verändern, entweder in Bezug auf die Polarität oder durch Integration beider mit einem Absolutwert (vollständige Wellengleichrichtung). Die räumliche Verteilung des temporalen Gleichrichtungsprozessors für eine Vollwelle an durch ein 10×10 Pixelraster ausgewählte Pixelpositionen mit pseudozufälliger Verschiebung um nicht mehr als ein paar Pixel berücksichtigt eine Vielzahl visueller Illusionen, einschließlich der Bewegungsumkehr und scintillierendem Rauschen. Die erforderliche zusätzliche Verarbeitung kann jedoch für bestimmte Anwendungen nicht wünschenswert sein.
Vorgesehen ist gemäß der vorliegenden Erfindung somit die temporale Verarbeitung für eine Echtzeit-HVS-Verhaltensmodellierung durch Einfügen vor der räumlichen Verarbeitung eines zweistufigen temporalen Filters – eines linearen temporalen Filters, gefolgt von einem nichtlinearen temporalen Filter – um neurales bzw. neuronales Einschwingen und Ausschwingen zu emulieren.

Claims

Verfahren zur Verhaltensmodellierung des menschlichen Sehsystems in Echtzeit, wobei das Verfahren die räumliche Modellierung (10) aufweist, um einen Wert für die sichtbare Beeinträchtigung eines von einem Referenzbildsignal abgeleiteten Testbildsignals zu erhalten, gekennzeichnet durch den Schritt des temporalen Verarbeitens (35, 36) der Referenz- und Testbildsignale vor der räumlichen Modellierung; wobei das genannte temporale Verarbeiten die folgenden Schritte umfasst: das lineare temporale Filtern (39, 40) der Referenz- und Testbildsignale, um Referenz- und Test-Tiefpassfilterausgaben zu erzeugen; und das nicht-lineare temporale Filtern (37, 38) der Referenz- und Test-Tiefpassfilterausgaben, um Referenz- und nicht-lineare Testfilterausgaben zu erzeugen, um Verschiebungen der Spitzenempfindlichkeit zu berücksichtigen, und mit einer Frequenzverdoppelung der räumlich-temporalen Empfindlichkeitsfunktion unter Verwendung eines Filters mit einer Eigenschaft einer Hüllkurven-Folgeeinrichtung oder eines Amplitudenmodulations-Detektors/Demodulators und mit einem schnelleren Einschwingen als Ausschwingen, wobei die Referenz- und nichtlinearen Testfilterausgaben in die räumliche Modellierung (10) eingegeben werden, um den Wert der sichtbaren Beeinträchtigung zu erzeugen.
Verfahren nach Anspruch 1, wobei das lineare temporale Filtern Eigenschaften einer Kombination aus Tiefpass- und Bandpassfiltern umfasst.
Verfahren nach Anspruch 1, wobei das lineare temporale Filtern die folgenden Schritte umfasst: das Eingeben der Referenz- und Testbildsignale in eine Reihe von Teilbildverzögerungsmodulen (41–44), mit einer Anzapfstelle in jedem Teilbild; das Koppeln der Ausgaben der Anzapfstellen mit entsprechenden Multiplizierern (45–48) zur Gewichtung durch entsprechende Koeffizienten; und das Summieren (50) der Ausgaben der entsprechenden Multiplizierer, um die Referenz- und Test-Tiefpassfilterausgaben zu erzeugen, welche die gewichtete Differenz zwischen Vollbildern der Referenz- und Testbildsignale darstellen, wobei jedes Vollbild ein entsprechendes Ausschwingen für das ältere der beiden Teilbilder, die jedes Vollbild bilden aufweist.
Verfahren nach einem der Ansprüche 1 bis 3, wobei das nicht-lineare temporale Filtern die folgenden Schritte umfasst: das Vergleichen (54) der Referenz- und Test-Tiefpassfilterausgaben mit entsprechenden ausgeschwungenen Versionen der Referenz- und nicht-linearen Testfilterausgaben, um entsprechende Vergleichsausgaben zu erzeugen; das Multiplizieren (56) der entsprechenden Vergleichsausgaben durch eine Einschwingfunktion, um entsprechende Einschwingausgaben zu erzeugen; das Gleichrichten (58) der entsprechenden Einschwingausgaben, um entsprechende gleichgerichtete Ausgaben zu erzeugen; und das Summieren (60) der entsprechenden gleichgerichteten Ausgaben mit entsprechenden ausgeschwungenen Versionen, um die Referenz- und nicht-linearen Testfilterausgaben zu erzeugen, wobei der Großteil der temporalen Maskierungs- und der temporalen verwandten visuellen Illusionen berücksichtigt wird.
Verfahren nach Anspruch 4, wobei das nicht-lineare temporale Filtern ferner den Schritt des Bestimmens der Einschwingfunktion und einer Ausschwingfunktion für ausgeschwungene Versionen umfasst, indem die Verhaltensmodellierung des menschlichen Sehsystems in Echtzeit sowohl in Bezug auf eine räumlich-temporale Grenzoberfläche und entsprechende oberhalb der Grenze liegende Bereiche der Raumfrequenz-Verdoppelungsillusion kalibriert wird.
System zur Verhaltensmodellierung des menschlichen Sehsystems in Echtzeit, wobei das System die räumliche Modellierung (10) aufweist, um einen Wert für die sichtbare Beeinträchtigung eines von einem Referenzbildsignal abgeleiteten Testbildsignals zu erhalten, gekennzeichnet durch eine Einrichtung zum temporalen Verarbeiten (35, 36) der Referenz- und Testbildsignale vor der räumlichen Modellierung, wobei die genannte Einrichtung zum temporalen Verarbeiten folgendes umfasst: eine Einrichtung zum linearen temporalen Filtern (39, 40) der Referenz- und Testbildsignale, um Referenz- und Test-Tiefpassfilterausgaben zu erzeugen; und eine Einrichtung zum nicht-linearen temporalen Filtern (37, 38) der Referenz- und Test-Tiefpassfilterausgaben, um Referenz- und nicht-lineare Testfilterausgaben zu erzeugen, um Verschiebungen der Spitzenempfindlichkeit zu berücksichtigen, und mit einer Frequenzverdoppelung der räumlich-temporalen Empfindlichkeitsfunktion unter Verwendung eines Filters mit einer Eigenschaft einer Hüllkurven-Folgeeinrichtung oder eines Amplitudenmodulations-Detektors/Demodulators und mit einem schnelleren Einschwingen als Ausschwingen, wobei die Referenz- und nichtlinearen Testfilterausgaben in die räumliche Modellierung (10) eingegeben werden, um den Wert der sichtbaren Beeinträchtigung zu erzeugen.
System nach Anspruch 6, wobei die Einrichtung zum linearen temporalen Filtern Eigenschaften einer Kombination aus Tiefpass- und Bandpassfiltern umfasst.
System nach Anspruch 6, wobei die Einrichtung zum linearen temporalen Filtern folgendes umfasst: eine Einrichtung zum Eingeben der Referenz- und Testbildsignale in eine Reihe von Teilbildverzögerungsmodulen (41–44), mit einer Anzapfstelle in jedem Teilbild; eine Einrichtung zum Koppeln der Ausgaben der Anzapfstellen mit entsprechenden Multiplizierern (45–48) zur Gewichtung durch entsprechende Koeffizienten; und eine Einrichtung zum Summieren (50) der Ausgaben der entsprechenden Multiplizierer, um die Referenz- und Test-Tiefpassfilterausgaben zu erzeugen, welche die gewichtete Differenz zwischen Vollbildern der Referenz- und Testbildsignale darstellen, wobei jedes Vollbild ein entsprechendes Ausschwingen für das ältere der beiden Teilbilder, die jedes Vollbild bilden aufweist.
System nach einem der Ansprüche 6 bis 8, wobei die Einrichtung zum nicht-linearen temporalen Filtern folgendes umfasst: eine Einrichtung zum Vergleichen (54) der Referenz- und Test-Tiefpassfilterausgaben mit entsprechenden ausgeschwungenen Versionen der Referenz- und nicht-linearen Testfilterausgaben, um entsprechende Vergleichsausgaben zu erzeugen; eine Einrichtung zum Multiplizieren (56) der entsprechenden Vergleichsausgaben durch eine Einschwingfunktion, um entsprechende Einschwingausgaben zu erzeugen; eine Einrichtung zum Gleichrichten (58) der entsprechenden Einschwingausgaben, um entsprechende gleichgerichtete Ausgaben zu erzeugen; und eine Einrichtung zum Summieren (60) der entsprechenden gleichgerichteten Ausgaben mit entsprechenden ausgeschwungenen Versionen, um die Referenz- und nicht-linearen Testfilterausgaben zu erzeugen, wobei der Großteil der temporalen Maskierungs- und der temporalen verwandten visuellen Illusionen berücksichtigt wird.
System nach Anspruch 9, wobei die Einrichtung zum nicht-linearen temporalen Filtern ferner eine Einrichtung zum Bestimmen der Einschwingfunktion und einer Ausschwingfunktion für ausgeschwungene Versionen umfasst, indem die Verhaltensmodellierung des menschlichen Sehsystems in Echtzeit sowohl in Bezug auf eine räumlich-temporale Grenzoberfläche und entsprechende oberhalb der Grenze liegende Bereiche der Raumfrequenz-Verdoppelungsillusion kalibriert wird.