WO1987000714A1

WO1987000714A1 - Process for compressing and expanding structurally associated multiple-data sequences, and arrangements for implementing the process

Info

Publication number: WO1987000714A1
Application number: PCT/DE1986/000289
Authority: WO
Inventors: Reinhard Lidzba; Heinz-Ulrich Wiebach
Original assignee: Reinhard Lidzba; Wiebach Heinz Ulrich
Priority date: 1985-07-19
Filing date: 1986-07-16
Publication date: 1987-01-29
Also published as: EP0230437B1; DE3525898C2; DE3682182D1; DE3525898A1; EP0230437A1; US4903018A

Description

Verfahren zum Komprimieren und Dekomprimieren mehrerer strukturverwandter Datenfolgen sowie Einrichtungen zur Durchführung des Verfahrens

Die Erfindung betrifft ein Verfahren zum Komprimieren und Dekomprimieren mehrerer strukturverwandter Datenfolgen, insbesondere Datensätze, bei dem die zu komprimierenden Datenfolgen in einer Speichermatrix unter Berücksichtigung ihrer Strukturverwandtschaft parallel gespeichert werden, zur Gewinnung einer eine 'Anzahl von Datenelementen der

Datenfolgen verbindenden Charakteristik für mehrere Daten¬ folgen eine Strukturanalyse von Datenelementen überein¬ stimmender Ordnungszahl vorgenommen wird, anstelle dieser Datenelemente ein Code verwendet wird und beim Dekompri- mieren die durch Decodieren des Codes gewonnenen Daten¬ elemente in Datenfolgen unter Berücksichtigung der jeweils betreffenden Datenelement-Ordnungszahl geordnet werden. Ferner betrifft die Erfindung Datenverarbeitungseinrich¬ tungen zur Durchführung des Verfahrens.

Datenfolgen sind häufig in hohem Maße redundant, d.h. sie enthalten eine wesentlich größere Zahl von Datenelementen oder Zeichen, als sie zur Darstellung der jeweils ent¬ haltenen Information erforderlich wäre. Ein Beispiel hier- für sind die regelmäßig aufgebauten Datensätze von Dateien aus Wirtschaft und Verwaltung. Ein weiteres Beispiel hier¬ für ist die Übertragung von Fernsehbildern, bei denen die nacheinander aufgenommenen und dann als Daten- folgen gespeicherten oder übertragenen Teilbilder bezüg¬ lich einzelner Bereiche einer Szene identisch sind, weil sie dort keine Änderung hinsichtlich der Lage, Helligkeit oder Farbe der Bildpunkte erfahren haben. Das ist ohne Szenenwechsel für die meisten Bildpunkte der Fall. Um die Übertragung von Datenfolgen wirtschaftlich vornehmen zu können, ist es erforderlich, diese zu komprimieren und am Ende der Ubertragungsstrecke wieder zu dekomprimie¬ ren.

Es sind bereits Verfahren bekannt, bei denen die Verdich¬ tung der Datenfolgen über eine Codierung veränderlicher Länge vorgenommen wird. Ein Codierschema dieses Typs be¬ wirkt, daß Bitreihen fest vorgegebener Länge in Bitreihen veränderlicher Länge umcodiert werden, wobei die häufi¬ ger vorkommenden Codeworte von Bitreihen dargestellt wer¬ den, die kürzer sind als die der Codeworte fest vorge¬ gebener Länge. Diese Umwandlung von Codeworten fester Länge in Codeworte veränderlicher Länge ist als Huffman- " Codierung bekannt. Bei sinnvoller Zuordnung von Codewor¬ ten veränderlicher Länge ergibt sich bei gegebenen Daten dann eine wesentlich geringere Länge derartiger Codeworte gegenüber den entsprechenden Codeworten fest vorgegebener Länge, obwohl viele Codeworte veränderlicher Länge wesent- lieh länger als die entsprechenden Codeworte fester Länge sind.

Es sind ferner Verfahren zum Komprimieren und Dekomprimie¬ ren von Datenfolgen bekannt, bei denen eine Strukturana- lyse vorgenommen wird, um bei einer vorgegebenen Zahl von Datenelementen der Datenfolgen eine diese verbindende Charakteristik zu erkennen. Eine solche Charakteristik kann beispielsweise im mehrmaligen Auftreten desselben Zeichens liegen oder auch bei einer aufsteigenden nume¬ rischen Ziffernfolge der Art 1, 2 ... n gegeben sein. Die vorgegebene Zahl von Datenelementen wird dann in einen Code umgesetzt. Bei einer Zeichenkette von n gleichen Zeichen müßte ein solcher Code mindestens ein Trennzeichen, das betreffende Zeichen und die Anzahl seines Auftretens ent¬ halten, um beim Dekomprimieren die ursprüngliche Zeichen¬ kette durch Decodieren des Codes wieder herstellen zu können.

Es ist ferner ein Verfahren zum Komprimieren und Dekompri¬ mieren von Datenfolgen bekannt, bei dem zwei logisch ver¬ wandte Datenfolgen vor dem eigentlichen Komprimieren her¬ kömmlicher Art EXKLUSIV-ODER verknüpft werden. Diese lo- gische Verknüpfung bewirkt, daß an den Stellen, an denen gleiche Zeichen vorhanden sind, Nullen erzeugt werden. Da die Datenfolgen, wie vorausgesetzt, logisch verwandt sind, wird durch die EXKLUSIV-ODER-Verknüpfung eine Datenfolge erzeugt, die als Datenelemente häufig Nullen enthält. Die mit Nullen stark durchsetzte Datenfolge wird dann nach herkömmlicher Art komprimiert.

Bei diesem Verfahren wird die Strukturverwandtschaft, ins¬ besondere die logische Verwandtschaft, zumindest zweier Datenfolgen zum Zwecke des Komprimierens genützt, um das Komprimierungsergebnis zu verbessern, aber auch bei die¬ sem Verfahren ist das Komprimierungsergebnis noch stark redundant. Außerdem benötigt man zur Durchführung einen hohen schaltungstechnischen Aufwand, da Universalrechner hoher Leistung erforderlich sind.

Gleiches gilt für ein Verfahren der eingangs genannten Art, das aus dem Aufsatz "Data Compaction for Improved Transmission Efficiency" von Dirk R. Klose in IEEE National Telecommunications Conference, 26.-28. November 1973, Seiten 35C-1 bis 35C-6, bekannt ist. Bei diesem Verfahren werden mehrere Datenfolgen vorbestimmter Länge, die zusam¬ men einen Datensatz bilden, zeilenweise in einer Matrix angeordnet und durch spaltenweises Umschlüsseln in weniger redundante Codefolgen komprimiert, indem ihre Strukturver¬ wandtschaft in Spaltenrichtung festgestellt und ausgewertet wird. Hierdurch läßt sich zwar das Komprimierungsergebnis verbessern, jedoch bleibt der schaltungstechnische Aufwand insbesondere für die spaltenweise Betrachtung der matrix- artig angeordneten Datenfolgen hoch.

Es ist daher Aufgabe der Erfindung, eine Möglichkeit des Einwirkens auf die Datenfolgen anzugeben, durch die das Komprimieren und Dekomprimieren mehrerer strukturverwandter Datenfolgen, insbesondere Datensätze, auch im Ergebnis gegenüber bisherigen Verfahren so deutlich verbessert wird, daß es durch einen weit geringeren schaltungstechnischen Aufwand realisiert werden kann als es bisher unumgänglich war.

Diese Aufgabe wird ausgehend von einem Verfahren eingangs genannter Art erfindungsgemäß dadurch gelöst, daß vor der Strukturanalyse die gespeicherten Datenfolgen auf ihre Länge untersucht, mit Datenfolgen gleicher Länge Daten- folgengruppen gebildet und die Datenfolgengruppen nach zu¬ nehmender oder abnehmender Länge geordnet werden.

Durch den gemäß der Erfindung vor der Strukturanalyse durchgeführten besonderen Verfahrensschritt wird es möglich, bei der spaltenweise durchzuführenden Struktur¬ analyse und Komprimierung der Datenelemente nur denjenigen Teil der jeweiligen Matrixspalte zu berücksichtigen, in dem infolge der vorgesehenen Ordnung der Datenfolgengruppen Informationen vorhanden sind. Dadurch läßt sich der Aufwand an Verarbeitungszeit und damit Schaltungstechnik wesentlich verringern, und gleichzeitig wird das Komprimierungs- ergebnis weiter verbessert, weil die vor der Struktur¬ analyse durchgeführte Ordnung der Datenfolgengruppen nach ihrer Länge ein zusammenfassendes Betrachten be- nachbarter Matrixspalten gleicher oder auch nahezu gleicher Länge ermöglicht, wodurch einzelne Matrix¬ spalten einer derartigen Gruppe kennzeichnende Code¬ zeichen beim Komprimieren eingespart werden. Es hat sich gezeigt, daß bei einer derartigen Ordnung der Da- tenfolgengruppen auch andere gemeinsame Merkmale ein¬ ander benachbarter Matrixspalten leichter auswertbar sind und zu einer Verkürzung der Codeworte im Kom¬ primierungsergebnis führen können.

Werden geordnete Datenfolgen gleicher effektiver Länge auf übereinstimmende Datenfolgecharakteristik, bei¬ spielsweise Satzart, letztes Zeichen einer Datenfolge oder Anzahl der Datenelemente einer Datenfolge unter¬ sucht, und entsprechend geordnet, so werden Daten- folgen mit gleicher oder auch ähnlicher Charakteristik und damit großer Strukturähnlichkeit näher zusammen¬ gebracht, wodurch das Komprimierungsergebnis weiter verbessert werden kann.

Werden geordnete Datenfolgen gleicher effektiver Länge und gleicher Charakteristik noch nach zunehmender oder abnehmender Speichermatrix-Zeilennummer geordnet, um die Strukturverwandtschaft der nacheinander zeilen¬ weise in die Speichermatrix eingelesenen Datenfolgen möglichst zu erhalten, so kann das Komprimierungser¬ gebnis dadurch weiter verbessert werden. Vorteilhaft können dabei die effektive Datenfolgelänge, mindestens eine Datenfolgecharakteristik und die Spei¬ chermatrix-Zeilennummer durch ein Attributfeld gekenn¬ zeichnet werden, das jede Datenfolge ergänzt. Es kann dann auf diese Ordnungskriterien leicht zugegriffen werden.

In einer weiteren Ausbildung des erfindungsgemäßen Ver¬ fahrens werden die einzelnen Datenfolgen seriell vor- komprimiert, um die bei serieller Betrachtung gegebene Strukturverwandtschaft der Datenelemente der einzelnen Datenfolgen zu nützen. Dabei sollten die strukturellen Bezugspunkte für die eigentliche spaltenweise Kom¬ primierung möglichst nicht zerstört werden. Dies wird dadurch erreicht, daß die verdichteten Zeichenketten in der Datenfolge durch Füllzeichen ersetzt werden, die bei der eigentlichen spaltenweisen Komprimierung nicht beachtet werden. Auf diese Weise bleibt die Struktur der einzelnen Datenfolgen erhalten.

Als eine Möglichkeit der seriellen Vorkomprimierung wird das jeweils letzte Datenelement mindestens einer Datenfolge sowie ggf. die Zahl solcher Datenelemente, also ihr Wiederholungsfaktor, in das Attributfeld übernommen. Ferner werden das letzte Datenelement so¬ wie seine mit ihm übereinstimmenden unmittelbaren Vorgänger in der Datenfolge zur Verkürzung eliminiert. Diese Art der seriellen Vorkomprimierung erweist sich als besonders vorteilhaft, da die letzten Datenelemente einer Datenfolge häufig übereinstimmen. Man denke da¬ bei z.B. an Leerzeichen, sogenannten Blanks, am Ende der Datenfolgen. Wenn die Art einer Datenfolge nicht explizit angegeben ist, so hat es sich als vorteilhaft erwiesen, das letzte und das vorletzte Datenelement der unverkürzten Daten¬ folge als Datenfolgecharakteristik in das Attributfeld zu übernehmen und in der Datenfolge zu eliminieren. Dies beruht vor allem auf der Erkenntnis, daß Strukturähn¬ liche Datenfolgen häufig in ihren Datenelementen am Da¬ tenfolgeende übereinstimmen.

Das Komprimierungsergebnis kann weiter verbessert werden, wenn im Rahmen der seriellen Vorkomprimierung der Daten¬ folgen mindestens die längste aus gleichen Datenelementen bestehende Zeichenkette einer Datenfolge eliminiert und durch Füllzeichen ersetzt wird und wenn diese Zeichen- kette in einem für jede Datenfolge separat vorgesehenen Deskriptorfeld durch einen den Zeichenkettenanfang mar¬ kierenden Zeiger, durch die Zeichenkettenlänge und durch das ersetzte Zeichen beschrieben wird. Mit dieser Maßnahme können lange Zeichenketten übereinstimmender Datenelemente höchst effektiv komprimiert werden, ohne daß dadurch die Struktur der einzelnen Datensätze zerstört wird, da die eliminierten Zeichenketten durch Füllzeichen ersetzt wer¬ den, die bei der eigentlichen spaltenweisen Komprimierung nicht berücksichtigt werden.

Da sich die Flatterung (fließsatzartige Anordnung) von bei¬ spielsweise Leerzeichen oder Nullzeichen auf das Komprimie¬ rungsergebnis bei der spaltenweisen Komprimierung negativ auswirkt, wird im Rahmen der seriellen Vorkomprimierung mindestens die größte Flatterung solcher Störzeichen bei den zu komprimierenden Datenfolgen festgestellt, werden die Stö.rzeichen durch Füllzeichen ersetzt und wird das Stör¬ zeichen selbst durch einen den Störzeichenfeldanfang arkie- renden Flatterungszeiger, durch die Feldlänge und durch das ersetzte Störzeichen beschrieben.

Da sämtliche im Rahmen der seriellen Vorkomprimierung be- schriebenen Maßnahmen ebenso wie die Sortierung der Daten¬ folgen aufgrund verschiedener Kriterien eineindeutige Vorgänge sind, können sie im Rahmen der Dekomprimierung wieder rückgängig gemacht werden.

In einer weiteren Ausbildung des erfindungsgemäßen Verfah¬ rens wird für jede Datenelementspalte jeweils mindestens ein Spalte deskriptorfeld vorgesehen, das die Datenele¬ mentspalte zumindest teilweise beschreibt. Es ist dadurch gemäß einer Weiterbildung der Erfindung beispielsweise möglich, daß aus gleichen Zeichen bestehende Datenelement¬ spalten eliminiert, durch Füllzeichen ersetzt und in den betreffenden Deskriptorfeidern durch Angabe des jeweils ^• ersetzten Zeichens^'beschrieben werden. Durch das Einfügen der Füllzeichen anstelle der eliminierten Datenspalte bleibt die Struktur der einzelnen Datenfolgen erhalten, weil die Füllzeichen bei der eigentlichen spaltenweisen Komprimierung übergangen werden.

Gemäß einer anderen Weiterbildung der Erfindung wird zumindest die längste aus gleichen Datenelementen bestehen¬ de Zeichenkette einer Datenelementspalte eliminiert und durch Füllzeichen ersetzt. Ferner wird diese Zeichenkette im jeweiligen Spaltendeskriptorfeld durch einen den Zeichen¬ kettenanfang markierenden Zeiger, durch die Zeichenketten- länge und durch das ersetzte Zeichen beschrieben. Durch diese Beschreibung der Zeichenkette ist es möglich, sie im Rahmen der Dekomprimierung wiederherzustellen und an richtiger Stelle in der Datenelementspalte anzuordnen. Bei einer anderen Weiterbildung des erfindungsgemäßen Ver¬ fahrens wird zumindest die längste aus gleichen Datenele¬ menten bestehende Zeichenkette einer Datenelementspalte in ein- im Vergleich zur betreffenden Zeichenkette kürze- res Codewort umcodiert und durch dieses ersetzt und werden die dabei freiwerdenden Datenelementplätze mit Füllzeichen aufgefüllt.

In einer weiteren vorteilhaften Ausbildung des -erfindungs- gemäßen Verfahrens werden zwei benachbarte Zeichenketten einer Datenelementspalte vertauscht und werden ein die Berührungssteile der Zeichenketten in ihrer ursprünglichen Lage markierender Zeiger und die Längen der Zeichenketten im Deskriptorfeld der betreffenden Datenelementspalte gespeichert. Diese Vertauschung zweier benachbarter Zei¬ chenketten bewirkt eine Homogenisierung der Daten der be- " treffenden Datenelementspalte.

In einer Weiterbildung des erfindungsgemäßen Verfahrens werden die Datenelemente mindestens eines Teils einer

Datenelemen s alte in einen für diese betreffende Spalte spezifischen, weniger redundanten Code umgeschlüsselt, wodurch das Komprimierungsergebnis weiter verbessert wer¬ den kann.

Als weitere Maßnahme zur Verbesserung des Komprimier ngs- ergebnisses dient die Verknüpfung der einzelnen Datenele¬ mente einer Datenelementspalte durch die logische Funktion mit der Wahrheitstabelle "A verknüpft mit B = W", falls A = B und "A verknüpft mit B = B", falls A f B unter der

Bedingung B ≠ W, wobei W ein beliebiges Wiederholungszeichen, z.B. das Nullzeichen, ist. Die Anwendung dieser logischen Funktion auf die Datenelemente einer Datenelementspalte 1^". dient der Homogenisierung dieser Datenelemente. Wird bei einem Vergleich des Datenelements B mit dem Datenelement A die Gleichheit von B und A festgestellt, so wird das Da¬ tenelement B durch das Wiederholungszeichen W ersetzt. Wird 5 dagegen bei einem Vergleich des Datenelements B mit dem Datenelement A die Ungleichheit von B und A festgestellt, so bleibt das Datenelement B unverändert. Wenn man diese logische Funktion auf die Datenelemente nacheinander, bei- ' spielsweise in der Datenelementspalte von unten nach oben

10. angewendet hat, so kann wegen der Eineindeutigkeit der logischen Funktion, die für die Bedingung B W gilt, beim Dekomprimieren die Datenelementspalte mit den ursprüng¬ lichen Datenelementen wiederhergestellt werden. Nach An¬ wendung dieser logischen Funktion auf die Datenelemente

15 aller Datenelementspalten können die Verknüpfungsergeb¬ nisse zweier Datenfolgen jeweils erneut seriell vorkompri¬ miert werden.

In einer weiteren Ausgestaltung des erfindungsgemäßen Ver- 20 fahrens wird jedes Datenelement einer Datenelementspalte in ein Bewertungs- oder Indikatorcodewort umgeschlüsselt, werden die Indikatorcodeworte der einzelnen Datenelemente einer Datenelementspalte bitweise addiert, unmittelbar be¬ nachbarte Indikatorcodeworte bitweise EXKLUSIV-ODER ver- 5 knüpft, die Verknüpfungsergebnisse ebenfalls addiert und die beiden Additionsergebnisse zur Klassifikation der Da¬ tenstruktur ausgewertet. Dabei haben die einzelnen Bit¬ positionen der Bewertungs- oder Indikatorcodeworte Aussage¬ kraft über den Typ des jeweiligen Datenelementes. So kann 0 beispielsweise eine 1 an der fünften Bitposition eines Bewertungs- oder Indikatorcodewortes bedeuten, daß das erste Halbzeichen des betreffenden Datenelements 0 ist. Durch die bitweise Addition der Indikatorcodeworte der

5 einzelnen Datenelemente einer Datenelementspalte erhält man die Aussage, wieviele Datenelemente in der Datenele¬ mentspalte vorhanden sind, deren erstes Halbzeichen 0 ist. Durch die bitweise EXKLUSIV-ODER-Verknüpfung unmittelbar benachbarter Indikatorcodeworte und durch die Addition der Verknüpfungsergebnisse erhält man eine Aussage über die Häufigkeit der Zeichenwechsel zwischen benachbarten Daten¬ elementen. Da die beiden Additionsergebnisse sowohl ein Maß für die Häufigkeit des Auftretens der einzelnen Da- tenelementtypen als auch ein Maß für die Häufigkeit der Datenelementtypwechsel sind, sind sie als Grundlage für die Auswertung zur Klassifikation der Datenstruktur be¬ sonders gut geeignet.

Da die Wahrscheinlichkeit eines halbzeichenweisen überein- stimmens oder zumindest einer gemeinsamen Charakteristik der Halbzeichen der Datenelemente einer Datenelementspalte größer ist als bei den vollständigen Datenelementen, kann das Komprimierungsergebnis verbessert werden, wenn jede Datenelementspalte halbzeichenweise in eine durch das Klassifikationsergebnis festgelegte Art von Codeworten umgesetzt wird.

Dies geschieht in einfacher Weise dadurch, daß das Klassi- fikationsergebnis durch m Bits ausgedrückt wird, daß aus dem m Bit-Klassifikationsergebnis zusammen mit einem n Bit-Halbzeichen eine (m+n) Bit-Adresse zur Adressie¬ rung eines die Codeworte enthaltenden Codespeichers gebil¬ det wird und daß die adressierten Codeworte nacheinander aus dem Codespeicher ausgelesen werden. Dabei wird durch das m Bit-Klassifikationsergebnis, das den höherwertigen Adreßteil bildet, ein Speicherbereich des Codespeichers aus¬ gewählt, der für die betreffende, durch das Klassifikations- ergebnis ausgedrückte Datenstruktur der Datenelement¬ spalte günstige Codeworte für die auftretenden Halbzei¬ chen enthält.

In einer Weiterbildung des Verfahrens werden jeweils die beiden zuletzt aus dem Codespeicher ausgelesenen Codeworte nach jedem Lesezyklus des Codespeichers auf Gleichheit überprüft. Es besteht dadurch die Möglichkeit, aufeinan¬ derfolgende gleiche Codeworte in einem weiteren Verfah- rensschritt zusammenzufassen und somit zu komprimieren.

Dies geschieht in einer Weiterbildung der Erfindung dadurch, daß die Anzahl der unmittelbar aufeinanderfolgenden Lese¬ zyklen des CodeSpeichers, nach denen jeweils die beiden zuletzt aus dem Codespeicher ausgelesenen Codeworte über¬ einstimmen, gezählt wird. Das Zählergebnis gibt dann an, wie oft der Typ des zuletzt aus dem Codespeicher ausgelesenen Codewortes hintereinander aufgetreten ist.

Eine Weiterbildung des erfindungsgemäßen Verfahrens zeich¬ net sich dadurch aus, daß das Zählergebnis in Abhängigkeit von der Art der Codeworte derart verschlüsselt wird, daß das verschlüsselte Zählergebnis von den betreffenden Code¬ worten unterscheidbar ist. Diese Verschlüsselung dient zur sicheren Unterscheidung des Zählergebnisses von den im Codespeicher auftretenden Codeworten.

Bei einer Weiterbildung des erfindungsge äßen Verfahrens werden das in einer Datenelementspalte überwiegend auftre- tende Halbzeichen ein einziges Mal und jedes der verbleibenden Halbzeichen sowie ein die jeweilige Stelle dieser verbleibenden Halbzeichen anzeigen¬ der Zeiger separat im Komprimierungscode dargestellt. Diese Art der Komprimierung eignet sich besonders gut für weitgehend homogene Datenelementspalten, die nur mit wenigen Störzeichen durchsetzt sind.

Eine Datenverarbeitungseinrichtung zur Durchfüh¬ rung des Verfahrens, ist in weiterer Ausbildung des Erfin- dungsgedankens derart aufgebaut, daß eine Speichermatrix an ihren Adreßeingängen mit einer ersten Umschalteinrichtung versehen ist, mit der in Abhängigkeit von einem ersten Umschaltsignal die Zeilen- und Spaltenadressen der Daten¬ elementspeicherplätze vertauschbar sind. Durch diese Ver- tauschbarkeit von Zeilen- und. Spaltenadressen wird es erst möglich, daß die Speichermatrix sowohl zeilenweise als auch spaltenweise ausgelesen bzw. neu beschrieben werden kann, ohne daß dazu aufwendige Adreßumrechnungen erforderlich sind, die einer hohen Rechnerleistung bedür- fen. Da bei den Befehlssätzen üblicher Datenverarbei¬ tungsanlagen die Adressierung einer Speichermatrix nur - zeilenweise vorgesehen ist, mußte bisher bei einer spal¬ tenweisen Bearbeitung der Speichermatrix immer zuerst die Adresse des nächstfolgenden Datenelementes in der Datenelementspalte berechnet werden, bevor die gewünsch¬ te Rechenoperation ausgeführt werden konnte.

Wenn ferner ein Indexspeicher vorgesehen ist, dessen Zeilenanzahl mit derjenigen der Speichermatrix übereinstimmt und der die Zeilenadressen der Speichermatrix in sortierter Reihen¬ folge enthält, ist es möglich, auf die Datenelementspei¬ cherplätze einer Datenelementspalte der Speichermatrix entsprechend der Reihenfolge der im Indexspeicher ent- haltenen Zeilenadressen sortiert zuzugreifen, ohne daß dazu eine vorangehende aufwendige Umsortierung der Daten¬ elementzeilen der Speichermatrix erforderlich ist. Die Beaufschlagung der Zeilenadreßeingänge der Speichermatrix mit den Ausgangssignalen des Indexspeichers erfolgt vor¬ teilhaft durch eine zweite Umschalteinrichtung, die von einem zweiten Umschaltsignal gesteuert wird.

In einer weiteren Ausbildung ist ein Attribut- und Deskriptorspeicher mit einer dritten Um¬ schalteinrichtung an dessen Adreßeingängen vorgesehen, mit der in Abhängigkeit von einem dritten Umschaltsignal die Zeilen- und Spaltenadressen der Speicherplätze ver- tauschbar sind. Ein separater Attribut- und Deskriptor¬ speicher neben der Speichermatrix für die eigentlichen Datenelemente hat den Vorteil, daß bei den Weiterbildungen des erfindungsgemäßen Verfahrens, bei denen eine Sortie¬ rung der Datenfolgen vorgenommen wird,^'diese nicht in ihrer Gesamtheit, sondern lediglich die Inhalte der Zeilen des Attribut- und Deskriptorspeichers in Abhängigkeit von den Sortierkriterien umsortiert werden müssen. In Abhängigkeit von der im Attribut- und Deskriptorspeicher vorgenommenen Umsortierung wird dann der Indexspeicher geladen, so daß die eigentliche Speichermatrix über diesen sortiert adressiert werden kann. Um die Speicherplätze des Attri¬ but- und Deskriptorspeichers sowohl zeilenweise als auch spaltenweise adressieren zu können, ohne rechenzeitauf- ^•wendige AdreßUmrechnungen vornehmen zu müssen, ist an den Adreßeingängen des Attribut- und Deskriptorspeichers eine dritte Umschalteinrichtung zum Vertauschen der Zeilen- und Spaltenadressen vorgesehen.

Zur Gewinnung des jeweiligen Umschaltsignals aus der Spei- cheradresse ist vorteilhaft mindestens ein Decoder vor¬ gesehen, der beispielsweise aus der oder den höherwertigen Adreßbits durch Decodierung das jeweilige Umschaltsignal erzeugt. Gemäß einer Weiterbildung der Erfindung ist als Umschalt¬ einrichtung jeweils ein handelsüblicher Multiplexer vor¬ gesehen.

Die Datenverarbeitungseinrichtung zur Durchführung des Ver¬ fahrens kann auch derart aufgebaut sein, daß ein die In¬ dikatorcodeworte enthaltender Lesespeicher vorgesehen ist, der durch die Datenelemente adressierbar ist. Auf diese Weise kann jedem Datenelementtyp ein bestimmtes Indikator- oder Bewertungscodewort auf einfache Weise zugeordnet wer¬ den.

In einer Weiterbildung ist dann eine Zähleranordnung mit gegenüber der Bit-Zahl der Indikatorcodeworte doppelter Zahl von Einzelzählern mit dem Datenausgang des Lesespei- ^■ chers verbunden und sind der Hälfte der EinzelzählerEXKLUSIV- ODER-Glieder vorgeschaltet, deren Eingängenjeweils eine Bitposition von im Lesespeicher unmittelbar benachbarten Indikatorcodeworten zugeführt wird. Durch ein derartiges Indikatorsystem ist es möglich festzustellen, wie oft die Datenelemente einer Datenelementspalte in einer Bitposition übereinstimmen und wieviele Bitwechsel zwischen benach¬ barten Datenelementen einer Datenelementspalte bei jeder einzelnen Bitposition zu verzeichnen sind. Zur Fest- Stellung der Wechsel bei den einzelnen Bitpostionen sind vorteilhaft zwischen dem Datenausgang des Lesespeichers und den Eingängen der EXKLUSIV-ODER-Glieder zwei Register vorgesehen, welche zur Zwischenspeicherung des jeweils zu¬ letzt bzw. des unmittelbar davor aus dem Lesespeicher aus- gelesenen Indikatorcodewortes dienen. Stimmen die Inhalte der beiden Register überein, so bedeutet dies, daß das je¬ weils letzte und das jeweils vorletzte aus dem Lesespeicher ausgelesene Indikatorcodewort ubereinstinmen. An den Ausgängen der EXKLUSIV-ODER-Glieder für die einzelnen Bitpositionen erscheint dann jeweils der Wert 0. Stimmen die Inhalte der beiden Register jedoch in einzelnen Bitpositionen nicht überein, so bedeutet dies, daß bei diesen Bitposi¬ tionen zwischen dem jeweils zuletzt und dem unmittelbar davor aus dem Lesespeicher ausgelesenen Indikatorcodewort ein Wechsel stattgefunden hat. An den Ausgängen der EXKLUSIV-ODER-Glieder dieser Bitpositionen erscheint dann jeweils der Wert 1.

Die Datenverarbeitungseinrichtung kann auch derart aufge¬ baut sein, daß ein Festwertspeicher als Codespeicher vor¬ gesehen ist, der vom Datenstruktur-Klassifikationser¬ gebnis der zu komprimierenden Datenspalte und vom je- weiligen Halbzeichen der betreffenden Datenspalte adres¬ sierbar ist, wobei das Datenstruktur-Klassifikations- ergebnis den höherwertigen Adreßteil und das jeweilige Halbzeichen den niederwertigen Adreßteil bildet. Auf diese Weise wird durch das Datenstruktur-Klassifikationsergebnis der für die betreffende Datenstruktur relevante Speicher¬ bereich des Codespeichers adressiert, in dem die für die betreffende Datenstruktur günstigen Codeworte für die zu komprimierenden Halbzeichen enthalten sind.

In einer Weiterbildung sind dem Codespeicher ein erstes und ein zweites Register nachgeschaltet, wobei das erste Register das jeweils zuletzt ausgelesene Codewort und das zweite Register das unmittelbar davor ausgelesene Codewort zwischenspeichert. Auf diese Weise kann auf die beiden je- weils zuletzt aus dem Codespeicher ausgelesenen Codeworte jederzeit in einfacher Weise zugegriffen werden. Vorteilhaft ist in einer weiteren Ausbildung der Datenver¬ arbeitungseinrichtung eine mit den Ausgängen des ersten und des zweiten Registers verbundene Vergleichsschaltung vorgesehen, um mit ihr die Übereinstimmung der beiden je- weils zuletzt aus dem Codespeicher ausgelesenen Codeworte feststellen zu können. Ferner ist ein von der Vergleichs¬ schaltung gesteuerter Zähler vorgesehen, mit dem die An¬ zahl der unmittelbar aufeinanderfolgenden aus dem Code¬ speicher ausgelesenen übereinstimmenden Codeworte gezählt werden kann.

Um den auszugebenden Zählerstand des Zählers in Abhängig¬ keit von der Art der Codeworte in einfacher Weise ver¬ schlüsseln zu können, ist vorteilhaft eine die Ver- schlüsselungscodeworte enthaltende Multiplexerschaltung vorgesehen.

Zur vorstehend beschriebenen logischen Verknüpfung von Datenelementen ist die Datenverarbeitungseinrichtung der- art aufgebaut, daß ein A-Register und ein B-Register vor¬ gesehen sind, das auch als Ergebnisregister dient, daß die Ausgänge der beiden Register bitweise mit den Eingängen von EXKLUSIV-ODER-Gliedern verbunden sind und daß die Ausgänge der EXKLUSIV-ODER-Glieder mit den Eingängen eines disjunktiven Verknüpfungsgliedes verbunden sind, dessen Ausgangssignal den Rücksetzeingang des B-Registers steuert. Diese Schaltungsanordnung zeichnet sich durch ihren einfachen Aufbau aus.

Die Erfindung wird im folgenden anhand eines Beispiels einer typischen Datendatei und anhand von Ausführungsbei¬ spielen eines Speichersystems, eines Indikatorsystems, einer Halbzeichenkomprimiereinrichtung und einer Schal¬ tungsanordnung zur logischen Verknüpfung von Datenele¬ menten in einer Datenverarbeitungseinrichtung näher erläutert,

Es zeigen:

Fig. 1 eine aus 37 Datensätzen bestehende Datei,

Fig. 2 ein Prinzipschaubild der Ansteuerung einer Speichermatrix über einen IndexSpeicher,

Fig. 3 eine schematische Darstellung einer Speicher¬ matrix mit zwei in einer Matrixzeile angeord¬ neten Datenelementen,

Fig. 4 die Speichermatrix von Fig. 3 mit zwei in einer Matrixspalte angeordneten Datenelementen,

Fig. 5 den Schaltplan eines Speichersystems,

Fig. 6 das Adressierschema des SpeicherSystems von Fig. 5,

Fig. 7 ein IndikatorSystem zur Klassifikation der Datenstruktur einer Datenelementfolge,

Fig. 8 einen Detailausschnitt der in Fig. 7 als

Blockschaltbild gezeigten Zähleranordnung,

Fig. 9 eine Halbzeichenkomprimiereinrichtung und

Fig. 10 eine Schaltungsanordnung zur logischen Ver¬ knüpfung von Datenelementen. In Fig. 1 ist eine typische, aus hexadezimal darge¬ stellten Datenelementen bestehende Datei gezeigt. Die in ihr enthaltenen 37 Datensätze sind der Länge nach sortiert angeordnet. Anhand dieser Datendatei soll ge¬ zeigt werden, daß die einzelnen Datenelemente bei spal¬ tenweiser Betrachtung der Datensätze aufgrund deren Strukturverwandtschaft größere Gemeinsamkeiten unter¬ einander aufweisen, als wenn man sie datensatz- oder zeilenweise betrachtet.

Es sei ferner erwähnt, daß beispielsweise ein Komprimieren von gleichen Zeichen nur dann sinnvoll ist, wenn diese mindestens viermal hintereinander auftreten, da der Kom¬ primierungscode ein eine komprimierte Zeichenfolge an- zeigendes Trennzeichen, das komprimierte Zeichen und die Anzahl seines Auftretens enthalten muß.

Betrachtet man beispielsweise in Fig. 1 die zweite Da¬ tenzeile, so kann man erkennen, daß das Datenelement F0 als einziges Datenelement einerseits viermal und anderer¬ seits fünfmal hintereinander auftritt. Bei einer Kompri¬ mierung gleicher Zeichen könnten daher bei dieser Daten¬ zeile lediglich drei Datenelemente eingespart werden, da lediglich die Vierer- und die Fünferdatenelementkette beim Komprimieren jeweils durch drei Zeichen dargestellt werden kann. Betrachtet man dagegen beispielsweise die zweite Datenspalte dieser Datendatei, so kann man erkennen, daß das Datenelement 1C zwanzigmal und das Datenelement 1B achtmal hintereinander auftritt. Bei der spaltenweisen datenelementweisen Komprimierung gleicher Zeichen können hier somit zweiundzwanzig (= ^'20+8-2x3) Datenelemente ein¬ gespart werden. Wenn man sich weitere Datenzeilen bzw. Datenspalten heraussucht und deren Komprimierungsergebnis vergleicht, so zeigt sich,- daß eine spaltenweise daten¬ elementweise Komprimierung gegenüber einer zeilenweisen datenelementweisen Komprimierung in der Regel zu einem deutlich besseren Ergebnis führt. Wenn man die spalten- weise Komprimierung der Datenelemente gar halbzeichen¬ weise vornimmt, so kann das Komprimierungsergebnis wei¬ ter verbessert werden. Betrachtet man wieder die zweite Datenspalte, so zeigt sich, daß das Halbzeichen oder Halb-Byte "1" insgesamt sechsunddreißigmal hintereinander auftritt. Ein mit einer derartigen Häufigkeit hintereinan¬ der auftretendes Halbzeichen kann höchst effektiv kompri¬ miert werden.

Da die Datensätze einer Datei in dieser in der Regel nicht der Länge nach sortiert angeordnet sind und da es für das spaltenweise Komprimieren der Datenelemente zweckmäßig ist, wenn die einzelnen Datensätze zur Ver¬ meidung von Datenelementlücken mit absteigender Länge von oben nach unten in der Speichermatrix angeordnet sind, ist es erforderlich, entweder die einzelnen die Daten¬ sätze enthaltenen Datenzeilen der Speichermatrix umzuord¬ nen oder aber, um Verarbeitungszeit zu sparen, die Spei¬ chermatrix sortiert zu adressieren. Dies ist, wie in Fig. 2 schematisch gezeigt, durch eine Zeilenadressierung mittels eines Indexspeichers 20 möglich. Dazu müssen lediglich die im Indexspeicher 20 enthaltenen Zeilenadressen der die einzelnen Datenelemente .enthaltenden Speichermatrix 22 so umsortiert werden, daß die Zeile 0 des Indexspeichers 22 die Adresse der Zeile der Speichermatrix 22 enthält, die die größte Anzahl von Datenelementen umfaßt. Die Zeile 1 des Indexspeichers 20 muß dann die Adresse der Zeile der Speichermatrix 22 enthalten, die die zweitgrößte Anzahl von Datenelementen enthält usw. Wird nun der IndexSpeicher 20 nacheinander von Zeile 0 bis Zeile 9 sukzessive ange¬ steuert und ausgelesen, so werden über die im Indexspei¬ cher 20 enthaltenen Zeilenadressen der Speichermatrix 22 die einzelnen, die Datensätze enthaltenden Zeilen der Speichermatrix 22 in Abhängigkeit von der 'Länge der Daten¬ sätze sortiert adressiert.

In Fig. 3 ist eine aus 10 Zeilen und 16 Spalten bestehen¬ de, mit dezimalen Adressen adressierbare Speichermatrix sowie ihr Adressierschema gezeigt. Wie aus der Fig. 3 zu entnehmen ist, wird das Datenelement X durch die Adresse 509 adressiert, wobei der höherwertige Adreßteil, also die Ziffer 5, die Zeilenadresse ist und der niederwerti- ge Adreßteil, also die Ziffernfolge 09, die Spalten- adresse ist. Die der Adresse 509 vorangestellte Ziffer 0 dient lediglich als Umschalter und wird zur eigentlichen Adressierung des Datenelements X nicht benötigt. Da bei der üblichen sukzessiven Speicheradressierung die Adresse des nächsten Datenelementes lediglich durch Hochzählen der Speicheradresse um 1 erfolgt, wird als nächstes Daten¬ element das Datenelement Y adressiert, das die selbe Zeilenadresse hat wie das Datenelement X und dessen Spalten¬ adresse im Vergleich zur Spaltenadresse des Datenelements X einen um 1 höheren Wert hat. Die Tatsache, daß bei der sukzessiven Speicheradressierung nach dem Datenelement X das Datenelement Y in der gleichen Zeile und nicht das Da¬ tenelement Z in der gleichen Spalte adressiert wird, ist darauf zurückzuführen, daß üblicherweise die Zeilenadresse den höherwertigen Adreßteil und die Spaltenadresse den niederwertigen Adreßteil bildet, der zunächst hochge¬ zählt wird.

Will man dagegen bei der sukzessiven Speicheradressierung nach dem Datenelement X als nächstes Datenelement Z, also zunächst die Datenelemente einer Spalte adressieren, so ist es erforderlich, daß die Speichermatrix mit einer Adresse adressiert wird, bei der, wie in Fig. 4 gezeigt ist, die Zeilenadresse mit der Spaltenadresse vertauscht ist. Wenn die Spaltenadresse 09 den höherwertigen Adreßteil und die Zeilenadresse 5 den niederwertigen Adreßteil bildet, dann wird beim Hochzählen der Adresse um 1 die Zeilen¬ adresse vom Wert 5 auf den Wert 6 bei gleichbleibender Spaltenadresse hochgezählt, so daß nach dem Datenelement X das Datenelement Z als nächstes Zeichen adressiert wird.

Diese Vertauschung der Zeilenadresse mit der Spaltenadresse kann durch eine weitere, für die Adressierung unmittelbar nicht benötigte Adreßstelle, den sogenannten Umschalter, erfolgen. Hat der Umschalter, wie in Fig. 3 gezeigt, bei- spielsweise den Wert 0, so bedeutet dies, daß die Zeilen¬ adresse mit der Spaltenadresse nicht vertauscht werden soll, mit der Folge, daß beim sukzessiven Speicheradressieren die Speichermatrix zeilenweise adressiert wird. Hat dagegen der Umschalter den Wert 1, wie in Fig. 4 'gezeigt, so bedeutet dies, daß die Zeilenadresse mit der Spaltenadresse zur Adressierung der Speichermatrix vertauscht werden soll, mit der Folge, daß beim sukzessiven Adressieren der Spei¬ chermatrix diese spaltenweise adressiert wird.

In Fig. 5 ist ein Blockschaltbild eines SpeicherSystems dargestellt, das sich vorzüglich zur Durchführung des er¬ findungsgemäßen Verfahrens eignet. Dieses Speichersystem enthält im wesentlichen einen Matrixspeicher 24, eine Speichermatrix 26, einen Indexspeicher 28, verbunden mit einem Datenpuffer 30, einen Programmspeicher 32, einen 1 aus 16 Decoder 34, einen ersten Multiplexer 36, einen zweiten Multiplexer 38 und einen dritten Multiplexer 40. Um den Aufbau und die Funktionsweise dieses Speichersystems verstehen zu können,ist es zunächst erforderlich, die Speicherbelegung dieses SpeicherSystems anzugeben. Sie soll im folgenden anhand von Fig. 6 in Verbindung mit Fig. 5 erläutert werden.

Der Adressenbereich 00000 bis 0FFFF ist dem 64kByte-Pro- grammspeicher 32 zugeordnet. Der Adreßbereich^' 10000 bis 100FF dient zur Adressierung der 256 Bytes des Index¬ speichers 28. Die Adressen 10100 bis 1FFFF werden bei diesem Speichersystem nicht benutzt. Der Adreßbereich 20000 bis 3FFFF dient zur Adressierung des 64kBytes um¬ fassenden Matrixspeichers 24, wobei dieser über den Adreß¬ bereich 20000 bis 2FFFF zeilenweise und über den Adreß¬ bereich 30000 bis 3FFFF spaltenweise adressierbar ist. Der Speicherbereich 40000 bis FFFFF schließlich ist der

Speichermatrix 26 zugeordnet. Die 256kBytes dieser Speicher¬ matrix 26 sind über die Adressen 40000 bis 7FFFF zeilen¬ weise adressierbar. Ferner sind sie über den Adreßbereich 80000 bis BFFFF spaltenweise adressierbar. Über den Adreß- bereich COOOO bis FFFFF sind sie darüber hinaus noch spal¬ tenweise indiziert, also sortiert adressierbar. Da bei diesem Speichersystem der Matrixspeicher 24 und die Spei¬ chermatrix 26 mehrfach, auf verschiedene Weise adressier- bar sind, ist der virtuelle Speicherbereich des Speicher- Systems deutlich größer als der körperlich vorhandene

Speicherbereich. Während letzterer in Fig. 6 unschraffiert dargestellt ist, ist der nur virtuelle Speicherbereich einfach schraffiert gezeigt. Der kreuzweise schraffierte Speicherbereich wird bei diesem Speichersystem nicht be- nutzt.

Das in Fig. 5 gezeigte Speichersystem hat also einschließ¬ lich der Umschalter für die verschiedenen Adressierungs- arten einen Adreßbereich von 1 MByte. Dazu sind 20 Bits, also 20 Adreßleitungen A0 bis A19 für die Adreßauswahl er¬ forderlich, um mit einem Schreib- oder Lesezugriff ein Byte als kleinste Speichereinheit adressieren zu können. Die Datenleitungen sind sogenannte bidirektionale Leitungen, d.h. die Information kommt bei Leseoperationen vom Spei¬ chersystem, bei Schreiboperationen dagegen wird sie dem Speichersystem auf diesen Leitungen zugeführt. Das Signal WR steuert die Speicheroperationen LESEN und SCHREIBEN. Während dieses Signal logisch 0 ist, wenn die Operation SCHREIBEN durchgeführt werden soll, sind die Signale ohne Querstrich logisch 1 , wenn sie aktiv sind. Zum Aufbau dieses Speichersystems können handelsübliche Speicherbau¬ steine verwendet werden.

Im folgenden soll die Funktion dieses Speichersystems näher erläutert werden. Die Auswahl des Programmspeichers 32 erfolgt, wenn die Adressen A16 bis A19 logisch 0 sind. Dies wird durch den 1 aus 16 Decoder 34 festgestellt. Seine Ausgänge sind im inaktiven Zustand logisch 1 , während sie im aktiven Zustand logisch 0 sind. Wenn also die Adreßbits A16 bis A19, die am Eingang des Decoders 34 anliegen, lo¬ gisch 0 sind, so erscheint am Ausgang "0" des Decoders 34 das Signal logisch 0, das den Select-Eingang 44 des Pro- grammspeichers 32 steuert. Da der Select-Eingang 44 ein negativer Eingang ist, wird der Programmspeicher 32 aus¬ gewählt, wenn dieses Signal logisch 0 ist. Wie bereits vorstehend erwähnt, gilt für den Eingang WRITE 46 das gleiche, d.h. wenn das Signal WR logisch 0 ist, wird in diesen Speicherbereich geschrieben. Wenn dieses Signal dagegen logisch 1 ist, wird aus diesem Speicherbereich ge¬ lesen und die Informationen auf den Datenbus geschaltet. Da die Speichermatrix 26 (Adreßbereich 40000 bis FFFFF) mit den Adreßbits A18 und A19 eindeutig ausgewählt wer¬ den kann, werden beim Decoder 34 die Ausgänge 4 bis 15 nicht genutzt.

Der Indexspeicher 28 wird im Adreßbereich 10000 bis

100FF sowohl im Lese- als auch im Schreibbetrieb, sowie für die indizierte Adressierung der Speichermatrix 26 ■ im Adreßbereich COOOO bis FFFFF nur im Lesebetrieb aus¬ gewählt. Bei letzterem Adreßbereich wird ein Einschreiben in den Indexspeicher 28 durch die logische Verknüpfung des Signals WR mit den Adreßsignalen A18 und A19 durch ein UND-Glied 48, einen Invertierer 50 und ein NAND-Glied 52 verhindert. Zur Auswahl des Indexspeichers 28 wird das Signal des Ausgangs "1" des Decoders 34 über einen Invertierer 54 einem NOR-Glied 56 zugeführt, dessen

Ausgangssignal den Select-Eingang 58 des Indexspeichers 28 steuert. Die Auswahl dieses IndexSpeichers 28 erfolgt für den Adreßbereich COOOO bis FFFFF nicht durch den Decoder 34, sondern durch die AdreßSignale A18 und A19 unmittelbar.

Diese beiden Signale werden durch das UND-Glied 48 ver¬ knüpft, dessen Ausgang mit dem Eingang 60 des NOR-Glie¬ des 56 verbunden ist. Der Indexspeicher 28 muß eine sehr kurze Zugriffszeit haben, da die Daten dieses Speichers innerhalb eines Speicherzyklus für die Adresse der Spei¬ chermatrix 26 benötigt werden.

Da der Indexspeicher 28 nur im Adreßbereich 10000 bis 100FF und nicht auch im Adreßbereich COOOO bis FFFFF beschrie- ben werden darf, ist der Datenpuffer 30 vorgesehen, der den Informationsfluß von den Datenleitungen 42 zum Index¬ speicher 28 nur im Adreßbereich 10000 bis 100FF erlaubt. Die Steuerung dieses Datenpuffers 30 erfolgt durch das am Ausgang 1 des Decoders 34 erscheinende Signal sowie durch das Signal WR. Die Speichermatrix 26 besteht aus 256 Zeilen i. 1024 Bytes, was einen Speicherbereich von 256 kByte ergibt. Zur Adressierung der 256 Zeilen ist eine Zeilenadresse von 8 Bit Länge und zur Adressierung der 1024 Spalten eine Spaltenadresse von 10 Bit Länge erforderlich. Das ergibt für diese Speichermatrix 26 eine 18 Bit-Adresse. Da diese Speichermatrix 26 für den Adreßbereich 40000 bis 7FFFF zeilenweise und für den Adreßbereich 80000 bis FFFFF spaltenweise bzw. spaltenweise indiziert adressiert wird, kann das höchstwertige Adreßsignal A19 zur Steue¬ rung des ersten Multiplexers 36 verwendet werden. Wenn das Adreßsignal A19 Null ist, so werden die O-Eingänge des Multiplexers 36 benutzt. In diesem Falle findet keine Vertauschung von Zeilen- und Spaltenadressen statt, so daß der Speicherbereich zeilenweise adressiert wird. Ist das Adreßsignal A19 dagegen 1, so werden die 1-Eingänge des Multiplexers 36 an die Adreßeingänge der Speichermatrix 26 geschaltet, mit der Folge, daß eine Vertauschung von Zeilen- und Spaltenadressen stattfindet. Die AdreßSignale A8 bis A17 werden dann zur Spaltenadresse und die Signale X0 bis X7 zur Zeilenadresse. Die Auswahl dieser Speicher¬ matrix 26 erfolgt, wenn zumindest eines der beiden Adreß- signale A18 und A19 aktiv ist. Sie werden daher durch ein

OR-Glied 60, dessen Ausgangssignal den Select-Eingang 62 ^'der Speichermatrix 26 steuert, disjunktiv verknüpft.

Die Signale X0 bis X7 stammen vom zweiten Multiplexer 38. Mit diesem kann eine Umschaltung von den Adreßsignalen AO bis A7 auf die Ausgangssignale 10 bis 17 des Indexspei- chers 28 erfolgen. Diese Umschaltung ist erforderlich, wenn die Speichermatrix 26 spaltenweise indiziert adressiert werden soll. Da dies für den Speicherbereich COOOO bis FFFFF erfolgen soll, muß die Umschaltung erfolgen, wenn die beiden höchstwertigen AdreßSignale A19 und A18 gleich¬ zeitig 1 sind, d.h. wenn das Signal SE am Ausgang des UND-Gliedes 48 1 ist.

Da dem MatrixSpeicher 24 der Speicherbereich 20000 bis 3FFFF zugeordnet ist, erfolgt die Auswahl dieses Matrix¬ speichers 24 mit den Signalen S2^" und S3^" des Decoders 34. Diese Signale werden durch Invertierer 64 bzw. 66 in¬ vertiert und anschließend durch ein NOR-Glied 68 ver- knüpft, dessen Ausgang 70 mit dem Select-Eingang 72 des Matrixspeichers 24 verbunden ist. Dieser umfaßt einen Speicherbereich von 256x256 Byte = 64kByte. Zu seiner Adressierung ist daher nur eine 16 Bit-Adresse, bestehend aus einer 8 Bit-Zeilen- und einer 8 Bit-Spaltenadresse, erforderlich. Diese 16 Bit-Adresse wird dem Matrixspei¬ cher 24 vom dritten Multiplexer 40 zugeführt. Die Steue¬ rung dieses Multiplexers 40 erfolgt durch das Signal s vom Decoder 34. Ist dieses Signal logisch 0, so werden die O-Eingänge des Multiplexers 40 für die Bildung der 16 Bit-Adresse des Matrixspeichers 24 verwendet. Diese •

O-Eingänge sind mit den Adreßbits Aθ bis A15 in aufsteigen¬ der normaler Adreßreihenfolge beaufschlagt. Bei den 1-Ein¬ gängen des Multiplexers 40 sind die Spalten- und Zeilen- adreßbits des Matrixspeichers 24 vertauscht angeordnet. Die Adresse A8 bis A15 ist in diesem Falle die Spalten¬ adresse, während die Adresse AO bis A7 die Zeilenadresse darstellt. Durch diese Adreßumschaltung durch den Multi¬ plexer 40 kann der Matrixspeicher 24, der bei der Durch¬ führung des vorstehend beschriebenen Verfahrens als Attri- but- und DeskriptorSpeicher dient, sowohl zeilenweise als auch spaltenweise adressiert werden.

Fig. 7 zeigt ein Indikatorsystem zur Klassifikation der Da¬ tenstruktur einer Datenelementreihe. Es besteht aus einer Schnittstellenkontrollschaltung 74, die den bidirektio¬ nalen Datenverkehr regelt, einem NUR-Lesespeicher 76, dem ein Register E und ein Register F nachgeschaltet sind, einer mit den Ausgängen dieser Register verbundenen Zähleranordnung 78, welche (8x2) 8 Bit-EinzelZähler umfaßt, einer von einem weiteren Zähler 80 mit 4 Bit-Ausgang ge¬ steuerten 1 aus 16 Auswahlschaltung 82 und einer Steuer¬ einheit 84 zur Steuerung dieser Komponenten.

Nachdem vorstehend der Aufbau dieses Indikatorsystems be¬ schrieben wurde, wird im folgenden seine Funktionsweise anhand von Fig. 7 in Verbindung mit Fig. 8 näher erläu¬ tert. Zunächst werden die Datenelemente z.B. einer Daten¬ elementspalte der Schnittstellenkontrollschaltung 74 zuge- führt. Die durch das Signal RD aktivierte Steuereinheit 84 gibt ein ÜbernahmeSignal R an die Schnittstellenkontroll- schaltung 74 ab, wodurch die Übernahme der Datenelemente bewirkt wird. Diese dienen zur Adressierung des einspaltigen, aus 256 Zeilen bestehenden, ^'die Indikatorcodeworte enthalten- den NUR-Lesespeichers 76. Zu Beginn des ersten Zyklus zur Übernahme des ersten Indikatorcodewortes in die Register E bzw. F werden sämtliche Zähler durch das Signal NORM rück¬ gesetzt. Während jeweils eines Zyklus wird ein einem Datenelement entsprechendes Indikatorcodewort zunächst mit dem Takt T1 in das Register E übernommen. Mit dem Takt T3, der mit zeitlichem Abstand auf den Takt T1 folgt, wird dasselbe Indikatorcodewort in das Register F übernommen. Wie aus Fig. 8 zu entnehmen ist, die eine 2x8 Bit-Zähler¬ kombination der Zähleranordnung 78 von Fig. 7 im Detail zeigt, sind für jedes Bit der Register E und F zwei 8 Bit- Zähler vorgesehen. Dabei zählt beispielsweise der Zähler 86 wie oft das Bit 0 des Registers E logisch 1 ist und der Zähler 88 zählt die Wechsel von 0 nach 1 oder umgekehrt. Beim Zähler 86 wird dies dadurch realisiert, daß dem Zählereingang ein UND-Glied 90 vorgeschaltet ist, an dessen Eingängen das Signal E0 des Registers E und der Takt T2, der zeitlich zwischen dem Takt T1 und dem Takt T3 liegt, anliegen. Hat also das Bit E0 des Re¬ gisters E den Wert 1, so wird der Zähler 86 mit dem Takt T2 um 1 erhöht.

Die Wechsel von 0 nach 1 oder umgekehrt werden beispiels- weise bei der Bitposition 0 dadurch festgestellt, daß die Signale E0 und FO der Register E und F einem EXKLUSIV- ODER-Glied 94 zugeführt werden, dessen Ausgang mit dem einen Eingang 96 eines UND-Gliedes 98 verbunden ist. Das AusgangsSignal dieses UND-Gliedes 98 steuert den Zähler 88. Stimmen die Signale E0 und FO nicht überein, so ist das

Ausgangssignal des EXKLUSIV-ODER-Gliedes 94 logisch 1. In ^' diesem Falle wird bei Auftreten des Taktes T2A der Zähler 88 um 1 erhöht. Da ein am Ausgang des NUR-Lesespeichers 76 vorliegendes Indikatorcodewort beim Takt T1 in das Regi- ster E und erst beim Auftreten des Taktes T3 in das Regi¬ ster F übernommen wird, ist zum Zeitpunkt T2A, der z-wischen dem Zeitpunkt T1 und T3 liegt, das am Ausgang des NUR-Lese- speichers 76 vorhandene Indikatorcodewort nur im Register E gespeichert, während im Register F noch das Indikatorcode- wort enthalten ist, das beim unmittelbar vorausgehenden Zyklus aus dem NUR-Lesespeicher 76 ausgelesen wurde. Auf diese Weise kann mit dem Zähler 88 festgestellt werden, wie oft benachbarte Indikatorcodeworte einer Datenfolge bei der Bitposition 0 voneinander abweichen. Wichtig ist bei dieser Zähleranordnung, daß der Takt T2A im ersten

Taktzyklus unterdrückt wird, da sonst die Anzahl der Bit¬ wechsel falsch gezählt wird.

Nach der Übernahme sämtlicher Datenelemente einer Datenele- mentreihe durch die Schnittstellenkontrollschaltung 74 werden von der 1 aus 16-AuswahlSchaltung 82 nacheinander die Signale AUSWAHL 0 bis AUSWAHL 16 erzeugt, wobei die Sig¬ nale AUSWAHL 0 und AUSWAHL 1 die beiden Leitungstreiber 92 und 100 steuern. Zuerst wird der Zählerstand des Zäh- lers 86 über den Leitungstreiber 92 und über die Schnitt- stellenkontrollschaltung 74 auf den Datenbus gegeben. Nach jeder Zählerstandausgabe wird der Zähler 80 durch ein von der-Steuereinheit 84 erzeugtes Signal C um 1 hochgezählt. Der um 1 erhöhte Zählerstand des Zählers 80 dient zur Auswahl des nächsten Einzelzählers der Zähler¬ anordnung 78.

Da für jedes Bit der Indikatorcodeworte zwei in Fig. 8 ge¬ zeigte Einzelzähler vorhanden sind, kann für jede Bit- position der Indikatorcodeworte einer Datenfolge fest¬ gestellt werden, wie oft die entsprechende Bitposition 1 ist fczw. wie oft Wechsel von 0 nach 1 oder umgekehrt stattfinden. Insgesamt sind also 8x2 = 16 8 Bit-Einzel¬ zähler vorgesehen. Die Auswertung der Zählergebnisse kann beispielsweise per Software erfolgen.

In Fig. 9 ist das Blockschaltbild einer Halbzeichenkompri- miereinrichtung für Datenworte von 8 Bit Länge gezeigt. Sie umfaßt eine Schnittstellenschaltung 102, durch die der Datentransfer und die Datenkontrolle vorgenommen wird. Ihr sind ein MODUS-Register 104 einerseits und ein Multi¬ plexer 106 mit nachfolgendem Zeichenregister 108 anderer¬ seits nachgeschaltet. Die Ausgänge des Zeichenregisters 108 sind mit den Eingängen einer ErkennungsSchaltung 110 für ein Füllzeichen, beispielsweise X'F', verbunden. Sie sind ferner mit dem niederwertigen Teil der Adreßein¬ gänge eines Festwertspeichers 112, kurz ROM genannt, verbunden. Die höherwertigen Adreßeingänge dieses ROM 112 sind mit den vier niederwertigen Ausgängen des MODUS-Re- gisters 104 verbunden. Insgesamt ist der ROM 112 mit einer 8 Bit-Adresse adressierbar und umfaßt daher maximal 256 Zeilen. Für jede Adresse sind 14 Bits im ROM 112 ge- speichert. Während maximal 9 Bits für die Darstellung des Zeichens selbst vorgesehen sind, ist in weiteren 4 Bits die Anzahl der gültigen linksbündigen Zeichenbits codiert. Ein Bit ist für den Fehlerfall vorgesehen. Es setzt dann das Bit M6 des MODUS-Registers 104. Die übri- gen Ausgänge des ROM 112, die 13 Bits umfassen, sind mit einem G-Register 114 und mit einem H-Register 116 ver¬ bunden, wobei das G-Register 114 die gerade am Ausgang des ROM 112 vorliegenden Daten und das H-Register 116 die Daten enthält, die zuletzt aus dem ROM 112 ausgelesen wurden. Die Ausgänge beider Register 114 und 116 sind mit einem 13 Bit-Vergleicher 118 verbunden. Es ist ferner ein Zähler 120 vorgesehen, der in Abhängigkeit vom Ver¬ gleichsergebnis des Vergleichers 118 hochgezählt wird. Die Ausgänge dieses Zählers 120 sind ebenso wie die Aus- gänge des H-Registers 116 mit den Eingängen einer 13 Bit- Multiplexerschaltung 122 verbunden. Dieser sind ein 9 Bit- Schieberegister 124 sowie ein Schiebezähler 126 nachge¬ schaltet. Der serielle Ausgang des Schieberegisters 124 ist mit dem Eingang eines Pufferspeichers 127 verbunden. Es ist ferner ein Zeichenzähler 128 vorgesehen, der bei der Übernahme von jeweils 8 Bits vom Schieberegister 124 in den Pufferspeicher 127 um 1 hochgezählt wird. Das funktionsgerechte Zusammenwirken der vorstehend genann¬ ten Komponenten der Halbzeichenkomprimiereinrichtung wird durch einen Mikroprozessor 130 gesteuert.

Im folgenden soll die Funktionsweise dieser Halbzeichen- komprimiereinrichtung näher erläutert werden. Soll eine Folge von 8 Bit-Datenworten, beispielsweise eine Daten¬ elementspalte einer Speichermatrix komprimiert werden, so wird zunächst das vom vorstehend beschriebenen Indika¬ torsystem für die betreffende Datenspalte erzeugte Klassi- fikationsergebnis von der Schnittstellenschaltung 102 übernommen und in das MODUS-Register 104 eingeschrieben. Dieses MODUS-Register 104 umfaßt 8 Bits, wovon 6 Bits durch die Signale DO bis D5 geladen werden. Die restlichen Bits sind Fehleranzeigen. Dabei dienen die Bits MO.bis M3 zur Speicherung des vom Indikatorsystem erhaltenen Klassi¬ fikationsergebnisses, durch das die Art des Komprimierens festgelegt wird. Das Bit M4 gibt an, ob ein Füllzeichen, in diesem Falle das Halbzeichen X'F' unterdrückt werden soll, Das Bit M5 dient zur Umschaltung der Datenauswahl, d.h. durch das Bit M5 wird festgelegt, ob bei den anschließend zu übernehmenden Datenworten die Bits DO bis D3 oder D4 bis D7 als zu komprimierende Halbzeichen herangezogen werden sollen. Das Bit M6 dient zur Fehleranzeige und wird vom ROM 112 übernommen. Es zeigt an, wenn Daten nicht korrekt komprimiert werden konnten. Das Bit M7 bleibt frei.

Nach dem Laden des MODUS-Registers werden die Datenworte der zu komprimierenden Datenelementspalte nacheinander von der Schnittstellenschaltung 102 übernommen und dem Multiplexer 106 zugeführt. Von diesem werden in Abhängig¬ keit vom MODUS-Register-Bit M5 entweder die Datenbits DO bis D3 oder die Datenbits D4 bis D7 ausgewählt und dem Zeichenregister 108 zugeführt. Anschließend werden die vom Zeichenregister 108 übernommenen Datenbits durch die Erkennungsschaltung 110 für das Füllzeichen, in diesem Falle für das Halbzeichen X'F¹, überprüft. In Abhängigkeit vom MODUS-Register-Bit M4 wird dann das übernommene 4 Bit Halb¬ zeichen unterdrückt, wenn es mit dem Halbzeichen X'F¹ über- einstimmt. Anschließend wird der ROM 112 durch die Bits MO bis M3 des MODUS-Registers 104 als höherwertiger Adreßteil und mit dem übernommenen Halbzeichen als nieder- wertiger Adreßteil vom Zeichenregister 108 adressiert. Dabei geben die 4 Bits MO bis M3 an, auf welche Weise das jeweilige Halbzeichen konvertiert werden soll. Da aufgrund der 4 Bit Länge der Halbzeichen nur maximal 16 verschie¬ dene Halbzeichen auftreten können, sind für jede durch die höherwertigen 4 Bits der ROM-Adresse festgelegte Komprimierungsart 16 Zeilen im ROM 112 vorgesehen, in denen die Komprimierungscodeworte der Halbzeichen für die betreffende Komprimierungsart enthalten sind..Neben den maximal 9 Bits für die Darstellung der Halbzeichen sind im ROM 112 in jeder Zeile jeweils weitere 4 Bits vorgesehen, die die Anzahl der gültigen linksbündigen Codewortbits wiedergeben. Das 14. Bit ist, wie bereits vorstehend erwähnt, für den Fehlerfäll vorgesehen und setzt das MODUS-Register- Bit M6. Das G-Register 114 und das H-Register 116 werden vom ROM 112 derart geladen, daß das G-Register 114 je- weils den zuletzt ausgelesenen Wert des ROM 112 und das H-Register 116 den unmittelbar davor ausgelesenen Wert enthält. Durch den Vergleicher 118 werden die beiden Re¬ gister 114 und 116 nach jeder Codewortübernahme mit¬ einander verglichen. Mit dem Zähler 120 wird gezählt, wie oft die beiden Register 114 und 116 nach Übernahme eines neuen Codewortes unmittelbar hintereinander überein¬ stimmen. Mit Hilfe der Multiplexerschaltung 122 wird ent¬ weder der Inhalt des H-Registers 116 oder der Zähler¬ stand des Zählers 120 an das Schieberegister.124 und an den Schiebezähler 126 ausgegeben. Die Steuerung der Multi¬ plexerschaltung 122 wird dabei durch den Mikroprozessor 130 vorgenommen. Stimmen die Register 114 und 116 mehrfach hintereinander nicht überein, so wird der Inhalt des H-Registers 116 jeweils dem Schieberegister 124 und dem Schiebezähler 126 zugeführt. Dabei erhält das Schiebere¬ gister 124 die maximal 9 Bits des Komprimierungscodewor¬ tes und der Schiebezähler 126 das Codewort für die Anzahl der gültigen linksbündigen Codewortbits des Schieberegi¬ sters 124. Stimmen dagegen die Register 114 und 116 bei¬ spielsweise n mal hintereinander überein, so wird zunächst der Inhalt des H-Registers 116 mit Hilfe der MultiplexerSchal¬ tung 122 an das Schieberegister 124 bzw. an den Schiebezähler 126 ausgegeben. Anschließend wird, gesteuert durch den Mikro¬ prozessor 130, das Zählergebnis des Zählers 120 der Mul- tiplexerschaltung 122 zugeführt und durch diese in Abhängig¬ keit von der durch das Klassifikationsergebnis des Indi¬ katorsystems festgelegten Art der Komprimierung umcodiert und in dieser Form an das Schieberegister 124 und an den Schiebezähler 126 ausgegeben. Auch in diesem Falle ent¬ hält der Schiebezähler 126 die Anzahl der gültigen links¬ bündigen Bits des Schieberegisters 124. Diese werden, ge¬ steuert durch den Schiebezähler 126, an den Pufferspei- eher 127 ausgegeben. Die von diesem übernommenen Bits wer¬ den gezählt. Bei der Übernahme von je 8 Bits wird der Zeichenzähler 128 jeweils um 1 erhöht. Nach der Komprimie¬ rung sämtlicher Datenelemente der Datenelementspalte wird der Pufferspeicher 127 solange mit Nullen aufgefüllt, bis die gespeicherte Bitanzahl ein ganzzahliges Vielfaches von 8 Bits ist. Anschließend wird der Inhalt des Puffer¬ speichers 127, der nun die Datenelemente der Datenele¬ mentspalte als Komprimierungscodeworte enthält, der Schnitt¬ stellenschaltung 102 zugeführt und dann ausgegeben.

Die AuswahlSignale des gesamten aus zwei Halbzeichenkom- primiereinrichtungen bestehenden Komprimierers sind derart festgelegt, daß die beiden Halbzeichenkomprimiereinrich- tungen 4-bitweise parallel arbeiten können, die Modus¬ einstellung und das Auslesen der Ergebnisse jedoch ge¬ trennt erfolgen kann.

In Fig. 10 ist eine Schaltungsanordnung zur logischen Ver¬ knüpfung von Datenelementen gemäß folgender Wahrheits¬ tabelle gezeigt:

A x B = 0 falls A = B A x B = B falls A ≠ B

unter der Bedingung B ≠ 0, mit 0 als Wiederholungszeichen.

Diese Schaltungsanordnung besteht aus einem A-Register 132, aus einem B-Register 134, aus 8 EXKLUSIV-ODER-Gliedern 136, durch^" die das A-Register 132 und das B-Register 134 bit¬ weise miteinander verknüpft werden, aus_.einem ODER-Glied .138, das die Ausgänge der 8 EXKLUSIV-ODER-Glieder 136 disjunk- tiv verknüpft, und aus einem Invertierer 140, über den das Ausgangssignal des ODER-Gliedes 138 einem Eingang eines UND-Gliedes 142 zugeführt wird. Der zweite Eingang des UND-Gliedes 142 wird mit dem Takt T2 beaufschlagt. Durch das AusgangsSignal RES B des UND-Gliedes 142 kann das B- Register 134 rückgesetzt werden.

Sollen zwei 8 Bit Datenelemente A und B gemäß obiger Funktion logisch verknüpft werden, so werden sie mit dem Takt T1 in das A-REgister 132 bzw. in das B-Register 134 geladen. Durch die bitweise EXKLUSIV-ODER-Verknüpfung der Inhalte der beiden Register 132 und 134 erhält man an den Ausgän¬ gen derjenigen EXKLUSIV-ODER-Glieder 136 ein Signal logisch 0, deren Eingänge übereinstimmen. Stimmen die Inhalte der beiden Register 132 und 134 in allen Bitpositionen überein, so erscheint an sämtlichen Ausgängen der EXKLUSIV-ODER- Glieder 136 das Signal logisch 0, so daß am Ausgang des ODER-Gliedes 135 ebenfalls das Signal logisch 0 und am Ausgang des Invertierers 140 folglich das Signal logisch 1 anliegt. Die UND-Verknüpfung des logisch 1 Signales am Ausgang des Invertierers 140 mit dem Taktsignal T2 durch das UND-Glied 142 bewirkt, daß an dessen Ausgang bei einem Takt T2 = logisch 1 das Signal RES B = logisch 1 auftritt, das das B-Register 134 rücksetzt, so daß dieses an allen Bitpositionεn Nullen enthält.

Ist dagegen das AusgangsSignal wenigstens eines der 8 EXKLUSIV-ODER-Glieder 136 logisch 1, was dann der Fall ist, wenn die Inhalte der beiden Register 132 und 134 zumindest an einer Bitposition nicht übereinstimmen, so erscheint am Ausgang des ODER-Gliedes 138 das Signal lo¬ gisch 1 , welches nach Invertierung durch den Invertierer 140 dem UND-Glied 142 zugeführt wird. In diesem Falle bleibt der Signalpegel logisch 0 am Ausgang des UND-Glie¬ des 142 bei Auftreten des Taktsignals T2 = logisch 1 erhalten, mit der Folge, daß das B-Register 134 nicht rückgesetzt wird und seinen Inhalt beibehält.

Claims

Patentansprüche

1. Verfahren zum Komprimieren und Dekomprimieren mehrerer strukturverwandter Datenfolgen, insbesondere Datensätze, bei dem die zu komprimierenden Datenfolgen in einer Spei¬ chermatrix unter Berücksichtigung ihrer Strukturverwandt¬ schaft parallel gespeichert werden, zur Gewinnung einer eine Anzahl von Datenelementen der Da.tenfolgen verbinden- den Charakteristik für mehrere Datenfolgen eine Struk¬ turanalyse von Datenelementen übereinstimmender Ordnungs¬ zahl vorgenommen wird, anstelle dieser Datenelemente ein Code verwendet wird und beim Dekomprimieren die durch De¬ codieren, des Codes gewonnenen Datenelemente in Datenfol- gen unter Berücksichtigung der jeweils betreffenden Daten¬ element-Ordnungszahl geordnet werden, dadurch g e ¬ k e n n z e i c h n e t , daß vor der Strukturanalyse die gespeicherten Datenfolgen auf ihre Länge untersucht, mit Datenfolgen gleicher Länge Datenfolgengruppen gebil- det und die Datenfolgengruppen nach zunehmender oder abnehmender Länge geordnet werden.

2. Verfahren nach Anspruch 1, dadurch g e k e n n ¬ z e i c h n e t , daß geordnete Datenfolgen gleicher effektiver Länge auf übereinstimmende Datenfolge-- Charakteristik untersucht und entsprechend geordnet wer¬ den.

3. Verfahren nach Anspruch 2, dadurch g e k e n n ¬ z e i c h n e t , daß bei geordneten Datenfolgen glei- eher effektiver Länge und gleicher Charakteristik die Speichermatrix-Zeilennummer festgestellt wird und daß diese Datenfolgen nach zunehmender oder abnehmender Speichermatrix-Zeilennummer geordnet werden.

4. Verfahren nach einem der vorhergehenden Ansprüche, da¬ durch g e k e n n z e i c h n e t , daß jede Daten¬ folge durch ein mindestens die effektive Datenfolgelänge, mindestens eine Datenfolgecharakteristik und die Spei- chermatrix-Zeilennummer enthaltendes Attributfeld er¬ gänzt wird.

5. Verfahren nach einem der vorhergehenden Ansprüche, da¬ durch g e k e n n z e i c h n e t , daß die einzel- nen Datenfolgen seriell vorkomprimiert werden.

6. Verfahren nach Anspruch 4 und 5, dadurch g e k e n n ¬ z e i c h n e t , daß das jeweils letzte Datenelement mindestens einer Datenfolge sowie ggf. die Zahl solcher Datenelemente (Wiederholungsfaktor) in das Attributfeld übernommen wird und daß dieses letzte Datenelement sowie seine mit ihm übereinstimmenden unmittelbaren Vorgänger zur Verkürzung in der Datenfolge eliminiert werden.

7. Verfahren nach Anspruch 6, dadurch g e k e n n ¬ z e i c h n e t , daß das letzte und das vorletzte Datenelement der unverkürzten Datenfolge als Datenfolge¬ charakteristik in das Attributfeld übernommen und in der Datenfolge eliminiert werden.

8. Verfahren nach einem der Ansprüche 5 bis 7, dadurch g e k e n n z e i c h n e t , daß mindestens die läng¬ ste aus gleichen Datenelementen bestehende Zeichenkette einer Datenfolge eliminiert und durch Füllzeichen er- setzt wird und daß diese Zeichenkette in einem für jede Datenfolge separat vorgesehenen Deskriptorfeld durch einen den Zeichenkettenanfang markierenden Zeiger, durch die Zeichenkettenlänge und durch das ersetzte Zeichen beschrieben wird.

9. Verfahren nach einem der Ansprüche 5 bis 8, dadurch g e k e n n z e i c h n e t , daß zumindest die größte Flatterung von Störzeichen, beispielsweise von Leerzei¬ chen, Nullzeichen und dgl. bei den zu komprimierenden Datenfolgen festgestellt wird, daß die Storzeichen durch Füllzeichen ersetzt werden und daß das Störzeichenfeld durch einen den Stδrzeichenfeldanfang markierenden Flatterungszeiger, durch die Feldlänge und durch das ersetzte Störzeichen beschrieben wird.

10. Verfahren nach einem der vorhergehenden Ansprüche, da¬ durch g e k e n n z e i c h n e t , daß für jede Datenelementspalte jeweils mindestens ein Spaltendeskrip¬ torfeld vorgesehen wird, das die Datenelementspalte zu- mindest teilweise beschreibt.

11. Verfahren nach Anspruch 10, dadurch g e k e n n ¬ z e i c h n e t , daß aus gleichen Zeichen bestehende Datenelementspalten eliminiert, durch Füllzeichen er- setzt und in denbetreffenden Deskriptorfeldern durch

Angabe des jeweils ersetzten Zeichens beschrieben wer¬ den.

12. Verfahren nach Anspruch 11, dadurch g e k e n n - z e i c h n e t , daß zumindest die längste aus glei¬ chen Datenelementen bestehende Zeichenkette einer Daten¬ elementspalte eliminiert und durch Füllzeichen ersetzt wird und daß diese Zeichenkette im jeweiligen Spalten¬ deskriptor durch einen den Zeichenkettenanfang markie- renden Zeiger, durch die Zeichenkettenlänge und durch das ersetzte Zeichen beschrieben wird.

13. Verfahren nach Anspruch 11, dadurch g e k e n n ¬ z e i c h n e t , daß zumindest die längste aus glei¬ chen Datenelementen bestehende Zeichenkette einer Daten¬ elementspalte in ein im Vergleich zur betreffenden Zei- chenkette kürzeres Codewort umcodiert und durch dieses ersetzt wird und daß die dabei freiwerdenden Datenele¬ mentplätze mit Füllzeichen aufgefüllt werden.

14. Verfahren nach Anspruch 10, 12 oder 13, dadurch g e - k e n n z e i c h n e t , daß zwei benachbarte Zeichen¬ ketten einer Datenelementspalte vertauscht werden und daß ein die Berührungsstelle der Zeichenketten in ihrer ursprünglichen Lage markierender Zeiger und die Längen der Zeichenketten im Deskriptorfeld der betreffenden Datenelementspalte gespeichert werden.

15. Verfahren nach Anspruch 10, 12, 13 oder 14, dadurch g e k e n n z e i c h n e t , daß die Datenelemente mindestens eines Teiles einer Datenelementspalte in ei- nen für diese spezifischen, weniger redundanten Code umgeschlüsselt werden.

16. Verfahren nach Anspruch 10, 12, 13, 14 oder 15, dadurch g e k e n n z e i c h n e t , daß die Datenelemente einer Datenelementspalte durch die logische Funktion mit der -Wahrheitstabelle

A x B = W, falls A =^• B und A x B = B, falls A ≠ B

unter der Bedingung B ≠ W, wobei W ein beliebiges Wie¬ derholungszeichen ist, verknüpft werden.

17. Verfahren nach einem der vorhergehenden Ansprüche, da¬ durch g e k e n n z e i c h n e t , daß jedes Daten¬ element einer Datenelementspalte in ein Bewertungs- oder Indikatorcodewort umgeschlüsselt wird, daß die Iπdika- torcodeworte der einzelnen Datenelemente einer Datenele¬ mentspalte bitweise addiert werden, daß unmittelbar benachbarte Indikatorcodeworte bitweise EXKLUSIV-ODER- verknüpft werden, daß die Verknüpfungsergebnisse addiert werden und daß die beiden Additionsergebnisse zur Klassi- fikation der Datenstruktur ausgewertet werden.

18. Verfahren nach Anspruch 17, dadurch g e k e n n ¬ z e i c h n e t , daß jede Datenelementspalte halbzei¬ chenweise in eine durch das Klassifikationsergebnis festgelegte Art von Codeworten umgesetzt wird.

19. Verfahren nach Arispruch 18, dadurch g e k e n n ¬ z e i c h n e t , daß das Klassifikationsergebnis durch m Bits ausgedrückt wird, daß aus dem m Bit- Klassifikationsergebnis zusammenmit einem n Bit-Halbzei¬ chen eine (m+n) Bit-Adresse zur Adressierung eines die Codeworte enthaltenden Codespeichers (112) gebildet wird und daß die adressierten Codeworte nacheinander aus dem Codespeicher (112) ausgelesen werden.

20. Verfahren nach Anspruch 19, dadurch g e k e n n ¬ z e i c h n e t , daß jeweils die beiden zuletzt aus dem Codespeicher (112) ausgelesenen Codeworte nach je¬ dem Lesezyklus des Codespeichers (112) auf Gleichheit überprüft werden.

21. Verfahren nach Anspruch 20, dadurch g e k e n n ¬ z e i c h n e t , daß die Anzahl der unmittelbar auf¬ einanderfolgenden Lesezyklen des Codespeichers (112), nach denen jeweils die beiden zuletzt aus dem Codespei- eher (112) ausgelesenen Codeworte übereinstimmen, ge¬ zählt wird.

22. Verfahren nach Anspruch 21, dadurch g e k e n n ¬ z e i c h n e t , daß das Zählergebnis in Abhängigkeit von der Art der Codeworte derart verschlüsselt wird, daß das verschlüsselte Zählergebnis von den betreffenden Codeworten unterscheidbar ist..

23. Verfahren nach einem der Ansprüche 18 bis 22, dadurch g e k e n n z e i c h n e t , daß das in einer Daten¬ elementspalte überwiegend auftretende Halbzeichen ein einziges Mal und-jedes der verbleibenden Halbzeichen sowie ein die jeweilige Stelle dieser verbleibenden Halb¬ zeichen anzeigender Zeiger separat im Komprimierungscode dargestellt werden.

24. Datenverarbeitungseinrichtung zur Durchführung des Ver¬ fahrens nach einem der vorhergehenden Ansprüche, dadurch g e k e n n z e i c h n e t , daß eine Speichermatrix (26) an ihren Adreßeingängen mit einer ersten Umschalt¬ einrichtung (36) versehen ist, mit der in Abhängigkeit von einem ersten Umschaltsignal die Zeilen- und Spalten¬ adressen der Datenelementspeicherplätze vertauschbar sind.

25. DatenverarbeitungseinrichtungnachAnspruch 24, dadurch g e k e n n z e i c h n e t , daß ein Indexspeicher (28) vorgesehen ist, dessen Zeilenanzahl mit derjenigen der Speichermatrix (26) übereinstimmt und der die Zei- lenadressen der Speichermatrix (26) in sortierter Reihen¬ folge enthält.

26. Datenverarbeitungseinrichtung nach Anspruch 25, dadurch g e k e n n z e i c h n e t , daß eine zweite Umschalt- einrichtung (38) vorgesehen ist, mit der die Zeilen- adreßeingänge der Speichermatrix (26) in Abhängigkeit von einem zweiten Umschaltsignal mit den Ausgängen des Indexspeichers (28) beaufschlagbar sind.

27. Datenverarbeitungseinrichtung nach einem der Ansprüche 24 bis 26, dadurch g e k e n n z e i c h n e t , daß ein Attribut- und Deskriptorspeicher (24) an seinen Adreßeingängen mit einer dritten Umschalteinrichtung (40) verbunden ist, mit der in Abhängigkeit von einem dritten Umschaltsignal die Zeilen- und Spaltenadressen der Speicherplätze vertauschbar sind.

28. Datenverarbeitungseinrichtung nach einem der Ansprüche 24 bis 27, dadurch g e k e n n z e i c h n e t , daß mindestens ein Decoder (34) zur Gewinnung des jewei¬ ligen Umschaltsignals aus der Speicheradresse vorgesehen ist.

29. Datenverarbeitungseinrichtung nach einem der Ansprüche 24 bis 28, dadurch g e k e n n z e i c h n e t , daß die jeweilige Umschalteinrichtung (36, 38, 40) ein Multiplexer ist.

30. Datenverarbeitungseinrichtung zur Durchführung des Ver¬ fahrens nach einem der Ansprüche 17 bis 23, dadurch g e k e n n z e i c h n e t , daß ein die Indikator¬ codeworte enthaltender Lesespeicher (76) vorgesehen ist, der durch die Datenelemente adressierbar ist.

31. Datenverarbeitungseinrichtung nach Anspruch 30, dadurch g e k e n n z e i c h n e t , daß eine Zähleranordnung (78) mit gegenüber der Bit-Zahl der Indikatorcodeworte doppelten Zahl von Einzelzählern (86, 88) mit dem Daten¬ ausgang des Lesespeichers- (76) verbunden ist und ddß der Hälfte der Einzelzähler (86, 88) EXKLUSIV-ODER-Glieder (94) vorgeschaltet sind, deren Eingängen jeweils eine Bitposition von im Lesespeicher (76) unmittelbar benach- ' harten Indikatorcodeworten zugeführt ist.

32. Datenverarbeitungseinriehtung nach Anspruch 31, dadurch g e k e n n z e i c h n e t , daß zwischen dem Daten¬ ausgang des Lesespeichers (76) und den Eingängen der EXKLUSIV-ODER-Glieder (94) zwei Register (E, F) vorge¬ sehen sind, welche zur Zwischenspeicherung des jeweils zuletzt bzw. des unmittelbar davor aus dem Lesespeicher (76) ausgelesenen Indikatorcodewortes dienen.

33. Datenverarbeitungseinriehtung zur Durchführung des Ver- fahrens nach einem der Ansprüche 18 bis 23, dadurch g e k e n n z e i c h n e t , daß ein Festwertspeicher (112) als Codespeicher vorgesehen ist, der vom Daten¬ struktur-Klassifikationsergebnis der zu komprimierenden Datenspalte und vom jeweiligen Halbzeichen der betreffen- den Datenspalte adressierbar ist, wobei das Datenstruktur- klassifikationsergebnis den höherwertigen Adreßteil und das jeweilige Halbzeichen den niederwertigen Adreßteil bildet.

34. Datenverarbeitungseinriehtung nach Anspruch 33, dadurch g e k e n n z e i c h n e t , daß dem Codespeicher (112) ein erstes und ein zweites Register (114, 116) zur Zwischenspeicherung des jeweils zuletzt und des unmittel- bar davor ausgelesenen Codewortes nachgeschaltet sind.

35. Datenverarbeitungseinriehtung nach Anspruch 34, dadurch g e k e n n z e i c h n e t , daß eine Vergleichs¬ schaltung (118) mit den Ausgängen des ersten (114) und des zweiten Registers (116) verbunden ist, die einen Zähler (120) steuert.

36. Datenverarbeitungseinriehtung nach Anspruch 35, dadurch g e k e n n z e i c h n e t , daß zum von der Art der Codeworte abhängigen Verschlüsseln des auszugebenden Zählerstandes des Zählers (120) eine die Verschlüsse¬ lungscodeworte enthaltende -Multiplexerschaltung (122) vorgesehen ist.

37. Datenverarbeitungseinriehtung zur Durchführung des Ver¬ fahrens nach einem der Ansprüche 16 bis 23, dadurch g e k e n n z e i c h n e t , daß ein A-Register (132) und ein B-Register (134) vorgesehen sind, das auch als Ergebnisregister dient, daß die Ausgänge der beiden Register (132, 134) bitweise mit den Eingängen von

EXKLUSIV-ODER-Gliedern (136) verbunden sind und daß die Ausgänge der EXKLUSIV-ODER-Glieder (136) mit den Ein¬ gängen eines disjunktiven Verknüpfungsgliedes (138) verbunden sind, dessen Ausgangssignal den Rücksetzein- gang des B-Registers (134) steuert.