DE69727421T2

DE69727421T2 - Hypertext-Dokumentwiederauffindungssystem zum Wiederauffinden zusammengehöriger Hypertextdokumente

Info

Publication number: DE69727421T2
Application number: DE69727421T
Authority: DE
Inventors: Masato Suginami-ku Ishikawa; Mitsuhiro Seya-ku Sato; Masaki Shinagawa-ku Hoshida; Yoshihiro Ichikawa-shi Noguchi; Hideki Musashino-shi Yasukawa
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1996-05-22
Filing date: 1997-05-13
Publication date: 2004-12-16
Anticipated expiration: 2017-05-14
Also published as: EP0809197A2; KR970076318A; CN1109982C; DE69727421D1; CN1170908A; EP0809197A3; EP0809197B1; KR100229395B1; US5848407A; JPH09311870A; JP3108015B2

Description

HINTERGRUND DER ERFINDUNG
1. GEBIET DER ERFINDUNG
Die vorliegende Erfindung bezieht sich allgemein auf ein Hypertext-Dokumentwiederauffindungssystem oder eine Hypertext-Dokumentwiederauffindungsvorrichtung und konkreter auf eine Hypertext-Dokumentwiederauffindungsvorrichtung, in der mehrere Hypertext-Dokumente, die wahrscheinlich eine Wiederauffindungsanforderung eines Nutzers erfüllen, aus einem großen Umfang an Hypertext-Dokumenten wiederaufgefunden und dem Nutzer präsentiert werden.
2. BESCHREIBUNG DER VERWANDTEN TECHNIK
2.1. FRÜHER VORGESCHLAGENE TECHNIK
Als eine herkömmliche Vorrichtung, in der ein oder mehrere Dokumente, die wahrscheinlich eine Wiederauffindungsanforderung eines Nutzers erfüllen, aus einem großen Umfang an Dokumenten wiederaufgefunden und dem Nutzer präsentiert werden, ist eine in 1 gezeigte Dokumentwiederauffindungsvorrichtung 200 bekannt. In dieser Vorrichtung 200 wird ein großer Umfang an in einer Dokumentverwaltungseinheit 201 gespeicherten Dokumenten vorher in einer Wiederauffindungsindizes entwickelnden Einheit 202 analysiert, und es wird untersucht, wie oft jedes von mehreren, in einem Wörterbuch der Wiederauffindungsindizes entwickelnden Einheit 202 registrierten Worte in jedem der Dokumente erscheint. Das heißt, es wird eine Auftrittshäufigkeit jedes Wortes in einem Dokument für jedes der in der Dokumentverwaltungseinheit 201 gespeicherten Dokumente berechnet, für jedes der Worte ein Abweichungsgrad IDF eines Wortes in den ganzen Dokumenten als ein Korrekturfaktor für das Wort berechnet, eine normierte Auftrittshäufigkeit (ein TF-Wert genannt) jedes Wortes für jedes der Dokumente berechnet, ein geschätzter Wert jedes Dokuments, der ausgedrückt wird durch TF*IDF, für jedes der Worte berechnet, indem der Abweichungsgrad und die normierte Auftrittshäufigkeit miteinander multipliziert werden, und ein Wiederauffindungsindex in der Wiederauffindungsindizes entwickelnden Einheit 202 entwickelt. Im Wiederauffindungsindex wird eine Gruppe bzw. ein Satz aus einem Wort, Identifizierungsdaten, die ein oder mehrere Dokumente angeben, in denen das Wort erscheint, und für jedes der Worte einem geschätzten Wert für das Wort registriert.
Wenn mehrere, von einem Nutzer 207 eingegebene Schlüsselworte in einer Schlüsselworteingabeeinheit 203 empfangen werden, werden danach die Schlüsselworte zu einer Wiederauffindungseinheit 204 übertragen. In der Wiederauffindungseinheit 204 werden mehrere, mit den eingegebenen Schlüsselworten übereinstimmende Wiederauffindungsworte aus dem Wiederauffindungsindex ausfindig gemacht, der in der Wiederauffindungsindizes entwickelnden Einheit 202 gespeichert ist, ein bestimmter Satz bzw. eine bestimmte Gruppe aus einem Wiederauffindungswort, Identifizierungsdaten, die ein oder mehrere Identifizierungsdokumente angeben, in denen das Wiederauffindungswort erscheint, und einem geschätzten Wert für das Wiederauffindungswort wird für jedes der Wiederauffindungsworte aus der Wiederauffindungsindizes entwickelnden Einheit 202 herausgenommen, und die den Schlüsselworten entsprechenden bestimmten Sätze werden zu einer Dokumentrangfolgen bestimmenden Einheit 205 übertragen.
In der Dokumentrangfolgen bestimmenden Einheit 205 werden mehrere Identifizierungstitel, die die Wiederauffindungsdokumente angeben, in absteigender Reihenfolge der geschätzten Werte der Wiederauffindungsdokumente angeordnet, um die Rangfolge der Wiederauffindungsdokumente zu bestimmen, und die gemäß der Rangfolge der Wiederauffindungsdokumente angeordneten Identifizierungstitel werden in einer Wiederauffindungsergebnisse anzeigenden Einheit 206 als Wiederauffindungsergebnis angezeigt. Wenn der Nutzer die auf der Anzeigeeinheit 206 in der geordneten Reihenfolge nacheinander angezeigten Identifizierungstitel auswählt, wird danach das durch den ausgewählten Identifizierungstitel angegebene Wiederauffindungsdokument aus der Dokumentverwaltungseinheit 201 jedesmal zur Anzeigeeinheit 206 ausgelesen, wenn ein Identifizierungstitel ausgewählt wird, und das Wiederauffindungsdokument wird auf der Wiederauffindungsergebnisse anzeigenden Einheit 206 jedesmal angezeigt, wenn ein Identifizierungstitel ausgewählt wird.
Da die Schlüsselworte gemäß einer Wiederauffindungsanforderung eines Nutzers vom Nutzer eingegeben werden, können deshalb mehrere Dokumente, die die Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, in der Reihenfolge des geschätzten Wertes TF*IDF präsentiert werden.
Bekannt sind mehrere Berechnungsmethoden des geschätzten Wertes TF*IDF. Als ein Beispiel eines Berechnungsverfahrens wird der Abweichungsgrad IDF (= 1 – log Nw/N) definiert, der durch Subtrahieren eines logarithmischen Wertes (log Nw/N) des Verhältnisses von 1 erhalten wird. Das Symbol Nw bezeichnet hier die Anzahl von Dokumenten, in denen ein markiertes Wort erscheint, und das Symbol N bezeichnet die Anzahl von in der Dokumentverwaltungseinheit 201 gespeicherten Dokumenten. Die normierte Auftrittshäufigkeit TF (= Fo/Nwd), die durch Teilen einer Auf trittshäufigkeit Fo des markierten Wortes in einem markierten Dokument durch die Anzahl Nwd von im markierten Dokument erscheinenden Worten erhalten wird, wird auch definiert. In diesem Fall wird der geschätzte Wert TF*IDF berechnet, indem der Abweichungsgrad und die normierte Auftrittshäufigkeit miteinander multipliziert werden.
Die Einzelheiten des geschätzten Wertes TD*IDF und einer herkömmlichen Dokumentwiederauffindungsvorrichtung, in der der geschätzte Wert TF*IDF verwendet wird, sind in der Literatur "Salton, Gerard: Introduction to modern Information Retrieval, McGraw-Hill computer science series, 1983, offenbart.
2.2. DURCH DIE ERFINDUNG ZU LÖSENDE PROBLEME:
In Fällen, in denen ein oder mehrere bestimmte Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einem großen Umfang an Hypertext-Dokumenten unter Verwendung der herkömmlichen Dokumentwiederauffindungsvorrichtung wiederaufgefunden werden, besteht jedoch, weil die Hypertext-Dokumente im Allgemeinen nicht voneinander unabhängig sind, sondern die Hypertext-Dokumente oft Referenzbeziehungen untereinander haben, ein Nachteil, dass die Rangfolge der bestimmten Hypertext-Dokumente, die die Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, nicht geeignet bestimmt werden kann. Das heißt, weil Inhalte mehrerer bestimmter Hypertext-Dokumente mit einer Referenzbeziehung untereinander oft mit einer einheitlichen Bedeutung verbunden sind, können die Inhalte der bestimmten Hypertext-Dokumente nicht verstanden werden, indem man nur ein bestimmtes Hypertext-Dokument liest, sondern verstanden werden, indem alle bestimmten Hypertext-Dokumente gelesen werden. Falls ein oder mehrere bestimmte Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, unter Verwendung der herkömmlichen Dokumentwiederauffindungsvorrichtung wiederaufgefunden werden, wird daher ein Bedeutungsgrad jedes bestimmten Hypertext-Dokuments falsch geschätzt, so dass ein Nachteil besteht, dass die Rangfolge der bestimmten Hypertext-Dokumente nicht geeignet bestimmt werden kann. Selbst wenn die bestimmten Hypertext-Dokumente, die gemäß ihren geschätzten Werten in der Rangfolge angeordnet sind, angezeigt werden, besteht, weil die Rangfolge der bestimmten Hypertext-Dokumente nicht geeignet bestimmt wird, auch ein weiterer Nachteil, dass der Nutzer die bestimmten Hypertext-Dokumente nicht in einer geeigneten Reihenfolge der Bedeutungsgrade problemlos auswählen kann.
Da eine Möglichkeit, dass mehrere, in einer Hypertext-Mark-Up-Language (HTML) im WorldWideWeb geschriebene Hypertext-Dokumente eine Referenzbeziehung untereinander haben, beträchtlich hoch ist, kann insbesondere die Rangfolge der bestimmten Hypertext-Dokumente nicht geeignet bestimmt werden, und der Nutzer kann nicht jedes der bestimmten Hypertext-Dokumente problemlos auswählen, selbst wenn die gemäß ihren geschätzten Werten nach Rangfolge geordneten bestimmten Hypertext-Dokumente angezeigt werden.
ZUSAMMENFASSUNG DER ERFINDUNG
Eine Aufgabe der vorliegenden Erfindung ist, unter gebührender Berücksichtigung der Nachteile einer solchen herkömmlichen Dokumentwiederauffindungsvorrichtung eine Hypertext-Dokumentwiederauffindungsvorrichtung zu schaffen, in der ein oder mehrere Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einem großen Umfang an Hypertext-Dokumenten wiederaufge funden und gemäß ihren Bedeutungsgraden geeignet nach Rangfolge geordnet werden, um jedes der Hypertext-Dokumente problemlos auszuwählen, selbst wenn die Hypertext-Dokumente in der Hypertext-Mark-Up-Language im WorldWideWeb geschrieben sind.
Um die Aufgabe der vorliegenden Erfindung zu erfüllen, werden in einer Hypertext-Dokumentwiederauffindungsvorrichtung mehrere bestimmte Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einer Gruppe von Hypertext-Dokumenten mit Referenzbeziehungen untereinander ausgewählt, in der ein Hypertext-Dokument mit einem Ankersatz als Stammdokument für ein anderes Hypertext-Dokument dient, das als Referenzdokument dient, und ein Nutzer verweist auf ein Referenzdokument, nachdem der Nutzer einen Ankersatz eines Stammdokuments entsprechend dem Referenzdokument auswählt.
Im Einzelnen werden in einem Hypertext-Dokumenttabellen erstellenden bzw. vorbereitenden Mittel eine Hypertext-Dokumentinformation, in der ein ein Hypertext-Dokument identifizierender Identifizierer für Hypertext-Dokumente, ein Hauptteil des Hypertext-Dokuments, ein Identifizierer für Stammdokumente, der ein Stammdokument identifiziert, das dem als Referenzdokument dienenden Hypertext-Dokument entspricht, und ein Ankersatz des Stammdokuments registriert sind, für jedes der Hypertext-Dokumente vorbereitet, und eine Hypertext-Dokumenttabelle der Hypertext-Dokumentinformation für alle Hypertext-Dokumente wird vorher vorbereitet.
Danach werden in einem Wiederauffindungsindizes erstellenden bzw. vorbereiteten Mittel mehrere Worte, die in jedem der Hypertext-Dokumente und der Stammdokumente erscheinen, gemäß der durch das Hy pertext-Dokumenttabellen vorbereitende Mittel vorbereiteten Hypertext-Dokumenttabelle realisiert, werden mehrere Auftrittspositionen der Worte in jedem der Hypertext-Dokumente und der Stammdokumente gemäß der Hypertext-Dokumenttabelle realisiert, wird eine Wortinformation, die aus einem oder mehreren Identifizierern für das Auftreten von Dokumenten besteht, die ein oder mehrere Hypertext-Dokumente, in denen ein Wort erscheint, und Auftrittspositionen des Wortes in den Hypertext-Dokumenten und ein oder mehrere Ankersätze eines oder mehrerer, den Hypertext-Dokumenten entsprechenden Stammdokumente identifizieren, für jedes der Worte vorbereitet, und ein Wiederauffindungsindex von Stücken einer Wortinformation für die Worte wird vorher vorbereitet.
Wenn ein die Wiederauffindungsanforderung eines Nutzers angebendes Schlüsselwort in einem Schlüsselworte empfangenden Mittel empfangen wird, wird danach eine bestimmte, dem Schlüsselwort entsprechende Wortinformation im Wiederauffindungsmittel aus dem durch das Wiederauffindungsindizes vorbereitende Mittel vorbereiteten Wiederauffindungsindex wiederaufgefunden. Aus der bestimmten Wortinformation werden mehrere bestimmte Identifizierer für das Auftreten von Dokumenten wiederaufgefunden, die mehrere bestimmte Hypertext-Dokumente identifizieren, in denen das Schlüsselwort erscheint, und mehrere bestimmte Auftrittspositionen des Schlüsselwortes in den bestimmten Hypertext-Dokumenten und einen oder mehrere bestimmte Ankersätze eines oder mehrerer bestimmter Stammdokumente entsprechend den bestimmten Hypertext-Dokumenten.
In einem Dokumentrangfolgen bestimmenden Mittel werden danach die durch die bestimmten Identifizierer für das Auftreten von Dokumenten identifizierten bestimmten Hypertext-Dokumente spezifiziert, werden Stücke bestimmter Hypertext-Dokumentinformationen für die bestimmten Hypertext-Dokumente aus der Hypertext-Dokumenttabelle abgefragt bzw. wiederaufgefunden, die durch das Hypertext-Dokumenttabellen vorbereitende Mittel vorbereitet wurden, werden ein bestimmtes Hypertext-Dokument und ein oder mehrere, dem bestimmten Hypertext-Dokument entsprechende bestimmte Stammdokumente für jedes der bestimmten Hypertext-Dokumente zu einem vereinigten Hypertext-Dokument vereinigt, wird eine Auftrittshäufigkeit des Schlüsselwortes in einem vereinigten Hypertext-Dokument für jedes vereinigte Hypertext-Dokument berechnet, werden mehrere Bedeutungsgrade der vereinigten Hypertext-Dokumente gemäß den Auftrittshäufigkeiten in den vereinigten Hypertext-Dokumenten bestimmt, wird ein Bedeutungsgrad eines vereinigten Hypertext-Dokuments als ein Bedeutungsgrad eines bestimmten Hypertext-Dokuments entsprechend dem vereinigten Hypertext-Dokument für jedes vereinigte Hypertext-Dokument festgelegt, und die Rangfolge der bestimmten Hypertext-Dokumente wird gemäß den Bedeutungsgraden der vereinigten Hypertext-Dokumente bestimmt.
Danach werden mehrere Indizes der bestimmten Hypertext-Dokumente durch ein Wiederauffindungsergebnisse anzeigendes Mittel in einer nach Rangfolge geordneten Reihenfolge entsprechend der Rangfolge der bestimmten Hypertext-Dokumente als Wiederauffindungsergebnis angezeigt.
Da ein vereinigtes Hypertext-Dokument erstellt bzw. vorbereitet wird, indem ein bestimmtes Hypertext-Dokument und ein oder mehrere, dem bestimmten Hypertext-Dokument entsprechende bestimmte Stammdokumente für jedes der bestimmten Hypertext-Dokumente vereinigt werden, und ein Bedeutungsgrad eines vereinigten Hypertext-Dokuments als ein Bedeutungsgrad eines bestimmten Hypertext-Dokuments entsprechend dem vereinigten Hypertext-Dokument für jedes der vereinigten Hypertext-Dokumente berechnet wird, kann die Rangfolge der bestimmten Hyper text-Dokumente bestimmt werden, indem die bestimmten Stammdokumente mit den Referenzbeziehungen mit den bestimmten Hypertext-Dokumenten betrachtet werden. Selbst wenn Inhalte mehrerer spezifischer Hypertext-Dokumente mit einer Referenzbeziehung untereinander mit einer einheitlichen Bedeutung verbunden sind, können daher die spezifischen Hypertext-Dokumente, die die Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einem großen Umfang an Hypertext-Dokumenten korrekt wiederaufgefunden und gemäß ihren Bedeutungsgraden geeignet nach Rangfolge geordnet werden, so dass der Nutzer die spezifischen Hypertext-Dokumente in einer geeigneten Reihenfolge von Bedeutungsgraden problemlos auswählen kann, selbst wenn die spezifischen Hypertext-Dokumente in der Hypertext-Mark-Up-Language im WorldWideWeb geschrieben sind.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
Die Aufgaben, Merkmale und Vorteile der vorliegenden Erfindung werden aus der folgenden Beschreibung ersichtlich werden, die in Verbindung mit den beiliegenden Zeichnungen geliefert wird, in denen:
1 ein Blockdiagramm einer herkömmlichen Dokumentwiederauffindungsvorrichtung ist;
2 eine Referenzbeziehung unter mehreren Hypertext-Dokumenten zeigt, die in einem WorldWideWeb eines Internet distributiv bzw. verteilt verwaltet werden;
3 ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer ersten Ausführungsform der vorliegenden Erfindung ist;
4 eine Hypertext-Dokumenttabelle von Stücken einer Hypertext-Dokumentinformation zeigt, die in einer Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitenden Einheit vorbereitet wurde, die in 3 gezeigt ist;
5 einen Abfrage- bzw. Wiederauffindungsindex von Stücken einer Wortinformation zeigt, die in einer in 3 gezeigten Wiederauffindungsindizes vorbereitenden Einheit vorbereitet wurde;
6 ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer zweiten Ausführungsform der vorliegenden Erfindung ist;
7 ein Beispiel eines Wiederauffindungsergebnisses zeigt, in welchem ein Index eines bestimmten Hypertext-Dokuments mit einem Index eines bestimmten Stammdokuments einer ersten Stufe und einem Index eines bestimmten Stammdokuments einer zweiten Stufe für jedes bestimmte Hypertext-Dokument durch eine in 6 gezeigte Wiederauffindungsergebnisse anzeigende Einheit angezeigt wird;
8 ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer dritten Ausführungsform der vorliegenden Erfindung;
9 ein Beispiel eines Wiederauffindungsergebnisses zeigt, in welchem Indizes mehrerer bestimmter Hypertext-Dokumente mit einem Index eines bestimmten Stammdokuments einer ersten Stufe und einem Index eines bestimmten Stammdokuments einer zweiten Stufe durch eine in 8 dargestellte Wiederauffindungsergebnisse anzeigende Einheit angezeigt werden;
10 ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer vierten Ausführungsform der vorliegenden Erfindung ist;
11 ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer fünften Ausführungsform der vorliegenden Erfindung ist;
12 ein Beispiel eines Wiederauffindungsergebnisses zeigt, in welchem ein Index eines bestimmten Hypertext-Dokuments mit einer Zusammenfassung des bestimmten Hypertext-Dokuments, einem Index eines bestimmten Stammdokuments einer ersten Stufe und einem Index eines bestimmten Stammdokuments einer zweiten Stufe für jedes bestimmte Hypertext-Dokument durch eine in 11 dargestellte Wiederauffindungsergebnisse anzeigende Einheit angezeigt wird;
13 ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer sechsten Ausführungsform der vorliegenden Erfindung ist;
14 ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer siebten Ausführungsform der vorliegenden Erfindung ist;
15 ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer achten Ausführungsform der vorliegenden Erfindung ist;
16 ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer neunten Ausführungsform der vorliegenden Erfindung ist;
17 die Unterteilung eines langen Hypertext-Dokuments mit einem oder mehreren Referenzetiketten zeigt;
18 ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer zehnten Ausführungsform der vorliegenden Erfindung ist;
19 ein Beispiel eines Wiederauffindungsergebnisses, in welchem Indizes von Hypertext-Dokumenten und Tasten bzw. Schaltflächen entsprechend mehreren zusammengehörigen Worten mit hoher Rangfolge angezeigt werden, gemäß der zehnten Ausführungsform darstellt;
20 ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer elften Ausführungsform der vorliegenden Erfindung ist; und
21 ein Beispiel eines Wiederauffindungsergebnisses, in welchem Indizes von Hypertext-Dokumenten und Schaltflächen entsprechend mehreren zusammengehörigen Worten mit hoher Rangfolge angezeigt sind, gemäß der elften Ausführungsform darstellt.
AUSFÜHRLICHE BESCHREIBUNG DER AUSFÜHRUNGSFORMEN
Bevorzugte Ausführungsformen eines Hypertext-Dokumentwiederauffindungssystems bzw. einer Hypertext-Dokumentwiederauffindungsvorrichtung, in der mehrere Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einem großen Umfang an Hypertext-Dokumenten abgefragt bzw. wiederaufgefunden werden, die in einem WorldWideWeb eines Internet distributiv verwaltet werden, werden mit Verweis auf Zeichnungen gemäß dem Konzept der vorliegenden Erfindung beschrieben.
2 zeigt eine Referenzbeziehung unter mehreren Hypertext-Dokumenten, die in einem WorldWideWeb eines Internet distributiv verwaltet werden.
Wie in 2 gezeigt ist, weisen mehrere, in einem WorldWideWeb eines Internet distributiv verwaltete Hypertext-Dokumente D80 bis D86 eine Referenzbeziehung untereinander auf. Das heisst, ein Ankersatz S800 ist im Hypertext-Dokument D80 platziert, ein Ankersatz S801 ist im Hypertext-Dokument D81 platziert, ein Ankersatz S802 ist im Hypertext-Dokument D82 platziert, mehrere Ankersätze S803 bis S805 sind im Hypertext-Dokument D83 platziert, und ein Ankersatz S806 ist im Hypertext-Dokument D84 platziert. In jedem der Ankersätze ist entweder ein Identifizierer, der ein Dokument identifiziert, auf das ein Nutzer Bezug nehmen kann, oder eine Position eines Dokuments verborgen bzw. vergraben, worauf ein Nutzer Bezug nehmen kann.
Ein Dokument, auf das ein Nutzer verweist, wird in dieser Beschreibung Verweis- bzw. Referenzdokument genannt, und ein Dokument mit einem Ankersatz, der ein oder mehrere Referenzdokumente angibt, wird in dieser Beschreibung Stammdokument genannt. Jeder Ankersatz besteht auch aus einem Satz oder mehreren Sätzen.
Wenn ein Nutzer das Stammdokument D801 liest, das auf einer Anzeige eines (Browser genannten) durchsuchte Dokumente auswählenden Mittels angezeigt wird, und eine Stelle bzw. Position des Ankersatzes S801 des Stammdokuments D81 durch Verwenden einer sogenannten Zeigereinrichtung hervorhebt, wird das Referenzdokument D83 aufgerufen und angezeigt, so dass der Nutzer die verteilten Hypertext-Dokumente D80 bis D86 effizient nutzen kann.
Eine Gruppe der Hypertext-Dokumente D80 bis D86 ist in einer Hypertext-Mark-Up-Language geschrieben, und jedes Hypertext-Dokument wird Seite genannt, und in jedem Hypertext-Dokument ist eine Zeichenkette, ein Bild oder ein Programm geschrieben. Falls z. B. das Stammdokument D81 in einer "farmer.html" genannten Datei gespeichert ist, das Referenzdokument D83 in einer "apple.html" genannten Datei gespeichert ist und ein Indikator (oder eine Dokumentenspeicherposition), der einen Verweis bzw. eine Referenz auf das Referenzdokument D83 anzeigt, in einer Zeichenkette "apple producing farmer" vergraben ist, die im Stammdokument D81 geschrieben ist, um den Ankersatz S801 zu formulieren (engl. to frame), wird der Ankersatz S801 durch "<a href =" apple.html"> apple producing farmer </a>" ausgedrückt. Da im Referenzdokument D83 kein Satz geschrieben ist, besteht in diesem Fall die Möglichkeit, dass das Dokument D82 in einem von einem anderen Computer weit entfernt aufgestellten Computer vorbereitet wird, worin das vor der Erstellung bzw. Vorbereitung des Dokuments D81 vorbereitete Dokument D83 gespeichert ist, und das Dokument D82 als Stammdokument für das Referenzdokument D83 dient.
Erste Ausführungsform
3 ist ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer ersten Ausführungsform der vorliegenden Erfindung.
Wie in 3 gezeigt ist, umfasst eine Hypertext-Wiederauffindungsvorrichtung 1 zum Wiederauffinden eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einem großen Umfang an Hypertext-Dokumenten, die in einer Hypertext-Dokumente verwaltenden Einheit 8 gespeichert sind, in der in einer großen Anzahl von in einem Netzwerk eines WorldWideWeb weit verteilten Computern erstellte bzw. vorbereitete Hypertext-Dokumente unter der Bedingung distributiv bzw. verteilt verwaltet werden, dass die Hypertext-Dokumente Referenzbeziehungen untereinander aufweisen,
eine Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitenden Einheit 7 zum Analysieren der Hypertext-Dokumente mit den Referenzbeziehungen, die von der Hypertext-Dokumente verwaltenden Einheit 8 verwaltet werden, Erstellen bzw. Vorbereiten einer Hypertext-Dokumentinformation, in der ein oder mehrere Identifizierer für Stammdokumente, die ein oder mehrere Stammdokumente identifizieren, und Ankersätze der Stammdokumente, mit einem Identifizierer für Hypertext-Dokumente, der ein Hypertext-Dokument identifiziert, und eine Dokumentspeicherposition des Hypertext-Dokuments aufgelistet sind, für jedes der Hypertext-Doku mente, und Erstellen bzw. Vorbereiten einer Hypertext-Dokumenttabelle der Hypertext-Dokumentinformation für alle durch die Hypertext-Dokumente verwaltenden Einheit 8 verwalteten Hypertext-Dokumente,
eine Wiederauffindungsindizes vorbereitende Einheit 6 mit einem Wörterbuch zum vorherigen Analysieren eines Hauptteils eines Hypertext-Dokuments, eines Titels des Hypertext-Dokuments und von Zeichenketten eines oder mehrerer Ankersätze eines oder mehrerer, dem Hypertext-Dokument entsprechender Stammdokumente für jedes der Hypertext-Dokumente, die von der Hypertext-Dokumente verwaltenden Einheit 8 verwaltet werden, gemäß der Hypertext-Dokumenttabelle, die durch die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7 vorbereitet wurde, um mehrere Worte zu erkennen, die in den Hypertext-Dokumenten erscheinen, Vorbereiten eines Stücks einer Wortinformation für ein Wort, worin ein Identifizierer für das Auftreten von Dokumenten, der ein Hypertext-Dokument identifiziert, in welchem das im Wörterbuch registrierte Wort erscheint, und eine Positionsinformation, die Auftrittspositionen des Wortes im Titel des Hypertext-Dokuments angibt, der Hauptteil des Hypertext-Dokuments und die Ankersätze der Stammdokumente entsprechend dem Hypertext-Dokument aufgelistet sind, für jedes der Hypertext-Dokumente, und Vorbereiten eines Wiederauffindungsindex von Stücken einer Wortinformation für die im Wörterbuch gespeicherten Worte,
eine Schlüsselworteingabeeinheit 2 zum Empfangen mehrerer, von einem Nutzer 9 eingegebener Schlüsselworte,
eine Wiederauffindungseinheit 3 zum Wiederauffinden mehrerer Stücke einer bestimmten Wortinformation entsprechend mehreren bestimmten Worten, die mit den in der Schlüsselworteingabeworteinheit 2 empfangenen Schlüsselworten übereinstimmen, aus dem Wiederauffindungsindex, der durch die Wiederauffindungsindizes vorbereitende Einheit 6 vorbereitet wurde, und Wiederauffinden bestimmter Identifizierer für das Auftre ten von Dokumenten, die bestimmte Hypertext-Dokumente, in denen ein mit einem Schlüsselwort übereinstimmendes bestimmtes Wort erscheint, und bestimmte Positionsinformationen, die bestimmte Auftrittspositionen eines bestimmten Wortes in den Hypertext-Dokumenten und mehrere bestimmten Stammdokumenten entsprechend den bestimmten Hypertext-Dokumenten aus der bestimmten Wortinformation für jedes der bestimmen Worte identifizieren,
eine Dokumentrangfolgen bestimmende Einheit 4 zum Vereinigen eines bestimmten Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdokumente entsprechend dem bestimmten Hypertext-Dokument zu einem vereinigten bestimmten Hypertext-Dokument gemäß der Dokumentinformation der Hypertext-Dokumenttabelle, die durch die Hypertext-Dokumenttabellen mit Stammdokumentenlisten vorbereitende Einheit 7 vorbereitet wurde, für jedes der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten wurden, Berechnen einer Auftrittshäufigkeit TF eines bestimmten Wortes in einem vereinigten bestimmten Hypertext-Dokument für jedes bestimmte Wort und jedes vereinigte bestimmte Hypertext-Dokument, Berechnen einer inversen Dokumenthäufigkeit IDF, die als inverser Wert der Anzahl bestimmter Hypertext-Dokumente definiert ist, in denen ein bestimmtes Wort erscheint, für jedes bestimmte Wort, Berechnen eines Produkts TF* IDF einer Auftrittshäufigkeit TF und einer inversen Dokumenthäufigkeit IDF, Summieren mehrerer Produkte für alle bestimmten Worte, um ein summiertes Produkt als einen geschätzten Wert für jedes vereinigte bestimmte Hypertext-Dokument zu erzeugen, Bestimmen mehrerer Bedeutungsgrade der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden für die vereinigten bestimmten Hypertext-Dokumente und Vorbereiten eines Index eines bestimmten Hypertext-Dokuments für jedes der bestimmten Hypertext-Dokumente, und
eine Wiederauffindungsergebnisse anzeigende Einheit 5 zum Anzeigen der Indizes der bestimmten Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden Einheit 4 bestimmt wurde, als ein Wiederauffindungsergebnis.
In der obigen Konfiguration wird eine Operation der Hypertext-Wiederauffindungsvorrichtung 1 beschrieben. Mehrere Hypertext-Dokumente mit Referenzbeziehungen untereinander werden in einer großen Anzahl von Computern erstellt bzw. vorbereitet, die in einem Netz eines WorldWide-Web weit verteilt sind. In der Hypertext-Dokumente verwaltenden Einheit 8 werden die Hypertext-Dokumente distributiv bzw. verteilt verwaltet. Die Referenzdokumenttabellen mit Stammdokumenten vorbereitende Einheit 7 hat eine zusammengehörige Dokumente sammelnde bzw. erfassende Funktion (im allgemeinen Web-Roboter genannt). Wenn mehrere Adressen von Dokumentspeicherpositionen (im allgemeinen mehrere universelle Ressourcen-Lokalisierer genannt) mehrerer Hypertext-Dokumente an die Referenzdokumenttabellen mit Stammdokumenten vorbereitende Einheit 7 geliefert werden, werden daher die mehreren Hypertext-Dokumente durch den universellen Ressourcen-Lokalisierer nacheinander als mehrere Stammdokumente angegeben, werden ein oder mehrere Ankersätze, die in jedem der Stammdokumente geschrieben sind, analysiert, und ein oder mehrere Referenzdokumente werden für jedes der Stammdokumente erfaßt. Danach werden mehrere Identifizierer für Hypertext-Dokumente, die nicht miteinander zusammenfallen, in den erfaßten Referenzdokumenten in der Reihenfolge der Erfassung zugeordnet, um die erfaßten Referenzdokumente zu identifizieren. Wenn in keines der erfaßten Referenzdokumente ein Bild oder Programm geschrieben ist und in jedes der erfaßten Referenzdokumente eine Zeichenkette geschrieben ist, kann in diesem Fall Zeit zur Erfassung gespart werden. Mehrere Adressen von Dokumentspeicherpositionen der erfaßten Referenzdokumente werden auch aufgelistet, um zu verhindern, dass ein aufgelistetes erfaßtes Referenzdokument erneut erfaßt wird. Wie in 2 gezeigt ist, wird daher, obgleich nicht nur das Stammdokument D83 gemäß dem Ankersatz S803 zum Referenzdokument D84 gehört, sondern auch das Stammdokument D84 gemäß dem anderen Ankersatz S806 zum Referenzdokument D83 gehört, verhindert, dass die Hypertext-Dokumente D83 und D84 zweimal erfaßt werden.
Danach wird eine Hypertext-Dokumenttabelle von Stücken einer Hypertext-Dokumentinformation (siehe 4), worin Identifzierer für Stammdokumente eines oder mehrerer Stammdokumente und Ankersätze der Stammdokumente für jedes Hypertext-Dokument aufgelistet sind, in der Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitenden Einheit 7 gemäß der folgenden Prozedur vorbereitet. Mehrere Plätze DS1 bis DS3 für Dokumenteninformationseinträge, deren Anzahl gleich der Anzahl erfaßter Referenzdokumente ist, werden vorbereitet. In jedem der Plätze für Dokumentinformationseinträge werden die Nummer eines Identifizierers für Hypertext-Dokumente, der ein erfaßtes Referenzdokument identifiziert, und eine Adresse für eine Dokumentspeicherinformation des erfaßten Referenzdokuments im Platz für einen Dokumentinformationseintrag geschrieben. Danach wird aus dem erfaßten Referenzdokument ein Titel des erfaßten Referenzdokumentes extrahiert, indem mehrere, im erfaßten Referenzdokument geschriebene Zeichenketten untersucht werden. In dieser Ausführungsform wird z. B. ein Titel "apple that I grew" aus der Zeichenkette "<title> apple that I grew <title>" extrahiert, und der Titel wird in den Platz für Dokumentinformationseinträge geschrieben. Danach werden ein oder mehrere Zeichenketten von Marken in der Hypertext-Mark-Up-Language, die jeweils eine zwischen "<"und">" platzierte Zeichenkette bezeichnen, aus mehreren Zeichenketten entfernt, die in einem Hauptteil des erfaßten Referenzdokuments vorhanden sind, um einen Textkörper bzw. Texthauptteil zu bilden, und der Textkörper wird in den Platz für Dokumentinformationseinträge geschrieben. Danach wird geprüft, ob ein oder mehrere Ankersätze, die zu einem Referenzdokument gehören, in einem oder mehreren, zum Referenzdokument gehörenden Stammdokumenten vorhanden sind oder nicht. Falls ein Ankersatz in einem Stammdokument vorhanden ist, das zu einem Referenzdokument gehört, wird ein Satz eines Identifizierers für Stammdokumente, der das Stammdokument und den Ankersatz des Stammdokuments identifiziert, in den Platz für Dokumentinformationseinträge geschrieben, um eine Stammdokumentliste für jede Information eines Hypertext-Dokuments zu bilden. Mehrere, im Textkörper verwendete Worte, der Titel und die Ankersätze werden auch in den Platz für Dokumentinformationseinträge geschrieben, um eine Wortliste für jede Hypertext-Dokumentinformation zu bilden.
Danach wird in der Referenzdokumenttabellen mit Stammdokumenten vorbereitenden Einheit 7, wie in 3 gezeigt ist, ein Platz für Dokumentinformationseinträge für jedes der Hypertext-Dokumente vorbereitet, die durch die Hypertext-Dokumente verwaltende Einheit 8 verwaltet werden, und ein Identifizierer für Hypertext-Dokumente, eine Dokumentspeicherposition, ein Titel, ein Textkörper, eine Stammdokumentliste und eine Wortliste werden in jeden der Plätze für Dokumentinformationseinträge geschrieben, um eine Hypertext-Dokumenttabelle vorzubereiten bzw. zu erstellen.
In dieser Ausführungsform wird die Hypertext-Dokumenttabelle erstellt bzw. vorbereitet, nachdem ein oder mehrere Ankersätze, die in jedem der Stammdokumente geschrieben sind, analysiert sind, um die Referenzdokumente zu erfassen. Danach werden die Ankersätze zweimal analysiert oder geprüft, um die erfaßten Referenzdokumente zu bestimmen und die Hypertext-Dokumenttabelle zu erstellen. Falls die Hypertext-Dokument tabelle erstellt wird, während die Ankersätze analysiert werden, um die Referenzdokumente zu sammeln bzw. zu erfassen, kann jedoch die Hypertext-Dokumenttabelle effizient vorbereitet werden.
Danach werden in der Wiederauffindungsindizes vorbereitendem Einheit 6 mit einem Wörterbuch ein Hauptteil eines Hypertext-Dokuments, ein Titel des Hypertext-Dokuments und Zeichenketten eines oder mehrerer Ankersätze des Hypertext-Dokuments für jedes der Hypertext-Dokumente der Hypertext-Dokumenttabelle im voraus analysiert, wird ein Stück einer Wortinformation, die aus einem Wort, einem oder mehreren Identifizierern für das Auftreten von Dokumenten, die Hypertext-Dokumente identifizieren, in denen das Wort erscheint, und einer Positionsinformation besteht, die Auftrittspositionen des Wortes in den Hypertext-Dokumenten angibt, für jedes von mehreren, im Wörterbuch gespeicherten Worten vorbereitet, und ein Wiederauffindungsindex von Stücken einer Wortinformation für die mehreren Worte wird wie in 5 gezeigt vorbereitet.
Im einzelnen sind einige zehntausend Worte im Wörterbuch der Wiederauffindungsindizes vorbereitenden Einheit 6 registriert, und mehrere Plätze WS1 bis WS3 für Wortinformationseinträge, deren Zahl gleich der Anzahl von im Wörterbuch registrierten Worten ist, sind vorbereitet, und jedes der Worte wird in einen der Plätze WS1 bis WS3 für Wortinformationseinträge geschrieben. Danach wird ein Wort, das in der Wortliste eines Platzes für Dokumentinformationseinträge der Hypertext-Dokumenttabelle registriert ist, als ein bestimmtes Wort festgestellt, wird ein Identifizierer für Hypertext-Dokumente eines bestimmten Hypertext-Dokuments entsprechend dem Platz für Dokumentinformationseinträge als ein Identifzierer für das Auftreten von Hypertext-Dokumenten festgestellt, werden ein oder mehrere Positionen des bestimmten Wortes im bestimmten Hypertext-Dokument als Positionsinformation festgestellt, und ein Satz des Identifizierers für das Auftreten von Hypertext-Dokumenten und der Positionsinformation wird als Wortinformation in einem bestimmten Platz für Wortinformationseinträge entsprechend dem bestimmten Wort geschrieben. Diese Verarbeitung wird für jedes der Worte durchgeführt, die in den Wortlisten aller Plätze für Dokumentinformationseinträge der Hypertext-Dokumenttabelle registriert sind, so dass ein Wiederauffindungsindex der Stücke einer Wortinformation entsprechend mehreren Worten vorbereitet wird, die in den Hypertext-Dokumenten verwendet werden.
5 zeigt ein Stück einer Wortinformation des Wiederauffindungsindex, das in dem Platz WS1 für Wortinformationseinträge geschrieben ist und einem Wort "apple" entspricht. "(Title, 1)" gibt an, dass das Wort "apple" in der ersten Wortposition des Titels des Hypertext-Dokuments D83 erscheint, "(Body, 4, 33, 43)" gibt an, dass das Wort "apple" an der vierten, dreiunddreißigsten und dreiundvierzigsten Wortposition des Hauptteils (engl. body) des Hypertext-Dokuments D83 erscheint, "(000081,1)" gibt an, dass das Wort "apple" an der ersten Wortposition des Ankersatzes S801 des Hypertext-Dokuments D81 erscheint, das als das Stammdokument dient, und "(000082,4)" gibt an, dass das Wort "apple" an der vierten Wortposition des Ankersatzes S802 des als Stammdokument dienenden Hypertext-Dokuments D82 erscheint.
Es ist auch zweckmäßig, dass ein inverser Wert der Anzahl von Auftrittsdokumenten, in denen ein Wort erscheint (im allgemeinen als inverse Dokumenthäufigkeit IDF bezeichnet), und die Auftrittshäufigkeit des Wortes in jedem der Auftrittsdokumente (im allgemeinen eine Texthäufigkeit TF genannt) vorher in der Wiederaufführungsindizes vorbereitenden Einheit 6 berechnet und in einem entsprechenden Platz für Wortinforma tionseinträge für jedes der Worte geschrieben werden. Daher kann eine für die Wiederauffindung erforderliche Verarbeitungszeit verkürzt werden.
In der Wiederauffindungsindizes vorbereitenden Einheit 6 wird jedes der Worte, die in den Texthauptteil bzw. Textkörper des Hypertext-Dokuments, in dem Titel des Hypertext-Dokuments und in den Ankersätzen der Stammdokumente erscheinen, die zum Hypertext-Dokument gehören, analysiert, und für jedes Wort wird eine Liste für das Auftreten von Dokumenten erstellt bzw. vorbereitet, die aus einem oder mehreren Identifizierern für das Auftreten von Dokumenten und der Positionsinformation besteht. Demgemäß kann ein Wiederauffindungsindex vorbereitet werden, in welchem für jedes Wort Positionen für das Erscheinen von Worten in jedem der Hypertext-Dokumente angegeben werden.
Eine Schlüsselworteingabeeinheit 2 hat eine Funktion eines Textkastens und einer ein Wiederauffinden startenden Schaltfläche zum Zurückholen von Inhalten des Textkastens, und ein HTML-Dokument, das gemäß der Hypertext-Mark-Up-Language mit einem Titel wie z. B. "Wiederauffindungsseite" wird für die Schlüsselworteingabeeinheit 2 verwendet. Das heißt, der Nutzer 9 ruft das HTML-Dokument im Browser des WorldWideWeb wie z. B. Mosaic oder Netscape auf, der auf seinem eigenen Client-Computer betrieben wird, ein einzelnes Schlüsselwort wird in den Textkasten eingegeben oder mehrere, durch Zwischenräume getrennte Schlüsselworte werden in den Textkasten eingegeben, und die ein Wiederauffinden startende Taste bzw. Schaltfläche wird gedrückt. Daher werden ein einzelnes Schlüsselwort oder Schlüsselworte eingegeben.
Folglich werden mehrere Schlüsselworte, die vom Nutzer 9 eingegeben wurden, in der Schlüsselworteingabeeinheit 2 empfangen und zur Wiederauffindungseinheit 3 übertragen. In dieser Ausführungsform gibt der Nutzer jedes der Schlüsselworte durch Drücken mehrerer, auf einer Tastatur angeordneter Tasten ein. Falls jedoch jeder von mehreren Kandidaten für ein Schlüsselwort durch Drücken einer Schaltfläche ausgewählt wird, kann ein Vorgang zur Eingabe von Schlüsselworten unter Ausnutzung der Zeigereinrichtung einfach durchgeführt werden, ohne eine Tastatur zu verwenden, selbst wenn eine ungeübte Person die Schlüsselworteingabeeinheit 2 bedient.
In der Wiederauffindungseinheit 3 werden Stücke bestimmter Wortinformationen entsprechend mehreren bestimmten Worten, die mit den über die Schlüsselworteingabeeinheit 2 eingegebenen Schlüsselworten übereinstimmen, aus dem in der Wiederauffindungsindizes vorbereitenden Einheit 6 gespeicherten Wiederauffindungsindex extrahiert, und ein oder mehrere Identifizierer für das Auftreten von Dokumenten, die ein oder mehrere bestimmte Hypertext-Dokumente identifizieren, in denen ein mit ein Schlüsselwort übereinstimmendes bestimmtes Wort erscheint, und Positionsinformationen, die Positionen des bestimmten Wortes in den bestimmten Hypertext-Dokumenten angeben, werden aus einem Stück einer Wortinformation für jedes der bestimmten Worte erhalten. Mehrere Sätze bzw. Gruppen der Identifizierer für das Auftreten von Dokumenten und der Positionsinformationen werden zu der Dokumentrangfolgen bestimmenden Einheit 4 übertragen.
In der Dokumentrangfolgen bestimmenden Einheit 4 werden Stücke einer Hypertext-Dokumentinformation, die den bestimmten Hypertext-Dokumenten entspricht, die durch die Identifizierer für das Auftreten von Dokumenten identifiziert wurden, aus der Hypertext-Dokumenttabelle extrahiert und ein bestimmtes Hypertext-Dokument und ein oder mehrere Stammdokumente, die von einem oder mehreren Identifizierern für Stammdokumente identifiziert wurden, die in einem Stück einer Hyper text-Dokumentinformation entsprechend dem bestimmten Hypertext-Dokument aufgelistet sind, werden zu einem vereinigten bestimmten Hypertext-Dokument vereinigt. Das vereinigte bestimmte Hypertext-Dokument wird für jedes der bestimmten Hypertext-Dokumente gebildet, die durch die von der Wiederauffindungseinheit 3 übertragenen Identifizierer für das Auftreten von Dokumenten identifiziert werden. Eine inverse Dokumenthäufigkeit IDF, die als ein inverser Wert der Anzahl vereinigter bestimmter Hypertext-Dokumente definiert ist, in denen ein bestimmtes Wort, das mit einem Schlüsselwort übereinstimmt, erscheint, und die Auftrittshäufigkeit TF eines bestimmten Wortes in jedem der vereinigten bestimmten Hypertext-Dokumente werden für jedes der bestimmten Worte gemäß den mehreren Sätzen bzw. Gruppen der Identifizierer für das Auftreten von Dokumenten und der Positionsinformationen berechnet. Die inverse Dokumenthäufigkeit IDF bezeichnet einen Korrekturfaktor für jedes bestimmte Wort.
Falls nur ein Schlüsselwort eingegeben wird, wird danach ein geschätzter Wert, der erhalten wird, indem die inverse Dokumenthäufigkeit IDF für ein bestimmtes Wort und die Auftrittshäufigkeit TF miteinander multipliziert werden, als Bedeutungsgrad für jedes der vereinigten bestimmten Hypertext-Dokumente berechnet. Falls die Zahl von vom Nutzer eingegebenen Schlüsselworten zwei oder mehr beträgt, wird ebenfalls ein Produkt TF*IDF einer Auftrittshäufigkeit TF und einer inversen Dokumenthäufigkeit IDF für jedes Schlüsselwort und jedes vereinigte bestimmte Hypertext-Dokument berechnet, wird eine Summe der für alle Schlüsselworte berechneten Produkte als geschätzter Wert für jedes der vereinigten bestimmten Hypertext-Dokumente übernommen, und ein Bedeutungsgrad für jedes der vereinigten bestimmten Hypertext-Dokumente wird gemäß den geschätzten Werten bestimmt. Der Bedeutungsgrad für jedes vereinigte bestimmte Hypertext-Dokument wird als ein Bedeutungsgrad für ein bestimmtes Hypertext-Dokument entsprechend dem vereinigten bestimmten Hypertext-Dokumentfestgelegt. Danach wird die Rangfolge der bestimmten Hypertext-Dokumente einschließlich der Stammdokumente gemäß den Bedeutungsgraden der bestimmten Hypertext-Dokumente bestimmt.
Falls die Anzahl von Schlüsselworten zwei oder mehr beträgt, ist es zweckmäßig, einen geschätzten Wert für ein bestimmtes Hypertext-Dokument auf einen Wert festzulegen, der N-mal (N ist Zwei oder mehr) so hoch wie eine Summe der Produkte TF*IDF ist, die für alle Schlüsselworte berechnet wurden, wenn N bestimmte Worte, die mit N Schlüsselworten übereinstimmen, in dem bestimmten Hypertext-Dokument erscheinen. Da die Korrelation unter den N Schlüsselworten sich im Bedeutungsgrad für jedes bestimmte Hypertext-Dokument widerspiegelt, kann außerdem die Wiederauffindungsanforderung eines Nutzers erfüllt werden.
Falls zwei, mit zwei Schlüsselworten übereinstimmende bestimmte Worte in einem bestimmten Hypertext-Dokument verwendet werden, die innerhalb von 20 Zeichen nahe beieinander liegen, ist es zweckmäßig, dass ein geschätzter Wert für das vereinigte bestimmte Hypertext-Dokument verdoppelt wird. Da die Korrelation zwischen den nahe beieinander liegenden Schlüsselworten sich im Bedeutungsgrad für jedes bestimmte Hypertext-Dokument widerspiegelt, kann in diesem Fall die Wiederauffindungsanforderung eines Nutzers außerdem erfüllt werden.
In der Dokumentrangfolgen bestimmenden Einheit 4 wird danach ein HTML-Dokument, in welchem mehrere Indizes der bestimmten Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge aufgelistet sind, erstellt bzw. vorbereitet und zu der Wiederauffindungsergebnisse anzeigenden Einheit 5 übertragen. In diesem Fall ist der Index eines bestimm ten Hypertext-Dokuments ein Titel des bestimmten Hypertext-Dokuments oder eine Zeichenkette eines Ankersatzes, der in einem der Stammdokumente geschrieben ist, und eine Adresse einer Dokumentspeicherposition, die eine Position des bestimmten Hypertext-Dokuments in der Hypertext-Dokumente verwaltenden Einheit 8 angibt, ist im Index des bestimmten Hypertext-Dokuments vergraben, und der Index dient als Ankersatz. Das heißt, wenn der Nutzer einen Index eines bestimmten Hypertext-Dokuments auswählt, wird das bestimmte Hypertext-Dokument aus der Hypertext-Dokumente verwaltenden Einheit 8 gemäß der Adresse einer Dokumentspeicherposition aufgerufen.
In der Dokumentrangfolgen bestimmenden Einheit 4 werden danach ein oder mehrere Stammdokumente mit einer Referenzbeziehung mit einem bestimmten Hypertext-Dokument aus der Hypertext-Dokumenttabelle, die in der Referenzdokumenttabellen mit Stammdokumenten vorbereitenden Einheit 7 vorbereitet wurde, für jedes bestimmte Hypertext-Dokument extrahiert, werden ein bestimmtes Hypertext-Dokument und ein oder mehrere Stammdokumente mit einer Referenzbeziehung mit dem bestimmten Hypertext-Dokument zu einem vereinigten bestimmten Hypertext-Dokument für jedes bestimmte Hypertext-Dokument vereinigt, wird ein Bedeutungsgrad des bestimmten Hypertext-Dokuments einschließlich der Stammdokumente gemäß einem geschätzten Wert TF*IDFN für jedes bestimmte Hypertext-Dokument bestimmt, werden bestimmte Hypertext-Dokumente gemäß jenen Bedeutungsgraden nach Rangfolge geordnet, und die bestimmten Hypertext-Dokumente werden in der nach Rangfolge geordneten Reihenfolge aufgelistet.
In dieser Ausführungsform wird die Auftrittshäufigkeit TF des Wortes nicht normiert, weil die Auftrittshäufigkeit T nicht durch eine Größe eines vereinigten bestimmten Hypertext-Dokuments geteilt wird. Falls die Auf trittshäufigkeit TF des Wortes normiert wird, indem die Auftrittshäufigkeit TF durch eine Größe eines vereinigten bestimmten Hypertext-Dokuments geteilt wird, ist es jedoch erforderlich, dass eine Größe jedes Hypertext-Dokuments in die Hypertext-Dokumenttabelle geschrieben wird.
Die Wiederauffindungsergebnisse anzeigende Einheit 5 wird durch den Browser des WorldWideWeb wie z. B. Mosaic oder Netscape verkörpert, der in seinem eigenen Client-Computer betrieben wird. Das in der Dokumentrangfolgen bestimmenden Einheit 4 erstellte bzw. vorbereitete HTML-Dokument wird auf einer Anzeige des Client-Computers angezeigt. Wenn der Nutzer einen Index eines bestimmten Hypertext-Dokuments, das im HTML-Dokument tabelliert ist, durch Verwenden einer Zeigervorrichtung auswählt, wird eine Position des vom Nutzer ausgewählten bestimmten Hypertext-Dokuments gemäß der im Index des bestimmten Hypertext-Dokuments vergrabenen Adresse einer Dokumentspeicherposition ermittelt, und das bestimmte Hypertext-Dokument wird von der Hypertext-Dokumente verwaltenden Einheit 8 aufgerufen.
In der Wiederauffindungsergebnisse anzeigenden Einheit 5 werden daher die Indizes der im HTML-Dokument aufgelisteten bestimmten Hypertext-Dokumente angezeigt, wählt der Nutzer einen Index eines bestimmten Hypertext-Dokuments aus, und das vom Nutzer ausgewählte bestimmte Hypertext-Dokument wird von der Hypertext-Dokumente verwaltenden Einheit 8 aufgerufen.
Da ein oder mehr Stammdokumente mit einer Referenzbeziehung mit jedem Referenzdokument in der Hypertext-Dokumenttabelle aufgelistet sind, die durch die Referenzdokumenttabellen mit Stammdokumenten vorbereitende Einheit 7 vorbereitet wurden, können demgemäß die einem Referenzdokument entsprechenden Stammdokumente spezifiziert werden, indem die dem Referenzdokument entsprechende Dokumentinformation aus der Hypertext-Dokumenttabelle extrahiert wird. Da es nicht erforderlich ist, die Hypertext-Dokumente verwaltende Einheit 8 nach einem oder mehreren Stammdokumenten entsprechend dem Referenzdokument zu fragen, können daher ein oder mehrere, jedem Referenzdokument entsprechende Stammdokumente schnell ermittelt werden.
Da ein bestimmtes Hypertext-Dokument und ein oder mehrere Stammdokumente mit einer Referenzbeziehung mit dem bestimmten Hypertext-Dokument als ein vereinigtes bestimmtes Hypertext-Dokument in der Dokumentrangfolgen bestimmenden Einheit 4 vereinigt werden, kann auch für jedes der vereinigten bestimmten Hypertext-Dokumente ein Bedeutungsgrad bestimmt werden. Daher kann die Rangfolge der bestimmten Hypertext-Dokumente, in denen ein mit einem Schlüsselwort übereinstimmendes bestimmtes Wort erscheint, gemäß den Bedeutungsgraden bestimmt werden, während die jedem bestimmten Hypertext-Dokument entsprechenden Stammdokumente betrachtet werden. Demgemäß können die Indizes der bestimmten Hypertext-Dokumente durch die Wiederauffindungsergebnisse anzeigende Einheit 5 gemäß der Rangfolge der bestimmten Hypertext-Dokumente unter der Bedingung angezeigt werden, dass die durch das Schlüsselwort ausgedrückte Wiederauffindungsanforderung eines Nutzers zuverlässig erfüllt wird, und der Nutzer kann die bestimmten Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge auswählen.
Da ein Hypertext-Dokument und ein oder mehrere Ankersätze eines oder mehrerer Stammdokumente mit einer Referenzbeziehung mit dem Hypertext-Dokument in jedem Stück einer Dokumentinformation der Hypertext-Dokumenttabelle aufgelistet sind, die durch die Referenzdokumenttabellen mit Stammdokumenten vorbereitende Einheit 7 vorbereitet wurde, kann auch jedes Stück einer Wortinformation des Wiederauffindungsindex, der angibt, dass ein Wort in einem Hypertext-Dokument und einem oder mehreren Ankersätzen eines oder mehrerer Stammdokumente mit einer Referenzbeziehung mit dem Hypertext-Dokument erscheint, in der Wiederauffindungsindizes vorbereitenden Einheit 6 einfach vorbereitet bzw. erstellt werden. Da ein oder mehrere Stammdokumente mit einer Referenzbeziehung mit jedem Referenzdokument in der Hypertext-Dokumenttabelle aufgelistet sind, die durch die Referenzdokumenttabellen mit Stammdokumenten vorbereitende Einheit 7 vorbereitet wurde, ist es, wenn der Wiederauffindungsindex in der Wiederauffindungsindizes vorbereitenden Einheit 6 vorbereitet wird, außerdem nicht erforderlich, die Hypertext-Dokumente verwaltende Einheit 8 nach einem oder mehreren dem Referenzdokument entsprechenden Stammdokumenten zu fragen. Daher kann der Wiederauffindungsindex schnell vorbereitet werden.
Zweite Ausführungsform
6 ist ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer zweiten Ausführungsform der vorliegenden Erfindung.
Wie in 6 gezeigt ist, umfasst eine Hypertext-Wiederauffindungsvorrichtung 11 zum Wiederauffinden eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einem großen Umfang an in der Hypertext-Dokumente verwaltenden Einheit 8 gespeicherten Hypertext-Dokumenten, die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2, die Wiederauffindungseinheit 3, eine Dokumentrangfolgen bestimmende Einheit 12 zum Vereinigen eines bestimmten Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdoku mente entsprechend dem bestimmten Hypertext-Dokument zu einem vereinigten bestimmten Hypertext-Dokument gemäß der Dokumentinformation der Hypertext-Dokumenttabelle, die durch die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7 vorbereitet wurde, für jedes der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten wurden, Berechnen geschätzter Werte für die vereinigten bestimmten Hypertext-Dokumente gemäß der bestimmten Wortinformation des Wiederauffindungsindex, der in der Wiederauffindungsindizes vorbereitenden Einheit 6 erhalten wurde, Bestimmen mehrerer Bedeutungsgrade der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden für die vereinigten bestimmten Hypertext-Dokumente und Vorbereiten bzw. Erstellen eines Index eines bestimmten Hypertext-Dokuments mit einem Index eines bestimmten Stammdokuments entsprechend dem bestimmten Hypertext-Dokument für jedes der bestimmten Hypertext-Dokumente, und
eine Wiederauffindungsergebnisse anzeigende Einheit 13 zum Anzeigen des Index des bestimmten Hypertext-Dokuments mit dem Index des bestimmten Stammdokuments für jedes der vereinigten bestimmten Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden Einheit 12 bestimmt wurde, als ein Wiederauffindungsergebnis.
In der obigen Konfiguration werden, nachdem die Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden in der Dokumentrangfolgen bestimmenden Einheit 12 in der gleichen Weise wie in der ersten Ausführungsform bestimmt ist, nicht nur ein Index eines bestimmten Hypertext-Dokuments, sondern auch ein Index eines dem bestimmten Hypertext-Dokument entsprechenden bestimmten Stammdokuments für jedes der bestimmten Hypertext-Dokumente vorbereitet. Falls mehrere Stammdokumente, die dem bestimmten Hypertext-Dokument entsprechen, existieren, wird ein Stammdokument, dessen Dokumentspeicherposition derjenigen des bestimmten Hypertext-Dokuments unter denjenigen der Stammdokumente am nächsten ist, als das bestimmte Stammdokument ausgewählt. Diese Auswahl wird durchgeführt, indem ein Abschnitt einer Zeichenkette, der die Dokumentspeicherposition jedes Stammdokuments angibt, mit einem Abschnitt einer Zeichenkette verglichen wird, der die Dokumentspeicherposition des bestimmten Hypertext-Dokuments angibt. Auch in dieser Ausführungsform wird das bestimmte Stammdokument (oder ein bestimmtes Stammdokument einer ersten Stufe) als ein Referenzdokument einer zweiten Stufe betrachtet, wird ein bestimmtes Stammdokument einer zweiten Stufe mit einer Referenzbeziehung mit dem Referenzdokument einer zweiten Stufe spezifiziert, und ein Index des bestimmten Stammdokuments einer zweiten Stufe wird vorbereitet. Danach wird der Index eines bestimmten Hypertext-Dokuments mit dem Index des bestimmten Stammdokuments einer ersten Stufe und dem Index des bestimmten Stammdokuments einer zweiten Stufe für jedes bestimmte Hypertext-Dokument durch die Wiederauffindungsergebnisse anzeigende Einheit 13 angezeigt.
7 zeigt ein Beispiel des Index eines bestimmten Hypertext-Dokuments, der mit dem Index des bestimmten Stammdokuments einer ersten Stufe und dem Index des bestimmten Stammdokuments einer zweiten Stufe für jedes bestimmte Hypertext-Dokument durch die Wiederauffindungsergebnisse anzeigende Einheit 13 angezeigt wird.
Wie in 7 gezeigt ist, wird, falls dem Hypertext-Dokument D83 der vierte Rang verliehen ist, dem Hypertext-Dokument D85 der achtzehnte Rang verliehen ist und dem Hypertext-Dokument D86 der neunzehnte Rang verliehen ist, der Index des bestimmten Hypertext-Dokuments D83 mit dem Index des bestimmten Stammdokuments D81 der ersten Stufe und dem Index des bestimmten Stammdokuments D80 einer zweiten Stufe als eine Gruppe der vierten Rangfolge angezeigt, wird der Index des bestimmten Hypertext-Dokuments D85 mit dem Index des bestimmten Stammdokuments D83 einer ersten Stufe und dem Index des bestimmten Stammdokuments D81 einer zweiten Stufe als eine Gruppe der achtzehnten Rangfolge angezeigt, und der Index des bestimmten Hypertext-Dokuments D86 wird mit dem Index des bestimmten Stammdokuments D83 einer ersten Stufe und dem Index des bestimmten Stammdokuments D81 einer zweiten Stufe als eine Gruppe der neunzehnten Rangfolge angezeigt.
Selbst wenn das Hypertext-Dokument D86 ohne Ankersatz als ein bestimmtes Hypertext-Dokument ausgewählt wird, kann demgemäß das Hypertext-Dokument D83 oder D81 mit einer engen Beziehung mit dem Hypertext-Dokument D86 einfach ausgewählt und von der Hypertext-Dokumente verwaltenden Einheit 8 aufgerufen werden, ohne auf irgendeinen Ankersatz angewiesen zu sein. Das heißt, da mehrere Hypertext-Dokumente mit einer Referenzbeziehung untereinander eng miteinander zusammenhängen, ist die Anzeige der Indizes des bestimmten Stammdokuments einer ersten Stufe und einer zweiten Stufe für den Nutzer sehr nützlich.
Dritte Ausführungsform
In der ersten oder zweiten Ausführungsform besteht, falls das Hypertext-Dokument D83 des vierten Rangs aufgerufen und gelesen wird, das Hypertext-Dokument D85 aufgerufen und gelesen wird, indem die Position des Ankersatzes S804 ausgewählt wird, und mehrere Hypertext-Dokumente niedrigerer Ränge nach dem vierten Rang nacheinander aufgerufen und gelesen werden, eine Wahrscheinlichkeit, dass das Hypertext-Dokument D85 des achtzehnten Rangs fälschlicherweise aufgerufen und wieder gelesen wird, weil der Nutzer die Lesung des Hypertext-Dokuments D85 vergisst, obgleich das Hypertext-Dokument D85 schon gelesen wurde. Selbst wenn das Hypertext-Dokument D86 des neunzehnten Rangs aufgerufen und gelesen wird, besteht, da eine lange Zeit verstreicht, nachdem das Hypertext-Dokument D83 des vierten Rangs aufgerufen und gelesen ist, ebenfalls eine Wahrscheinlichkeit, dass der Nutzer einen Kontext des Hypertext-Dokuments D86 nicht verstehen kann, der mit einem Kontext des Hypertext-Dokuments D83 eng zusammenhängt. Um die obigen Nachteile in der dritten Ausführungsform zu lösen, werden daher die Ränge, die mehreren, eng miteinander zusammenhängenden Hypertext-Dokumenten verliehen wurden, auf den gleichen Rang gesetzt.
8 ist ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer dritten Ausführungsform der vorliegenden Erfindung.
Wie in 8 gezeigt ist, umfasst eine Hypertext-Wiederauffindungsvorrichtung 21 zum Wiederauffinden eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einem großen Umfang an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2, die Wiederauffindungseinheit 3, eine Dokumentrangfolgen bestimmende Einheit 22 zum Vereinigen eines bestimmten Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdokumente, die dem bestimmten Hypertext-Dokument entsprechen, zu einem vereinigten bestimmten Hypertext-Dokument gemäß der Dokumentinformation der Hypertext-Dokumenttabelle, die durch die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7 vorbereitet wurde, für jedes der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten wurden, Berechnen geschätzter Werte für die vereinigten bestimmten Hypertext-Dokumente gemäß der bestimmten Wortinformation des Wiederauffindungsindex, der in der Wiederauffindungsindizes vorbereitenden Einheit 6 erhalten wurde, Bestimmen mehrerer Bedeutungsgrade der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden für die vereinigten bestimmten Hypertext-Dokumente unter der Bedingung, dass Ränge, die zwei oder mehr bestimmten Hypertext-Dokumenten verliehen wurden, die eng miteinander zusammenhängen, auf den gleichen Rang festgelegt bzw. gesetzt werden, und Vorbereiten eines Index eines bestimmten Hypertext-Dokuments für jedes der bestimmten Hypertext-Dokumente, und
eine Wiederauffindungsergebnisse anzeigende Einheit 23 zum Anzeigen der Indizes der bestimmten Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden Einheit 22 bestimmt wurde, als ein Wiederauffindungsergebnis unter der Bedingung, dass zwei oder mehr bestimmte Hypertext-Dokumente, die auf den gleichen Rang gesetzt sind, mit einem oder mehreren bestimmten Stammdokumenten entsprechend irgendeinem der bestimmten Hypertext-Dokumente in einer Gruppe gemeinsam angezeigt werden.
In der obigen Konfiguration werden, nachdem die Bedeutungsgrade der bestimmten Hypertext-Dokumente berechnet sind und die Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden in der Dokumentrangfolgen bestimmenden Einheit 22 in der gleichen Weise wie in der ersten Ausführungsform bestimmt ist, ein oder mehrere Identifiziererer für Stammdokumente, die in einem Stück einer Dokumenteninfor mation der Hypertext-Dokumenttabelle aufgelistet sind, die einem bestimmten Hypertext-Dokument entspricht, extrahiert, und ein oder mehrere Stammdokumente, die durch die Identifizierer für Stammdokumente identifiziert sind, werden für jedes bestimmte Hypertext-Dokument spezifiziert. Danach wird beurteilt, ob jedes der Stammdokumente mit einem der bestimmten Hypertext-Dokumente übereinstimmt oder nicht. Falls ein Stammdokument, das einem ersten bestimmten Hypertext-Dokument eines Rangs A entspricht, mit einem zweiten bestimmten Hypertext-Dokument eines Rangs B übereinstimmt, wird beurteilt, dass das erste und zweite bestimmte Hypertext-Dokument eng miteinander zusammenhängen, und das erste und zweite bestimmte Hypertext-Dokument werden auf einen höheren Rang zwischen den Rängen A und B neu gesetzt. Danach werden Indizes der bestimmten Hypertext-Dokumente durch die Wiederauffindungsergebnisse anzeigende Einheit 23 in der nach Rangfolge geordneten Reihenfolge angezeigt.
Da das Stammdokument D83, das dem Hypertext-Dokument D85 des achtzehnten Rangs entspricht, mit dem Hypertext-Dokument D83 des vierten Rangs übereinstimmt, wird z. B. das Hypertext-Dokument D85 auf den vierten Rang neu gesetzt. Da das Stammdokument D83, das dem Hypertext-Dokument D86 des neunzehnten Rangs entspricht, mit dem Hypertext-Dokument D83 des vierten Rangs übereinstimmt, wird auch das Hypertext-Dokument D86 auf den vierten Rang neu eingestellt bzw. gesetzt.
Da mehrere bestimmte Hypertext-Dokumente, die eng miteinander zusammenhängen, auf den gleichen Rang gesetzt werden und dicht beieinander angezeigt werden, kann daher der Nutzer die bestimmten Hypertext-Dokumente, die eng miteinander zusammenhängen, nacheinander lesen, so dass der Nutzer die Kontexte der bestimmten Hypertext-Doku mente leicht erkennen bzw. realisieren kann. Dementsprechend wird verhindert, dass das gleiche bestimmte Hypertext-Dokument fälschlicherweise wieder gelesen wird, und der Nutzer kann eine Gruppe bestimmter Hypertext-Dokumente effizient lesen, die eng miteinander zusammenhängen.
In dieser Ausführungsform werden mehrere bestimmte Hypertext-Dokumente, die eng miteinander zusammenhängen, auf den höchsten Rang unter den Rängen gesetzt, die den mehreren bestimmten Hypertext-Dokumenten verliehen wurden. Die dritte Ausführungsform ist jedoch nicht auf dieses Konzept beschränkt. Das heißt, wenn mehrere bestimmte Hypertext-Dokumente, die eng miteinander zusammenhängen, bestimmt sind, ist es zweckmäßig, dass eine Summe der Bedeutungsgrade der bestimmten Hypertext-Dokumente berechnet wird und die bestimmten Hypertext-Dokumente gemäß dem summierten Bedeutungsgrad neu auf den gleichen höheren Rang gesetzt werden.
Es wird auch bevorzugt, dass das Konzept der zweiten Ausführungsform und das Konzept der dritten Ausführungsform kombiniert werden. Wenn beispielsweise, wie in 7 gezeigt ist, eine erste Gruppe des bestimmten Hypertext-Dokuments D83 und der Stammdokumente D80 und D81 auf den vierten Rang gesetzt ist, eine zweite Gruppe des bestimmten Hypertext-Dokuments D85 und der Stammdokumente D81 und D83 auf den achtzehnten Rang gesetzt ist und eine dritte Gruppe des bestimmten Hypertext-Dokuments D86 und der Stammdokumente D81 und D83 auf den neunzehnten Rang gemäß der zweiten Ausführungsform gesetzt ist, wird die zweite Gruppe der Dokumente D81, D83 und D85, die auf den achtzehnten Rang gesetzt sind, auf den vierten Rang neu gesetzt, und die dritte Gruppe von Dokumenten D81, D83 und D86, die auf den neunzehnten Rang gesetzt sind, wird auf den vierten Rang neu gesetzt, und eine kombinierte Gruppe der bestimmten Hypertext-Dokumente D83, D85 und D86 und der Stammdokumente D80 und D81, die auf den vierten Rang zurückgesetzt wurden, wird wie in 9 dargestellt angezeigt.
Vierte Ausführungsform
Im Allgemeinen erscheint ein spezielles Wort, das ein Merkmal eines Referenzdokuments angibt, viele Male in einem oder mehreren Ankersätzen eines oder mehrerer Stammdokumente, die dem Referenzdokument entsprechen. Falls ein geschätzter Wert für das Referenzdokument gerade berechnet wird, indem das in den Ankersätzen des Stammdokuments erscheinende spezielle Wort betrachtet wird, und das Referenzdokument gemäß dem geschätzten Wert in der Rangfolge angeordnet wird, kann daher die Zuverlässigkeit für das Wiederauffinden mehrerer Hypertext-Dokumente, die einer Wiederauffindungsanforderung eines Nutzers wahrscheinlich entsprechen, verbessert werden.
10 ist ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer vierten Ausführungsform der vorliegenden Erfindung.
Wie in 10 gezeigt ist, umfasst eine Hypertext-Wiederauffindungsvorrichtung 31 zum Wiederauffinden eines oder mehrerer Hypertext-Dokumente, die wahrscheinlich einer Wiederauffindungsanforderung eines Nutzers entsprechen, aus einem großen Umfang an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2, die Wiederauffindungseinheit 3,
eine Dokumentrangfolgen bestimmende Einheit 32 zum Berechnen einer Auftrittshäufigkeit jedes bestimmten Wortes in einem bestimmten Hypertext-Dokument und einem oder mehreren Ankersätzen eines oder mehrerer bestimmter Stammdokumente entsprechend dem bestimmten Hypertext-Dokument als eine überarbeitete (engl. revised) Auftrittshäufigkeit TF für das bestimmte Hypertext-Dokument für jedes der bestimmten Hypertext-Dokumente gemäß der bestimmten Wortinformation des Wiederauffindungsindex, der in der Wiederauffindungsindizes vorbereitenden Einheit 6 erhalten wurde, Berechnen geschätzter Werte der bestimmten Hypertext-Dokumente gemäß den überarbeiteten Auftrittshäufigkeiten TF und inversen Dokumenthäufigkeiten IDF, Bestimmen mehrerer Bedeutungsgrade der bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden und Vorbereiten von Indizes der bestimmten Hypertext-Dokumente, und
eine Wiederauffindungsergebnisse anzeigende Einheit 33 zum Anzeigen der Indizes der bestimmten Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden Einheit 22 bestimmt wurde, als ein Wiederauffindungsergebnis.
Falls der Nutzer ein Schlüsselwort "apple" eingibt, wie in 4 gezeigt ist, erscheint in der obigen Konfiguration das bestimmte Wort "apple" viermal in dem Titel des Hypertext-Dokuments D83 und dem Hauptteil des Hypertext-Dokuments D83. Das bestimmte Wort "apple" erscheint auch in dem Ankersatz S801 des Stammdokuments D81 und dem Ankersatz S802 des Stammdokuments D82. Da eine Summe einer Auftrittshäufigkeit des bestimmten Wortes "apple" im Hypertext-Dokument D83 und den Ankersätzen S801 und S802 der Stammdokumente D81 und D82 6 beträgt, wird daher eine überarbeitete Auftrittshäufigkeit TF für das bestimmte Hypertext-Dokument D83 auf 6 eingestellt bzw. festgelegt, und ein ge schätzter Wert des bestimmten Hypertext-Dokuments D83 wird berechnet, indem die überarbeitete Auftrittshäufigkeit TF in der Dokumentrangfolgen bestimmenden Einheit 32 verwendet wird. Demgemäß wird das bestimmte Hypertext-Dokument D83 in der Rangfolge auf einen höheren Rang gesetzt, so dass eine Zuverlässigkeit des Wiederauffindens des bestimmten Hypertext-Dokuments D83 verbessert werden kann.
Fünfte Ausführungsform
In den ersten bis vierten Ausführungsformen ist es, falls der Nutzer einen Überblick von Inhalten eines bestimmten Hypertext-Dokuments wissen möchte, wenn ein Index eines bestimmten Hypertext-Dokuments angezeigt wird, erforderlich, das bestimmte Hypertext-Dokument aus der Hypertext-Dokumente verwaltenden Einheit 8 aufzurufen. Falls der Nutzer Inhalte vieler bestimmter Hypertext-Dokumente lesen möchte, ist es daher mühevoll, dass der Nutzer die bestimmten Hypertext-Dokumente aufruft.
11 ist ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer fünften Ausführungsform der vorliegenden Erfindung.
Wie in 11 gezeigt ist, umfasst eine Hypertext-Wiederauffindungsvorrichtung 41 zum Wiederauffinden eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einem großen Umfang an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2, die Wiederauffindungseinheit 3, eine Dokumentrangfolgen bestimmende Einheit 42 zum Vereinigen eines bestimmten Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdokumente, die dem bestimmten Hypertext-Dokument entsprechen, zu einem vereinigten bestimmten Hypertext-Dokument gemäß der Dokumentinformation der Hypertext-Dokumenttabelle, die durch die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7 vorbereitet wurde, für jedes der in der Wiederauffindungseinheit 3 erhaltenen bestimmten Hypertext-Dokumente, Berechnen geschätzter Werte für die vereinigten bestimmten Hypertext-Dokumente für jedes bestimmte Wort gemäß der bestimmten Wortinformation des Wiederauffindungsindex, der in der Wiederauffindungsindizes vorbereitenden Einheit 6 erhalten wurde, Bestimmen mehrerer Bedeutungsgrade der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten für jedes bestimmte Wort, Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden für die vereinigten bestimmten Hypertext-Dokumente für jedes bestimmte Wort, Vorbereiten eines Index eines bestimmten Hypertext-Dokuments für jedes der bestimmten Hypertext-Dokumente und Vorbereiten mehrerer Zusammenfassungen der bestimmten Hypertext-Dokumente für jedes der bestimmten Worte, und
eine Wiederauffindungsergebnisse anzeigende Einheit 43 zum Anzeigen einer Gruppe der Indizes der bestimmten Hypertext-Dokumente mit den Zusammenfassungen der bestimmten Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden Einheit 42 bestimmt wurde, für jedes bestimmte Wort als ein Wiederauffindungsergebnis.
Nachdem die Indizes der bestimmten Hypertext-Dokumente in der Dokumentrangfolgen bestimmenden Einheit 42 vorbereitet sind, wird in der obigen Konfiguration ein bestimmter Satz oder eine bestimmte Phrase, der oder die ein bestimmtes Wort enthält, aus einem bestimmten Hypertext-Dokument gemäß der Positionsinformation der Wortinformation des durch die Wiederauffindungsindizes vorbereitende Einheit 6 vorbereiteten Wiederauffindungsindex extrahiert, und eine Zusammenfassung, in der der bestimmte Satz oder die bestimmte Phrase nach einem obersten Satz oder einer obersten Phrase des bestimmten Hypertext-Dokuments geschrieben ist, wird für jedes der bestimmten Worte und jedes der bestimmten Hypertext-Dokumente vorbereitet. Falls mehrere bestimmte Sätze oder mehrere bestimmte Phrasen, die ein bestimmtes Wort enthalten, in einem bestimmten Hypertext-Dokument existieren, wird eine Zusammenfassung vorbereitet, in der die bestimmten Sätze oder die bestimmten Phrasen, die in der bestehenden Reihenfolge angeordnet sind, nach einem obersten Satz oder einer obersten Phrase des bestimmten Hypertext-Dokuments geschrieben werden. Die Indizes der bestimmten Hypertext-Dokumente mit den Zusammenfassungen der bestimmten Hypertext-Dokumente werden danach für jedes bestimmte Wort durch die Wiederauffindungsergebnisse anzeigende Einheit 43 in der nach Rangfolge geordneten Reihenfolge angezeigt, die in der Dokumentrangfolgen bestimmenden Einheit 42 bestimmt wurde.
Da die Zusammenfassung eines bestimmten Hypertext-Dokuments für jedes der bestimmten Hypertext-Dokumente angezeigt wird, kann demgemäß der Nutzer einen Überblick von Inhalten jedes bestimmten Hypertext-Dokuments erlangen, indem die Zusammenfassung jedes bestimmten Hypertext-Dokuments gelesen wird, ohne jedes bestimmte Hypertext-Dokument von der Hypertext-Dokumente verwaltenden Einheit 8 aufzurufen, und der Nutzer kann leicht ein oder mehrere bestimmte Hypertext-Dokumente auswählen, die eine Wiederauffindungsanforderung des Nutzers erfüllen.
Selbst wenn ein bestimmter Satz oder eine bestimmte Phrase, der oder die ein bestimmtes Wort enthält, in einem bestimmten Hypertext-Dokument viele Male erscheint, werden in dieser Ausführungsform alle bestimmten Sätze oder alle bestimmten Phrasen, die das bestimmte Wort enthalten, aus dem bestimmten Hypertext-Dokument extrahiert, und eine Zusammenfassung wird erstellt bzw. vorbereitet. Falls eine Zusammenfassung eines bestimmten Hypertext-Dokuments, die durch Verbinden einer Reihe bestimmter Sätze oder einer Reihe bestimmter Phrasen des bestimmten Hypertext-Dokuments mit einem obersten Satz oder einer obersten Phrase des bestimmten Hypertext-Dokuments erhalten wird, zu lang wird, ist es jedoch für den Nutzer schwierig, eine lange Zusammenfassung schnell zu verstehen bzw. zu realisieren. Daher ist es zweckmäßig, dass drei bestimmte Sätze oder drei bestimmte Phrasen des bestimmten Hypertext-Dokuments mit einem obersten Satz oder einer obersten Phrase des bestimmten Hypertext-Dokuments verbunden werden, um eine Zusammenfassung für jedes bestimmte Wort zu erstellen bzw. vorzubereiten, wenn die Anzahl von vom Nutzer eingegebenen Schlüsselworten fünf oder weniger beträgt, zwei bestimmte Sätze oder zwei bestimmte Phrasen des bestimmten Hypertext-Dokuments mit einem obersten Satz oder einer obersten Phrase des bestimmten Hypertext-Dokuments verbunden werden, um eine Zusammenfassung für jedes bestimmte Wort zu erstellen bzw. vorzubereiten, wenn die Anzahl von vom Nutzer eingegebenen Schlüsselworten zehn oder weniger beträgt, oder ein bestimmter Satz oder eine bestimmte Phrase des bestimmten Hypertext-Dokuments mit einem obersten Satz oder einer obersten Phrase des bestimmten Hypertext-Dokuments verbunden wird, um eine Zusammenfassung für jedes bestimmte Wort zu erstellen bzw. vorzubereiten, wenn die Anzahl von vom Nutzer eingegebenen Schlüsselworten 11 oder mehr beträgt. Folglich wird verhindert, dass die Zusammenfassung zu lang wird, und der Nutzer kann mehrere Zusammenfassungen effizient lesen, die durch die Wiederauffindungsergebnisse anzeigende Einheit 43 angezeigt werden.
Es wird auch bevorzugt, dass das Konzept der zweiten Ausführungsform und das Konzept der fünften Ausführungsform kombiniert werden. Wenn z. B. eine erste Gruppe des bestimmten Hypertext-Dokuments D83 und der Stammdokumente D80 und D81 auf den vierten Rang gesetzt ist, eine zweite Gruppe des bestimmten Hypertext-Dokuments D85 und der Stammdokumente D81 und D83 auf den achtzehnten Rang gesetzt ist und eine dritte Gruppe des bestimmten Hypertext-Dokuments D86 und der Stammdokumente D81 und D83 auf den neunzehnten Rang gemäß der zweiten Ausführungsform gesetzt ist, wie in 12 dargestellt ist, wird eine Zusammenfassung des bestimmten Hypertext-Dokuments D83 zur ersten Gruppe addiert, wird eine Zusammenfassung des bestimmten Hypertext-Dokuments D85 zur zweiten Gruppe addiert, und eine Zusammenfassung des bestimmten Hypertext-Dokuments D86 wird zur dritten Gruppe addiert.
Sechste Ausführungsform
Im WorldWideWeb ist ein Aufsatz (oder ein Artikel) in mehrere Abschnitte unterteilt, und jeder Abschnitt des Aufsatzes ist in einem Hypertext-Dokument geschrieben. Daher gibt es einen Fall, dass ein Kontext des Aufsatzes in einem Abschnitt des in einem Hypertext-Dokument geschriebenen Aufsatzes nicht ausreichend ausgedrückt wird. Obgleich ein in Aomori gewachsener Apfel im Aufsatz beschrieben ist, ist z. B. das Wort "Aomori"; das den Herkunftsort des Apfels angibt, nicht im Hypertext-Dokument D83, sondern ist im Stammdokument D81 geschrieben.
Falls mehrere Schlüsselworte, die einen Kontext eines Aufsatzes ausdrücken, in einem Hypertext-Dokument und mehreren Stammdokumenten mit einer Referenzbeziehung mit dem Hypertext-Dokument separat verwendet werden, wird daher im Stand der Technik das Hypertext-Dokument in unerwünschter Weise in der Rangfolge in einer niedrigeren Klasse eingeordnet bzw. klassifiziert. In der sechsten Ausführungsform wird jedoch für jedes der Stammdokumente ein kombiniertes Hypertext-Dokument erstellt bzw. vorbereitet, das erzeugt wird, indem ein Hypertext-Dokument für Wiederauffindung (oder ein bestimmtes Hypertext-Dokument) und ein Stammdokument mit einer Referenzbeziehung mit dem Hypertext-Dokument zur Wiederauffindung kombiniert werden, werden Bedeutungsgrade der kombinierten Hypertext-Dokumente miteinander verglichen, wird ein kombiniertes Hypertext-Dokument mit dem maximalen Bedeutungsgrad ausgewählt, und der maximale Bedeutungsgrad wird als ein Bedeutungsgrad für das Wiederauffindungs-Hypertext-Dokument verwendet.
13 ist ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer sechsten Ausführungsform der vorliegenden Erfindung.
Wie in 13 gezeigt ist, umfasst eine Hypertext-Wiederauffindungsvorrichtung 51 zum Wiederauffinden eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einen großen Umfang an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2, die Wiederauffindungseinheit 3, eine Dokumentrangfolgen bestimmende Einheit 52 zum Kombinieren eines bestimmten Hypertext-Dokuments und eines bestimmten Stammdokuments, das dem bestimmten Hypertext-Dokument entspricht, um ein kombiniertes bestimmtes Hypertext-Dokument gemäß der Dokumentinformation der Hypertext-Dokumenttabelle zu bilden, die in der Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitenden Einheit 7 vorbereitet wurde, für jedes der bestimmten Stammdokumente, die dem bestimmten Hypertext-Dokument entsprechen, und jedes der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten wurden, Berechnen geschätzter Werte für die kombinierten bestimmten Hypertext-Dokumente gemäß der bestimmten Wortinformation des Wiederauffindungsindex, der in der Wiederauffindungsindizes vorbereitenden Einheit 6 erhalten wurde, für jedes der bestimmten Hypertext-Dokumente, Bestimmen mehrerer Bedeutungsgrade der kombinierten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten für jedes der bestimmten Hypertext-Dokumente, miteinander Vergleichen der Bedeutungsgrade der kombinierten bestimmten Hypertext-Dokumente für jedes der bestimmten Hypertext-Dokumente, Auswählen eines maximalen Bedeutungsgrades unter den Bedeutungsgraden der kombinierten bestimmten Hypertext-Dokumente, die zu einem bestimmten Hypertext-Dokument gehören, für jedes der bestimmten Hypertext-Dokumente, Festlegen des maximalen Bedeutungsgrads auf einen Bedeutungsgrad für das bestimmte Hypertext-Dokument für jedes der bestimmten Hypertext-Dokumente, Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß jenen Bedeutungsgraden und Vorbereiten eines Index eines bestimmten Hypertext-Dokuments für jedes der bestimmten Hypertext-Dokumente, und
eine Wiederauffindungsergebnisse anzeigende Einheit 53 zum Anzeigen einer Gruppe der Indizes der bestimmten Hypertext-Dokumente mit den Zusammenfassungen der bestimmten Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden Einheit 52 bestimmt wurde, für jedes bestimmte Wort als ein Wiederauffindungsergebnis.
Wenn ein Schlüsselwort "apple" und ein anderes Schlüsselwort "Aomori" vom Nutzer unter der Bedingung eingegeben werden, dass ein Wort "apple" im Hypertext-Dokument D83 erscheint und ein Wort "Aomori", das einen Verwaltungsbezirk mit Apfelanbau angibt, im Hypertext-Dokument D83 oder D82 nicht erscheint, sondern im Hypertext-Dokument D81 erscheint, wird in der obigen Konfiguration, weil ein bestimmtes Wort "apple", das mit dem Schlüsselwort "apple" übereinstimmt, im Hypertext-Dokument D83 erscheint, das Hypertext-Dokument D83 in der Wiederauffindungseinheit 3 als ein bestimmtes Hypertext-Dokument festgelegt.
In der Dokumentrangfolgen bestimmenden Einheit 52 werden danach das bestimmte Hypertext-Dokument D83 und das bestimmte Stammdokument D81 kombiniert, um ein erstes kombiniertes bestimmtes Hypertext-Dokument zu bilden, werden das bestimmte Hypertext-Dokument D83 und das bestimmte Stammdokument D82 kombiniert, um ein zweites kombiniertes bestimmtes Hypertext-Dokument zu bilden, werden geschätzte Werte für die kombinierten bestimmten Hypertext-Dokumente für jedes der bestimmten Worte berechnet, und werden eine erste Summe des geschätzten Wertes des ersten kombinierten bestimmten Hypertext-Dokuments für die bestimmten Worte und eine zweite Summe des geschätzten Wertes des zweiten kombinierten bestimmten Hypertext-Dokuments für die bestimmten Worte berechnet. Da das bestimmte Wort "Aomori" im Hypertext-Dokument D82 nicht erscheint, aber im Hypertext-Dokument D81 erscheint, ist in diesem Fall die erste Summe des geschätzten Wertes des ersten kombinierten bestimmten Hypertext-Dokuments höher als die zweite Summe des geschätzten Wertes des zweiten kombinierten bestimmten Hypertext-Dokuments. Daher wird das erste kombinierte bestimmte Hypertext-Dokument ausgewählt, und die erste Summe des geschätzten Wertes des ersten kombinierten bestimmten Hypertext-Dokuments wird als ein geschätzter Wert des bestimmten Hypertext-Dokuments D83 für die Schlüsselworte "apple" und "Aomori" festgelegt, und aus dem geschätzten Wert des bestimmten Hypertext-Dokuments D83 wird ein Bedeutungsgrad für das bestimmte Hypertext- Dokument D83 berechnet. In der gleichen Weise werden Bedeutungsgrade für andere bestimmte Hypertext-Dokumente berechnet, und die Rangfolge der bestimmten Hypertext-Dokumente wird gemäß den Bedeutungsgraden bestimmt.
Selbst wenn mehrere Schlüsselworte, die einen Kontext eines Aufsatzes ausdrücken, in einem Hypertext-Dokument und mehreren Stammdokumenten mit einer Referenzbeziehung mit dem Hypertext-Dokument separat verwendet werden, besteht dementsprechend keine Wahrscheinlichkeit, dass das bestimmte Hypertext-Dokument in unerwünschter Weise in eine niedrigere Klasse eingeordnet bzw. klassifiziert wird, weil ein kombiniertes bestimmtes Hypertext-Dokument, das durch Kombinieren eines bestimmten Hypertext-Dokuments und eines bestimmten Stammdokuments erhalten wurde, für jedes der bestimmten Stammdokumente gebildet und ein maximaler geschätzter Wert eines kombinierten bestimmten Hypertext-Dokuments unter denjenigen der kombinieren bestimmten Hypertext-Dokumente als ein geschätzter Wert für das bestimmte Hypertext-Dokument festgelegt wird.
Siebte Ausführungsform
Ein Überschrifts- bzw. Kopfabschnitt eines Hypertext-Dokuments gibt normalerweise ein Merkmal des Hypertext-Dokuments sehr gut an. Um ein im Kopfabschnitt des Hypertext-Dokuments erscheinendes bestimmtes Wort grob (engl. heavily abzuschätzen, wird daher eine Auftrittshäufigkeit des bestimmten Wortes, das mit einem Schlüsselwort im Kopfabschnitt des Hypertext-Dokuments übereinstimmt, verdoppelt. Als ein Beispiel des Kopfabschnitts wird in dieser Ausführungsform ein Titel des Hypertext-Dokuments oder ein Ankersatz eines Stammdokuments mit einer Referenzbeziehung mit dem Hypertext-Dokument betrachtet.
14 ist ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer siebten Ausführungsform der vorliegenden Erfindung.
Wie in 14 gezeigt ist, umfasst eine Hypertext-Wiederauffindungsvorrichtung 61 zum Wiederauffinden eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einem großen Umfang an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2, die Wiederauffindungseinheit 3, eine Dokumentrangfolgen bestimmende Einheit 62 zum Vereinigen eines bestimmten Hypertext-Dokuments und eines oder mehrerer Stammdokumente, die dem bestimmten Hypertext-Dokument entsprechen, zu einem vereinigten bestimmten Hypertext-Dokument gemäß der Dokumentinformation der Hypertext-Dokumenttabelle, die durch die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7 vorbereitet wurde, für jedes der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten werden, Berechnen einer Auftrittshäufigkeit TF eines bestimmten Wortes in einem vereinigten bestimmten Hypertext-Dokument für jedes bestimmte Wort und jedes vereinigte bestimmte Hypertext-Dokument unter der Bedingung, dass eine Auftrittshäufigkeit des bestimmten Wortes, das in einem Kopfabschnitt des vereinigten bestimmten Hypertext-Dokuments erscheint, verdoppelt ist, Berechnen einer inversen Dokumenthäufigkeit IDF, die als ein inverser Wert der Anzahl bestimmter Hypertext-Dokumente definiert ist, in der ein bestimmtes Wort erscheint, für jedes bestimmte Wort, Berechnen eines Produkts TF*IDF einer Auftrittshäufigkeit TF und einer inversen Dokumenthäufigkeit IDF, Summieren mehrerer Produkte für alle bestimmten Worte, um ein summiertes Produkt als einen geschätzten Wert für jedes bestimmte Hypertext-Dokument erzeugen, Bestimmen mehrerer Bedeutungsgrade der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden für die vereinigten bestimmten Hypertext-Dokumente und Vorbereiten eines Index eines bestimmten Hypertext-Dokuments für jedes der bestimmten Hypertext-Dokumente, und
eine Wiederauffindungsergebnisse anzeigende Einheit 63 zum Anzeigen der Indizes der bestimmten Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden Einheit 62 bestimmt wurde, als ein Wiederauffindungsergebnis.
In der obigen Konfiguration besteht ein Kopfabschnitt jedes vereinigten bestimmten Hypertext-Dokuments aus einem Titel eines bestimmten Hypertext-Dokuments, das dem vereinigten bestimmten Hypertext-Dokument entspricht, und einem oder mehreren Ankersätzen bestimmter Stammdokumente mit einer Referenzbeziehung mit dem bestimmten Hypertext-Dokument. Falls z. B. ein bestimmtes Wort, das mit einem Schlüsselwort übereinstimmt, in einem vereinigten bestimmten Hypertext-Dokument sechsmal erscheint, wird unter der Bedingung, dass das bestimmte Wort im Kopfabschnitt des vereinigten bestimmten Hypertext-Dokuments dreimal erscheint, das bestimmte Wort, das im Kopfabschnitt des vereinigten bestimmten Hypertext-Dokuments erscheint, jedes Mal doppelt gezählt, wenn das bestimmte Wort erscheint, so dass eine Auftrittshäufigkeit TF des bestimmten Wortes im vereinigten bestimmten Hypertext-Dokument gleich 9 ist. Ein bestimmtes Hypertext-Dokument, das dem vereinigten bestimmten Hypertext-Dokument entspricht, wird danach gemäß der Auftrittshäufigkeit TF = 9 nach der Rangfolge eingeordnet.
Da der Kopfabschnitt des Hypertext-Dokuments normalerweise ein Merkmal des Hypertext-Dokuments sehr gut angibt und das bestimmte Wort, das im Kopfabschnitt des vereinigten bestimmten Hypertext-Dokuments erscheint, doppelt gezählt wird, kann demgemäß die Zuverlässigkeit für das Einordnen der bestimmten Hypertext-Dokumente gemäß der Rangfolge außerdem erhöht werden.
In einem HTML-Hypertext-Dokument, das in der Hypertext-Mark-Up-Language geschrieben ist, wird ein kleiner Index durch eine Zeichenkette ausgedrückt, die von "<h1>" und "</h1>" umgeben ist. Daher ist es zweckmäßig, dass der kleine Index im Kopfabschnitt des HTML-Hypertext-Dokuments enthalten ist.
In dieser Ausführungsform wird die Auftrittshäufigkeit des bestimmten Wortes, das im Kopfabschnitt des vereinigten bestimmten Hypertext-Dokuments erscheint, verdoppelt. Es ist jedoch zweckmäßig, dass die Auftrittshäufigkeit des bestimmten Wortes drei- oder mehrfach erhöht wird.
Achte Ausführungsform
In den Hypertext-Dokumenten des WorldWideWeb gibt es ein spezielles Hypertext-Dokument, in welchem mehrere Ankersätze existieren und keine anderen Sätze existieren. Dieses spezielle Hypertext-Dokument wird allgemein Link- bzw. Verknüpfungsseite genannt. Selbst wenn die Verknüpfungsseite abgefragt bzw. wiederaufgefunden und angezeigt wird, existiert keine nützliche Information, die mit einem Wiederauffindungsziel eines Nutzers übereinstimmt, in der Verknüpfungsseite. Daher wird eine Auftrittszahl eines bestimmten Wortes in der Verknüpfungsseite in dieser Ausführungsform auf Null herabgesetzt.
15 ist ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer achten Ausführungsform der vorliegenden Erfindung.
Wie in 15 gezeigt ist, umfasst eine Hypertext-Wiederauffindungsvorrichtung 71 zum Wiederauffinden eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einem großen Umfang an Hypertext-Dokumenten, die in der Hypertext-Dokument verwaltenden Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2, die Wiederauffindungseinheit 3, eine Dokumentrangfolgen bestimmende Einheit 72 zum Vereinigen eines bestimmten Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdokumente, die dem bestimmten Hypertext-Dokument entsprechen, zu einem vereinigten bestimmten Hypertext-Dokument gemäß der Dokumentinformation der Hypertext-Dokumenttabelle, die von der Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitenden Einheit 7 vorbereitet wurde, für jedes der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten wurden, Spezifizieren einer Verknüpfungsseite unter den bestimmten Hypertext-Dokumenten, Berechnen einer Auftrittshäufigkeit TF eines bestimmten Wortes in einem vereinigten bestimmten Hypertext-Dokument für jedes bestimmte Wort und jedes vereinigte bestimmte Hypertext-Dokument unter der Bedingung, dass eine Auftrittshäufigkeit des bestimmten Wortes in der Verknüpfungsseite jedes Mal um Eins reduziert wird, wenn das bestimmte Wort in der Verknüpfungsseite gefunden wird, die als ein bestimmtes Stammdokument des vereinigten bestimmten Hypertext-Dokuments behandelt wird, Berechnen einer inversen Dokumenthäufigkeit IDF, die als ein inverser Wert der Zahl bestimmter Hypertext-Dokumente, in denen ein bestimmtes Wort erscheint, definiert ist, für jedes bestimmte Wort, Berechnen eines Produkts TF*IDF einer Auftrittshäufigkeit TF und einer inversen Dokumenthäufigkeit IDF, Summieren mehrerer Produkte für alle bestimmten Worte, um ein summiertes Produkt als einen geschätzten Wert für jedes bestimmte Hypertext-Dokument zu erzeugen, Bestimmen mehrerer Bedeutungsgrade der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden für die vereinigten bestimmten Hypertext-Dokumente und Vorbereiten eines Index eines bestimmten Hypertext-Dokuments für jedes der bestimmten Hypertext-Dokumente, und
eine Wiederauffindungsergebnisse anzeigende Einheit 73 zum Anzeigen der Indizes der bestimmten Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden Einheit 62 bestimmt wurde, als ein Wiederauffindungsergebnis.
In der obigen Konfiguration ist z. B. das Hypertext-Dokument D82 eine zu einem bestimmten Wort "apple" gehörende Verknüpfungsseite und besteht aus zehn Ankersätzen. Daher existieren zehn Referenzdokumente, die jeweils eine Referenzbeziehung mit dem Hypertext-Dokument D82 aufweisen. Wenn eine Auftrittshäufigkeit des bestimmten Wortes "apple" in einem vereinigten bestimmten Hypertext-Dokument, das aus einem als ein bestimmtes Hypertext-Dokument behandeltes Referenzdokument und dem als ein bestimmtes Stammdokument behandelten Hypertext-Dokument D82 besteht, berechnet wird, wird eine Auftrittshäufigkeit des bestimmten Wortes "apple" in dem als ein bestimmtes Hypertext-Dokument behandelten Hypertext-Dokument D82 jedesmal um Eins reduziert, wenn das bestimmte Wort "apple" im bestimmten Stammdokument D82 gefun den wird. Diese reduzierende Operation wird für alle Referenzdokumente durchgeführt, die als die bestimmten Hypertext-Dokumente behandelt werden.
Selbst wenn das bestimmte Wort "apple" viele Male im Hypertext-Dokument D82 erscheint, wird deshalb die Auftrittshäufigkeit des bestimmten Wortes "apple" im Hypertext-Dokument D82 notwendigerweise auf Null reduziert, und das Hypertext-Dokument D82 wird in die niedrigste Klasse eingeordnet.
Demgemäß kann immer ein als Verknüpfungsseite dienendes bestimmtes Hypertext-Dokument in die niedrigste Klasse eingeordnet werden.
Neunte Ausführungsform
Es gibt ein langes Hypertext-Dokument, das aus mehreren Blöcken besteht, die jeweils einer Bedeutung entsprechen, und an der obersten Stelle jedes Blocks des langen Hypertext-Dokuments ist ein Referenzetikett angeordnet. In dieser Ausführungsform ist das lange Hypertext-Dokument in mehrere Blöcke geteilt, und eine jedem Block des langen Hypertext-Dokuments entsprechende Hypertext-Dokumenttabelle wird erstellt bzw. vorbereitet.
16 ist ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer neunten Ausführungsform der vorliegenden Erfindung.
Wie in 16 gezeigt ist, umfasst eine Hypertext-Wiederauffindungsvorrichtung 76 zum Wiederauffinden eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrschein lich erfüllen, aus einem großen Umfang an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden Einheit 8 gespeichert sind, eine Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 77 zum Analysieren der Hypertext-Dokumente mit den Referenzbeziehungen, die durch die Hypertext-Dokumente verwaltende Einheit 8 verwaltet werden, Spezifizieren eines langen Hypertext-Dokuments, das aus mehreren Blöcken besteht, die jeweils einer Bedeutung entsprechen, Festlegen jedes Blocks des langen Hypertext-Dokuments als ein Hypertext-Dokument entsprechend einer Bedeutung, Vorbereiten einer Hypertext-Dokumentinformation, in der ein oder mehrere Identifizierer für Stammdokumente, die ein oder mehrere Stammdokumente und Ankersätze der Stammdokumente identifizieren, mit einem Identifizierer für Hypertext-Dokumente aufgelistet sind, der ein Hypertext-Dokument und eine Dokumentspeicherposition des Hypertext-Dokuments identifiziert, für jedes der Hypertext-Dokumente, und Vorbereiten einer Hypertext-Dokumenttabelle der Hypertext-Dokumentinformation für alle Hypertext-Dokumente, die durch die Hypertext-Dokumente verwaltende Einheit 8 verwaltet werden,
die Wiederauffindungsindizes vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2, die Wiederauffindungseinheit 3, die Dokumentrangfolgen bestimmende Einheit 4 und die Wiederauffindungsergebnisse anzeigende Einheit 73.
Falls ein langes Hypertext-Dokument D87, das aus mehreren Blöcken besteht, die jeweils einer Bedeutung entsprechen, in den von der Hypertext-Dokumente verwaltenden Einheit 8 verwalteten Hypertext-Dokumenten existiert, wird in der obigen Konfiguration, wie in 17 gezeigt ist, das lange Hypertext-Dokument D87 durch die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 77 spezifiziert, und ein oder mehrere Referenzetiketten, die jeweils an der obersten Stelle eines Blocks des langen Hypertext-Dokuments D87 angeordnet sind, werden ausfindig gemacht. Danach wird das lange Hypertext-Dokument D87 in die mehreren Blöcke geteilt, und jeder Block des langen Hypertext-Dokuments D87 wird als ein Hypertext-Dokument D87, D88 oder D89 festgelegt. Wenn der Nutzer eine Zeichenkette "ABC" oder "XYZ" eines Ankersatzes eines Hypertext-Dokuments liest, kann in diesem Fall der Nutzer sofort auf das Referenzetikett wie z. B. "#ABC" oder "#XYZ" eines anderen Hypertext-Dokuments verweisen. Danach wird eine Hypertext-Dokumenttabelle der Hypertext-Dokumentinformation für alle Hypertext-Dokumente in der gleichen Weise wie in der ersten Ausführungsform vorbereitet bzw. erstellt.
Selbst wenn ein langes Hypertext-Dokument, das aus mehreren Blöcken besteht, die jeweils einer Bedeutung entsprechen, in den Hypertext-Dokumenten existiert, können demgemäß, weil das lange Hypertext-Dokument in die Blöcke geteilt und jeder Block des langen Hypertext-Dokuments als ein Hypertext-Dokument festgelegt wird, um die Hypertext-Dokumentinformation für jeden Block des langen Hypertext-Dokuments vorzubereiten bzw. zu erstellen, die Hypertext-Dokumente, die jeweils zu einer Bedeutung gehören, nach der Rangfolge geordnet werden, so dass der Nutzer eine Gruppe von Hypertext-Dokumenten, die seine Anforderung wahrscheinlich erfüllen, leicht Wiederauffinden kann.
Falls ein kleiner Index, der durch eine von "<h1>" und "</h1>" umschlossene Zeichenkette ausgedrückt wird, in einem langen Hypertext-Dokument verwendet wird, ist es in dieser Ausführungsform zweckmäßig, dass das lange Hypertext-Dokument in mehrere Blöcke unter der Bedingung geteilt wird, dass ein Referenzetikett oder ein kleiner Index an der obersten Stelle jedes Blocks angeordnet wird.
Zehnte Ausführungsform
Falls der Nutzer erneut mehrere Hypertext-Dokumente wiederauffinden möchte, indem ein anfängliches Schlüsselwort in ein anderes Schlüsselwort geändert wird, das sich auf mehrere bestimmte Hypertext-Dokumente bezieht, die gemäß dem anfänglichen Schlüsselwort angezeigt werden, möchte der Nutzer im allgemeinen ein oder mehrere Worte bestätigen, die in den bestimmten Hypertext-Dokumenten häufig erscheinen. In dieser Ausführungsform werden daher ein oder mehrere Worte, die in den bestimmten Hypertext-Dokumenten häufig erscheinen, angezeigt.
18 ist ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer zehnten Ausführungsform der vorliegenden Erfindung.
Wie in 18 gezeigt ist, umfasst eine Hypertext-Wiederauffindungsvorrichtung 91 zum Wiederauffinden eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einem großen Umfang an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen mit Stammdokumentlisten verarbeitende Einheit 7, die Wiederauffindungsindizes vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2, die Wiederauffindungseinheit 3, eine Dokumentrangfolgen bestimmende Einheit 92 zum Vereinigen eines bestimmten Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdokumente, die dem bestimmten Hypertext-Dokument entsprechen, zu einem vereinigten bestimmten Hypertext-Dokument gemäß der Dokumentinformation der Hypertext-Dokumenttabelle, die von der Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitenden Einheit 7 vorbereitet wurde, für jedes der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten wurden, Berechnen einer Auftrittshäufigkeit TF eines bestimmten Wortes in einem vereinigten bestimmten Hypertext-Dokument für jedes bestimmte Wort und jedes vereinigte bestimmte Hypertext-Dokument, Berechnen einer inversen Dokumenthäufigkeit IDF, die als ein inverser Wert der Zahl bestimmter Hypertext-Dokumente definiert ist, in denen ein bestimmtes Wort erscheint, für jedes bestimmte Wort, Berechnen eines Produkts TF*IDF einer Auftrittshäufigkeit TF und einer inversen Dokumenthäufigkeit IDF, Summieren mehrerer Produkte für alle bestimmten Worte, um ein summiertes Produkt als einen geschätzten Wert für jedes bestimmte Hypertext-Dokument zu erzeugen, Bestimmen mehrerer Bedeutungsgrade der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden für die vereinigten bestimmten Hypertext-Dokumente, Vorbereiten eines Index eines bestimmten Hypertext-Dokuments für jedes der bestimmten Hypertext-Dokumente, Auswählen mehrerer Hypertext-Dokumente mit hoher Rangfolge aus den bestimmten Hypertext-Dokumenten, Extrahieren mehrerer zusammengehöriger Worte, die in mehreren Wortlisten von Stücken einer Hypertext-Dokumentinformation der Hypertext-Dokumenttabelle entsprechend den Hypertext-Dokumenten mit hoher Rangfolge aufgelistet sind, Berechnen einer Auftrittshäufigkeit TF eines zusammengehörigen Wortes in einem Hypertext-Dokument mit hoher Rangfolge für jedes zusammengehörige Wort und jedes Hypertext-Dokument mit hoher Rangfolge, Berechnen einer inversen Dokumenthäufigkeit IDF, die als ein inverser Wert der Zahl von Hypertext-Dokumenten mit hoher Rangfolge, in denen ein zusammengehöriges Wort erscheint, definiert ist, für jedes zusammengehörige Wort, Berechnen einer Summe mehrerer Produkte TF*IDF für alle Hypertext-Dokumente mit hoher Rangfolge, um ein summiertes Produkt als einen Bedeutungsgrad für jedes zusammengehörige Wort zu erzeugen, miteinander Vergleichen der Bedeutungsgrade der zusammengehörigen Worte, Auswählen mehrerer zusam mengehöriger Worte mit hoher Rangfolge, deren Bedeutungsgrade höher als diejenigen anderer zusammengehöriger Worte sind, und Erstellen bzw. Vorbereiten eines Hypertext-Mark-Up-Language-(HTML)-Dokuments, in welchem mehrere Schaltflächen zur Auswahl von Schlüsselworten entsprechend den zusammengehörigen Worten mit hoher Rangfolge in absteigender Reihenfolge der Bedeutungsgrade der zusammengehörigen Worte mit hoher Rangfolge angeordnet sind, um ein zusammengehöriges Wort mit hoher Rangfolge durch Drücken einer Schaltfläche zur Auswahl von Schlüsselworten auszuwählen, und
eine Wiederauffindungsergebnisse anzeigende Einheit 93 zum Anzeigen der Indizes der bestimmten Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden Einheit 92 bestimmt wurde, als ein Wiederauffindungsergebnis auf einem Ergebnisse anzeigenden Fenster W1 und Anzeigen des durch die Dokumentrangfolgen bestimmende Einheit 92 vorbereiteten bzw. erstellten HTML-Dokuments auf einem ein zusammengehöriges Wort mit hoher Rangfolge auswählenden Fenster W2.
Falls die zehnte Ausführungsform und die dritte Ausführungsform kombiniert werden, werden, wie in 19 gezeigt ist, in der obigen Konfiguration, wenn ein Schlüsselwort "apple" in die Schlüsselworteingabeeinheit 2 eingegeben wird, mehrere Indizes bestimmter Hypertext-Dokumente wie der Dokumente D83, D85 und D86 und mehrere Indizes von Stammdokumenten wie z. B. der D80 und D81 beispielsweise auf dem Ergebnisse anzeigenden Fenster W1 in der gleichen Weise wie in der dritten Ausführungsform angezeigt. In der Dokumentrangfolgen bestimmenden Einheit 92 werden danach aus den bestimmten Hypertext-Dokumenten zehn Hypertext-Dokumente mit hoher Rangfolge ausgewählt, werden mehrere zusammengehörige Worte extrahiert, die in mehreren Wortlisten von Stücken einer Hypertext-Dokumentinformation der Hypertext- Dokumenttabelle entsprechend den Hypertext-Dokumenten mit hoher Rangfolge aufgelistet sind, wird eine Summe mehrerer Produkte TF*IDF für alle Hypertext-Dokumente mit hoher Rangfolge für jedes zusammengehörige Wort berechnet, und Bedeutungsgrade für die zusammengehörigen Worte werden bestimmt. Danach werden aus den zusammengehörigen Worten zehn zusammengehörige Worte mit hoher Rangfolge "Shinshu", "farmer", "product", "Aomori", "manure", "farm", "festival", "Nebuta", "Nagano" und "Olympics" ausgewählt, wird ein HTML-Dokument vorbereitet, in welchem zehn Schaltflächen zur Auswahl von Schlüsselworten entsprechend den zugehörigen Worten mit hoher Rangfolge in absteigender Reihenfolge der Bedeutungsgrade der zusammengehörigen Worte mit hoher Rangfolge angeordnet sind, und das HTML-Dokument wird auf dem zusammengehörige Worte mit hoher Rangfolge auswählenden Fenster W2 angezeigt.
Wenn der Nutzer die Schaltfläche für ein Schlüsselwort drückt, die dem zusammengehörigen Wort mit hoher Rangfolge "Shinshu" entspricht, wird das Wort "Shinshu", das einen Landkreis mit Apfelanbau bezeichnet, als ein Schlüsselwort in die Schlüsselworteingabeeinheit 2 eingegeben, werden Bedeutungsgrade mehrerer bestimmter Hypertext-Dokumente entsprechend dem Schlüsselwort "Shinshu" bestimmt, und die in der absteigenden Reihenfolge der Bedeutungsgrade angeordneten bestimmten Hypertext-Dokumente werden auf dem Ergebnisse anzeigenden Fenster W1 in der gleichen Weise wie in der ersten Ausführungsform angezeigt.
Selbst wenn der Nutzer anfangs sich an kein geeignetes Schlüsselwort erinnern kann, kann demgemäß der Nutzer ein oder mehrere Schlüsselworte auswählen, die seinem Wiederauffindungsziel näher liegen. Der Nutzer kann auch sein Wiederauffindungsziel ändern, indem er auf die zusammengehörigen Worte mit hoher Rangfolge Bezug nimmt, und meh rere bestimmte Hypertext-Dokumente, die einem neuen Schlüsselwort entsprechen, das vom Nutzer gemäß einer neuen Wiederauffindungsabsicht ausgewählt wurde, können angezeigt werden.
In diesem Fall kann der Nutzer die Schaltfläche zur Auswahl von Schlüsselworten unter Verwendung einer Zeigervorrichtung ohne Verwendung einer Tastatur drücken. Die Schaltflächen zur Auswahl von Schlüsselworten werden auch verkörpert, indem ein JAVA-Skript ausgeführt wird, in welchem die zusammengehörigen Worte mit hoher Rangfolge zu einem Textkasten addiert werden, eine Schaltfläche "Löschen" kann verkörpert werden, indem ein JAVA-Skript ausgeführt wird, in welchem ein dem Textkasten hinzugefügtes zusammengehöriges Wort mit hoher Rangfolge gelöscht wird, eine Schaltfläche "Anfangsbedingung" wird verkörpert, indem ein JAVA-Skript ausgeführt wird, in welchem die dem Textkasten hinzugefügten zusammengehörigen Worte mit hoher Rangfolge zu einer Anfangsgruppe von Schlüsselworten wie z. B. "apple" zurückgeführt werden, und eine Schaltfläche "erneutes Wiederauffinden" wird verkörpert, indem ein JAVA-Skript ausgeführt wird, in welchem eine Wiederauffindungsoperation wieder ausgeführt wird, indem ein oder mehrere Worte, die dem Textkasten hinzugefügt wurden, als ein oder mehrere Schlüsselworte verwendet werden.
In dieser Ausführungsform werden die Hypertext-Dokumente mit hoher Rangfolge aus den bestimmten Hypertext-Dokumenten ausgewählt. Es ist jedoch zweckmäßig, dass die Hypertext-Dokumente mit hoher Rangfolge aus den bestimmten Hypertext-Dokumenten und den Stammdokumenten ausgewählt werden. In diesem Fall können mehrere zusammengehörige Worte aus mehreren Hypertext-Dokumenten mit einer Referenzbeziehung untereinander weitgehend erfaßt bzw. gesammelt werden.
Elfte Ausführungsform
In der zehnten Ausführungsform werden die Bedeutungsgrade der zusammengehörigen Worte ohne jegliche Verbindung mit dem vom Nutzer zu Anfang eingegebenen Schlüsselwort bestimmt. Falls jedoch der Nutzer ein zusammengehöriges Wort mit einer engen Korrelation mit dem Schlüsselwort auswählen möchte, wird bevorzugt, dass ein zusammengehöriges Wort mit enger Korrelation mit einem Schlüsselwort als ein zusammengehöriges Wort mit hoher Rangfolge vorzugsweise ausgewählt wird. In dieser Ausführungsform wird daher eine Auftrittshäufigkeit eines zusammengehörigen Wortes mit einer engen Korrelation mit einem Schlüsselwort verdoppelt, um einen Bedeutungsgrad des zusammengehörigen Wortes zu erhöhen.
20 ist ein Blockdiagramm einer Hypertext-Wiederauffindungsvorrichtung gemäß einer elften Ausführungsform der vorliegenden Erfindung.
Wie in 20 gezeigt ist, umfasst eine Hypertext-Wiederauffindungsvorrichtung 101 zum Wiederauffinden eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus einem großen Umfang an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2, die Wiederauffindungseinheit 3, eine Dokumentrangfolgen bestimmte Einheit 102 zum Vereinigen eines bestimmten Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdokumente, die dem bestimmten Hypertext-Dokument entsprechen, zu einem vereinigten bestimmten Hypertext-Dokument gemäß der Dokumentinformation der Hypertext-Dokumenttabelle, die von der Hyper text-Dokumenttabellen mit Stammdokumentlisten vorbereitenden Einheit 7 vorbereitet wurde, für jedes der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten wurden, Berechnen einer Auftrittshäufigkeit TF eines bestimmten Wortes in einem vereinigten bestimmten Hypertext-Dokument für jedes bestimmte Wort und jedes vereinigte bestimmte Hypertext-Dokument, Berechnen einer inversen Dokumenthäufigkeit IDF, die als ein inverser Wert der Zahl bestimmter Hypertext-Dokumente definiert ist, in denen ein bestimmtes Wort erscheint, für jedes bestimmte Wort, Berechnen eines Produkts TF*IDF einer Auftrittshäufigkeit TF und einer inversen Dokumenthäufigkeit IDF, Summieren mehrerer Produkte für alle bestimmten Worte, um ein summiertes Produkt als einen geschätzten Wert für jedes bestimmte Hypertext-Dokument zu erzeugen, Bestimmen mehrerer Bedeutungsgrade der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden für die vereinigten bestimmten Hypertext-Dokumente, Erstellen bzw. Vorbereiten eines Index eines bestimmten Hypertext-Dokuments für jedes der bestimmten Hypertext-Dokumente, Auswählen mehrerer Hypertext-Dokumente mit hoher Rangfolge aus den bestimmten Hypertext-Dokumenten, Extrahieren mehrerer zusammengehöriger Worte, die in mehreren Wortlisten von Stücken einer Hypertext-Dokumentinformation der Hypertext-Dokumenttabelle entsprechend den Hypertext-Dokumenten mit hoher Rangfolge aufgelistet sind, Berechnen einer Auftrittshäufigkeit TF eines zusammengehörigen Wortes in einem Hypertext-Dokument mit hoher Rangfolge für jedes zusammengehörige Wort und jedes Hypertext-Dokument mit hoher Rangfolge unter der Bedingung, dass das zusammengehörige Wort doppelt gezählt wird, wenn das zusammengehörige Wort innerhalb einer Distanz von 40 Buchstaben von einem Schlüsselwort platziert ist, Berechnen einer inversen Dokumenthäufigkeit IDF, die als ein inverser Wert der Zahl von Hypertext- Dokumenten mit hoher Rangfolge definiert ist, in denen ein zusammengehöriges Wort erscheint, für jedes zusammengehörige Wort, Berechnen einer Summe mehrerer Produkte TF*IDF für alle Hypertext-Dokumente mit hoher Rangfolge, um ein summiertes Produkt als einen Bedeutungsgrad für jedes zusammengehörige Wort zu erzeugen, miteinander Vergleichen der Bedeutungsgrade der zusammengehörigen Worte, Auswählen mehrerer zusammengehöriger Worte mit hoher Rangfolge, deren Bedeutungsgrade höher als diejenigen anderer zusammengehöriger Worte sind, und Vorbereiten bzw. Erstellen eines Hypertext-Mark-Up-Language-(HTML)-Dokuments, in welchem mehrere, den zusammengehörigen Worten mit hoher Rangfolge entsprechende Schaltflächen zur Auswahl von Schlüsselworten in der absteigenden Reihenfolge der Bedeutungsgrade der zusammengehörigen Worte mit hoher Rangfolge angeordnet sind, um durch Drücken einer Schaltfläche zur Auswahl von Schlüsselworten ein zusammengehöriges Wort mit hoher Rangfolge auszuwählen, und eine Wiederauffindungsergebnisse anzeigende Einheit 103 zum Anzeigen der Indizes der bestimmten Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden Einheit 92 bestimmt wurde, als ein Wiederauffindungsergebnis auf einem Ergebnisse anzeigenden Fenster W1 und Anzeigen des durch die Dokumentrangfolgen bestimmende Einheit 102 vorbereiteten bzw. erstellten HTML-Dokuments auf einem zusammengehörige Worte mit hoher Rangfolge auswählenden Fenster W2.
Nachdem die zusammengehörigen Worte in der gleichen Weise wie in der zehnten Ausführungsform extrahiert sind, wird in der obigen Konfiguration eine Auftrittshäufigkeit TF eines zusammengehörigen Wortes in einem Hypertext-Dokument mit hoher Rangfolge für jedes zusammengehörige Wort und jedes Hypertext-Dokument mit hoher Rangfolge berechnet. Wenn das zusammengehörige Wort innerhalb einer Distanz von 40 Buch staben von einem Schlüsselwort "apple" platziert ist, wird in diesem Fall das zusammengehörige Wort doppelt gezählt. Da das zusammengehörige Wort "Shinshu", das einen Landkreis mit Apfelanbau bezeichnet, oder das zusammengehörige Wort "farmer" oft innerhalb einer Distanz von 40 Buchstaben von einem Schlüsselwort "apple" erscheint und weil das zusammengehörige Wort "Nagano", das einen Amtsbezirk mit Apfelanbau bezeichnet, oder das zusammengehörige Wort "Olympics", das ein in Nagano 1998 abgehaltenes Festival bezeichnet, kaum innerhalb einer Distanz von 40 Buchstaben von einem Schlüsselwort "apple" erscheint, werden, wie in 21 gezeigt ist, die zusammengehörigen Worte "Shinshu" und "farmer" auf dem Kopfabschnitt des zusammengehörige Worte mit hoher Rangfolge auswählenden Fensters W2 zuverlässig angezeigt, und die zusammengehörigen Worte "Nagano" und "Olympics" werden auf dem hinteren Abschnitt des zusammengehörige Worte mit hoher Rangfolge auswählenden Fensters W2 angezeigt, selbst wenn die zusammengehörigen Worte "Nagano" und "Olympics" in den bestimmten Hypertext-Dokumenten häufig erscheinen.
Ein oder mehrere zusammengehörige Worte mit einer starken Beziehung mit dem Schlüsselwort können demgemäß in Positionen mit hoher Rangfolge angezeigt werden, und ein oder mehrere zusammengehörige Worte, die einem Wiederauffindungsziel eines Nutzers entsprechen, das von dem anfänglichen Wiederauffindungsziel verschieden ist, können in Positionen mit niedriger Rangfolge angezeigt werden.
Nachdem die Prinzipien der vorliegenden Erfindung in deren bevorzugter Ausführungsform veranschaulicht und beschrieben wurden, sollte dem Fachmann ohne weiteres ersichtlich sein, dass die Erfindung in Aufbau und Einzelheiten abgewandelt werden kann, ohne von solchen Prinzipien abzuweichen. Wir beanspruchen alle Modifikationen, die in den Umfang der beiliegenden Ansprüche fallen.

Claims

Hypertext-Dokumentwiederauffindungsvorrichtung zum Wiederauffinden mehrerer bestimmter Hypertext-Dokumente, die wahrscheinlich eine Wiederauffindungsanforderung eines Nutzers erfüllen, aus einer Gruppe von Hypertext-Dokumenten mit Referenzbeziehungen untereinander, in der ein Hypertext-Dokument mit einem Ankersatz als ein Stammdokument für ein anderes Hypertext-Dokument dient, das als Referenzdokument dient, und ein Nutzer auf ein Referenzdokument Bezug nimmt, nachdem der Nutzer einen Ankersatz eines Stammdokuments entsprechend dem Referenzdokument auswählt, mit: einem Hypertext-Dokumenttabellen vorbereitenden Mittel (7, 77), um für jedes der Hypertext-Dokumente eine Hypertext-Dokumentinformation vorzubereiten, in der ein ein Hypertext-Dokument identifizierender Identifzierer für Hypertext-Dokumente, ein Hauptteil des Hypertext-Dokuments, ein Identifizierer für Stammdokumente, der ein Stammdokument identifiziert, das dem als Referenzdokument dienenden Hypertext-Dokument entspricht, und ein Ankersatz des Stammdokuments registriert sind, und eine Hypertext-Dokumenttabelle der Hypertext-Dokumenteninformation für die Hypertext-Dokumente vorzubereiten; einem Wiederauffindungsindizes vorbereitenden Mittel (6) zum Erkennen mehrerer Worte, die in jedem der Hypertext-Dokumente und der Stammdokumente erscheinen, gemäß der Hypertext-Dokumenttabelle, die durch das Hypertext-Dokumenttabellen vorbereitende Mittel vorbereitet wurde, Erkennen mehrerer Auftrittspositionen der Worte in jedem der Hypertext-Dokumente und der Stammdokumente gemäß der Hypertext-Dokumenttabelle, Vorbereiten einer Wortinformation, die aus einem oder mehreren Identifizierern für das Auftreten von Dokumenten besteht, die ein oder mehr Hypertext-Dokumente, in denen ein Wort erscheint, und Auftrittspositionen des Wortes in den Hypertext-Dokumenten und einen oder mehrere Ankersätze eines oder mehrerer Stammdokumente entsprechend den Hypertext-Dokumenten für jedes der Worte identifizieren, und Vorbereiten eines Wiederauffindungsindex von Stücken einer Wortinformation für die Worte; einem Schlüsselworte empfangenden Mittel (2), um ein Schlüsselwort zu empfangen, das die Wiederauffindungsanforderung des Nutzers angibt; einem Wiederauffindungsmittel (3) zum Wiederauffinden einer bestimmten Wortinformation entsprechend dem Schlüsselwort, das vom Schlüsselworte empfangenden Mittel empfangen wurde, aus dem Wiederauffindungsindex, der durch das Wiederauffindungsindizes vorbereitende Mittel vorbereitet wurde, und Wiederauffinden mehrerer bestimmter Identifizierer für das Auftreten von Dokumenten, die mehrere bestimmte Hypertext-Dokumente, in denen das Schlüsselwort erscheint, und mehrere bestimmte Auftrittspositionen des Schlüsselwortes in den bestimmten Hypertext-Dokumenten und einen oder mehrere bestimmte Ankersätze eines oder mehrerer bestimmter Stammdokumente entsprechend den bestimmten Hyper text-Dokumenten aus der bestimmten Wortinformation identifizieren; Dokumentenrangfolgen bestimmenden Mitteln (4, 12, 22, 32, 42, 52, 62, 72, 92, 102) zum Spezifizieren der bestimmten Hypertext-Dokumente, die durch die bestimmten, durch das Wiederauffindungsmittel wiederaufgefundenen Identifizierern für das Auftreten von Dokumenten identifiziert werden, Wiederauffinden von Stücken einer bestimmten Hypertext-Dokumentinformation für die bestimmten Hypertext-Dokumente aus der Hypertext-Dokumenttabelle, die durch das Hypertext-Dokumenttabellen vorbereitende Mittel vorbereitet wurde, Vereinigen eines bestimmten Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdokumente entsprechend dem bestimmten Hypertext-Dokument zu einem vereinigten Hypertext-Dokument für jedes der bestimmten Hypertext-Dokumente, Berechnen einer Auftrittshäufigkeit des Schlüsselwortes in einem vereinigten Hypertext-Dokument für jedes vereinigte Hypertext-Dokument, Bestimmen mehrerer Bedeutungsgrade der vereinigten Hypertext-Dokumente gemäß den Auftrittshäufigkeiten in den vereinigten Hypertext-Dokumenten, Festlegen eines Bedeutungsgrads eines vereinigten Hypertext-Dokuments als einen Bedeutungsgrad eines bestimmten Hypertext-Dokuments entsprechend dem vereinigten Hypertext-Dokument für jedes vereinigte Hypertext-Dokument und Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden der bestimmten Hypertext-Dokumente; und einem Wiederauffindungsergebnisse anzeigenden Mittel (5, 13, 23, 33, 43, 53, 63, 73, 93, 103) zum Anzeigen mehrerer Indizes der bestimmten Hypertext-Dokumente in einer geordneten Reihenfolge entsprechend der Rangfolge der bestimmten Hypertext-Dokumente, die durch das Dokumentrangfolgen bestimmende Mittel bestimmt wurde, als ein Wiederauffindungsergebnis.
Hypertext-Dokumentvviederauffindungsvorrichtung nach Anspruch 1, bei der ein Index eines bestimmten Stammdokuments entsprechend einem bestimmten Hypertext-Dokument mit dem Index des bestimmten Hypertext-Dokuments durch das Wiederauffindungsergebnisse anzeigende Mittel für jedes der bestimmten Hypertext-Dokumente angezeigt wird.
Hypertext-Dokumentewiederauffindungsvorrichtung nach Anspruch 1, bei der mehrere bestimmte Hypertext-Dokumente, die dem gleichen bestimmten Stammdokument entsprechen, auf den gleichen Rang als höchster Rang unter den Rängen, die für die bestimmten Hypertext-Dokumente bestimmt wurden, durch das Dokumentrangfolgen bestimmende Mittel zurückgesetzt werden und die auf den gleichen Rang gesetzten bestimmten Hypertext-Dokumente mit dem bestimmten Stammdokument in einer Gruppe durch das Wiederauffindungsergebnisse anzeigende Mittel angezeigt werden.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 1, bei der mehrere bestimmte Hypertext-Dokumente entsprechend dem gleichen bestimmten Stammdokument gemäß einer Summe der Bedeutungsgrade für die bestimmten Hypertext-Dokumente durch das Dokumentrangfolgen bestimmende Mittel auf einen gleichen Rang zurückgesetzt werden und die auf den gleichen Rang gesetzten bestimmten Hypertext-Dokumente mit dem bestimmten Stammdo kument in einer Gruppe durch das Wiederauffindungsergebnisse anzeigende Mittel angezeigt werden.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 1, bei der jedes der vereinigten Hypertext-Dokumente durch das Dokumentrangfolgen bestimmende Mittel gebildet wird, indem ein oder mehrere Ankersätze eines oder mehrerer bestimmte Stammdokumente entsprechend dem einen bestimmten Hypertext-Dokument und das bestimmte Hypertext-Dokument vereinigt werden.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 1, bei der ein bestimmter Satz oder eine bestimmte Phrase, der oder die das Schlüsselwort enthält, aus jedem der bestimmten Hypertext-Dokumente durch das Dokumentrangfolgen bestimmende Mittel extrahiert wird und eine Zusammenfassung, in der ein bestimmter Satz oder eine bestimmte Phrase eines bestimmten Hypertext-Dokuments nach einem obersten Satz oder einer obersten Phrase des bestimmten Hypertext-Dokuments geschrieben wird, mit dem Index des bestimmten Hypertext-Dokuments für jedes der bestimmten Hypertext-Dokumente angezeigt wird.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 1, bei der der Bedeutungsgrad jedes der vereinigten Hypertext-Dokumente durch das Dokumentrangfolgen bestimmende Mittel bestimmt wird, indem eine Summe einer Auftrittshäufigkeit des Schlüsselwortes in einem Hypertext-Dokument und einer Auftrittshäufigkeit des Schlüsselwortes in einem Stammdokument entsprechend dem Hypertext-Dokument für jedes der Stammdokumente entsprechend dem Hypertext-Dokument berechnet wird, eine Maximumsumme unter den Summen für die Stammdokumente ausgewählt wird, ein bestimmtes Stammdokument entsprechend der Maximumsumme spezifiziert wird, ein Bedeutungsgrad für eine Kombination des Hypertext-Dokuments und des bestimmten Stammdokuments gemäß der Maximumsumme bestimmt wird und der Bedeutungsgrad als ein Bedeutungsgrad eines vereinigten Hypertext-Dokuments entsprechend dem Hypertext-Dokument betrachtet wird.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 1, bei der die Auftrittshäufigkeit des Schlüsselwortes in jedem vereinigten Hypertext-Dokument durch das Dokumentrangfolgen bestimmende Mittel berechnet wird, indem das Schlüsselwort doppelt gezählt wird, das in einem oder mehreren Ankersätzen eines oder mehrerer bestimmter Stammdokumente entsprechend dem vereinigten Hypertext-Dokument erscheint.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 1, bei der die Auftrittshäufigkeit des Schlüsselwortes in einem Hypertext-Dokument, das als eine Verknüpfungsseite dient, die aus einem mehreren Ankersätzen besteht, durch das Dokumentrangfolgen bestimmende Mittel auf Null gesetzt wird.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 1, bei der ein Hypertext-Dokument mit Inhalten entsprechend mehreren Bedeutungen, die jeweils durch ein Referenzetikett identifiziert werden, durch das Hypertext-Dokumenttabellen vorbereitende Mit tel in mehrere Blöcke geteilt wird, so dass an einer obersten Stelle jedes Blocks ein Referenzetikett eingebunden wird, und eine Hypertext-Dokumentinformation für jeden Block des Hypertext-Dokuments durch das Hypertext-Dokumenttabellen vorbereitende Mittel vorbereitet wird.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 1, bei der eine vorbestimmte Anzahl bestimmter Hypertext-Dokumente mit hoher Rangfolge aus den bestimmten Hypertext-Dokumenten durch das Dokumentrangfolgen bestimmende Mittel ausgewählt wird, mehrere verwandte bzw. zusammengehörige Worte, die in den bestimmten Hypertext-Dokumenten mit hoher Rangfolge erscheinen, aus den bestimmten Hypertext-Dokumenten mit hoher Rangfolge durch das Dokumentrangfolgen bestimmende Mittel extrahiert wird, mehrere Bedeutungsgrade der zusammengehörigen Worte aus mehreren Auftrittshäufigkeiten der zusammengehörigen Worte in den bestimmten Hypertext-Dokumenten mit hoher Rangfolge durch das Dokumentrangfolgen bestimmende Mittel berechnet werden, eine vorbestimmte Anzahl zusammengehöriger Worte mit hoher Rangfolge aus den zusammengehörigen Worten, die gemäß den Bedeutungsgraden der zusammengehörigen Worte durch das Dokumentrangfolgen bestimmende Mittel in der Rangfolge angeordnet wurden, ausgewählt wird und mehrere Auswahltasten für die zusammengehörigen Worte mit hoher Rangfolge mit den Indizes der bestimmten Hypertext-Dokumente durch das Wiederauffindungsergebnisse anzeigende Mittel angezeigt werden.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 1, bei der eine vorbestimmte Anzahl bestimmter Hypertext-Dokumente mit hoher Rangfolge aus den bestimmten Hypertext-Dokumenten durch das Dokumentrangfolgen bestimmende Mittel ausgewählt wird, mehrere zusammengehörige Worte, die in den bestimmten Hypertext-Dokumenten mit hoher Rangfolge erscheinen, und mehrere bestimmte Stammdokumente entsprechend den bestimmten Hypertext-Dokumenten mit hoher Rangfolge aus den bestimmten Hypertext-Dokumenten mit hoher Rangfolge durch das Dokumentrangfolgen bestimmende Mittel extrahiert werden, mehrere Bedeutungsgrade der zusammengehörigen Worte aus mehreren Auftrittshäufigkeiten der zusammengehörigen Worte in dem bestimmten Hypertext-Dokument mit hoher Rangfolge und den bestimmten Stammdokumenten durch das Dokumentrangfolgen bestimmende Mittel berechnet werden, eine vorbestimmte Anzahl zusammengehöriger Worte mit hoher Rangfolge aus den zusammengehörigen Worten gemäß den Bedeutungsgraden der zusammengehörigen Worte durch das Dokumentrangfolgen bestimmende Mittel ausgewählt wird und mehrere Auswahltasten für die zusammengehörigen Worte mit hoher Rangfolge mit den Indizes der bestimmten Hypertext-Dokumente durch das Wiederauffindungsergebnisse anzeigende Mittel angezeigt werden.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 1, bei der eine vorbestimmte Anzahl bestimmter Hypertext-Dokumente mit hoher Rangfolge aus den bestimmten Hypertext-Dokumenten durch das Dokumentrangfolgen bestimmende Mittel ausgewählt wird, mehrere zusammengehörige Worte, die in dem be stimmten Hypertext-Dokument mit hoher Rangfolge erscheinen, durch das Dokumentrangfolgen bestimmende Mittel aus den bestimmten Hypertext-Dokumenten mit hoher Rangfolge extrahiert werden, eine Auftrittshäufigkeit jedes zusammengehörigen Wortes in den bestimmten Hypertext-Dokumenten mit hoher Rangfolge durch das Dokumentrangfolgen bestimmende Mittel unter der Bedingung berechnet wird, dass das in einem bestimmten Hypertext-Dokument mit hoher Rangfolge erscheinende zusammengehörige Wort doppelt gezählt wird, falls eine Auftrittsposition des zusammengehörigen Wortes nahe einer Auftrittsposition des Schlüsselwortes liegt, mehrere Bedeutungsgrade der zusammengehörigen Worte aus den Auftrittshäufigkeiten der zusammengehörigen Worte durch das Dokumentrangfolgen bestimmende Mittel berechnet werden, eine vorbestimmte Anzahl zusammengehöriger Worte hoher Rangfolge aus den zusammengehörigen Worten ausgewählt wird, die gemäß den Bedeutungsgraden der zusammengehörigen Worte durch das Dokumentrangfolgen bestimmende Mittel in der Rangfolge angeordnet werden, und mehrere Auswahltasten für die zusammengehörigen Worte mit hoher Rangfolge mit den Indizes der bestimmten Hypertext-Dokumente durch das Wiederauffindungsergebnisse anzeigende Mittel angezeigt werden.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 1, bei der eine vorbestimmte Anzahl bestimmter Hypertext-Dokumente mit hoher Rangfolge aus den bestimmten Hypertext-Dokumenten durch das Dokumentrangfolgen bestimmende Mittel ausgewählt wird, mehrere zusammengehörige Worte, die in den bestimmten Hypertext-Dokumenten mit hoher Rangfolge erscheinen, und mehrere bestimmte Stammdokumente entsprechend den bestimmten Hypertext-Dokumenten mit hoher Rangfolge durch das Dokumentrangfolgen bestimmende Mittel aus den bestimmten Hypertext-Dokumenten mit hoher Rangfolge extrahiert werden, eine Auftrittshäufigkeit jedes zusammengehörigen Wortes in den bestimmten Hypertext-Dokumenten mit hoher Rangfolge und den bestimmten Stammdokumenten durch das Dokumentrangfolgen bestimmende Mittel unter der Bedingung berechnet wird, dass das in einem bestimmten Hypertext-Dokument mit hoher Rangfolge oder einem bestimmten Stammdokument erscheinende zusammengehörige Wort doppelt gezählt wird, falls eine Auftrittsposition des zusammengehörigen Wortes nahe einer Auftrittsposition des Schlüsselwortes liegt, mehrere Bedeutungsgrade der zusammengehörigen Worte aus den Auftrittshäufigkeiten der zusammengehörigen Worte durch das Dokumentrangfolgen bestimmende Mittel berechnet werden, eine vorbestimmte Anzahl zusammengehöriger Worte mit hoher Rangfolge aus den zusammengehörigen Worten ausgewählt wird, die gemäß den Bedeutungsgraden der zusammengehörigen Worte durch das Dokumentrangfolgen bestimmende Mittel in der Rangfolge angeordnet wurden, und mehrere Auswahltasten für die zusammengehörigen Worte mit hoher Rangfolge mit den Indizes der bestimmten Hypertext-Dokumente durch das Wiederauffindungsergebnisse anzeigende Mittel angezeigt werden.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 1, bei der mehrere Schlüsselworte vom Schlüsselworte empfangenden Mittel empfangen werden, eine Auftrittshäufigkeit TF eines Schlüsselwortes in einem vereinigten Hypertext-Dokument durch das Dokumentrangfolgen bestimmende Mittel für jedes Schlüsselwort und jedes vereinigte Hypertext-Dokument berechnet wird, eine inverse Dokumenthäufigkeit IDF, die als ein inverser Wert der Anzahl bestimmter Hypertext-Dokumente definiert ist, in denen ein Schlüsselwort erscheint, durch das Dokumentrangfolgen bestimmende Mittel für jedes Schlüsselwort berechnet wird, ein Produkt TF*IDF einer Auftrittshäufigkeit TF und einer inversen Dokumenthäufigkeit IDF durch das Dokumentrangfolgen bestimmende Mittel berechnet wird, mehrere Produkte für die Schlüsselworte durch das Dokumentrangfolgen bestimmende Mittel summiert werden, um ein summiertes Produkt eines geschätzten Wertes für jedes vereinigte bestimmte Hypertext-Dokument zu erzeugen, und die Bedeutungsgrade der vereinigten Hypertext-Dokumente gemäß den geschätzten Werten durch das Dokumentrangfolgen bestimmende Mittel bestimmt werden.
Hypertext-Dokumentwiederauffindungsvorrichtung nach Anspruch 15, bei der ein geschätzter Wert für ein vereinigtes bestimmtes Hypertext-Dokument erhöht wird, um den Rang des bestimmten Hypertext-Dokuments zu erhöhen, falls zwei oder mehr Schlüsselworte in dem vereinigten bestimmten Hypertext-Dokument erscheinen oder eine Distanz von zwei Schlüsselworten in dem vereinigten bestimmten Hypertext-Dokument innerhalb einer vorbestimmten Anzahl von Worten liegt.