-
HINTERGRUND
DER ERFINDUNG
-
1. GEBIET DER ERFINDUNG
-
Die
vorliegende Erfindung bezieht sich allgemein auf ein Hypertext-Dokumentwiederauffindungssystem
oder eine Hypertext-Dokumentwiederauffindungsvorrichtung und konkreter
auf eine Hypertext-Dokumentwiederauffindungsvorrichtung,
in der mehrere Hypertext-Dokumente,
die wahrscheinlich eine Wiederauffindungsanforderung eines Nutzers erfüllen, aus
einem großen
Umfang an Hypertext-Dokumenten wiederaufgefunden und dem Nutzer
präsentiert
werden.
-
2. BESCHREIBUNG DER VERWANDTEN
TECHNIK
-
2.1. FRÜHER VORGESCHLAGENE
TECHNIK
-
Als
eine herkömmliche
Vorrichtung, in der ein oder mehrere Dokumente, die wahrscheinlich
eine Wiederauffindungsanforderung eines Nutzers erfüllen, aus
einem großen
Umfang an Dokumenten wiederaufgefunden und dem Nutzer präsentiert
werden, ist eine in 1 gezeigte
Dokumentwiederauffindungsvorrichtung 200 bekannt. In dieser
Vorrichtung 200 wird ein großer Umfang an in einer Dokumentverwaltungseinheit 201 gespeicherten
Dokumenten vorher in einer Wiederauffindungsindizes entwickelnden
Einheit 202 analysiert, und es wird untersucht, wie oft
jedes von mehreren, in einem Wörterbuch
der Wiederauffindungsindizes entwickelnden Einheit 202 registrierten
Worte in jedem der Dokumente erscheint. Das heißt, es wird eine Auftrittshäufigkeit
jedes Wortes in einem Dokument für
jedes der in der Dokumentverwaltungseinheit 201 gespeicherten
Dokumente berechnet, für
jedes der Worte ein Abweichungsgrad IDF eines Wortes in den ganzen
Dokumenten als ein Korrekturfaktor für das Wort berechnet, eine
normierte Auftrittshäufigkeit
(ein TF-Wert genannt) jedes Wortes für jedes der Dokumente berechnet,
ein geschätzter
Wert jedes Dokuments, der ausgedrückt wird durch TF*IDF, für jedes
der Worte berechnet, indem der Abweichungsgrad und die normierte
Auftrittshäufigkeit
miteinander multipliziert werden, und ein Wiederauffindungsindex
in der Wiederauffindungsindizes entwickelnden Einheit 202 entwickelt.
Im Wiederauffindungsindex wird eine Gruppe bzw. ein Satz aus einem
Wort, Identifizierungsdaten, die ein oder mehrere Dokumente angeben,
in denen das Wort erscheint, und für jedes der Worte einem geschätzten Wert
für das
Wort registriert.
-
Wenn
mehrere, von einem Nutzer 207 eingegebene Schlüsselworte
in einer Schlüsselworteingabeeinheit 203 empfangen
werden, werden danach die Schlüsselworte
zu einer Wiederauffindungseinheit 204 übertragen. In der Wiederauffindungseinheit 204 werden
mehrere, mit den eingegebenen Schlüsselworten übereinstimmende Wiederauffindungsworte
aus dem Wiederauffindungsindex ausfindig gemacht, der in der Wiederauffindungsindizes
entwickelnden Einheit 202 gespeichert ist, ein bestimmter Satz
bzw. eine bestimmte Gruppe aus einem Wiederauffindungswort, Identifizierungsdaten,
die ein oder mehrere Identifizierungsdokumente angeben, in denen
das Wiederauffindungswort erscheint, und einem geschätzten Wert
für das
Wiederauffindungswort wird für
jedes der Wiederauffindungsworte aus der Wiederauffindungsindizes
entwickelnden Einheit 202 herausgenommen, und die den Schlüsselworten
entsprechenden bestimmten Sätze
werden zu einer Dokumentrangfolgen bestimmenden Einheit 205 übertragen.
-
In
der Dokumentrangfolgen bestimmenden Einheit 205 werden
mehrere Identifizierungstitel, die die Wiederauffindungsdokumente
angeben, in absteigender Reihenfolge der geschätzten Werte der Wiederauffindungsdokumente
angeordnet, um die Rangfolge der Wiederauffindungsdokumente zu bestimmen,
und die gemäß der Rangfolge
der Wiederauffindungsdokumente angeordneten Identifizierungstitel
werden in einer Wiederauffindungsergebnisse anzeigenden Einheit 206 als
Wiederauffindungsergebnis angezeigt. Wenn der Nutzer die auf der
Anzeigeeinheit 206 in der geordneten Reihenfolge nacheinander
angezeigten Identifizierungstitel auswählt, wird danach das durch
den ausgewählten Identifizierungstitel
angegebene Wiederauffindungsdokument aus der Dokumentverwaltungseinheit 201 jedesmal
zur Anzeigeeinheit 206 ausgelesen, wenn ein Identifizierungstitel
ausgewählt
wird, und das Wiederauffindungsdokument wird auf der Wiederauffindungsergebnisse
anzeigenden Einheit 206 jedesmal angezeigt, wenn ein Identifizierungstitel
ausgewählt
wird.
-
Da
die Schlüsselworte
gemäß einer
Wiederauffindungsanforderung eines Nutzers vom Nutzer eingegeben
werden, können
deshalb mehrere Dokumente, die die Wiederauffindungsanforderung
eines Nutzers wahrscheinlich erfüllen,
in der Reihenfolge des geschätzten
Wertes TF*IDF präsentiert
werden.
-
Bekannt
sind mehrere Berechnungsmethoden des geschätzten Wertes TF*IDF. Als ein
Beispiel eines Berechnungsverfahrens wird der Abweichungsgrad IDF
(= 1 – log
Nw/N) definiert, der durch Subtrahieren eines logarithmischen Wertes
(log Nw/N) des Verhältnisses
von 1 erhalten wird. Das Symbol Nw bezeichnet hier die Anzahl von
Dokumenten, in denen ein markiertes Wort erscheint, und das Symbol
N bezeichnet die Anzahl von in der Dokumentverwaltungseinheit 201 gespeicherten
Dokumenten. Die normierte Auftrittshäufigkeit TF (= Fo/Nwd), die
durch Teilen einer Auf trittshäufigkeit
Fo des markierten Wortes in einem markierten Dokument durch die
Anzahl Nwd von im markierten Dokument erscheinenden Worten erhalten
wird, wird auch definiert. In diesem Fall wird der geschätzte Wert TF*IDF
berechnet, indem der Abweichungsgrad und die normierte Auftrittshäufigkeit
miteinander multipliziert werden.
-
Die
Einzelheiten des geschätzten
Wertes TD*IDF und einer herkömmlichen
Dokumentwiederauffindungsvorrichtung, in der der geschätzte Wert TF*IDF
verwendet wird, sind in der Literatur "Salton, Gerard: Introduction to modern
Information Retrieval, McGraw-Hill computer science series, 1983,
offenbart.
-
2.2. DURCH DIE ERFINDUNG
ZU LÖSENDE
PROBLEME:
-
In
Fällen,
in denen ein oder mehrere bestimmte Hypertext-Dokumente, die eine
Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus
einem großen
Umfang an Hypertext-Dokumenten unter Verwendung der herkömmlichen Dokumentwiederauffindungsvorrichtung
wiederaufgefunden werden, besteht jedoch, weil die Hypertext-Dokumente
im Allgemeinen nicht voneinander unabhängig sind, sondern die Hypertext-Dokumente oft Referenzbeziehungen
untereinander haben, ein Nachteil, dass die Rangfolge der bestimmten
Hypertext-Dokumente, die die Wiederauffindungsanforderung eines
Nutzers wahrscheinlich erfüllen,
nicht geeignet bestimmt werden kann. Das heißt, weil Inhalte mehrerer bestimmter
Hypertext-Dokumente mit einer Referenzbeziehung untereinander oft
mit einer einheitlichen Bedeutung verbunden sind, können die
Inhalte der bestimmten Hypertext-Dokumente nicht verstanden werden,
indem man nur ein bestimmtes Hypertext-Dokument liest, sondern verstanden
werden, indem alle bestimmten Hypertext-Dokumente gelesen werden.
Falls ein oder mehrere bestimmte Hypertext-Dokumente, die eine Wiederauffindungsanforderung
eines Nutzers wahrscheinlich erfüllen, unter
Verwendung der herkömmlichen
Dokumentwiederauffindungsvorrichtung wiederaufgefunden werden, wird
daher ein Bedeutungsgrad jedes bestimmten Hypertext-Dokuments falsch
geschätzt,
so dass ein Nachteil besteht, dass die Rangfolge der bestimmten
Hypertext-Dokumente nicht geeignet bestimmt werden kann. Selbst
wenn die bestimmten Hypertext-Dokumente,
die gemäß ihren
geschätzten Werten
in der Rangfolge angeordnet sind, angezeigt werden, besteht, weil
die Rangfolge der bestimmten Hypertext-Dokumente nicht geeignet
bestimmt wird, auch ein weiterer Nachteil, dass der Nutzer die bestimmten
Hypertext-Dokumente nicht in einer geeigneten Reihenfolge der Bedeutungsgrade
problemlos auswählen
kann.
-
Da
eine Möglichkeit,
dass mehrere, in einer Hypertext-Mark-Up-Language (HTML) im WorldWideWeb
geschriebene Hypertext-Dokumente eine Referenzbeziehung untereinander
haben, beträchtlich hoch
ist, kann insbesondere die Rangfolge der bestimmten Hypertext-Dokumente
nicht geeignet bestimmt werden, und der Nutzer kann nicht jedes
der bestimmten Hypertext-Dokumente problemlos auswählen, selbst
wenn die gemäß ihren
geschätzten Werten
nach Rangfolge geordneten bestimmten Hypertext-Dokumente angezeigt
werden.
-
ZUSAMMENFASSUNG
DER ERFINDUNG
-
Eine
Aufgabe der vorliegenden Erfindung ist, unter gebührender
Berücksichtigung
der Nachteile einer solchen herkömmlichen
Dokumentwiederauffindungsvorrichtung eine Hypertext-Dokumentwiederauffindungsvorrichtung
zu schaffen, in der ein oder mehrere Hypertext-Dokumente, die eine
Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus
einem großen
Umfang an Hypertext-Dokumenten wiederaufge funden und gemäß ihren
Bedeutungsgraden geeignet nach Rangfolge geordnet werden, um jedes
der Hypertext-Dokumente problemlos auszuwählen, selbst wenn die Hypertext-Dokumente
in der Hypertext-Mark-Up-Language im
WorldWideWeb geschrieben sind.
-
Um
die Aufgabe der vorliegenden Erfindung zu erfüllen, werden in einer Hypertext-Dokumentwiederauffindungsvorrichtung
mehrere bestimmte Hypertext-Dokumente, die eine Wiederauffindungsanforderung
eines Nutzers wahrscheinlich erfüllen,
aus einer Gruppe von Hypertext-Dokumenten mit Referenzbeziehungen
untereinander ausgewählt,
in der ein Hypertext-Dokument mit einem Ankersatz als Stammdokument
für ein
anderes Hypertext-Dokument dient, das als Referenzdokument dient,
und ein Nutzer verweist auf ein Referenzdokument, nachdem der Nutzer
einen Ankersatz eines Stammdokuments entsprechend dem Referenzdokument
auswählt.
-
Im
Einzelnen werden in einem Hypertext-Dokumenttabellen erstellenden
bzw. vorbereitenden Mittel eine Hypertext-Dokumentinformation, in
der ein ein Hypertext-Dokument identifizierender Identifizierer
für Hypertext-Dokumente, ein Hauptteil
des Hypertext-Dokuments, ein Identifizierer für Stammdokumente, der ein Stammdokument
identifiziert, das dem als Referenzdokument dienenden Hypertext-Dokument
entspricht, und ein Ankersatz des Stammdokuments registriert sind,
für jedes
der Hypertext-Dokumente
vorbereitet, und eine Hypertext-Dokumenttabelle der Hypertext-Dokumentinformation
für alle
Hypertext-Dokumente wird vorher vorbereitet.
-
Danach
werden in einem Wiederauffindungsindizes erstellenden bzw. vorbereiteten
Mittel mehrere Worte, die in jedem der Hypertext-Dokumente und der
Stammdokumente erscheinen, gemäß der durch
das Hy pertext-Dokumenttabellen vorbereitende Mittel vorbereiteten
Hypertext-Dokumenttabelle
realisiert, werden mehrere Auftrittspositionen der Worte in jedem
der Hypertext-Dokumente und der Stammdokumente gemäß der Hypertext-Dokumenttabelle
realisiert, wird eine Wortinformation, die aus einem oder mehreren
Identifizierern für
das Auftreten von Dokumenten besteht, die ein oder mehrere Hypertext-Dokumente,
in denen ein Wort erscheint, und Auftrittspositionen des Wortes
in den Hypertext-Dokumenten und ein oder mehrere Ankersätze eines
oder mehrerer, den Hypertext-Dokumenten entsprechenden Stammdokumente
identifizieren, für jedes
der Worte vorbereitet, und ein Wiederauffindungsindex von Stücken einer
Wortinformation für die
Worte wird vorher vorbereitet.
-
Wenn
ein die Wiederauffindungsanforderung eines Nutzers angebendes Schlüsselwort
in einem Schlüsselworte
empfangenden Mittel empfangen wird, wird danach eine bestimmte,
dem Schlüsselwort
entsprechende Wortinformation im Wiederauffindungsmittel aus dem
durch das Wiederauffindungsindizes vorbereitende Mittel vorbereiteten
Wiederauffindungsindex wiederaufgefunden. Aus der bestimmten Wortinformation
werden mehrere bestimmte Identifizierer für das Auftreten von Dokumenten wiederaufgefunden,
die mehrere bestimmte Hypertext-Dokumente identifizieren, in denen
das Schlüsselwort
erscheint, und mehrere bestimmte Auftrittspositionen des Schlüsselwortes
in den bestimmten Hypertext-Dokumenten
und einen oder mehrere bestimmte Ankersätze eines oder mehrerer bestimmter Stammdokumente
entsprechend den bestimmten Hypertext-Dokumenten.
-
In
einem Dokumentrangfolgen bestimmenden Mittel werden danach die durch
die bestimmten Identifizierer für
das Auftreten von Dokumenten identifizierten bestimmten Hypertext-Dokumente
spezifiziert, werden Stücke
bestimmter Hypertext-Dokumentinformationen für die bestimmten Hypertext-Dokumente
aus der Hypertext-Dokumenttabelle abgefragt bzw. wiederaufgefunden,
die durch das Hypertext-Dokumenttabellen vorbereitende Mittel vorbereitet
wurden, werden ein bestimmtes Hypertext-Dokument und ein oder mehrere, dem bestimmten
Hypertext-Dokument entsprechende bestimmte Stammdokumente für jedes
der bestimmten Hypertext-Dokumente zu einem vereinigten Hypertext-Dokument vereinigt,
wird eine Auftrittshäufigkeit
des Schlüsselwortes
in einem vereinigten Hypertext-Dokument für jedes vereinigte Hypertext-Dokument
berechnet, werden mehrere Bedeutungsgrade der vereinigten Hypertext-Dokumente gemäß den Auftrittshäufigkeiten
in den vereinigten Hypertext-Dokumenten
bestimmt, wird ein Bedeutungsgrad eines vereinigten Hypertext-Dokuments
als ein Bedeutungsgrad eines bestimmten Hypertext-Dokuments entsprechend dem
vereinigten Hypertext-Dokument für
jedes vereinigte Hypertext-Dokument festgelegt, und die Rangfolge
der bestimmten Hypertext-Dokumente wird gemäß den Bedeutungsgraden der
vereinigten Hypertext-Dokumente bestimmt.
-
Danach
werden mehrere Indizes der bestimmten Hypertext-Dokumente durch
ein Wiederauffindungsergebnisse anzeigendes Mittel in einer nach
Rangfolge geordneten Reihenfolge entsprechend der Rangfolge der
bestimmten Hypertext-Dokumente als Wiederauffindungsergebnis angezeigt.
-
Da
ein vereinigtes Hypertext-Dokument erstellt bzw. vorbereitet wird,
indem ein bestimmtes Hypertext-Dokument und ein oder mehrere, dem
bestimmten Hypertext-Dokument entsprechende bestimmte Stammdokumente
für jedes
der bestimmten Hypertext-Dokumente vereinigt werden, und ein Bedeutungsgrad
eines vereinigten Hypertext-Dokuments als ein Bedeutungsgrad eines
bestimmten Hypertext-Dokuments entsprechend dem vereinigten Hypertext-Dokument
für jedes
der vereinigten Hypertext-Dokumente
berechnet wird, kann die Rangfolge der bestimmten Hyper text-Dokumente
bestimmt werden, indem die bestimmten Stammdokumente mit den Referenzbeziehungen
mit den bestimmten Hypertext-Dokumenten
betrachtet werden. Selbst wenn Inhalte mehrerer spezifischer Hypertext-Dokumente mit
einer Referenzbeziehung untereinander mit einer einheitlichen Bedeutung
verbunden sind, können
daher die spezifischen Hypertext-Dokumente, die die Wiederauffindungsanforderung
eines Nutzers wahrscheinlich erfüllen,
aus einem großen
Umfang an Hypertext-Dokumenten korrekt wiederaufgefunden und gemäß ihren
Bedeutungsgraden geeignet nach Rangfolge geordnet werden, so dass
der Nutzer die spezifischen Hypertext-Dokumente in einer geeigneten
Reihenfolge von Bedeutungsgraden problemlos auswählen kann, selbst wenn die
spezifischen Hypertext-Dokumente in der Hypertext-Mark-Up-Language
im WorldWideWeb geschrieben sind.
-
KURZE BESCHREIBUNG
DER ZEICHNUNGEN
-
Die
Aufgaben, Merkmale und Vorteile der vorliegenden Erfindung werden
aus der folgenden Beschreibung ersichtlich werden, die in Verbindung mit
den beiliegenden Zeichnungen geliefert wird, in denen:
-
1 ein Blockdiagramm einer
herkömmlichen
Dokumentwiederauffindungsvorrichtung ist;
-
2 eine Referenzbeziehung
unter mehreren Hypertext-Dokumenten
zeigt, die in einem WorldWideWeb eines Internet distributiv bzw.
verteilt verwaltet werden;
-
3 ein Blockdiagramm einer
Hypertext-Wiederauffindungsvorrichtung gemäß einer ersten Ausführungsform
der vorliegenden Erfindung ist;
-
4 eine Hypertext-Dokumenttabelle
von Stücken
einer Hypertext-Dokumentinformation zeigt, die in einer Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitenden Einheit vorbereitet wurde,
die in 3 gezeigt ist;
-
5 einen Abfrage- bzw. Wiederauffindungsindex
von Stücken
einer Wortinformation zeigt, die in einer in 3 gezeigten Wiederauffindungsindizes
vorbereitenden Einheit vorbereitet wurde;
-
6 ein Blockdiagramm einer
Hypertext-Wiederauffindungsvorrichtung gemäß einer zweiten Ausführungsform
der vorliegenden Erfindung ist;
-
7 ein Beispiel eines Wiederauffindungsergebnisses
zeigt, in welchem ein Index eines bestimmten Hypertext-Dokuments mit einem
Index eines bestimmten Stammdokuments einer ersten Stufe und einem
Index eines bestimmten Stammdokuments einer zweiten Stufe für jedes
bestimmte Hypertext-Dokument durch eine in 6 gezeigte Wiederauffindungsergebnisse
anzeigende Einheit angezeigt wird;
-
8 ein Blockdiagramm einer
Hypertext-Wiederauffindungsvorrichtung gemäß einer dritten Ausführungsform
der vorliegenden Erfindung;
-
9 ein Beispiel eines Wiederauffindungsergebnisses
zeigt, in welchem Indizes mehrerer bestimmter Hypertext-Dokumente mit einem
Index eines bestimmten Stammdokuments einer ersten Stufe und einem
Index eines bestimmten Stammdokuments einer zweiten Stufe durch
eine in 8 dargestellte
Wiederauffindungsergebnisse anzeigende Einheit angezeigt werden;
-
10 ein Blockdiagramm einer
Hypertext-Wiederauffindungsvorrichtung gemäß einer vierten Ausführungsform
der vorliegenden Erfindung ist;
-
11 ein Blockdiagramm einer
Hypertext-Wiederauffindungsvorrichtung gemäß einer fünften Ausführungsform der vorliegenden
Erfindung ist;
-
12 ein Beispiel eines Wiederauffindungsergebnisses
zeigt, in welchem ein Index eines bestimmten Hypertext-Dokuments mit einer
Zusammenfassung des bestimmten Hypertext-Dokuments, einem Index
eines bestimmten Stammdokuments einer ersten Stufe und einem Index
eines bestimmten Stammdokuments einer zweiten Stufe für jedes
bestimmte Hypertext-Dokument durch eine in 11 dargestellte Wiederauffindungsergebnisse
anzeigende Einheit angezeigt wird;
-
13 ein Blockdiagramm einer
Hypertext-Wiederauffindungsvorrichtung gemäß einer sechsten Ausführungsform
der vorliegenden Erfindung ist;
-
14 ein Blockdiagramm einer
Hypertext-Wiederauffindungsvorrichtung gemäß einer siebten Ausführungsform
der vorliegenden Erfindung ist;
-
15 ein Blockdiagramm einer
Hypertext-Wiederauffindungsvorrichtung gemäß einer achten Ausführungsform
der vorliegenden Erfindung ist;
-
16 ein Blockdiagramm einer
Hypertext-Wiederauffindungsvorrichtung gemäß einer neunten Ausführungsform
der vorliegenden Erfindung ist;
-
17 die Unterteilung eines
langen Hypertext-Dokuments mit einem oder mehreren Referenzetiketten
zeigt;
-
18 ein Blockdiagramm einer
Hypertext-Wiederauffindungsvorrichtung gemäß einer zehnten Ausführungsform
der vorliegenden Erfindung ist;
-
19 ein Beispiel eines Wiederauffindungsergebnisses,
in welchem Indizes von Hypertext-Dokumenten und Tasten bzw. Schaltflächen entsprechend
mehreren zusammengehörigen
Worten mit hoher Rangfolge angezeigt werden, gemäß der zehnten Ausführungsform
darstellt;
-
20 ein Blockdiagramm einer
Hypertext-Wiederauffindungsvorrichtung gemäß einer elften Ausführungsform
der vorliegenden Erfindung ist; und
-
21 ein Beispiel eines Wiederauffindungsergebnisses,
in welchem Indizes von Hypertext-Dokumenten und Schaltflächen entsprechend mehreren
zusammengehörigen
Worten mit hoher Rangfolge angezeigt sind, gemäß der elften Ausführungsform
darstellt.
-
AUSFÜHRLICHE
BESCHREIBUNG DER AUSFÜHRUNGSFORMEN
-
Bevorzugte
Ausführungsformen
eines Hypertext-Dokumentwiederauffindungssystems bzw. einer Hypertext-Dokumentwiederauffindungsvorrichtung,
in der mehrere Hypertext-Dokumente, die eine Wiederauffindungsanforderung
eines Nutzers wahrscheinlich erfüllen,
aus einem großen
Umfang an Hypertext-Dokumenten abgefragt bzw. wiederaufgefunden
werden, die in einem WorldWideWeb eines Internet distributiv verwaltet
werden, werden mit Verweis auf Zeichnungen gemäß dem Konzept der vorliegenden
Erfindung beschrieben.
-
2 zeigt eine Referenzbeziehung
unter mehreren Hypertext-Dokumenten, die in einem WorldWideWeb eines
Internet distributiv verwaltet werden.
-
Wie
in 2 gezeigt ist, weisen
mehrere, in einem WorldWideWeb eines Internet distributiv verwaltete
Hypertext-Dokumente D80 bis D86 eine Referenzbeziehung untereinander
auf. Das heisst, ein Ankersatz S800 ist im Hypertext-Dokument D80
platziert, ein Ankersatz S801 ist im Hypertext-Dokument D81 platziert,
ein Ankersatz S802 ist im Hypertext-Dokument D82 platziert, mehrere Ankersätze S803
bis S805 sind im Hypertext-Dokument D83 platziert, und ein Ankersatz
S806 ist im Hypertext-Dokument D84 platziert. In jedem der Ankersätze ist
entweder ein Identifizierer, der ein Dokument identifiziert, auf
das ein Nutzer Bezug nehmen kann, oder eine Position eines Dokuments
verborgen bzw. vergraben, worauf ein Nutzer Bezug nehmen kann.
-
Ein
Dokument, auf das ein Nutzer verweist, wird in dieser Beschreibung
Verweis- bzw. Referenzdokument genannt, und ein Dokument mit einem
Ankersatz, der ein oder mehrere Referenzdokumente angibt, wird in
dieser Beschreibung Stammdokument genannt. Jeder Ankersatz besteht
auch aus einem Satz oder mehreren Sätzen.
-
Wenn
ein Nutzer das Stammdokument D801 liest, das auf einer Anzeige eines
(Browser genannten) durchsuchte Dokumente auswählenden Mittels angezeigt wird,
und eine Stelle bzw. Position des Ankersatzes S801 des Stammdokuments
D81 durch Verwenden einer sogenannten Zeigereinrichtung hervorhebt,
wird das Referenzdokument D83 aufgerufen und angezeigt, so dass
der Nutzer die verteilten Hypertext-Dokumente D80 bis D86 effizient
nutzen kann.
-
Eine
Gruppe der Hypertext-Dokumente D80 bis D86 ist in einer Hypertext-Mark-Up-Language
geschrieben, und jedes Hypertext-Dokument wird Seite genannt, und
in jedem Hypertext-Dokument ist eine Zeichenkette, ein Bild oder
ein Programm geschrieben. Falls z. B. das Stammdokument D81 in einer "farmer.html" genannten Datei
gespeichert ist, das Referenzdokument D83 in einer "apple.html" genannten Datei
gespeichert ist und ein Indikator (oder eine Dokumentenspeicherposition),
der einen Verweis bzw. eine Referenz auf das Referenzdokument D83
anzeigt, in einer Zeichenkette "apple
producing farmer" vergraben
ist, die im Stammdokument D81 geschrieben ist, um den Ankersatz
S801 zu formulieren (engl. to frame), wird der Ankersatz S801 durch "<a href =" apple.html"> apple
producing farmer </a>" ausgedrückt. Da im Referenzdokument
D83 kein Satz geschrieben ist, besteht in diesem Fall die Möglichkeit,
dass das Dokument D82 in einem von einem anderen Computer weit entfernt
aufgestellten Computer vorbereitet wird, worin das vor der Erstellung bzw.
Vorbereitung des Dokuments D81 vorbereitete Dokument D83 gespeichert
ist, und das Dokument D82 als Stammdokument für das Referenzdokument D83
dient.
-
Erste Ausführungsform
-
3 ist ein Blockdiagramm
einer Hypertext-Wiederauffindungsvorrichtung gemäß einer ersten Ausführungsform
der vorliegenden Erfindung.
-
Wie
in 3 gezeigt ist, umfasst
eine Hypertext-Wiederauffindungsvorrichtung 1 zum Wiederauffinden
eines oder mehrerer Hypertext-Dokumente, die
eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich erfüllen, aus
einem großen
Umfang an Hypertext-Dokumenten, die in einer Hypertext-Dokumente
verwaltenden Einheit 8 gespeichert sind, in der in einer
großen
Anzahl von in einem Netzwerk eines WorldWideWeb weit verteilten
Computern erstellte bzw. vorbereitete Hypertext-Dokumente unter der Bedingung distributiv
bzw. verteilt verwaltet werden, dass die Hypertext-Dokumente Referenzbeziehungen
untereinander aufweisen,
eine Hypertext-Dokumenttabellen mit
Stammdokumentlisten vorbereitenden Einheit 7 zum Analysieren der
Hypertext-Dokumente mit den Referenzbeziehungen, die von der Hypertext-Dokumente
verwaltenden Einheit 8 verwaltet werden, Erstellen bzw. Vorbereiten
einer Hypertext-Dokumentinformation, in der ein oder mehrere Identifizierer
für Stammdokumente,
die ein oder mehrere Stammdokumente identifizieren, und Ankersätze der
Stammdokumente, mit einem Identifizierer für Hypertext-Dokumente, der
ein Hypertext-Dokument identifiziert, und eine Dokumentspeicherposition
des Hypertext-Dokuments aufgelistet sind, für jedes der Hypertext-Doku mente, und
Erstellen bzw. Vorbereiten einer Hypertext-Dokumenttabelle der Hypertext-Dokumentinformation
für alle
durch die Hypertext-Dokumente verwaltenden Einheit 8 verwalteten
Hypertext-Dokumente,
eine Wiederauffindungsindizes vorbereitende
Einheit 6 mit einem Wörterbuch
zum vorherigen Analysieren eines Hauptteils eines Hypertext-Dokuments,
eines Titels des Hypertext-Dokuments und von Zeichenketten eines
oder mehrerer Ankersätze
eines oder mehrerer, dem Hypertext-Dokument entsprechender Stammdokumente
für jedes
der Hypertext-Dokumente,
die von der Hypertext-Dokumente verwaltenden Einheit 8 verwaltet
werden, gemäß der Hypertext-Dokumenttabelle,
die durch die Hypertext-Dokumenttabellen mit Stammdokumentlisten
vorbereitende Einheit 7 vorbereitet wurde, um mehrere Worte
zu erkennen, die in den Hypertext-Dokumenten erscheinen, Vorbereiten
eines Stücks
einer Wortinformation für ein
Wort, worin ein Identifizierer für
das Auftreten von Dokumenten, der ein Hypertext-Dokument identifiziert,
in welchem das im Wörterbuch
registrierte Wort erscheint, und eine Positionsinformation, die
Auftrittspositionen des Wortes im Titel des Hypertext-Dokuments
angibt, der Hauptteil des Hypertext-Dokuments und die Ankersätze der
Stammdokumente entsprechend dem Hypertext-Dokument aufgelistet sind,
für jedes
der Hypertext-Dokumente, und Vorbereiten eines Wiederauffindungsindex
von Stücken
einer Wortinformation für
die im Wörterbuch
gespeicherten Worte,
eine Schlüsselworteingabeeinheit 2 zum
Empfangen mehrerer, von einem Nutzer 9 eingegebener Schlüsselworte,
eine
Wiederauffindungseinheit 3 zum Wiederauffinden mehrerer
Stücke
einer bestimmten Wortinformation entsprechend mehreren bestimmten
Worten, die mit den in der Schlüsselworteingabeworteinheit 2 empfangenen
Schlüsselworten übereinstimmen,
aus dem Wiederauffindungsindex, der durch die Wiederauffindungsindizes
vorbereitende Einheit 6 vorbereitet wurde, und Wiederauffinden
bestimmter Identifizierer für
das Auftre ten von Dokumenten, die bestimmte Hypertext-Dokumente,
in denen ein mit einem Schlüsselwort übereinstimmendes
bestimmtes Wort erscheint, und bestimmte Positionsinformationen,
die bestimmte Auftrittspositionen eines bestimmten Wortes in den
Hypertext-Dokumenten und mehrere bestimmten Stammdokumenten entsprechend
den bestimmten Hypertext-Dokumenten
aus der bestimmten Wortinformation für jedes der bestimmen Worte
identifizieren,
eine Dokumentrangfolgen bestimmende Einheit 4 zum
Vereinigen eines bestimmten Hypertext-Dokuments und eines oder mehrerer
bestimmter Stammdokumente entsprechend dem bestimmten Hypertext-Dokument
zu einem vereinigten bestimmten Hypertext-Dokument gemäß der Dokumentinformation der
Hypertext-Dokumenttabelle, die durch die Hypertext-Dokumenttabellen
mit Stammdokumentenlisten vorbereitende Einheit 7 vorbereitet
wurde, für
jedes der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten
wurden, Berechnen einer Auftrittshäufigkeit TF eines bestimmten
Wortes in einem vereinigten bestimmten Hypertext-Dokument für jedes
bestimmte Wort und jedes vereinigte bestimmte Hypertext-Dokument,
Berechnen einer inversen Dokumenthäufigkeit IDF, die als inverser
Wert der Anzahl bestimmter Hypertext-Dokumente definiert ist, in
denen ein bestimmtes Wort erscheint, für jedes bestimmte Wort, Berechnen
eines Produkts TF* IDF einer Auftrittshäufigkeit TF und einer inversen
Dokumenthäufigkeit
IDF, Summieren mehrerer Produkte für alle bestimmten Worte, um
ein summiertes Produkt als einen geschätzten Wert für jedes
vereinigte bestimmte Hypertext-Dokument
zu erzeugen, Bestimmen mehrerer Bedeutungsgrade der vereinigten
bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen der Rangfolge
der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden für die vereinigten
bestimmten Hypertext-Dokumente und Vorbereiten eines Index eines
bestimmten Hypertext-Dokuments für
jedes der bestimmten Hypertext-Dokumente, und
eine Wiederauffindungsergebnisse
anzeigende Einheit 5 zum Anzeigen der Indizes der bestimmten
Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge,
die in der Dokumentrangfolgen bestimmenden Einheit 4 bestimmt
wurde, als ein Wiederauffindungsergebnis.
-
In
der obigen Konfiguration wird eine Operation der Hypertext-Wiederauffindungsvorrichtung 1 beschrieben.
Mehrere Hypertext-Dokumente mit Referenzbeziehungen untereinander
werden in einer großen
Anzahl von Computern erstellt bzw. vorbereitet, die in einem Netz
eines WorldWide-Web
weit verteilt sind. In der Hypertext-Dokumente verwaltenden Einheit 8 werden
die Hypertext-Dokumente distributiv bzw. verteilt verwaltet. Die
Referenzdokumenttabellen mit Stammdokumenten vorbereitende Einheit 7 hat
eine zusammengehörige
Dokumente sammelnde bzw. erfassende Funktion (im allgemeinen Web-Roboter
genannt). Wenn mehrere Adressen von Dokumentspeicherpositionen (im
allgemeinen mehrere universelle Ressourcen-Lokalisierer genannt)
mehrerer Hypertext-Dokumente an die Referenzdokumenttabellen mit
Stammdokumenten vorbereitende Einheit 7 geliefert werden,
werden daher die mehreren Hypertext-Dokumente durch den universellen Ressourcen-Lokalisierer
nacheinander als mehrere Stammdokumente angegeben, werden ein oder mehrere
Ankersätze,
die in jedem der Stammdokumente geschrieben sind, analysiert, und
ein oder mehrere Referenzdokumente werden für jedes der Stammdokumente
erfaßt.
Danach werden mehrere Identifizierer für Hypertext-Dokumente, die
nicht miteinander zusammenfallen, in den erfaßten Referenzdokumenten in
der Reihenfolge der Erfassung zugeordnet, um die erfaßten Referenzdokumente
zu identifizieren. Wenn in keines der erfaßten Referenzdokumente ein
Bild oder Programm geschrieben ist und in jedes der erfaßten Referenzdokumente
eine Zeichenkette geschrieben ist, kann in diesem Fall Zeit zur
Erfassung gespart werden. Mehrere Adressen von Dokumentspeicherpositionen
der erfaßten
Referenzdokumente werden auch aufgelistet, um zu verhindern, dass
ein aufgelistetes erfaßtes
Referenzdokument erneut erfaßt
wird. Wie in 2 gezeigt
ist, wird daher, obgleich nicht nur das Stammdokument D83 gemäß dem Ankersatz
S803 zum Referenzdokument D84 gehört, sondern auch das Stammdokument
D84 gemäß dem anderen
Ankersatz S806 zum Referenzdokument D83 gehört, verhindert, dass die Hypertext-Dokumente
D83 und D84 zweimal erfaßt werden.
-
Danach
wird eine Hypertext-Dokumenttabelle von Stücken einer Hypertext-Dokumentinformation (siehe 4), worin Identifzierer
für Stammdokumente
eines oder mehrerer Stammdokumente und Ankersätze der Stammdokumente für jedes
Hypertext-Dokument aufgelistet sind, in der Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitenden Einheit 7 gemäß der folgenden
Prozedur vorbereitet. Mehrere Plätze
DS1 bis DS3 für
Dokumenteninformationseinträge,
deren Anzahl gleich der Anzahl erfaßter Referenzdokumente ist,
werden vorbereitet. In jedem der Plätze für Dokumentinformationseinträge werden
die Nummer eines Identifizierers für Hypertext-Dokumente, der
ein erfaßtes
Referenzdokument identifiziert, und eine Adresse für eine Dokumentspeicherinformation
des erfaßten
Referenzdokuments im Platz für
einen Dokumentinformationseintrag geschrieben. Danach wird aus dem
erfaßten
Referenzdokument ein Titel des erfaßten Referenzdokumentes extrahiert,
indem mehrere, im erfaßten
Referenzdokument geschriebene Zeichenketten untersucht werden. In
dieser Ausführungsform wird
z. B. ein Titel "apple
that I grew" aus
der Zeichenkette "<title> apple that I grew <title>" extrahiert, und der Titel wird in den
Platz für
Dokumentinformationseinträge
geschrieben. Danach werden ein oder mehrere Zeichenketten von Marken
in der Hypertext-Mark-Up-Language, die jeweils eine zwischen "<"und">" platzierte
Zeichenkette bezeichnen, aus mehreren Zeichenketten entfernt, die
in einem Hauptteil des erfaßten
Referenzdokuments vorhanden sind, um einen Textkörper bzw. Texthauptteil zu bilden,
und der Textkörper
wird in den Platz für
Dokumentinformationseinträge
geschrieben. Danach wird geprüft,
ob ein oder mehrere Ankersätze,
die zu einem Referenzdokument gehören, in einem oder mehreren,
zum Referenzdokument gehörenden Stammdokumenten
vorhanden sind oder nicht. Falls ein Ankersatz in einem Stammdokument
vorhanden ist, das zu einem Referenzdokument gehört, wird ein Satz eines Identifizierers
für Stammdokumente,
der das Stammdokument und den Ankersatz des Stammdokuments identifiziert,
in den Platz für
Dokumentinformationseinträge
geschrieben, um eine Stammdokumentliste für jede Information eines Hypertext-Dokuments
zu bilden. Mehrere, im Textkörper verwendete
Worte, der Titel und die Ankersätze
werden auch in den Platz für
Dokumentinformationseinträge
geschrieben, um eine Wortliste für
jede Hypertext-Dokumentinformation zu bilden.
-
Danach
wird in der Referenzdokumenttabellen mit Stammdokumenten vorbereitenden
Einheit 7, wie in 3 gezeigt
ist, ein Platz für
Dokumentinformationseinträge
für jedes
der Hypertext-Dokumente vorbereitet, die durch die Hypertext-Dokumente
verwaltende Einheit 8 verwaltet werden, und ein Identifizierer
für Hypertext-Dokumente,
eine Dokumentspeicherposition, ein Titel, ein Textkörper, eine
Stammdokumentliste und eine Wortliste werden in jeden der Plätze für Dokumentinformationseinträge geschrieben,
um eine Hypertext-Dokumenttabelle vorzubereiten bzw. zu erstellen.
-
In
dieser Ausführungsform
wird die Hypertext-Dokumenttabelle erstellt bzw. vorbereitet, nachdem
ein oder mehrere Ankersätze,
die in jedem der Stammdokumente geschrieben sind, analysiert sind, um
die Referenzdokumente zu erfassen. Danach werden die Ankersätze zweimal
analysiert oder geprüft,
um die erfaßten
Referenzdokumente zu bestimmen und die Hypertext-Dokumenttabelle
zu erstellen. Falls die Hypertext-Dokument tabelle erstellt wird,
während
die Ankersätze
analysiert werden, um die Referenzdokumente zu sammeln bzw. zu erfassen,
kann jedoch die Hypertext-Dokumenttabelle effizient vorbereitet
werden.
-
Danach
werden in der Wiederauffindungsindizes vorbereitendem Einheit 6 mit
einem Wörterbuch
ein Hauptteil eines Hypertext-Dokuments, ein Titel des Hypertext-Dokuments
und Zeichenketten eines oder mehrerer Ankersätze des Hypertext-Dokuments
für jedes
der Hypertext-Dokumente der Hypertext-Dokumenttabelle im voraus
analysiert, wird ein Stück
einer Wortinformation, die aus einem Wort, einem oder mehreren Identifizierern
für das
Auftreten von Dokumenten, die Hypertext-Dokumente identifizieren,
in denen das Wort erscheint, und einer Positionsinformation besteht,
die Auftrittspositionen des Wortes in den Hypertext-Dokumenten angibt,
für jedes
von mehreren, im Wörterbuch
gespeicherten Worten vorbereitet, und ein Wiederauffindungsindex von
Stücken
einer Wortinformation für
die mehreren Worte wird wie in 5 gezeigt
vorbereitet.
-
Im
einzelnen sind einige zehntausend Worte im Wörterbuch der Wiederauffindungsindizes
vorbereitenden Einheit 6 registriert, und mehrere Plätze WS1
bis WS3 für
Wortinformationseinträge,
deren Zahl gleich der Anzahl von im Wörterbuch registrierten Worten
ist, sind vorbereitet, und jedes der Worte wird in einen der Plätze WS1
bis WS3 für
Wortinformationseinträge
geschrieben. Danach wird ein Wort, das in der Wortliste eines Platzes
für Dokumentinformationseinträge der Hypertext-Dokumenttabelle
registriert ist, als ein bestimmtes Wort festgestellt, wird ein
Identifizierer für
Hypertext-Dokumente eines bestimmten Hypertext-Dokuments entsprechend
dem Platz für
Dokumentinformationseinträge
als ein Identifzierer für
das Auftreten von Hypertext-Dokumenten festgestellt, werden ein
oder mehrere Positionen des bestimmten Wortes im bestimmten Hypertext-Dokument
als Positionsinformation festgestellt, und ein Satz des Identifizierers
für das
Auftreten von Hypertext-Dokumenten und der Positionsinformation
wird als Wortinformation in einem bestimmten Platz für Wortinformationseinträge entsprechend
dem bestimmten Wort geschrieben. Diese Verarbeitung wird für jedes
der Worte durchgeführt,
die in den Wortlisten aller Plätze
für Dokumentinformationseinträge der Hypertext-Dokumenttabelle
registriert sind, so dass ein Wiederauffindungsindex der Stücke einer Wortinformation
entsprechend mehreren Worten vorbereitet wird, die in den Hypertext-Dokumenten
verwendet werden.
-
5 zeigt ein Stück einer
Wortinformation des Wiederauffindungsindex, das in dem Platz WS1 für Wortinformationseinträge geschrieben
ist und einem Wort "apple" entspricht. "(Title, 1)" gibt an, dass das
Wort "apple" in der ersten Wortposition
des Titels des Hypertext-Dokuments D83 erscheint, "(Body, 4, 33, 43)" gibt an, dass das
Wort "apple" an der vierten, dreiunddreißigsten
und dreiundvierzigsten Wortposition des Hauptteils (engl. body)
des Hypertext-Dokuments D83 erscheint, "(000081,1)" gibt an, dass das Wort "apple" an der ersten Wortposition
des Ankersatzes S801 des Hypertext-Dokuments D81 erscheint, das
als das Stammdokument dient, und "(000082,4)" gibt an, dass das Wort "apple" an der vierten Wortposition
des Ankersatzes S802 des als Stammdokument dienenden Hypertext-Dokuments D82
erscheint.
-
Es
ist auch zweckmäßig, dass
ein inverser Wert der Anzahl von Auftrittsdokumenten, in denen ein
Wort erscheint (im allgemeinen als inverse Dokumenthäufigkeit
IDF bezeichnet), und die Auftrittshäufigkeit des Wortes in jedem
der Auftrittsdokumente (im allgemeinen eine Texthäufigkeit
TF genannt) vorher in der Wiederaufführungsindizes vorbereitenden Einheit 6 berechnet
und in einem entsprechenden Platz für Wortinforma tionseinträge für jedes
der Worte geschrieben werden. Daher kann eine für die Wiederauffindung erforderliche
Verarbeitungszeit verkürzt
werden.
-
In
der Wiederauffindungsindizes vorbereitenden Einheit 6 wird
jedes der Worte, die in den Texthauptteil bzw. Textkörper des
Hypertext-Dokuments, in dem Titel des Hypertext-Dokuments und in den
Ankersätzen
der Stammdokumente erscheinen, die zum Hypertext-Dokument gehören, analysiert, und
für jedes
Wort wird eine Liste für
das Auftreten von Dokumenten erstellt bzw. vorbereitet, die aus
einem oder mehreren Identifizierern für das Auftreten von Dokumenten
und der Positionsinformation besteht. Demgemäß kann ein Wiederauffindungsindex vorbereitet
werden, in welchem für
jedes Wort Positionen für
das Erscheinen von Worten in jedem der Hypertext-Dokumente angegeben
werden.
-
Eine
Schlüsselworteingabeeinheit 2 hat
eine Funktion eines Textkastens und einer ein Wiederauffinden startenden
Schaltfläche
zum Zurückholen
von Inhalten des Textkastens, und ein HTML-Dokument, das gemäß der Hypertext-Mark-Up-Language
mit einem Titel wie z. B. "Wiederauffindungsseite" wird für die Schlüsselworteingabeeinheit 2 verwendet.
Das heißt,
der Nutzer 9 ruft das HTML-Dokument im Browser des WorldWideWeb
wie z. B. Mosaic oder Netscape auf, der auf seinem eigenen Client-Computer betrieben
wird, ein einzelnes Schlüsselwort
wird in den Textkasten eingegeben oder mehrere, durch Zwischenräume getrennte
Schlüsselworte
werden in den Textkasten eingegeben, und die ein Wiederauffinden
startende Taste bzw. Schaltfläche
wird gedrückt.
Daher werden ein einzelnes Schlüsselwort oder
Schlüsselworte
eingegeben.
-
Folglich
werden mehrere Schlüsselworte,
die vom Nutzer 9 eingegeben wurden, in der Schlüsselworteingabeeinheit 2 empfangen
und zur Wiederauffindungseinheit 3 übertragen. In dieser Ausführungsform
gibt der Nutzer jedes der Schlüsselworte
durch Drücken
mehrerer, auf einer Tastatur angeordneter Tasten ein. Falls jedoch
jeder von mehreren Kandidaten für
ein Schlüsselwort
durch Drücken
einer Schaltfläche
ausgewählt
wird, kann ein Vorgang zur Eingabe von Schlüsselworten unter Ausnutzung
der Zeigereinrichtung einfach durchgeführt werden, ohne eine Tastatur
zu verwenden, selbst wenn eine ungeübte Person die Schlüsselworteingabeeinheit 2 bedient.
-
In
der Wiederauffindungseinheit 3 werden Stücke bestimmter
Wortinformationen entsprechend mehreren bestimmten Worten, die mit
den über
die Schlüsselworteingabeeinheit 2 eingegebenen Schlüsselworten übereinstimmen,
aus dem in der Wiederauffindungsindizes vorbereitenden Einheit 6 gespeicherten
Wiederauffindungsindex extrahiert, und ein oder mehrere Identifizierer
für das
Auftreten von Dokumenten, die ein oder mehrere bestimmte Hypertext-Dokumente
identifizieren, in denen ein mit ein Schlüsselwort übereinstimmendes bestimmtes Wort
erscheint, und Positionsinformationen, die Positionen des bestimmten
Wortes in den bestimmten Hypertext-Dokumenten angeben, werden aus
einem Stück
einer Wortinformation für
jedes der bestimmten Worte erhalten. Mehrere Sätze bzw. Gruppen der Identifizierer
für das
Auftreten von Dokumenten und der Positionsinformationen werden zu
der Dokumentrangfolgen bestimmenden Einheit 4 übertragen.
-
In
der Dokumentrangfolgen bestimmenden Einheit 4 werden Stücke einer
Hypertext-Dokumentinformation, die den bestimmten Hypertext-Dokumenten
entspricht, die durch die Identifizierer für das Auftreten von Dokumenten
identifiziert wurden, aus der Hypertext-Dokumenttabelle extrahiert
und ein bestimmtes Hypertext-Dokument und ein oder mehrere Stammdokumente,
die von einem oder mehreren Identifizierern für Stammdokumente identifiziert
wurden, die in einem Stück
einer Hyper text-Dokumentinformation entsprechend dem bestimmten
Hypertext-Dokument
aufgelistet sind, werden zu einem vereinigten bestimmten Hypertext-Dokument
vereinigt. Das vereinigte bestimmte Hypertext-Dokument wird für jedes der bestimmten Hypertext-Dokumente
gebildet, die durch die von der Wiederauffindungseinheit 3 übertragenen
Identifizierer für
das Auftreten von Dokumenten identifiziert werden. Eine inverse Dokumenthäufigkeit
IDF, die als ein inverser Wert der Anzahl vereinigter bestimmter
Hypertext-Dokumente definiert ist, in denen ein bestimmtes Wort,
das mit einem Schlüsselwort übereinstimmt,
erscheint, und die Auftrittshäufigkeit
TF eines bestimmten Wortes in jedem der vereinigten bestimmten Hypertext-Dokumente
werden für
jedes der bestimmten Worte gemäß den mehreren
Sätzen
bzw. Gruppen der Identifizierer für das Auftreten von Dokumenten
und der Positionsinformationen berechnet. Die inverse Dokumenthäufigkeit
IDF bezeichnet einen Korrekturfaktor für jedes bestimmte Wort.
-
Falls
nur ein Schlüsselwort
eingegeben wird, wird danach ein geschätzter Wert, der erhalten wird, indem
die inverse Dokumenthäufigkeit
IDF für
ein bestimmtes Wort und die Auftrittshäufigkeit TF miteinander multipliziert
werden, als Bedeutungsgrad für jedes
der vereinigten bestimmten Hypertext-Dokumente berechnet. Falls
die Zahl von vom Nutzer eingegebenen Schlüsselworten zwei oder mehr beträgt, wird
ebenfalls ein Produkt TF*IDF einer Auftrittshäufigkeit TF und einer inversen
Dokumenthäufigkeit
IDF für
jedes Schlüsselwort
und jedes vereinigte bestimmte Hypertext-Dokument berechnet, wird
eine Summe der für
alle Schlüsselworte
berechneten Produkte als geschätzter
Wert für
jedes der vereinigten bestimmten Hypertext-Dokumente übernommen, und
ein Bedeutungsgrad für
jedes der vereinigten bestimmten Hypertext-Dokumente wird gemäß den geschätzten Werten
bestimmt. Der Bedeutungsgrad für jedes
vereinigte bestimmte Hypertext-Dokument wird als ein Bedeutungsgrad
für ein bestimmtes
Hypertext-Dokument entsprechend dem vereinigten bestimmten Hypertext-Dokumentfestgelegt.
Danach wird die Rangfolge der bestimmten Hypertext-Dokumente einschließlich der
Stammdokumente gemäß den Bedeutungsgraden
der bestimmten Hypertext-Dokumente bestimmt.
-
Falls
die Anzahl von Schlüsselworten
zwei oder mehr beträgt,
ist es zweckmäßig, einen
geschätzten
Wert für
ein bestimmtes Hypertext-Dokument
auf einen Wert festzulegen, der N-mal (N ist Zwei oder mehr) so
hoch wie eine Summe der Produkte TF*IDF ist, die für alle Schlüsselworte
berechnet wurden, wenn N bestimmte Worte, die mit N Schlüsselworten übereinstimmen,
in dem bestimmten Hypertext-Dokument erscheinen. Da die Korrelation
unter den N Schlüsselworten
sich im Bedeutungsgrad für
jedes bestimmte Hypertext-Dokument widerspiegelt, kann außerdem die
Wiederauffindungsanforderung eines Nutzers erfüllt werden.
-
Falls
zwei, mit zwei Schlüsselworten übereinstimmende
bestimmte Worte in einem bestimmten Hypertext-Dokument verwendet
werden, die innerhalb von 20 Zeichen nahe beieinander liegen, ist
es zweckmäßig, dass
ein geschätzter
Wert für
das vereinigte bestimmte Hypertext-Dokument verdoppelt wird. Da
die Korrelation zwischen den nahe beieinander liegenden Schlüsselworten
sich im Bedeutungsgrad für
jedes bestimmte Hypertext-Dokument
widerspiegelt, kann in diesem Fall die Wiederauffindungsanforderung
eines Nutzers außerdem
erfüllt
werden.
-
In
der Dokumentrangfolgen bestimmenden Einheit 4 wird danach
ein HTML-Dokument, in welchem mehrere Indizes der bestimmten Hypertext-Dokumente in der
nach Rangfolge geordneten Reihenfolge aufgelistet sind, erstellt
bzw. vorbereitet und zu der Wiederauffindungsergebnisse anzeigenden
Einheit 5 übertragen.
In diesem Fall ist der Index eines bestimm ten Hypertext-Dokuments
ein Titel des bestimmten Hypertext-Dokuments oder eine Zeichenkette
eines Ankersatzes, der in einem der Stammdokumente geschrieben ist,
und eine Adresse einer Dokumentspeicherposition, die eine Position
des bestimmten Hypertext-Dokuments in der Hypertext-Dokumente verwaltenden
Einheit 8 angibt, ist im Index des bestimmten Hypertext-Dokuments
vergraben, und der Index dient als Ankersatz. Das heißt, wenn der
Nutzer einen Index eines bestimmten Hypertext-Dokuments auswählt, wird
das bestimmte Hypertext-Dokument aus der Hypertext-Dokumente verwaltenden
Einheit 8 gemäß der Adresse
einer Dokumentspeicherposition aufgerufen.
-
In
der Dokumentrangfolgen bestimmenden Einheit 4 werden danach
ein oder mehrere Stammdokumente mit einer Referenzbeziehung mit
einem bestimmten Hypertext-Dokument aus der Hypertext-Dokumenttabelle,
die in der Referenzdokumenttabellen mit Stammdokumenten vorbereitenden
Einheit 7 vorbereitet wurde, für jedes bestimmte Hypertext-Dokument
extrahiert, werden ein bestimmtes Hypertext-Dokument und ein oder
mehrere Stammdokumente mit einer Referenzbeziehung mit dem bestimmten
Hypertext-Dokument zu einem vereinigten bestimmten Hypertext-Dokument
für jedes
bestimmte Hypertext-Dokument vereinigt, wird ein Bedeutungsgrad
des bestimmten Hypertext-Dokuments einschließlich der Stammdokumente gemäß einem geschätzten Wert
TF*IDFN für
jedes bestimmte Hypertext-Dokument bestimmt, werden bestimmte Hypertext-Dokumente gemäß jenen
Bedeutungsgraden nach Rangfolge geordnet, und die bestimmten Hypertext-Dokumente
werden in der nach Rangfolge geordneten Reihenfolge aufgelistet.
-
In
dieser Ausführungsform
wird die Auftrittshäufigkeit
TF des Wortes nicht normiert, weil die Auftrittshäufigkeit
T nicht durch eine Größe eines
vereinigten bestimmten Hypertext-Dokuments geteilt wird. Falls die
Auf trittshäufigkeit
TF des Wortes normiert wird, indem die Auftrittshäufigkeit
TF durch eine Größe eines
vereinigten bestimmten Hypertext-Dokuments geteilt wird, ist es
jedoch erforderlich, dass eine Größe jedes Hypertext-Dokuments in die
Hypertext-Dokumenttabelle geschrieben wird.
-
Die
Wiederauffindungsergebnisse anzeigende Einheit 5 wird durch
den Browser des WorldWideWeb wie z. B. Mosaic oder Netscape verkörpert, der in
seinem eigenen Client-Computer betrieben wird. Das in der Dokumentrangfolgen
bestimmenden Einheit 4 erstellte bzw. vorbereitete HTML-Dokument wird auf
einer Anzeige des Client-Computers angezeigt. Wenn der Nutzer einen
Index eines bestimmten Hypertext-Dokuments, das im HTML-Dokument tabelliert
ist, durch Verwenden einer Zeigervorrichtung auswählt, wird
eine Position des vom Nutzer ausgewählten bestimmten Hypertext-Dokuments
gemäß der im
Index des bestimmten Hypertext-Dokuments
vergrabenen Adresse einer Dokumentspeicherposition ermittelt, und
das bestimmte Hypertext-Dokument wird von der Hypertext-Dokumente verwaltenden
Einheit 8 aufgerufen.
-
In
der Wiederauffindungsergebnisse anzeigenden Einheit 5 werden
daher die Indizes der im HTML-Dokument aufgelisteten bestimmten
Hypertext-Dokumente
angezeigt, wählt
der Nutzer einen Index eines bestimmten Hypertext-Dokuments aus, und
das vom Nutzer ausgewählte
bestimmte Hypertext-Dokument wird von der Hypertext-Dokumente verwaltenden
Einheit 8 aufgerufen.
-
Da
ein oder mehr Stammdokumente mit einer Referenzbeziehung mit jedem
Referenzdokument in der Hypertext-Dokumenttabelle aufgelistet sind,
die durch die Referenzdokumenttabellen mit Stammdokumenten vorbereitende
Einheit 7 vorbereitet wurden, können demgemäß die einem Referenzdokument
entsprechenden Stammdokumente spezifiziert werden, indem die dem
Referenzdokument entsprechende Dokumentinformation aus der Hypertext-Dokumenttabelle
extrahiert wird. Da es nicht erforderlich ist, die Hypertext-Dokumente
verwaltende Einheit 8 nach einem oder mehreren Stammdokumenten
entsprechend dem Referenzdokument zu fragen, können daher ein oder mehrere,
jedem Referenzdokument entsprechende Stammdokumente schnell ermittelt
werden.
-
Da
ein bestimmtes Hypertext-Dokument und ein oder mehrere Stammdokumente
mit einer Referenzbeziehung mit dem bestimmten Hypertext-Dokument als ein
vereinigtes bestimmtes Hypertext-Dokument in der Dokumentrangfolgen
bestimmenden Einheit 4 vereinigt werden, kann auch für jedes
der vereinigten bestimmten Hypertext-Dokumente ein Bedeutungsgrad
bestimmt werden. Daher kann die Rangfolge der bestimmten Hypertext-Dokumente,
in denen ein mit einem Schlüsselwort übereinstimmendes
bestimmtes Wort erscheint, gemäß den Bedeutungsgraden
bestimmt werden, während
die jedem bestimmten Hypertext-Dokument
entsprechenden Stammdokumente betrachtet werden. Demgemäß können die
Indizes der bestimmten Hypertext-Dokumente durch die Wiederauffindungsergebnisse
anzeigende Einheit 5 gemäß der Rangfolge der bestimmten
Hypertext-Dokumente unter der Bedingung angezeigt werden, dass die
durch das Schlüsselwort ausgedrückte Wiederauffindungsanforderung
eines Nutzers zuverlässig
erfüllt
wird, und der Nutzer kann die bestimmten Hypertext-Dokumente in
der nach Rangfolge geordneten Reihenfolge auswählen.
-
Da
ein Hypertext-Dokument und ein oder mehrere Ankersätze eines
oder mehrerer Stammdokumente mit einer Referenzbeziehung mit dem
Hypertext-Dokument in jedem Stück
einer Dokumentinformation der Hypertext-Dokumenttabelle aufgelistet sind, die
durch die Referenzdokumenttabellen mit Stammdokumenten vorbereitende
Einheit 7 vorbereitet wurde, kann auch jedes Stück einer
Wortinformation des Wiederauffindungsindex, der angibt, dass ein
Wort in einem Hypertext-Dokument und einem oder mehreren Ankersätzen eines
oder mehrerer Stammdokumente mit einer Referenzbeziehung mit dem
Hypertext-Dokument erscheint, in der Wiederauffindungsindizes vorbereitenden
Einheit 6 einfach vorbereitet bzw. erstellt werden. Da
ein oder mehrere Stammdokumente mit einer Referenzbeziehung mit jedem
Referenzdokument in der Hypertext-Dokumenttabelle aufgelistet sind,
die durch die Referenzdokumenttabellen mit Stammdokumenten vorbereitende
Einheit 7 vorbereitet wurde, ist es, wenn der Wiederauffindungsindex
in der Wiederauffindungsindizes vorbereitenden Einheit 6 vorbereitet
wird, außerdem
nicht erforderlich, die Hypertext-Dokumente verwaltende Einheit 8 nach
einem oder mehreren dem Referenzdokument entsprechenden Stammdokumenten
zu fragen. Daher kann der Wiederauffindungsindex schnell vorbereitet
werden.
-
Zweite Ausführungsform
-
6 ist ein Blockdiagramm
einer Hypertext-Wiederauffindungsvorrichtung gemäß einer zweiten Ausführungsform
der vorliegenden Erfindung.
-
Wie
in 6 gezeigt ist, umfasst
eine Hypertext-Wiederauffindungsvorrichtung 11 zum Wiederauffinden
eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung
eines Nutzers wahrscheinlich erfüllen,
aus einem großen Umfang
an in der Hypertext-Dokumente verwaltenden Einheit 8 gespeicherten
Hypertext-Dokumenten, die Hypertext-Dokumenttabellen mit Stammdokumentlisten
vorbereitende Einheit 7, die Wiederauffindungsindizes vorbereitende
Einheit 6, die Schlüsselworteingabeeinheit 2,
die Wiederauffindungseinheit 3, eine Dokumentrangfolgen
bestimmende Einheit 12 zum Vereinigen eines bestimmten
Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdoku mente
entsprechend dem bestimmten Hypertext-Dokument zu einem vereinigten
bestimmten Hypertext-Dokument gemäß der Dokumentinformation der
Hypertext-Dokumenttabelle, die durch die Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitende Einheit 7 vorbereitet
wurde, für
jedes der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten
wurden, Berechnen geschätzter
Werte für
die vereinigten bestimmten Hypertext-Dokumente gemäß der bestimmten
Wortinformation des Wiederauffindungsindex, der in der Wiederauffindungsindizes
vorbereitenden Einheit 6 erhalten wurde, Bestimmen mehrerer
Bedeutungsgrade der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen
der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden
für die
vereinigten bestimmten Hypertext-Dokumente und Vorbereiten bzw.
Erstellen eines Index eines bestimmten Hypertext-Dokuments mit einem
Index eines bestimmten Stammdokuments entsprechend dem bestimmten
Hypertext-Dokument für
jedes der bestimmten Hypertext-Dokumente, und
eine Wiederauffindungsergebnisse
anzeigende Einheit 13 zum Anzeigen des Index des bestimmten
Hypertext-Dokuments mit dem Index des bestimmten Stammdokuments
für jedes
der vereinigten bestimmten Hypertext-Dokumente in der nach Rangfolge
geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden
Einheit 12 bestimmt wurde, als ein Wiederauffindungsergebnis.
-
In
der obigen Konfiguration werden, nachdem die Rangfolge der bestimmten
Hypertext-Dokumente gemäß den Bedeutungsgraden
in der Dokumentrangfolgen bestimmenden Einheit 12 in der
gleichen Weise wie in der ersten Ausführungsform bestimmt ist, nicht
nur ein Index eines bestimmten Hypertext-Dokuments, sondern auch
ein Index eines dem bestimmten Hypertext-Dokument entsprechenden
bestimmten Stammdokuments für jedes
der bestimmten Hypertext-Dokumente vorbereitet. Falls mehrere Stammdokumente,
die dem bestimmten Hypertext-Dokument entsprechen, existieren, wird
ein Stammdokument, dessen Dokumentspeicherposition derjenigen des
bestimmten Hypertext-Dokuments unter denjenigen der Stammdokumente
am nächsten ist,
als das bestimmte Stammdokument ausgewählt. Diese Auswahl wird durchgeführt, indem
ein Abschnitt einer Zeichenkette, der die Dokumentspeicherposition
jedes Stammdokuments angibt, mit einem Abschnitt einer Zeichenkette
verglichen wird, der die Dokumentspeicherposition des bestimmten Hypertext-Dokuments
angibt. Auch in dieser Ausführungsform
wird das bestimmte Stammdokument (oder ein bestimmtes Stammdokument
einer ersten Stufe) als ein Referenzdokument einer zweiten Stufe betrachtet,
wird ein bestimmtes Stammdokument einer zweiten Stufe mit einer
Referenzbeziehung mit dem Referenzdokument einer zweiten Stufe spezifiziert,
und ein Index des bestimmten Stammdokuments einer zweiten Stufe
wird vorbereitet. Danach wird der Index eines bestimmten Hypertext-Dokuments
mit dem Index des bestimmten Stammdokuments einer ersten Stufe und
dem Index des bestimmten Stammdokuments einer zweiten Stufe für jedes
bestimmte Hypertext-Dokument durch die Wiederauffindungsergebnisse
anzeigende Einheit 13 angezeigt.
-
7 zeigt ein Beispiel des
Index eines bestimmten Hypertext-Dokuments, der mit dem Index des
bestimmten Stammdokuments einer ersten Stufe und dem Index des bestimmten
Stammdokuments einer zweiten Stufe für jedes bestimmte Hypertext-Dokument
durch die Wiederauffindungsergebnisse anzeigende Einheit 13 angezeigt
wird.
-
Wie
in 7 gezeigt ist, wird,
falls dem Hypertext-Dokument D83 der vierte Rang verliehen ist, dem
Hypertext-Dokument D85 der achtzehnte Rang verliehen ist und dem
Hypertext-Dokument D86 der neunzehnte Rang verliehen ist, der Index
des bestimmten Hypertext-Dokuments D83 mit dem Index des bestimmten
Stammdokuments D81 der ersten Stufe und dem Index des bestimmten
Stammdokuments D80 einer zweiten Stufe als eine Gruppe der vierten
Rangfolge angezeigt, wird der Index des bestimmten Hypertext-Dokuments
D85 mit dem Index des bestimmten Stammdokuments D83 einer ersten Stufe
und dem Index des bestimmten Stammdokuments D81 einer zweiten Stufe
als eine Gruppe der achtzehnten Rangfolge angezeigt, und der Index
des bestimmten Hypertext-Dokuments D86 wird mit dem Index des bestimmten
Stammdokuments D83 einer ersten Stufe und dem Index des bestimmten
Stammdokuments D81 einer zweiten Stufe als eine Gruppe der neunzehnten
Rangfolge angezeigt.
-
Selbst
wenn das Hypertext-Dokument D86 ohne Ankersatz als ein bestimmtes
Hypertext-Dokument ausgewählt
wird, kann demgemäß das Hypertext-Dokument
D83 oder D81 mit einer engen Beziehung mit dem Hypertext-Dokument
D86 einfach ausgewählt
und von der Hypertext-Dokumente
verwaltenden Einheit 8 aufgerufen werden, ohne auf irgendeinen
Ankersatz angewiesen zu sein. Das heißt, da mehrere Hypertext-Dokumente mit einer
Referenzbeziehung untereinander eng miteinander zusammenhängen, ist
die Anzeige der Indizes des bestimmten Stammdokuments einer ersten
Stufe und einer zweiten Stufe für
den Nutzer sehr nützlich.
-
Dritte Ausführungsform
-
In
der ersten oder zweiten Ausführungsform besteht,
falls das Hypertext-Dokument
D83 des vierten Rangs aufgerufen und gelesen wird, das Hypertext-Dokument
D85 aufgerufen und gelesen wird, indem die Position des Ankersatzes
S804 ausgewählt wird,
und mehrere Hypertext-Dokumente niedrigerer Ränge nach dem vierten Rang nacheinander
aufgerufen und gelesen werden, eine Wahrscheinlichkeit, dass das
Hypertext-Dokument D85 des achtzehnten Rangs fälschlicherweise aufgerufen
und wieder gelesen wird, weil der Nutzer die Lesung des Hypertext-Dokuments
D85 vergisst, obgleich das Hypertext-Dokument D85 schon gelesen
wurde. Selbst wenn das Hypertext-Dokument D86 des neunzehnten Rangs
aufgerufen und gelesen wird, besteht, da eine lange Zeit verstreicht,
nachdem das Hypertext-Dokument D83 des vierten Rangs aufgerufen und
gelesen ist, ebenfalls eine Wahrscheinlichkeit, dass der Nutzer
einen Kontext des Hypertext-Dokuments D86 nicht verstehen kann,
der mit einem Kontext des Hypertext-Dokuments D83 eng zusammenhängt. Um
die obigen Nachteile in der dritten Ausführungsform zu lösen, werden
daher die Ränge,
die mehreren, eng miteinander zusammenhängenden Hypertext-Dokumenten verliehen
wurden, auf den gleichen Rang gesetzt.
-
8 ist ein Blockdiagramm
einer Hypertext-Wiederauffindungsvorrichtung gemäß einer dritten Ausführungsform
der vorliegenden Erfindung.
-
Wie
in 8 gezeigt ist, umfasst
eine Hypertext-Wiederauffindungsvorrichtung 21 zum Wiederauffinden
eines oder mehrerer Hypertext-Dokumente,
die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich
erfüllen,
aus einem großen Umfang
an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden
Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes
vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2,
die Wiederauffindungseinheit 3, eine Dokumentrangfolgen
bestimmende Einheit 22 zum Vereinigen eines bestimmten
Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdokumente,
die dem bestimmten Hypertext-Dokument entsprechen, zu einem vereinigten bestimmten
Hypertext-Dokument gemäß der Dokumentinformation
der Hypertext-Dokumenttabelle, die durch die Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitende Einheit 7 vorbereitet wurde,
für jedes
der bestimmten Hypertext-Dokumente,
die in der Wiederauffindungseinheit 3 erhalten wurden,
Berechnen geschätzter
Werte für
die vereinigten bestimmten Hypertext-Dokumente gemäß der bestimmten Wortinformation
des Wiederauffindungsindex, der in der Wiederauffindungsindizes vorbereitenden
Einheit 6 erhalten wurde, Bestimmen mehrerer Bedeutungsgrade
der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten,
Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden
für die
vereinigten bestimmten Hypertext-Dokumente unter der Bedingung,
dass Ränge,
die zwei oder mehr bestimmten Hypertext-Dokumenten verliehen wurden,
die eng miteinander zusammenhängen,
auf den gleichen Rang festgelegt bzw. gesetzt werden, und Vorbereiten
eines Index eines bestimmten Hypertext-Dokuments für jedes
der bestimmten Hypertext-Dokumente, und
eine Wiederauffindungsergebnisse
anzeigende Einheit 23 zum Anzeigen der Indizes der bestimmten
Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge,
die in der Dokumentrangfolgen bestimmenden Einheit 22 bestimmt
wurde, als ein Wiederauffindungsergebnis unter der Bedingung, dass zwei
oder mehr bestimmte Hypertext-Dokumente, die auf den gleichen Rang
gesetzt sind, mit einem oder mehreren bestimmten Stammdokumenten
entsprechend irgendeinem der bestimmten Hypertext-Dokumente in einer
Gruppe gemeinsam angezeigt werden.
-
In
der obigen Konfiguration werden, nachdem die Bedeutungsgrade der
bestimmten Hypertext-Dokumente berechnet sind und die Rangfolge der
bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden in der
Dokumentrangfolgen bestimmenden Einheit 22 in der gleichen
Weise wie in der ersten Ausführungsform
bestimmt ist, ein oder mehrere Identifiziererer für Stammdokumente,
die in einem Stück
einer Dokumenteninfor mation der Hypertext-Dokumenttabelle aufgelistet
sind, die einem bestimmten Hypertext-Dokument entspricht, extrahiert,
und ein oder mehrere Stammdokumente, die durch die Identifizierer
für Stammdokumente
identifiziert sind, werden für
jedes bestimmte Hypertext-Dokument spezifiziert. Danach wird beurteilt,
ob jedes der Stammdokumente mit einem der bestimmten Hypertext-Dokumente übereinstimmt
oder nicht. Falls ein Stammdokument, das einem ersten bestimmten Hypertext-Dokument
eines Rangs A entspricht, mit einem zweiten bestimmten Hypertext-Dokument eines Rangs
B übereinstimmt,
wird beurteilt, dass das erste und zweite bestimmte Hypertext-Dokument
eng miteinander zusammenhängen,
und das erste und zweite bestimmte Hypertext-Dokument werden auf einen
höheren
Rang zwischen den Rängen
A und B neu gesetzt. Danach werden Indizes der bestimmten Hypertext-Dokumente
durch die Wiederauffindungsergebnisse anzeigende Einheit 23 in
der nach Rangfolge geordneten Reihenfolge angezeigt.
-
Da
das Stammdokument D83, das dem Hypertext-Dokument D85 des achtzehnten
Rangs entspricht, mit dem Hypertext-Dokument D83 des vierten Rangs übereinstimmt,
wird z. B. das Hypertext-Dokument D85 auf den vierten Rang neu gesetzt.
Da das Stammdokument D83, das dem Hypertext-Dokument D86 des neunzehnten
Rangs entspricht, mit dem Hypertext-Dokument D83 des vierten Rangs übereinstimmt,
wird auch das Hypertext-Dokument D86 auf den vierten Rang neu eingestellt
bzw. gesetzt.
-
Da
mehrere bestimmte Hypertext-Dokumente, die eng miteinander zusammenhängen, auf
den gleichen Rang gesetzt werden und dicht beieinander angezeigt
werden, kann daher der Nutzer die bestimmten Hypertext-Dokumente,
die eng miteinander zusammenhängen,
nacheinander lesen, so dass der Nutzer die Kontexte der bestimmten
Hypertext-Doku mente leicht erkennen bzw. realisieren kann. Dementsprechend
wird verhindert, dass das gleiche bestimmte Hypertext-Dokument fälschlicherweise
wieder gelesen wird, und der Nutzer kann eine Gruppe bestimmter
Hypertext-Dokumente effizient lesen, die eng miteinander zusammenhängen.
-
In
dieser Ausführungsform
werden mehrere bestimmte Hypertext-Dokumente, die eng miteinander
zusammenhängen,
auf den höchsten
Rang unter den Rängen
gesetzt, die den mehreren bestimmten Hypertext-Dokumenten verliehen wurden. Die dritte Ausführungsform
ist jedoch nicht auf dieses Konzept beschränkt. Das heißt, wenn
mehrere bestimmte Hypertext-Dokumente, die eng miteinander zusammenhängen, bestimmt
sind, ist es zweckmäßig, dass
eine Summe der Bedeutungsgrade der bestimmten Hypertext-Dokumente
berechnet wird und die bestimmten Hypertext-Dokumente gemäß dem summierten Bedeutungsgrad
neu auf den gleichen höheren
Rang gesetzt werden.
-
Es
wird auch bevorzugt, dass das Konzept der zweiten Ausführungsform
und das Konzept der dritten Ausführungsform
kombiniert werden. Wenn beispielsweise, wie in 7 gezeigt ist, eine erste Gruppe des
bestimmten Hypertext-Dokuments D83 und der Stammdokumente D80 und
D81 auf den vierten Rang gesetzt ist, eine zweite Gruppe des bestimmten
Hypertext-Dokuments D85 und der Stammdokumente D81 und D83 auf den
achtzehnten Rang gesetzt ist und eine dritte Gruppe des bestimmten Hypertext-Dokuments
D86 und der Stammdokumente D81 und D83 auf den neunzehnten Rang
gemäß der zweiten
Ausführungsform
gesetzt ist, wird die zweite Gruppe der Dokumente D81, D83 und D85, die
auf den achtzehnten Rang gesetzt sind, auf den vierten Rang neu
gesetzt, und die dritte Gruppe von Dokumenten D81, D83 und D86,
die auf den neunzehnten Rang gesetzt sind, wird auf den vierten
Rang neu gesetzt, und eine kombinierte Gruppe der bestimmten Hypertext-Dokumente
D83, D85 und D86 und der Stammdokumente D80 und D81, die auf den vierten
Rang zurückgesetzt
wurden, wird wie in 9 dargestellt
angezeigt.
-
Vierte Ausführungsform
-
Im
Allgemeinen erscheint ein spezielles Wort, das ein Merkmal eines
Referenzdokuments angibt, viele Male in einem oder mehreren Ankersätzen eines
oder mehrerer Stammdokumente, die dem Referenzdokument entsprechen.
Falls ein geschätzter Wert
für das
Referenzdokument gerade berechnet wird, indem das in den Ankersätzen des
Stammdokuments erscheinende spezielle Wort betrachtet wird, und
das Referenzdokument gemäß dem geschätzten Wert
in der Rangfolge angeordnet wird, kann daher die Zuverlässigkeit
für das
Wiederauffinden mehrerer Hypertext-Dokumente, die einer Wiederauffindungsanforderung
eines Nutzers wahrscheinlich entsprechen, verbessert werden.
-
10 ist ein Blockdiagramm
einer Hypertext-Wiederauffindungsvorrichtung gemäß einer vierten Ausführungsform
der vorliegenden Erfindung.
-
Wie
in 10 gezeigt ist, umfasst
eine Hypertext-Wiederauffindungsvorrichtung 31 zum Wiederauffinden
eines oder mehrerer Hypertext-Dokumente, die wahrscheinlich einer
Wiederauffindungsanforderung eines Nutzers entsprechen, aus einem großen Umfang
an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden
Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes
vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2,
die Wiederauffindungseinheit 3,
eine Dokumentrangfolgen
bestimmende Einheit 32 zum Berechnen einer Auftrittshäufigkeit
jedes bestimmten Wortes in einem bestimmten Hypertext-Dokument und
einem oder mehreren Ankersätzen
eines oder mehrerer bestimmter Stammdokumente entsprechend dem bestimmten
Hypertext-Dokument als eine überarbeitete
(engl. revised) Auftrittshäufigkeit TF
für das
bestimmte Hypertext-Dokument für
jedes der bestimmten Hypertext-Dokumente gemäß der bestimmten Wortinformation
des Wiederauffindungsindex, der in der Wiederauffindungsindizes
vorbereitenden Einheit 6 erhalten wurde, Berechnen geschätzter Werte
der bestimmten Hypertext-Dokumente gemäß den überarbeiteten Auftrittshäufigkeiten
TF und inversen Dokumenthäufigkeiten
IDF, Bestimmen mehrerer Bedeutungsgrade der bestimmten Hypertext-Dokumente
gemäß den geschätzten Werten,
Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden und
Vorbereiten von Indizes der bestimmten Hypertext-Dokumente, und
eine
Wiederauffindungsergebnisse anzeigende Einheit 33 zum Anzeigen
der Indizes der bestimmten Hypertext-Dokumente in der nach Rangfolge
geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden
Einheit 22 bestimmt wurde, als ein Wiederauffindungsergebnis.
-
Falls
der Nutzer ein Schlüsselwort "apple" eingibt, wie in 4 gezeigt ist, erscheint
in der obigen Konfiguration das bestimmte Wort "apple" viermal in dem Titel des Hypertext-Dokuments
D83 und dem Hauptteil des Hypertext-Dokuments D83. Das bestimmte
Wort "apple" erscheint auch in
dem Ankersatz S801 des Stammdokuments D81 und dem Ankersatz S802
des Stammdokuments D82. Da eine Summe einer Auftrittshäufigkeit
des bestimmten Wortes "apple" im Hypertext-Dokument
D83 und den Ankersätzen
S801 und S802 der Stammdokumente D81 und D82 6 beträgt, wird
daher eine überarbeitete Auftrittshäufigkeit
TF für
das bestimmte Hypertext-Dokument D83 auf 6 eingestellt bzw. festgelegt, und
ein ge schätzter
Wert des bestimmten Hypertext-Dokuments D83 wird berechnet, indem
die überarbeitete
Auftrittshäufigkeit
TF in der Dokumentrangfolgen bestimmenden Einheit 32 verwendet
wird. Demgemäß wird das
bestimmte Hypertext-Dokument D83 in der Rangfolge auf einen höheren Rang gesetzt,
so dass eine Zuverlässigkeit
des Wiederauffindens des bestimmten Hypertext-Dokuments D83 verbessert
werden kann.
-
Fünfte Ausführungsform
-
In
den ersten bis vierten Ausführungsformen ist
es, falls der Nutzer einen Überblick
von Inhalten eines bestimmten Hypertext-Dokuments wissen möchte, wenn
ein Index eines bestimmten Hypertext-Dokuments angezeigt wird, erforderlich,
das bestimmte Hypertext-Dokument aus der Hypertext-Dokumente verwaltenden
Einheit 8 aufzurufen. Falls der Nutzer Inhalte vieler bestimmter
Hypertext-Dokumente lesen möchte,
ist es daher mühevoll,
dass der Nutzer die bestimmten Hypertext-Dokumente aufruft.
-
11 ist ein Blockdiagramm
einer Hypertext-Wiederauffindungsvorrichtung gemäß einer fünften Ausführungsform der vorliegenden
Erfindung.
-
Wie
in 11 gezeigt ist, umfasst
eine Hypertext-Wiederauffindungsvorrichtung 41 zum Wiederauffinden
eines oder mehrerer Hypertext-Dokumente,
die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich
erfüllen,
aus einem großen Umfang
an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden
Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes
vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2,
die Wiederauffindungseinheit 3, eine Dokumentrangfolgen
bestimmende Einheit 42 zum Vereinigen eines bestimmten
Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdokumente,
die dem bestimmten Hypertext-Dokument entsprechen, zu einem vereinigten bestimmten
Hypertext-Dokument gemäß der Dokumentinformation
der Hypertext-Dokumenttabelle, die durch die Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitende Einheit 7 vorbereitet wurde,
für jedes
der in der Wiederauffindungseinheit 3 erhaltenen bestimmten
Hypertext-Dokumente, Berechnen geschätzter Werte für die vereinigten
bestimmten Hypertext-Dokumente für
jedes bestimmte Wort gemäß der bestimmten
Wortinformation des Wiederauffindungsindex, der in der Wiederauffindungsindizes
vorbereitenden Einheit 6 erhalten wurde, Bestimmen mehrerer
Bedeutungsgrade der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten
für jedes
bestimmte Wort, Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente
gemäß den Bedeutungsgraden
für die
vereinigten bestimmten Hypertext-Dokumente für jedes bestimmte Wort, Vorbereiten
eines Index eines bestimmten Hypertext-Dokuments für jedes
der bestimmten Hypertext-Dokumente und Vorbereiten mehrerer Zusammenfassungen
der bestimmten Hypertext-Dokumente für jedes der bestimmten Worte, und
eine
Wiederauffindungsergebnisse anzeigende Einheit 43 zum Anzeigen
einer Gruppe der Indizes der bestimmten Hypertext-Dokumente mit
den Zusammenfassungen der bestimmten Hypertext-Dokumente in der
nach Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen
bestimmenden Einheit 42 bestimmt wurde, für jedes
bestimmte Wort als ein Wiederauffindungsergebnis.
-
Nachdem
die Indizes der bestimmten Hypertext-Dokumente in der Dokumentrangfolgen
bestimmenden Einheit 42 vorbereitet sind, wird in der obigen
Konfiguration ein bestimmter Satz oder eine bestimmte Phrase, der
oder die ein bestimmtes Wort enthält, aus einem bestimmten Hypertext-Dokument gemäß der Positionsinformation
der Wortinformation des durch die Wiederauffindungsindizes vorbereitende
Einheit 6 vorbereiteten Wiederauffindungsindex extrahiert,
und eine Zusammenfassung, in der der bestimmte Satz oder die bestimmte
Phrase nach einem obersten Satz oder einer obersten Phrase des bestimmten
Hypertext-Dokuments geschrieben ist, wird für jedes der bestimmten Worte
und jedes der bestimmten Hypertext-Dokumente vorbereitet. Falls mehrere
bestimmte Sätze
oder mehrere bestimmte Phrasen, die ein bestimmtes Wort enthalten,
in einem bestimmten Hypertext-Dokument existieren, wird eine Zusammenfassung
vorbereitet, in der die bestimmten Sätze oder die bestimmten Phrasen,
die in der bestehenden Reihenfolge angeordnet sind, nach einem obersten
Satz oder einer obersten Phrase des bestimmten Hypertext-Dokuments
geschrieben werden. Die Indizes der bestimmten Hypertext-Dokumente
mit den Zusammenfassungen der bestimmten Hypertext-Dokumente werden
danach für
jedes bestimmte Wort durch die Wiederauffindungsergebnisse anzeigende
Einheit 43 in der nach Rangfolge geordneten Reihenfolge
angezeigt, die in der Dokumentrangfolgen bestimmenden Einheit 42 bestimmt wurde.
-
Da
die Zusammenfassung eines bestimmten Hypertext-Dokuments für jedes
der bestimmten Hypertext-Dokumente angezeigt wird, kann demgemäß der Nutzer
einen Überblick
von Inhalten jedes bestimmten Hypertext-Dokuments erlangen, indem die Zusammenfassung
jedes bestimmten Hypertext-Dokuments gelesen wird, ohne jedes bestimmte
Hypertext-Dokument
von der Hypertext-Dokumente verwaltenden Einheit 8 aufzurufen,
und der Nutzer kann leicht ein oder mehrere bestimmte Hypertext-Dokumente auswählen, die
eine Wiederauffindungsanforderung des Nutzers erfüllen.
-
Selbst
wenn ein bestimmter Satz oder eine bestimmte Phrase, der oder die
ein bestimmtes Wort enthält,
in einem bestimmten Hypertext-Dokument viele Male erscheint, werden
in dieser Ausführungsform
alle bestimmten Sätze
oder alle bestimmten Phrasen, die das bestimmte Wort enthalten,
aus dem bestimmten Hypertext-Dokument extrahiert, und eine Zusammenfassung
wird erstellt bzw. vorbereitet. Falls eine Zusammenfassung eines
bestimmten Hypertext-Dokuments, die durch Verbinden einer Reihe bestimmter
Sätze oder
einer Reihe bestimmter Phrasen des bestimmten Hypertext-Dokuments
mit einem obersten Satz oder einer obersten Phrase des bestimmten
Hypertext-Dokuments erhalten wird, zu lang wird, ist es jedoch für den Nutzer
schwierig, eine lange Zusammenfassung schnell zu verstehen bzw. zu
realisieren. Daher ist es zweckmäßig, dass
drei bestimmte Sätze
oder drei bestimmte Phrasen des bestimmten Hypertext-Dokuments mit einem
obersten Satz oder einer obersten Phrase des bestimmten Hypertext-Dokuments
verbunden werden, um eine Zusammenfassung für jedes bestimmte Wort zu erstellen
bzw. vorzubereiten, wenn die Anzahl von vom Nutzer eingegebenen
Schlüsselworten
fünf oder
weniger beträgt,
zwei bestimmte Sätze
oder zwei bestimmte Phrasen des bestimmten Hypertext-Dokuments mit
einem obersten Satz oder einer obersten Phrase des bestimmten Hypertext-Dokuments
verbunden werden, um eine Zusammenfassung für jedes bestimmte Wort zu erstellen
bzw. vorzubereiten, wenn die Anzahl von vom Nutzer eingegebenen Schlüsselworten
zehn oder weniger beträgt,
oder ein bestimmter Satz oder eine bestimmte Phrase des bestimmten
Hypertext-Dokuments mit einem obersten Satz oder einer obersten
Phrase des bestimmten Hypertext-Dokuments verbunden wird, um eine
Zusammenfassung für
jedes bestimmte Wort zu erstellen bzw. vorzubereiten, wenn die Anzahl
von vom Nutzer eingegebenen Schlüsselworten 11 oder
mehr beträgt.
Folglich wird verhindert, dass die Zusammenfassung zu lang wird,
und der Nutzer kann mehrere Zusammenfassungen effizient lesen, die
durch die Wiederauffindungsergebnisse anzeigende Einheit 43 angezeigt
werden.
-
Es
wird auch bevorzugt, dass das Konzept der zweiten Ausführungsform
und das Konzept der fünften
Ausführungsform
kombiniert werden. Wenn z. B. eine erste Gruppe des bestimmten Hypertext-Dokuments
D83 und der Stammdokumente D80 und D81 auf den vierten Rang gesetzt
ist, eine zweite Gruppe des bestimmten Hypertext-Dokuments D85 und
der Stammdokumente D81 und D83 auf den achtzehnten Rang gesetzt
ist und eine dritte Gruppe des bestimmten Hypertext-Dokuments D86
und der Stammdokumente D81 und D83 auf den neunzehnten Rang gemäß der zweiten
Ausführungsform
gesetzt ist, wie in 12 dargestellt
ist, wird eine Zusammenfassung des bestimmten Hypertext-Dokuments
D83 zur ersten Gruppe addiert, wird eine Zusammenfassung des bestimmten
Hypertext-Dokuments D85 zur zweiten Gruppe addiert, und eine Zusammenfassung
des bestimmten Hypertext-Dokuments D86 wird zur dritten Gruppe addiert.
-
Sechste Ausführungsform
-
Im
WorldWideWeb ist ein Aufsatz (oder ein Artikel) in mehrere Abschnitte
unterteilt, und jeder Abschnitt des Aufsatzes ist in einem Hypertext-Dokument
geschrieben. Daher gibt es einen Fall, dass ein Kontext des Aufsatzes
in einem Abschnitt des in einem Hypertext-Dokument geschriebenen
Aufsatzes nicht ausreichend ausgedrückt wird. Obgleich ein in Aomori
gewachsener Apfel im Aufsatz beschrieben ist, ist z. B. das Wort "Aomori"; das den Herkunftsort des
Apfels angibt, nicht im Hypertext-Dokument D83, sondern ist im Stammdokument
D81 geschrieben.
-
Falls
mehrere Schlüsselworte,
die einen Kontext eines Aufsatzes ausdrücken, in einem Hypertext-Dokument
und mehreren Stammdokumenten mit einer Referenzbeziehung mit dem
Hypertext-Dokument separat verwendet werden, wird daher im Stand
der Technik das Hypertext-Dokument in unerwünschter Weise in der Rangfolge
in einer niedrigeren Klasse eingeordnet bzw. klassifiziert. In der sechsten
Ausführungsform
wird jedoch für
jedes der Stammdokumente ein kombiniertes Hypertext-Dokument erstellt
bzw. vorbereitet, das erzeugt wird, indem ein Hypertext-Dokument
für Wiederauffindung (oder
ein bestimmtes Hypertext-Dokument) und ein Stammdokument mit einer
Referenzbeziehung mit dem Hypertext-Dokument zur Wiederauffindung kombiniert
werden, werden Bedeutungsgrade der kombinierten Hypertext-Dokumente
miteinander verglichen, wird ein kombiniertes Hypertext-Dokument mit
dem maximalen Bedeutungsgrad ausgewählt, und der maximale Bedeutungsgrad
wird als ein Bedeutungsgrad für
das Wiederauffindungs-Hypertext-Dokument verwendet.
-
13 ist ein Blockdiagramm
einer Hypertext-Wiederauffindungsvorrichtung gemäß einer sechsten Ausführungsform
der vorliegenden Erfindung.
-
Wie
in 13 gezeigt ist, umfasst
eine Hypertext-Wiederauffindungsvorrichtung 51 zum Wiederauffinden
eines oder mehrerer Hypertext-Dokumente,
die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich
erfüllen,
aus einen großen Umfang
an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden
Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes
vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2,
die Wiederauffindungseinheit 3, eine Dokumentrangfolgen
bestimmende Einheit 52 zum Kombinieren eines bestimmten
Hypertext-Dokuments und eines bestimmten Stammdokuments, das dem
bestimmten Hypertext-Dokument entspricht, um ein kombiniertes bestimmtes
Hypertext-Dokument gemäß der Dokumentinformation
der Hypertext-Dokumenttabelle zu bilden, die in der Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitenden Einheit 7 vorbereitet
wurde, für
jedes der bestimmten Stammdokumente, die dem bestimmten Hypertext-Dokument
entsprechen, und jedes der bestimmten Hypertext-Dokumente, die in
der Wiederauffindungseinheit 3 erhalten wurden, Berechnen
geschätzter
Werte für
die kombinierten bestimmten Hypertext-Dokumente gemäß der bestimmten
Wortinformation des Wiederauffindungsindex, der in der Wiederauffindungsindizes
vorbereitenden Einheit 6 erhalten wurde, für jedes
der bestimmten Hypertext-Dokumente, Bestimmen mehrerer Bedeutungsgrade
der kombinierten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten
für jedes
der bestimmten Hypertext-Dokumente, miteinander Vergleichen der
Bedeutungsgrade der kombinierten bestimmten Hypertext-Dokumente
für jedes
der bestimmten Hypertext-Dokumente, Auswählen eines maximalen Bedeutungsgrades
unter den Bedeutungsgraden der kombinierten bestimmten Hypertext-Dokumente,
die zu einem bestimmten Hypertext-Dokument gehören, für jedes der bestimmten Hypertext-Dokumente,
Festlegen des maximalen Bedeutungsgrads auf einen Bedeutungsgrad
für das
bestimmte Hypertext-Dokument für
jedes der bestimmten Hypertext-Dokumente,
Bestimmen der Rangfolge der bestimmten Hypertext-Dokumente gemäß jenen
Bedeutungsgraden und Vorbereiten eines Index eines bestimmten Hypertext-Dokuments
für jedes
der bestimmten Hypertext-Dokumente,
und
eine Wiederauffindungsergebnisse anzeigende Einheit 53 zum
Anzeigen einer Gruppe der Indizes der bestimmten Hypertext-Dokumente
mit den Zusammenfassungen der bestimmten Hypertext-Dokumente in
der nach Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen
bestimmenden Einheit 52 bestimmt wurde, für jedes
bestimmte Wort als ein Wiederauffindungsergebnis.
-
Wenn
ein Schlüsselwort "apple" und ein anderes
Schlüsselwort "Aomori" vom Nutzer unter
der Bedingung eingegeben werden, dass ein Wort "apple" im Hypertext-Dokument D83 erscheint
und ein Wort "Aomori", das einen Verwaltungsbezirk
mit Apfelanbau angibt, im Hypertext-Dokument D83 oder D82 nicht
erscheint, sondern im Hypertext-Dokument D81 erscheint, wird in
der obigen Konfiguration, weil ein bestimmtes Wort "apple", das mit dem Schlüsselwort "apple" übereinstimmt, im Hypertext-Dokument D83 erscheint,
das Hypertext-Dokument D83 in der Wiederauffindungseinheit 3 als
ein bestimmtes Hypertext-Dokument festgelegt.
-
In
der Dokumentrangfolgen bestimmenden Einheit 52 werden danach
das bestimmte Hypertext-Dokument D83 und das bestimmte Stammdokument
D81 kombiniert, um ein erstes kombiniertes bestimmtes Hypertext-Dokument zu bilden,
werden das bestimmte Hypertext-Dokument D83 und das bestimmte Stammdokument
D82 kombiniert, um ein zweites kombiniertes bestimmtes Hypertext-Dokument
zu bilden, werden geschätzte
Werte für
die kombinierten bestimmten Hypertext-Dokumente für jedes
der bestimmten Worte berechnet, und werden eine erste Summe des
geschätzten
Wertes des ersten kombinierten bestimmten Hypertext-Dokuments für die bestimmten
Worte und eine zweite Summe des geschätzten Wertes des zweiten kombinierten bestimmten
Hypertext-Dokuments
für die
bestimmten Worte berechnet. Da das bestimmte Wort "Aomori" im Hypertext-Dokument
D82 nicht erscheint, aber im Hypertext-Dokument D81 erscheint, ist in diesem Fall
die erste Summe des geschätzten
Wertes des ersten kombinierten bestimmten Hypertext-Dokuments höher als
die zweite Summe des geschätzten Wertes
des zweiten kombinierten bestimmten Hypertext-Dokuments. Daher wird
das erste kombinierte bestimmte Hypertext-Dokument ausgewählt, und
die erste Summe des geschätzten
Wertes des ersten kombinierten bestimmten Hypertext-Dokuments wird als
ein geschätzter
Wert des bestimmten Hypertext-Dokuments D83 für die Schlüsselworte "apple" und "Aomori" festgelegt, und aus dem geschätzten Wert
des bestimmten Hypertext-Dokuments
D83 wird ein Bedeutungsgrad für
das bestimmte Hypertext- Dokument
D83 berechnet. In der gleichen Weise werden Bedeutungsgrade für andere
bestimmte Hypertext-Dokumente berechnet, und die Rangfolge der bestimmten
Hypertext-Dokumente wird gemäß den Bedeutungsgraden
bestimmt.
-
Selbst
wenn mehrere Schlüsselworte,
die einen Kontext eines Aufsatzes ausdrücken, in einem Hypertext-Dokument
und mehreren Stammdokumenten mit einer Referenzbeziehung mit dem
Hypertext-Dokument separat verwendet werden, besteht dementsprechend
keine Wahrscheinlichkeit, dass das bestimmte Hypertext-Dokument
in unerwünschter
Weise in eine niedrigere Klasse eingeordnet bzw. klassifiziert wird,
weil ein kombiniertes bestimmtes Hypertext-Dokument, das durch Kombinieren
eines bestimmten Hypertext-Dokuments und eines bestimmten Stammdokuments
erhalten wurde, für
jedes der bestimmten Stammdokumente gebildet und ein maximaler geschätzter Wert
eines kombinierten bestimmten Hypertext-Dokuments unter denjenigen der
kombinieren bestimmten Hypertext-Dokumente als ein geschätzter Wert
für das
bestimmte Hypertext-Dokument festgelegt wird.
-
Siebte Ausführungsform
-
Ein Überschrifts-
bzw. Kopfabschnitt eines Hypertext-Dokuments gibt normalerweise
ein Merkmal des Hypertext-Dokuments sehr gut an. Um ein im Kopfabschnitt
des Hypertext-Dokuments erscheinendes bestimmtes Wort grob (engl.
heavily abzuschätzen,
wird daher eine Auftrittshäufigkeit
des bestimmten Wortes, das mit einem Schlüsselwort im Kopfabschnitt des
Hypertext-Dokuments übereinstimmt, verdoppelt.
Als ein Beispiel des Kopfabschnitts wird in dieser Ausführungsform
ein Titel des Hypertext-Dokuments
oder ein Ankersatz eines Stammdokuments mit einer Referenzbeziehung
mit dem Hypertext-Dokument betrachtet.
-
14 ist ein Blockdiagramm
einer Hypertext-Wiederauffindungsvorrichtung gemäß einer siebten Ausführungsform
der vorliegenden Erfindung.
-
Wie
in 14 gezeigt ist, umfasst
eine Hypertext-Wiederauffindungsvorrichtung 61 zum Wiederauffinden
eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung
eines Nutzers wahrscheinlich erfüllen,
aus einem großen Umfang
an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden
Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes
vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2,
die Wiederauffindungseinheit 3, eine Dokumentrangfolgen
bestimmende Einheit 62 zum Vereinigen eines bestimmten
Hypertext-Dokuments und eines oder mehrerer Stammdokumente, die
dem bestimmten Hypertext-Dokument entsprechen, zu einem vereinigten
bestimmten Hypertext-Dokument gemäß der Dokumentinformation der
Hypertext-Dokumenttabelle, die durch die Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitende Einheit 7 vorbereitet
wurde, für
jedes der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten
werden, Berechnen einer Auftrittshäufigkeit TF eines bestimmten
Wortes in einem vereinigten bestimmten Hypertext-Dokument für jedes
bestimmte Wort und jedes vereinigte bestimmte Hypertext-Dokument
unter der Bedingung, dass eine Auftrittshäufigkeit des bestimmten Wortes,
das in einem Kopfabschnitt des vereinigten bestimmten Hypertext-Dokuments
erscheint, verdoppelt ist, Berechnen einer inversen Dokumenthäufigkeit
IDF, die als ein inverser Wert der Anzahl bestimmter Hypertext-Dokumente
definiert ist, in der ein bestimmtes Wort erscheint, für jedes
bestimmte Wort, Berechnen eines Produkts TF*IDF einer Auftrittshäufigkeit
TF und einer inversen Dokumenthäufigkeit
IDF, Summieren mehrerer Produkte für alle bestimmten Worte, um
ein summiertes Produkt als einen geschätzten Wert für jedes
bestimmte Hypertext-Dokument erzeugen, Bestimmen mehrerer Bedeutungsgrade
der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen
der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden für die vereinigten
bestimmten Hypertext-Dokumente und Vorbereiten eines Index eines
bestimmten Hypertext-Dokuments für
jedes der bestimmten Hypertext-Dokumente, und
eine Wiederauffindungsergebnisse
anzeigende Einheit 63 zum Anzeigen der Indizes der bestimmten
Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge,
die in der Dokumentrangfolgen bestimmenden Einheit 62 bestimmt
wurde, als ein Wiederauffindungsergebnis.
-
In
der obigen Konfiguration besteht ein Kopfabschnitt jedes vereinigten
bestimmten Hypertext-Dokuments aus einem Titel eines bestimmten Hypertext-Dokuments,
das dem vereinigten bestimmten Hypertext-Dokument entspricht, und einem oder
mehreren Ankersätzen
bestimmter Stammdokumente mit einer Referenzbeziehung mit dem bestimmten
Hypertext-Dokument. Falls z. B. ein bestimmtes Wort, das mit einem
Schlüsselwort übereinstimmt,
in einem vereinigten bestimmten Hypertext-Dokument sechsmal erscheint, wird unter
der Bedingung, dass das bestimmte Wort im Kopfabschnitt des vereinigten
bestimmten Hypertext-Dokuments
dreimal erscheint, das bestimmte Wort, das im Kopfabschnitt des
vereinigten bestimmten Hypertext-Dokuments erscheint, jedes Mal
doppelt gezählt, wenn
das bestimmte Wort erscheint, so dass eine Auftrittshäufigkeit
TF des bestimmten Wortes im vereinigten bestimmten Hypertext-Dokument
gleich 9 ist. Ein bestimmtes Hypertext-Dokument, das dem vereinigten
bestimmten Hypertext-Dokument entspricht, wird danach gemäß der Auftrittshäufigkeit
TF = 9 nach der Rangfolge eingeordnet.
-
Da
der Kopfabschnitt des Hypertext-Dokuments normalerweise ein Merkmal
des Hypertext-Dokuments sehr gut angibt und das bestimmte Wort,
das im Kopfabschnitt des vereinigten bestimmten Hypertext-Dokuments
erscheint, doppelt gezählt wird,
kann demgemäß die Zuverlässigkeit
für das Einordnen
der bestimmten Hypertext-Dokumente gemäß der Rangfolge außerdem erhöht werden.
-
In
einem HTML-Hypertext-Dokument, das in der Hypertext-Mark-Up-Language geschrieben
ist, wird ein kleiner Index durch eine Zeichenkette ausgedrückt, die
von "<h1>" und "</h1>" umgeben ist. Daher ist es zweckmäßig, dass
der kleine Index im Kopfabschnitt des HTML-Hypertext-Dokuments enthalten
ist.
-
In
dieser Ausführungsform
wird die Auftrittshäufigkeit
des bestimmten Wortes, das im Kopfabschnitt des vereinigten bestimmten
Hypertext-Dokuments
erscheint, verdoppelt. Es ist jedoch zweckmäßig, dass die Auftrittshäufigkeit des bestimmten Wortes
drei- oder mehrfach erhöht
wird.
-
Achte Ausführungsform
-
In
den Hypertext-Dokumenten des WorldWideWeb gibt es ein spezielles
Hypertext-Dokument, in welchem mehrere Ankersätze existieren und keine anderen
Sätze existieren.
Dieses spezielle Hypertext-Dokument wird allgemein Link- bzw. Verknüpfungsseite
genannt. Selbst wenn die Verknüpfungsseite
abgefragt bzw. wiederaufgefunden und angezeigt wird, existiert keine
nützliche
Information, die mit einem Wiederauffindungsziel eines Nutzers übereinstimmt,
in der Verknüpfungsseite.
Daher wird eine Auftrittszahl eines bestimmten Wortes in der Verknüpfungsseite
in dieser Ausführungsform
auf Null herabgesetzt.
-
15 ist ein Blockdiagramm
einer Hypertext-Wiederauffindungsvorrichtung gemäß einer achten Ausführungsform
der vorliegenden Erfindung.
-
Wie
in 15 gezeigt ist, umfasst
eine Hypertext-Wiederauffindungsvorrichtung 71 zum Wiederauffinden
eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung
eines Nutzers wahrscheinlich erfüllen,
aus einem großen Umfang
an Hypertext-Dokumenten, die in der Hypertext-Dokument verwaltenden
Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes
vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2,
die Wiederauffindungseinheit 3, eine Dokumentrangfolgen
bestimmende Einheit 72 zum Vereinigen eines bestimmten
Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdokumente,
die dem bestimmten Hypertext-Dokument entsprechen, zu einem vereinigten bestimmten
Hypertext-Dokument gemäß der Dokumentinformation
der Hypertext-Dokumenttabelle, die von der Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitenden Einheit 7 vorbereitet wurde,
für jedes
der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten
wurden, Spezifizieren einer Verknüpfungsseite unter den bestimmten
Hypertext-Dokumenten, Berechnen einer Auftrittshäufigkeit TF eines bestimmten
Wortes in einem vereinigten bestimmten Hypertext-Dokument für jedes
bestimmte Wort und jedes vereinigte bestimmte Hypertext-Dokument
unter der Bedingung, dass eine Auftrittshäufigkeit des bestimmten Wortes
in der Verknüpfungsseite
jedes Mal um Eins reduziert wird, wenn das bestimmte Wort in der
Verknüpfungsseite
gefunden wird, die als ein bestimmtes Stammdokument des vereinigten
bestimmten Hypertext-Dokuments behandelt wird, Berechnen einer inversen
Dokumenthäufigkeit
IDF, die als ein inverser Wert der Zahl bestimmter Hypertext-Dokumente,
in denen ein bestimmtes Wort erscheint, definiert ist, für jedes
bestimmte Wort, Berechnen eines Produkts TF*IDF einer Auftrittshäufigkeit
TF und einer inversen Dokumenthäufigkeit
IDF, Summieren mehrerer Produkte für alle bestimmten Worte, um
ein summiertes Produkt als einen geschätzten Wert für jedes
bestimmte Hypertext-Dokument zu erzeugen, Bestimmen mehrerer Bedeutungsgrade
der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen der
Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden für die vereinigten
bestimmten Hypertext-Dokumente und Vorbereiten eines Index eines
bestimmten Hypertext-Dokuments für
jedes der bestimmten Hypertext-Dokumente, und
eine Wiederauffindungsergebnisse
anzeigende Einheit 73 zum Anzeigen der Indizes der bestimmten
Hypertext-Dokumente in der nach Rangfolge geordneten Reihenfolge,
die in der Dokumentrangfolgen bestimmenden Einheit 62 bestimmt
wurde, als ein Wiederauffindungsergebnis.
-
In
der obigen Konfiguration ist z. B. das Hypertext-Dokument D82 eine
zu einem bestimmten Wort "apple" gehörende Verknüpfungsseite
und besteht aus zehn Ankersätzen.
Daher existieren zehn Referenzdokumente, die jeweils eine Referenzbeziehung
mit dem Hypertext-Dokument D82 aufweisen. Wenn eine Auftrittshäufigkeit
des bestimmten Wortes "apple" in einem vereinigten
bestimmten Hypertext-Dokument, das aus einem als ein bestimmtes Hypertext-Dokument
behandeltes Referenzdokument und dem als ein bestimmtes Stammdokument behandelten
Hypertext-Dokument D82 besteht, berechnet wird, wird eine Auftrittshäufigkeit
des bestimmten Wortes "apple" in dem als ein bestimmtes Hypertext-Dokument
behandelten Hypertext-Dokument D82 jedesmal um Eins reduziert, wenn
das bestimmte Wort "apple" im bestimmten Stammdokument
D82 gefun den wird. Diese reduzierende Operation wird für alle Referenzdokumente
durchgeführt, die
als die bestimmten Hypertext-Dokumente behandelt werden.
-
Selbst
wenn das bestimmte Wort "apple" viele Male im Hypertext-Dokument
D82 erscheint, wird deshalb die Auftrittshäufigkeit des bestimmten Wortes "apple" im Hypertext-Dokument
D82 notwendigerweise auf Null reduziert, und das Hypertext-Dokument
D82 wird in die niedrigste Klasse eingeordnet.
-
Demgemäß kann immer
ein als Verknüpfungsseite
dienendes bestimmtes Hypertext-Dokument in die niedrigste Klasse
eingeordnet werden.
-
Neunte Ausführungsform
-
Es
gibt ein langes Hypertext-Dokument, das aus mehreren Blöcken besteht,
die jeweils einer Bedeutung entsprechen, und an der obersten Stelle
jedes Blocks des langen Hypertext-Dokuments ist ein Referenzetikett
angeordnet. In dieser Ausführungsform
ist das lange Hypertext-Dokument in mehrere Blöcke geteilt, und eine jedem
Block des langen Hypertext-Dokuments
entsprechende Hypertext-Dokumenttabelle wird erstellt bzw. vorbereitet.
-
16 ist ein Blockdiagramm
einer Hypertext-Wiederauffindungsvorrichtung gemäß einer neunten Ausführungsform
der vorliegenden Erfindung.
-
Wie
in 16 gezeigt ist, umfasst
eine Hypertext-Wiederauffindungsvorrichtung 76 zum Wiederauffinden
eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung
eines Nutzers wahrschein lich erfüllen,
aus einem großen Umfang
an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden
Einheit 8 gespeichert sind, eine Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitende Einheit 77 zum Analysieren
der Hypertext-Dokumente mit den Referenzbeziehungen, die durch die
Hypertext-Dokumente verwaltende Einheit 8 verwaltet werden,
Spezifizieren eines langen Hypertext-Dokuments, das aus mehreren
Blöcken
besteht, die jeweils einer Bedeutung entsprechen, Festlegen jedes
Blocks des langen Hypertext-Dokuments als ein Hypertext-Dokument
entsprechend einer Bedeutung, Vorbereiten einer Hypertext-Dokumentinformation,
in der ein oder mehrere Identifizierer für Stammdokumente, die ein oder
mehrere Stammdokumente und Ankersätze der Stammdokumente identifizieren,
mit einem Identifizierer für
Hypertext-Dokumente aufgelistet sind, der ein Hypertext-Dokument
und eine Dokumentspeicherposition des Hypertext-Dokuments identifiziert, für jedes
der Hypertext-Dokumente, und Vorbereiten einer Hypertext-Dokumenttabelle der
Hypertext-Dokumentinformation für
alle Hypertext-Dokumente,
die durch die Hypertext-Dokumente verwaltende Einheit 8 verwaltet
werden,
die Wiederauffindungsindizes vorbereitende Einheit 6,
die Schlüsselworteingabeeinheit 2,
die Wiederauffindungseinheit 3, die Dokumentrangfolgen
bestimmende Einheit 4 und die Wiederauffindungsergebnisse
anzeigende Einheit 73.
-
Falls
ein langes Hypertext-Dokument D87, das aus mehreren Blöcken besteht,
die jeweils einer Bedeutung entsprechen, in den von der Hypertext-Dokumente
verwaltenden Einheit 8 verwalteten Hypertext-Dokumenten
existiert, wird in der obigen Konfiguration, wie in 17 gezeigt ist, das lange Hypertext-Dokument
D87 durch die Hypertext-Dokumenttabellen mit Stammdokumentlisten
vorbereitende Einheit 77 spezifiziert, und ein oder mehrere
Referenzetiketten, die jeweils an der obersten Stelle eines Blocks
des langen Hypertext-Dokuments D87 angeordnet sind, werden ausfindig
gemacht. Danach wird das lange Hypertext-Dokument D87 in die mehreren
Blöcke
geteilt, und jeder Block des langen Hypertext-Dokuments D87 wird als ein Hypertext-Dokument
D87, D88 oder D89 festgelegt. Wenn der Nutzer eine Zeichenkette "ABC" oder "XYZ" eines Ankersatzes
eines Hypertext-Dokuments liest, kann in diesem Fall der Nutzer
sofort auf das Referenzetikett wie z. B. "#ABC" oder "#XYZ" eines anderen Hypertext-Dokuments
verweisen. Danach wird eine Hypertext-Dokumenttabelle der Hypertext-Dokumentinformation
für alle
Hypertext-Dokumente
in der gleichen Weise wie in der ersten Ausführungsform vorbereitet bzw.
erstellt.
-
Selbst
wenn ein langes Hypertext-Dokument, das aus mehreren Blöcken besteht,
die jeweils einer Bedeutung entsprechen, in den Hypertext-Dokumenten
existiert, können
demgemäß, weil
das lange Hypertext-Dokument in die Blöcke geteilt und jeder Block
des langen Hypertext-Dokuments als ein Hypertext-Dokument festgelegt
wird, um die Hypertext-Dokumentinformation
für jeden
Block des langen Hypertext-Dokuments vorzubereiten bzw. zu erstellen,
die Hypertext-Dokumente, die jeweils zu einer Bedeutung gehören, nach
der Rangfolge geordnet werden, so dass der Nutzer eine Gruppe von
Hypertext-Dokumenten, die seine Anforderung wahrscheinlich erfüllen, leicht
Wiederauffinden kann.
-
Falls
ein kleiner Index, der durch eine von "<h1>" und "</h1>" umschlossene Zeichenkette ausgedrückt wird,
in einem langen Hypertext-Dokument verwendet
wird, ist es in dieser Ausführungsform zweckmäßig, dass
das lange Hypertext-Dokument in mehrere Blöcke unter der Bedingung geteilt
wird, dass ein Referenzetikett oder ein kleiner Index an der obersten
Stelle jedes Blocks angeordnet wird.
-
Zehnte Ausführungsform
-
Falls
der Nutzer erneut mehrere Hypertext-Dokumente wiederauffinden möchte, indem
ein anfängliches
Schlüsselwort
in ein anderes Schlüsselwort
geändert
wird, das sich auf mehrere bestimmte Hypertext-Dokumente bezieht,
die gemäß dem anfänglichen
Schlüsselwort
angezeigt werden, möchte der
Nutzer im allgemeinen ein oder mehrere Worte bestätigen, die
in den bestimmten Hypertext-Dokumenten häufig erscheinen. In dieser
Ausführungsform
werden daher ein oder mehrere Worte, die in den bestimmten Hypertext-Dokumenten
häufig
erscheinen, angezeigt.
-
18 ist ein Blockdiagramm
einer Hypertext-Wiederauffindungsvorrichtung gemäß einer zehnten Ausführungsform
der vorliegenden Erfindung.
-
Wie
in 18 gezeigt ist, umfasst
eine Hypertext-Wiederauffindungsvorrichtung 91 zum Wiederauffinden
eines oder mehrerer Hypertext-Dokumente, die eine Wiederauffindungsanforderung
eines Nutzers wahrscheinlich erfüllen,
aus einem großen Umfang
an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden
Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen
mit Stammdokumentlisten verarbeitende Einheit 7, die Wiederauffindungsindizes
vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2,
die Wiederauffindungseinheit 3, eine Dokumentrangfolgen
bestimmende Einheit 92 zum Vereinigen eines bestimmten
Hypertext-Dokuments und eines oder mehrerer bestimmter Stammdokumente,
die dem bestimmten Hypertext-Dokument entsprechen, zu einem vereinigten bestimmten
Hypertext-Dokument gemäß der Dokumentinformation
der Hypertext-Dokumenttabelle, die von der Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitenden Einheit 7 vorbereitet wurde,
für jedes
der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten
wurden, Berechnen einer Auftrittshäufigkeit TF eines bestimmten
Wortes in einem vereinigten bestimmten Hypertext-Dokument für jedes
bestimmte Wort und jedes vereinigte bestimmte Hypertext-Dokument,
Berechnen einer inversen Dokumenthäufigkeit IDF, die als ein inverser
Wert der Zahl bestimmter Hypertext-Dokumente definiert ist, in denen
ein bestimmtes Wort erscheint, für
jedes bestimmte Wort, Berechnen eines Produkts TF*IDF einer Auftrittshäufigkeit
TF und einer inversen Dokumenthäufigkeit IDF,
Summieren mehrerer Produkte für
alle bestimmten Worte, um ein summiertes Produkt als einen geschätzten Wert
für jedes
bestimmte Hypertext-Dokument
zu erzeugen, Bestimmen mehrerer Bedeutungsgrade der vereinigten
bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen der
Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden für die vereinigten
bestimmten Hypertext-Dokumente, Vorbereiten eines Index eines bestimmten
Hypertext-Dokuments für
jedes der bestimmten Hypertext-Dokumente, Auswählen mehrerer Hypertext-Dokumente
mit hoher Rangfolge aus den bestimmten Hypertext-Dokumenten, Extrahieren
mehrerer zusammengehöriger
Worte, die in mehreren Wortlisten von Stücken einer Hypertext-Dokumentinformation der
Hypertext-Dokumenttabelle entsprechend den Hypertext-Dokumenten
mit hoher Rangfolge aufgelistet sind, Berechnen einer Auftrittshäufigkeit
TF eines zusammengehörigen
Wortes in einem Hypertext-Dokument mit hoher Rangfolge für jedes
zusammengehörige
Wort und jedes Hypertext-Dokument mit
hoher Rangfolge, Berechnen einer inversen Dokumenthäufigkeit
IDF, die als ein inverser Wert der Zahl von Hypertext-Dokumenten
mit hoher Rangfolge, in denen ein zusammengehöriges Wort erscheint, definiert
ist, für
jedes zusammengehörige
Wort, Berechnen einer Summe mehrerer Produkte TF*IDF für alle Hypertext-Dokumente
mit hoher Rangfolge, um ein summiertes Produkt als einen Bedeutungsgrad für jedes
zusammengehörige
Wort zu erzeugen, miteinander Vergleichen der Bedeutungsgrade der
zusammengehörigen
Worte, Auswählen
mehrerer zusam mengehöriger
Worte mit hoher Rangfolge, deren Bedeutungsgrade höher als
diejenigen anderer zusammengehöriger
Worte sind, und Erstellen bzw. Vorbereiten eines Hypertext-Mark-Up-Language-(HTML)-Dokuments,
in welchem mehrere Schaltflächen
zur Auswahl von Schlüsselworten
entsprechend den zusammengehörigen
Worten mit hoher Rangfolge in absteigender Reihenfolge der Bedeutungsgrade
der zusammengehörigen
Worte mit hoher Rangfolge angeordnet sind, um ein zusammengehöriges Wort
mit hoher Rangfolge durch Drücken einer
Schaltfläche
zur Auswahl von Schlüsselworten auszuwählen, und
eine
Wiederauffindungsergebnisse anzeigende Einheit 93 zum Anzeigen
der Indizes der bestimmten Hypertext-Dokumente in der nach Rangfolge
geordneten Reihenfolge, die in der Dokumentrangfolgen bestimmenden
Einheit 92 bestimmt wurde, als ein Wiederauffindungsergebnis
auf einem Ergebnisse anzeigenden Fenster W1 und Anzeigen des durch
die Dokumentrangfolgen bestimmende Einheit 92 vorbereiteten
bzw. erstellten HTML-Dokuments auf einem ein zusammengehöriges Wort
mit hoher Rangfolge auswählenden
Fenster W2.
-
Falls
die zehnte Ausführungsform
und die dritte Ausführungsform
kombiniert werden, werden, wie in 19 gezeigt
ist, in der obigen Konfiguration, wenn ein Schlüsselwort "apple" in die Schlüsselworteingabeeinheit 2 eingegeben
wird, mehrere Indizes bestimmter Hypertext-Dokumente wie der Dokumente
D83, D85 und D86 und mehrere Indizes von Stammdokumenten wie z.
B. der D80 und D81 beispielsweise auf dem Ergebnisse anzeigenden
Fenster W1 in der gleichen Weise wie in der dritten Ausführungsform
angezeigt. In der Dokumentrangfolgen bestimmenden Einheit 92 werden
danach aus den bestimmten Hypertext-Dokumenten zehn Hypertext-Dokumente
mit hoher Rangfolge ausgewählt, werden
mehrere zusammengehörige
Worte extrahiert, die in mehreren Wortlisten von Stücken einer Hypertext-Dokumentinformation
der Hypertext- Dokumenttabelle
entsprechend den Hypertext-Dokumenten mit hoher Rangfolge aufgelistet
sind, wird eine Summe mehrerer Produkte TF*IDF für alle Hypertext-Dokumente
mit hoher Rangfolge für
jedes zusammengehörige
Wort berechnet, und Bedeutungsgrade für die zusammengehörigen Worte
werden bestimmt. Danach werden aus den zusammengehörigen Worten
zehn zusammengehörige
Worte mit hoher Rangfolge "Shinshu", "farmer", "product", "Aomori", "manure", "farm", "festival", "Nebuta", "Nagano" und "Olympics" ausgewählt, wird
ein HTML-Dokument vorbereitet, in welchem zehn Schaltflächen zur Auswahl
von Schlüsselworten
entsprechend den zugehörigen
Worten mit hoher Rangfolge in absteigender Reihenfolge der Bedeutungsgrade
der zusammengehörigen
Worte mit hoher Rangfolge angeordnet sind, und das HTML-Dokument
wird auf dem zusammengehörige
Worte mit hoher Rangfolge auswählenden
Fenster W2 angezeigt.
-
Wenn
der Nutzer die Schaltfläche
für ein Schlüsselwort
drückt,
die dem zusammengehörigen Wort
mit hoher Rangfolge "Shinshu" entspricht, wird das
Wort "Shinshu", das einen Landkreis
mit Apfelanbau bezeichnet, als ein Schlüsselwort in die Schlüsselworteingabeeinheit 2 eingegeben,
werden Bedeutungsgrade mehrerer bestimmter Hypertext-Dokumente entsprechend
dem Schlüsselwort "Shinshu" bestimmt, und die
in der absteigenden Reihenfolge der Bedeutungsgrade angeordneten
bestimmten Hypertext-Dokumente werden auf dem Ergebnisse anzeigenden
Fenster W1 in der gleichen Weise wie in der ersten Ausführungsform
angezeigt.
-
Selbst
wenn der Nutzer anfangs sich an kein geeignetes Schlüsselwort
erinnern kann, kann demgemäß der Nutzer
ein oder mehrere Schlüsselworte auswählen, die
seinem Wiederauffindungsziel näher liegen.
Der Nutzer kann auch sein Wiederauffindungsziel ändern, indem er auf die zusammengehörigen Worte
mit hoher Rangfolge Bezug nimmt, und meh rere bestimmte Hypertext-Dokumente,
die einem neuen Schlüsselwort
entsprechen, das vom Nutzer gemäß einer
neuen Wiederauffindungsabsicht ausgewählt wurde, können angezeigt
werden.
-
In
diesem Fall kann der Nutzer die Schaltfläche zur Auswahl von Schlüsselworten
unter Verwendung einer Zeigervorrichtung ohne Verwendung einer Tastatur
drücken.
Die Schaltflächen
zur Auswahl von Schlüsselworten
werden auch verkörpert,
indem ein JAVA-Skript ausgeführt
wird, in welchem die zusammengehörigen
Worte mit hoher Rangfolge zu einem Textkasten addiert werden, eine
Schaltfläche "Löschen" kann verkörpert werden, indem ein JAVA-Skript
ausgeführt
wird, in welchem ein dem Textkasten hinzugefügtes zusammengehöriges Wort
mit hoher Rangfolge gelöscht
wird, eine Schaltfläche "Anfangsbedingung" wird verkörpert, indem
ein JAVA-Skript ausgeführt
wird, in welchem die dem Textkasten hinzugefügten zusammengehörigen Worte mit
hoher Rangfolge zu einer Anfangsgruppe von Schlüsselworten wie z. B. "apple" zurückgeführt werden,
und eine Schaltfläche "erneutes Wiederauffinden" wird verkörpert, indem
ein JAVA-Skript ausgeführt
wird, in welchem eine Wiederauffindungsoperation wieder ausgeführt wird,
indem ein oder mehrere Worte, die dem Textkasten hinzugefügt wurden,
als ein oder mehrere Schlüsselworte
verwendet werden.
-
In
dieser Ausführungsform
werden die Hypertext-Dokumente mit hoher Rangfolge aus den bestimmten
Hypertext-Dokumenten ausgewählt.
Es ist jedoch zweckmäßig, dass
die Hypertext-Dokumente mit hoher Rangfolge aus den bestimmten Hypertext-Dokumenten
und den Stammdokumenten ausgewählt
werden. In diesem Fall können
mehrere zusammengehörige
Worte aus mehreren Hypertext-Dokumenten mit einer Referenzbeziehung
untereinander weitgehend erfaßt
bzw. gesammelt werden.
-
Elfte Ausführungsform
-
In
der zehnten Ausführungsform
werden die Bedeutungsgrade der zusammengehörigen Worte ohne jegliche Verbindung
mit dem vom Nutzer zu Anfang eingegebenen Schlüsselwort bestimmt. Falls jedoch
der Nutzer ein zusammengehöriges
Wort mit einer engen Korrelation mit dem Schlüsselwort auswählen möchte, wird
bevorzugt, dass ein zusammengehöriges
Wort mit enger Korrelation mit einem Schlüsselwort als ein zusammengehöriges Wort
mit hoher Rangfolge vorzugsweise ausgewählt wird. In dieser Ausführungsform
wird daher eine Auftrittshäufigkeit
eines zusammengehörigen
Wortes mit einer engen Korrelation mit einem Schlüsselwort
verdoppelt, um einen Bedeutungsgrad des zusammengehörigen Wortes
zu erhöhen.
-
20 ist ein Blockdiagramm
einer Hypertext-Wiederauffindungsvorrichtung gemäß einer elften Ausführungsform
der vorliegenden Erfindung.
-
Wie
in 20 gezeigt ist, umfasst
eine Hypertext-Wiederauffindungsvorrichtung 101 zum Wiederauffinden
eines oder mehrerer Hypertext-Dokumente,
die eine Wiederauffindungsanforderung eines Nutzers wahrscheinlich
erfüllen,
aus einem großen Umfang
an Hypertext-Dokumenten, die in der Hypertext-Dokumente verwaltenden
Einheit 8 gespeichert sind, die Hypertext-Dokumenttabellen
mit Stammdokumentlisten vorbereitende Einheit 7, die Wiederauffindungsindizes
vorbereitende Einheit 6, die Schlüsselworteingabeeinheit 2,
die Wiederauffindungseinheit 3, eine Dokumentrangfolgen
bestimmte Einheit 102 zum Vereinigen eines bestimmten Hypertext-Dokuments
und eines oder mehrerer bestimmter Stammdokumente, die dem bestimmten
Hypertext-Dokument entsprechen, zu einem vereinigten bestimmten
Hypertext-Dokument gemäß der Dokumentinformation
der Hypertext-Dokumenttabelle, die von der Hyper text-Dokumenttabellen
mit Stammdokumentlisten vorbereitenden Einheit 7 vorbereitet wurde,
für jedes
der bestimmten Hypertext-Dokumente, die in der Wiederauffindungseinheit 3 erhalten
wurden, Berechnen einer Auftrittshäufigkeit TF eines bestimmten
Wortes in einem vereinigten bestimmten Hypertext-Dokument für jedes
bestimmte Wort und jedes vereinigte bestimmte Hypertext-Dokument,
Berechnen einer inversen Dokumenthäufigkeit IDF, die als ein inverser
Wert der Zahl bestimmter Hypertext-Dokumente definiert ist, in denen
ein bestimmtes Wort erscheint, für
jedes bestimmte Wort, Berechnen eines Produkts TF*IDF einer Auftrittshäufigkeit
TF und einer inversen Dokumenthäufigkeit IDF,
Summieren mehrerer Produkte für
alle bestimmten Worte, um ein summiertes Produkt als einen geschätzten Wert
für jedes
bestimmte Hypertext-Dokument zu erzeugen, Bestimmen mehrerer Bedeutungsgrade
der vereinigten bestimmten Hypertext-Dokumente gemäß den geschätzten Werten, Bestimmen
der Rangfolge der bestimmten Hypertext-Dokumente gemäß den Bedeutungsgraden
für die
vereinigten bestimmten Hypertext-Dokumente, Erstellen bzw. Vorbereiten
eines Index eines bestimmten Hypertext-Dokuments für jedes
der bestimmten Hypertext-Dokumente, Auswählen mehrerer Hypertext-Dokumente
mit hoher Rangfolge aus den bestimmten Hypertext-Dokumenten, Extrahieren mehrerer
zusammengehöriger
Worte, die in mehreren Wortlisten von Stücken einer Hypertext-Dokumentinformation
der Hypertext-Dokumenttabelle entsprechend den Hypertext-Dokumenten
mit hoher Rangfolge aufgelistet sind, Berechnen einer Auftrittshäufigkeit
TF eines zusammengehörigen
Wortes in einem Hypertext-Dokument mit hoher Rangfolge für jedes
zusammengehörige
Wort und jedes Hypertext-Dokument mit hoher Rangfolge unter der
Bedingung, dass das zusammengehörige
Wort doppelt gezählt
wird, wenn das zusammengehörige
Wort innerhalb einer Distanz von 40 Buchstaben von einem Schlüsselwort
platziert ist, Berechnen einer inversen Dokumenthäufigkeit
IDF, die als ein inverser Wert der Zahl von Hypertext- Dokumenten mit hoher
Rangfolge definiert ist, in denen ein zusammengehöriges Wort
erscheint, für
jedes zusammengehörige
Wort, Berechnen einer Summe mehrerer Produkte TF*IDF für alle Hypertext-Dokumente
mit hoher Rangfolge, um ein summiertes Produkt als einen Bedeutungsgrad
für jedes
zusammengehörige
Wort zu erzeugen, miteinander Vergleichen der Bedeutungsgrade der zusammengehörigen Worte,
Auswählen
mehrerer zusammengehöriger
Worte mit hoher Rangfolge, deren Bedeutungsgrade höher als
diejenigen anderer zusammengehöriger
Worte sind, und Vorbereiten bzw. Erstellen eines Hypertext-Mark-Up-Language-(HTML)-Dokuments,
in welchem mehrere, den zusammengehörigen Worten mit hoher Rangfolge entsprechende
Schaltflächen
zur Auswahl von Schlüsselworten
in der absteigenden Reihenfolge der Bedeutungsgrade der zusammengehörigen Worte
mit hoher Rangfolge angeordnet sind, um durch Drücken einer Schaltfläche zur
Auswahl von Schlüsselworten
ein zusammengehöriges
Wort mit hoher Rangfolge auszuwählen,
und eine Wiederauffindungsergebnisse anzeigende Einheit 103 zum
Anzeigen der Indizes der bestimmten Hypertext-Dokumente in der nach
Rangfolge geordneten Reihenfolge, die in der Dokumentrangfolgen
bestimmenden Einheit 92 bestimmt wurde, als ein Wiederauffindungsergebnis
auf einem Ergebnisse anzeigenden Fenster W1 und Anzeigen des durch
die Dokumentrangfolgen bestimmende Einheit 102 vorbereiteten bzw.
erstellten HTML-Dokuments auf einem zusammengehörige Worte mit hoher Rangfolge
auswählenden
Fenster W2.
-
Nachdem
die zusammengehörigen
Worte in der gleichen Weise wie in der zehnten Ausführungsform
extrahiert sind, wird in der obigen Konfiguration eine Auftrittshäufigkeit
TF eines zusammengehörigen
Wortes in einem Hypertext-Dokument mit hoher Rangfolge für jedes
zusammengehörige
Wort und jedes Hypertext-Dokument mit hoher Rangfolge berechnet.
Wenn das zusammengehörige
Wort innerhalb einer Distanz von 40 Buch staben von einem Schlüsselwort "apple" platziert ist, wird
in diesem Fall das zusammengehörige
Wort doppelt gezählt.
Da das zusammengehörige
Wort "Shinshu", das einen Landkreis
mit Apfelanbau bezeichnet, oder das zusammengehörige Wort "farmer" oft innerhalb einer Distanz von 40
Buchstaben von einem Schlüsselwort "apple" erscheint und weil
das zusammengehörige Wort "Nagano", das einen Amtsbezirk
mit Apfelanbau bezeichnet, oder das zusammengehörige Wort "Olympics", das ein in Nagano 1998 abgehaltenes Festival
bezeichnet, kaum innerhalb einer Distanz von 40 Buchstaben von einem
Schlüsselwort "apple" erscheint, werden,
wie in 21 gezeigt ist,
die zusammengehörigen
Worte "Shinshu" und "farmer" auf dem Kopfabschnitt
des zusammengehörige
Worte mit hoher Rangfolge auswählenden
Fensters W2 zuverlässig
angezeigt, und die zusammengehörigen Worte "Nagano" und "Olympics" werden auf dem hinteren
Abschnitt des zusammengehörige
Worte mit hoher Rangfolge auswählenden
Fensters W2 angezeigt, selbst wenn die zusammengehörigen Worte "Nagano" und "Olympics" in den bestimmten
Hypertext-Dokumenten
häufig
erscheinen.
-
Ein
oder mehrere zusammengehörige
Worte mit einer starken Beziehung mit dem Schlüsselwort können demgemäß in Positionen mit hoher Rangfolge
angezeigt werden, und ein oder mehrere zusammengehörige Worte,
die einem Wiederauffindungsziel eines Nutzers entsprechen, das von
dem anfänglichen
Wiederauffindungsziel verschieden ist, können in Positionen mit niedriger
Rangfolge angezeigt werden.
-
Nachdem
die Prinzipien der vorliegenden Erfindung in deren bevorzugter Ausführungsform
veranschaulicht und beschrieben wurden, sollte dem Fachmann ohne
weiteres ersichtlich sein, dass die Erfindung in Aufbau und Einzelheiten
abgewandelt werden kann, ohne von solchen Prinzipien abzuweichen.
Wir beanspruchen alle Modifikationen, die in den Umfang der beiliegenden
Ansprüche
fallen.