DE69931256T2 - Verfahren und system zum zurückholen einer elektronischen akte - Google Patents

Verfahren und system zum zurückholen einer elektronischen akte Download PDF

Info

Publication number
DE69931256T2
DE69931256T2 DE69931256T DE69931256T DE69931256T2 DE 69931256 T2 DE69931256 T2 DE 69931256T2 DE 69931256 T DE69931256 T DE 69931256T DE 69931256 T DE69931256 T DE 69931256T DE 69931256 T2 DE69931256 T2 DE 69931256T2
Authority
DE
Germany
Prior art keywords
document
documents
stored
keywords
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69931256T
Other languages
English (en)
Other versions
DE69931256D1 (de
Inventor
Reima Terho NIEMI
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of DE69931256D1 publication Critical patent/DE69931256D1/de
Application granted granted Critical
Publication of DE69931256T2 publication Critical patent/DE69931256T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Description

  • Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft ein Verfahren und System zum Auffinden elektronischer Dateien und insbesondere ein Verfahren und System, das es einem Benutzer eines Computersystems ermöglicht, bereits bearbeitete Dateien wieder aufzufinden, die für eine Datei relevant sind, die gegenwärtig von dem Benutzer betrachtet wird.
  • Allgemeiner Stand der Technik
  • Vor dem Hintergrund des jüngsten dramatischen Anstiegs an Computerspeicherplatz, der Benutzern von Personal Computern (PCs) zur Verfügung steht, haben die Benutzer nunmehr die Möglichkeit, gewaltige Archive persönlicher Dokumente zu erzeugen. Hinzu kommt die Möglichkeit, Dokumente über das World Wide Web (WWW, Internet) aufzufinden, was eine nahezu unbegrenzte Informationsquelle bereitstellt. Während diese Entwicklungen das einem PC-Benutzer zur Verfügung stehende Wissen enorm vergrößern, ist es oft nicht leicht für den Benutzer, Informationen zu lokalisieren, die für eine gegenwärtige Aufgabe relevant sind.
  • Es wurden komplizierte Suchmaschinen entwickelt, um es WWW-Benutzern zu ermöglichen, im Internet zu „surfen". Diese Maschinen, beispielsweise AltavistaTM, funktionieren im Allgemeinen so, dass sie in erschöpfendem Umfang Wörter von im Internet veröffentlichten Webseiten extrahieren. Dann werden einer Datenbank neben den entsprechenden Worteinträgen Links auf diese Seiten hinzugefügt. Es wurden auch Suchalgorithmen zum Suchen von Dokumenten entwickelt, die beispielsweise auf der Festplatte eines PCs gespeichert sind. Auch diese neigen dazu, eine erschöpfende Suche der gespeicherten Dokumente nach einem benutzerdefinierten Stichwort durchzuführen.
  • Dokument EP 810 534 A2 offenbart das Anzeigen eines Dokuments zusammen mit einem Steuerelement, das es dem Benutzer ermöglicht, Zugang zu einem elektronischen Wörterbuch anzufordern. Fordert der Benutzer Zugang zum Wörterbuch an, so wird das elektronische Dokument modifiziert, indem Informationen zu Hypertextlinks bereitgestellt werden, die auf Einträge im elektronischen Wörterbuch verweisen, um Wörter in dem Wörterbuch nachzuschlagen.
  • Dokument EP 778 534 A1 offenbart ein Kommentierungssystem zum automatischen Hinzufügen von Querverweisen auf andere Dokumente zu angeforderten Dokumenten. Das System umfasst ein Verzeichnis von Querverweisen auf Dokumente, das aufgebaut wird, indem Links zwischen bestimmten Begriffen, die in dem Dokument vorkommen, und querverlinkte Verweise innerhalb dieses Dokuments und/oder allgemein zwischen einer Dokumentenquelle und einer anderen Dokumentenquelle identifiziert werden.
  • Kurzdarstellung der vorliegenden Erfindung
  • Es ist eine Aufgabe der vorliegenden Erfindung, ein Verfahren und System bereitzustellen, das in der Lage ist, elektronische Dokumente oder Dateien zu identifizieren, die für ein anderes Dokument relevant sind, das aus einem Datennetzwerk herunter geladen wird, und direkt oder indirekt Links zu diesen relevanten Dokumenten in das heruntergeladene Dokument einzubauen.
  • Gemäß einem ersten Aspekt der Erfindung der vorliegenden Erfindung wird ein Verfahren zum Betreiben eines Computersystems bereitgestellt, wobei das Computersystem mit einem Datennetzwerk verbunden ist und ein Display und eine Datenbank, in der eine Gruppe von Dokumenten und/oder Dokumentkennungen gespeichert ist, umfasst, wobei das Verfahren folgende Schritte umfasst:
    • – das Herunterladen eines elektronischen Dokuments in das Computersystem über das Datennetzwerk, wobei das Dokument in Form eines computerlesbaren Codes vorliegt,
    • – das Identifizieren von Stichwörtern im heruntergeladenen Dokument,
    • – das Modifizieren des computerlesbaren Codes solcherart, dass er Hyperlinks enthält, um dem Benutzer den Link zu Dokumenten zu ermöglichen, die in der Datenbank gespeichert oder mit einer Kennung versehen sind und mindestens eines der Stichwörter enthalten, und
    • – das Anzeigen des heruntergeladenen Dokuments auf dem Display des Computersystems, wo die eingeführten Hyperlinks als vom Benutzer auswählbare Elemente erscheinen, wobei das Verfahren dadurch gekennzeichnet ist, dass
    • – der Schritt des Identifizierens von Stichwörtern das Erstellen einer globalen Stichwortliste durch das Analysieren der Worthäufigkeitsverteilung über die Dokumente und das Identifizieren derjenigen globalen Stichwörter umfasst, die in dem heruntergeladenen Dokument vorliegen,
    • – das Bestimmen, welche der gespeicherten und/oder mit einer Kennung versehenen Dokumente das entsprechende Stichwort enthalten,
    • – das Bestimmen des Ähnlichkeits-/Unähnlichkeitskoeffizienten für mindestens eines der gespeicherten oder mit einer Kennung versehenen Dokumente im Vergleich zum heruntergeladenen Dokument, und
    • – das Anzeigen einer Liste von mindestens einem gespeicherten und/oder mit einer Kennung versehenen Dokument zusammen mit dem Ähnlichkeits-/Unähnlichkeitskoeffizienten.
  • Vorzugsweise umfasst der Schritt des Modifizierens des computerlesbaren Codes das Erstellen eines Hyperlinks für jedes identifizierte Stichwort. Insbesondere umfasst das Verfahren ferner nach dem Schritt des Identifizierens der globalen Stichwörter in dem heruntergeladenen Dokument folgenden weiteren Schritt:
    • – das Aktivieren eines der eingeführten Hyperlinks.
  • Vorzugsweise umfasst die angezeigte Liste Hyperlinks zu den aufgelisteten Dokumenten.
  • Vorzugsweise sind die Hyperlinks durch Hervorhebung der in dem heruntergeladenen Dokument identifizierten Stichwörter angezeigt, z.B. durch Verwendung einer anderen Farbe, Unterstreichen oder Kursivschrift. Links können auch als spezielle Druckzeichen angezeigt werden, Z.B. ".", "!", "?".
  • Vorzugsweise handelt es sich bei dem computerlesbaren Code um Hyper Text Markup Language (HTML), in welchem Fall die Schritte des Herunterladens und Anzeigens von einem Webbrowser durchgeführt werden.
  • Vorzugsweise ist das Datennetzwerk, über das das elektronische Dokument heruntergeladen wird, das World Wide Web. Der Schritt des Anzeigens des heruntergeladenen Dokuments (mit hinzugefügten Links) kann das Interpretieren des Dokuments mit einem Internetbrowser umfassen.
  • Die Dokumentkennungen können ein Dokumenttitel, ein Computerlaufwerkpfad oder ein Universal Source Locator (URL) auf eine Internetseite oder eine Kombination aus diesen sein. Bei den Dokumenten, die zum Aufbau der Datenbank benutzt werden, kann es sich um Webseiten, Textverarbeitungsdokumente und elektronische Post handeln.
  • Gemäß einem zweiten Aspekt der Erfindung wird ein programmiertes Computersystem bereitgestellt, das Folgendes umfasst:
    • – Kommunikationsmittel, das mit einem Datennetzwerk zum Herunterladen eines elektronischen Dokuments über das Datennetzwerk gekoppelt ist, wobei das Dokument in Form eines computerlesbaren Codes vorliegt,
    • – eine elektronische Datenbank, die eine Gruppe von Dokument und/oder Dokumentkennungen speichert,
    • – erste Verarbeitungsmittel, die zum Identifizieren von Stichwörtern in dem heruntergeladenen Dokument angeordnet sind,
    • – ein zweites Verarbeitungsmittel, das zum Modifizieren des computerlesbaren Codes angeordnet ist, um Hyperlinks darin einzufügen, um es einem Benutzer zu ermöglichen, auf Dokumente, die in der Datenbank gespeichert oder mit einer Kennung versehen sind und mindestens eines der Stichwörter enthalten, zuzugreifen, und
    • – ein Display des Computersystems und Displaytreibermittel, die angeordnet sind, um das heruntergeladene Dokument in einer Form anzuzeigen, in der die eingefügten Hyperlinks als vom Benutzer auswählbare Elemente erscheinen, wobei das Computersystem dadurch gekennzeichnet ist, dass
    • – das zweite Verarbeitungsmittel im Gebrauch angeordnet ist, um Stichwörter zu identifizieren, indem es eine globale Stichwortliste durch das Analysieren der Worthäufigkeitsverteilung über die Dokumente erstellt, und um diejenigen globalen Stichwörter, die in dem heruntergeladenen Dokument vorliegen, zu identifizieren,
    • – das zweite Verarbeitungsmittel angeordnet ist, um zu bestimmen, welche der gespeicherten und/oder mit einer Kennung versehenen Dokumente das entsprechende Stichwort enthalten,
    • – das zweite Verarbeitungsmittel angeordnet ist, um einen Ähnlichkeits-/Unähnlichkeitskoeffizienten für mindestens eines der gespeicherten oder mit einer Kennung versehenen Dokumente im Vergleich zum heruntergeladenen Dokument zu bestimmen, und
    • – das Display des Computersystems angeordnet ist, um eine Liste von mindestens einem gespeicherten und/oder mit einer Kennung versehenen Dokument zusammen mit dem Ähnlichkeits-/Unähnlichkeitskoeffizienten anzuzeigen.
  • In bestimmten Ausführungsformen des zweiten Aspekts der Erfindung ist das Computersystem durch einen in geeigneter Weise programmierten Computer geschaffen, in dem das Kommunikationsmittel ein Datenmodem des Computers und das erste und das zweite Verarbeitungsmittel einen Mikroprozessor oder einen digitalen Signalprozessor umfassen.
  • In anderen Ausführungsformen der Erfindung umfasst das System einen Personal Computer, der an ein lokales Netzwerk angeschlossen ist, das über einen Router mit dem WWW gekoppelt ist. Die Datenbank und des erste und zweite Verarbeitungsmittel können in dem PC oder in einem zweiten Computer geschaffen sein, der ebenfalls an das lokale Netzwerk angeschlossen und über andere PCs zugänglich ist. Alternativ können die Datenbank und das erste und zweite Verarbeitungsmittel in den PC und in einen oder mehrere andere Computer des lokalen Netzwerks kopiert sein, um eine Hierarchie von „Wissens"-Servern bereitzustellen.
  • Gemäß einem dritten Aspekt der vorliegenden Erfindung wird ein Computerprogramm, das in einem computerlesbaren Medium ausgeführt ist, zum Betreiben eines Computersystems bereitgestellt, wobei das Computersystem an ein Netzwerk angeschlossen ist und ein Display, eine Datenbank, in der eine Gruppe von Dokumenten und/oder Dokumentkennungen gespeichert ist, umfasst, wobei das Computerprogramm eingerichtet ist, folgende Schritte durchzuführen, wenn es auf dem Datenverarbeitungsgerät ausgeführt wird:
    • – das Einrichten einer Datenbank, in der eine Gruppe von Dokumenten und/oder Dokumentkennungen gespeichert ist,
    • – das Herunterladen eines elektronischen Dokuments in das Computersystem über ein Datennetzwerk, wobei das Dokument in einem computerlesbaren Code vorliegt,
    • – das Identifizieren von Stichwörtern im heruntergeladenen Dokument,
    • – das Modifizieren des computerlesbaren Codes solcherart, dass er Hyperlinks enthält, um dem Benutzer den Link zu Dokumenten zu ermöglichen, die in der Datenbank gespeichert oder mit einer Kennung versehen sind und mindestens eines der Stichwörter enthalten, und
    • – das Anzeigen des heruntergeladenen Dokuments auf dem Display des Computersystems, wo die eingefügten Hyperlinks als vom Benutzer auswählbare Elemente erscheinen, dadurch gekennzeichnet, dass das Computerprogramm ferner eingerichtet ist, die folgenden Schritte durchzuführen, wenn es auf dem Datenverarbeitungsgerät ausgeführt wird:
    • – das Identifizieren von Stichwörtern, indem durch das Analysieren der Worthäufigkeitsverteilung über die Dokumente eine globale Stichwortliste erstellt wird, und das Identifizieren derjenigen globalen Stichwörter, die in dem heruntergeladenen Dokument vorliegen,
    • – das Bestimmen, welche der gespeicherten und/oder mit einer Kennung versehenen Dokumente das entsprechende Stichwort enthalten,
    • – das Bestimmen des Ähnlichkeits-/Unähnlichkeitskoeffizienten für mindestens eines der gespeicherten oder mit einer Kennung versehenen Dokumente im Vergleich zum heruntergeladenen Dokument, und
    • – das Anzeigen einer Liste von mindestens einem gespeicherten und/oder mit einer Kennung versehenen Dokument zusammen mit dem Ähnlichkeits-/Unähnlichkeitskoeffizienten.
  • Zum besseren Verständnis der vorliegenden Erfindung und um zu zeigen, wie dieselbe umgesetzt werden kann, wird nunmehr als Beispiel auf die zugehörigen Zeichnungen verwiesen, in denen:
  • 1 schematisch einen Computer zeigt, der mit dem WWW verbunden und so angeordnet ist, dass er eine Wissensdatenbank aufbaut und benutzt; und
  • 2 eine angezeigte Webseite mit während der Übertragung hinzugefügten Hyperlinks zeigt.
  • Detaillierte Beschreibung bestimmter Ausführungsformen
  • Mit Bezug auf 1 ist ein Personal Computer (PC) 1 funktional dargestellt und wird allgemein mit dem Bezugszeichen 1 gekennzeichnet. Der PC 1 weist ein Modem 2 auf, das es dem PC 1 ermöglicht, mit einer Telefonleitung 3 und über die Telefonleitung mit dem WWW 4 verbunden zu werden. Es versteht sich, dass diese Verbindung zusätzlich einen Internet-Dienstanbieter (ISP – Internet Service Provider) umfassen kann, obwohl dieser in der Figur nicht dargestellt ist. Es wird auch verstanden werden, dass der PC 1 alternativ über ein lokales Netzwerk (LAN – Local Area Network) mit eigenem Netzwerkzugangsserver (NAS – Network Access Server) mit dem WWW 4 verbunden sein kann.
  • Durch ein Computerprogramm, das in einem Speicher des PC 1 gespeichert und von einem PRozessor ausgeführt wird, ist der PC 1 mit einem Internetbrowser 5 versehen. Dies kann ein herkömmlicher Browser wie der Microsoft Internet ExplorerTM oder der Netscape NavigatorTM sein, der aber auf jeden Fall in der Lage ist, über das Modem 2 und unter Verwendung von http oder einem anderen geeigneten Internetprotokoll sowie eines Universal Source Locator (URL) oder einer ähnlichen Kennung (z.B. Ressourcename), die die Seite kennzeichnen, im WWW 4 eine Webseite anzufordern und abzufragen.
  • Wie bereits bekannt ist, benutzt das Internet eine spezielle Programmiersprache bzw. einen Code, die/der als Hyper Text Markup Language (HTML) bekannt ist, um Webseiten zu codieren, und der Internetbrowser ist in der Lage, diesen Code zu interpretieren und eine empfangene Seite auf einem Display 6 einer Benutzerschnittstelle 7 des PCs 1 anzeigen zu lassen. Mit Hilfe von HTML können sogenannte „Hyperlinks" in eine Webseite eingebaut werden. Hyperlinks sind Elemente einer Webseite, z.B. Legenden, Wörter, Bilder usw., die der Benutzer mit Hilfe einer Computermaus auswählen kann. Durch das Auswählen eines Hyperlinks wird normalerweise der Browser 5 dazu veranlasst, eine weitere Webseite aus dem WWW 4 herunterzuladen, wobei diese Seite in dem ursprünglich empfangenen HTML mit einer URL gekennzeichnet ist, die zu diesem konkreten Hyperlink gehört.
  • 1 zeigt ein zusätzliches Software-/Hardware-Modul 8, das funktionell zwischen dem Webbrowser 5 und dem Modem 2 angeordnet ist. Das Modul kann durch geeignete Programmierung der CPU des PC 1 oder mit Hilfe eines DSP oder derartigem installiert werden. Das Modul 8 umfasst einen Server 9, der mit dem Internetbrowser über TCP/IP kommuniziert. In dem Fall, dass der Benutzer durch das Eingeben einer URL das Herunterladen einer Webseite vom WWW 4 anfordert, wird diese Aufforderung durch den Server 9 (der als Proxy-Server dient) zum WWW übertragen. Bei dem Übertragen der Anforderung gibt der Proxy-Server 9 die URL auch an eine Speichersteuerungsfunktion 10 weiter, die die URL in einem dazugehörigen Speicherblock 11 speichert.
  • Wenn die angeforderte Webseite vom WWW 4 zurückgesendet wird, wird die Seite von dem Modul 8 (auf der Grundlage der gespeicherten URL) abgefangen und durch die Speichersteuerungsfunktion 10 temporär in dem Speicherblock 11 gespeichert. Bevor die Seite zum Internetbrowser 5 weitergeleitet wird, damit dieser sie anzeigt, wird die Seite wie unten beschrieben in dem Speicherblock 11 modifiziert. Zunächst jedoch ist es nötig, die Struktur und Funktion einer Stichwortdatenbank zu erläutern, die in einem Speicherblock gespeichert ist, der in 1 mit Bezugszeichen 12 gekennzeichnet ist.
  • Die Datenbank 12 enthält eine „Wort"-Tabelle, die in ihrer ersten Spalte jeden Wortstamm speichert, der in mindestens einem der bereits analysierten Dokumente (in diesem Beispiel bereits heruntergeladene Webseiten) erscheinen. Beispielsweise werden die Wörter „produce", „produced", „produces", „producing" usw. in der Tabelle durch einen einzigen Stamm „produc" dargestellt (ein geeigneter Algorithmus zur „Wortstammbildung" ist beschrieben in „Development of a Stemming Algorithm", Julie Beth Lovins, Mechanical Translation and Computational Linguistics, 11, 22–32, 1968). Für jedes Wort (Wortstamm) wird die Anzahl der Dokumente, in denen das Wort 0mal auftritt, in Spalte 2 eingetragen, die Anzahl der Dokumente, in denen das Wort 1mal auftritt, wird in Spalte 3 eingetragen usw. Dies illustriert die Tabelle 1 unten, aus der ersichtlich ist, dass das Wort Nr. 3 in 45 Dokumenten 0mal auftritt, in einem Dokument 1mal usw.
  • Mit Hilfe der Informationen, die in der oben genannten Tabelle enthalten sind, ist es möglich festzustellen, welches der aufgelisteten Wörter wahrscheinlich ein Stichwort ist. Dieser Vorgang ist in zwei Artikeln beschrieben mit dem Titel „A Probabilistic Approach to Automatic Keyword Indexing", Teil I, Journal of the American Society for Information Science, Juli – August 1975, S. 197–206; Teil II, Journal of the American Society for Information Science, September – Oktober 1975, S. 280–289. Kurz umrissen geht es in diesem Vorgang darum, für jedes aufgelistete Wort die Poisson-Verteilung der Häufigkeit der Nennung zu bestimmen und Die Abweichung zwischen der tatsächlichen Verteilung und der Poisson-Verteilung zu bestimmen. Dann wird eine Konstante festgelegt, und Wörter, bei denen Die Abweichung geringer ist als diese Konstante, werden als Stichwörter identifiziert. Diejenigen aufgelisteten Wörter, die als Stichwörter identifiziert werden, werden in einer zusätzlichen Spalte der oben genannten Tabelle durch eine Stichwortflagge gekennzeichnet, die auf 1 eingestellt ist, wenn das Wort ein Stichwort ist, und auf 0, wenn das Wort kein Stichwort ist. Diese Stichwörter sind global in dem Sinne, dass sie auf der Grundlage aller analysierten Dokumente abgeleitet sind.
  • Die Datenbank 12 enthält eine zweite Tabelle, die als die „Dokument"-Tabelle bezeichnet wird. Diese Tabelle enthält für jedes untersuchte Dokument die Anzahl des Auftretens jedes Wortes zusammen mit der URL, die das Dokument kennzeichnet. Ein Beispiel einer solchen Tabelle ist unten in Tabelle 2 dargestellt, aus der ersichtlich ist, dass das Dokument 2 ein Wort Nr. 1 1mal enthält, ein Wort Nr. 2 23mal usw.
  • Es versteht sich, dass, wenn das System zum ersten Mal gestartet wird, die Wort- und die Dokumenttabelle leer sein können. Die Tabellen werden dann aufgebaut, während das System genutzt wird. Es ist natürlich möglich, Tabellen auf der Grundlage einer Anzahl repräsentativer Dokumente vorzuinstallieren.
  • Zurück zu der heruntergeladenen Webseite, die temporär im Speicherblock 11 gespeichert ist, versteht es sich, dass diese Seite typischerweise in HTML vorliegt und sehr wahrscheinlich mehrere Textpassagen enthält. Dieser Text wird durch die Textanalysefunktion 13 extrahiert, und die in der Datenbank 12 gespeicherte Worttabelle wird auf der Grundlage des extrahierten Textes aktualisiert. Die Dokumenttabelle wird in ähnlicher Weise aktualisiert. Auf der Grundlage der aktualisierten Worttabelle wird die Stichwortliste verfeinert (und die Stichwortflaggen entsprechend eingestellt).
  • Dann durchsucht die Textanalysefunktion 13 den Text, der in der heruntergeladenen Webseite enthalten ist, um die darin vorliegenden Stichworte zu identifizieren. Wird ein Stichwort identifiziert, modifiziert die Funktion 13 „während der Übertragung" den HTML-Code, der in dem Puffer enthalten ist, so, dass ein dazugehöriger Hyperlink (dessen Funktion nachfolgend erklärt ist) eingefügt wird. Die folgende HTML-Auflistung zeigt eine heruntergeladene Webseite, die die Stichworte „TeamWARE TM, „Internet", „desktop" und „agents" enthält und in der hinzugefügte Hyperlinks unterstrichen dargestellt sind (diese Seite enthielt ursprünglich keine Hyperlinks).
  • Figure 00150001
  • Nach Modifizierung des HTML-Codes während der Übertragung wird die Webseite vom Speicherblock 11 über die Speichersteuerungsfunktion 10 und den Server 9 zum Webbrowser 5 zurückgeschickt. 2 zeigt die dem oben stehenden Code entsprechende Webseite, wie sie vom Webbrowser 5 angezeigt wird. Die hinzugefügten Hyperlinks sind nun unterstrichen dargestellt, obschon es sich (aus oben stehendem Code) versteht, dass diese in einer farbigen Darstellung grün erscheinen.
  • Nun angenommen, der Benutzer möchte Dokumente auffinden, die mit der heruntergeladenen Seite im Zusammenhang stehen, und insbesondere über das Wort „Internet" miteinander im Zusammenhang stehen. Durch Klicken auf einen der „Internet"-Hyperlinks, die der Webseite hinzugefügt sind, veranlasst der Benutzer den Webbrowser 5, von dem Server 9 (der als Webserver wirkt) die Inhalte der URL „http://niemi_terho/page-62/word-29329/default" abzurufen. Die in dieser URL enthaltene Kennung „default" veranlasst den Webserver 9, eine Anwendung 14 zu starten, die als zur Laufzeit linkbare Bibliothek (DLL – Dynamic Linkable Library) bezeichnet wird und die den Webserver 9 mit der Datenbank 12 verlinkt.
  • Die URL-Wortkennung, in diesem Fall „word-29329" kennzeichnet für die Datenbank 12 das Stichwort „Internet" in der Worttabelle, während die Seitenkennung, „page-62", das Quelldokument, d.h. die heruntergeladene Webseite, in der Dokumenttabelle kennzeichnet. Die Datenbank 12 identifiziert zuerst alle in ihr mit einer Kennung versehenen Dokumente, die das Stichwort „Internet" enthalten. Dann wird für jedes oder für einige der mit einer Kennung versehenen Dokumente ein Unähnlichkeitskoeffizient, bezogen auf das Quelldokument, berechnet wie folgt.
  • Angenommen, es werden acht Dokumente (1 bis 8) identifiziert, die das Wort „Internet" enthalten, und jedes dieser Dokumente enthält einen oder mehrere komplette Sätze aufgelisteter Stichwörter (I bis P, wobei I das Stichwort „Internet" darstellt). Wenn „Ref" das heruntergeladene Dokument ist (d.h. „page-62"), dann kann diese Information grafisch wie in Tabelle 3 unten dargestellt werden.
  • Der Unähnlichkeitskoeffizient für ein identifiziertes Dokument wird wie folgt berechnet:
    Figure 00170001
    wobei X für den Satz Stichwörter steht, der im Dokument Ref enthalten ist, Y für den Satz Stichwörter steht, der im betreffenden gekennzeichneten Dokument enthalten ist, und XΔY = (XχY) – (X1Y). So ist beispielsweise im Falle des Dokuments 1 der Zähler in der oben stehenden Gleichung gleich 3 (d.h. 6 gemeinsame Stichwörter minus 3 nicht gemeinsame Stickwörter), während der Zähler gleich 9 ist, was einen Unähnlichkeitskoeffizienten von 0,333 oder 33,3 % ergibt.
  • Die DLL 14 schickt von der Datenbank 12 die URLs der identifizierten Seiten zusammen mit dem entsprechenden Unähnlichkeitskoeffizienten an den Webserver 9 und den Webbrowser 5 zurück. Diese Seiten werden dem Benutzer als eine Liste von Hyperlinks angezeigt. Angenommen, der Benutzer wählt einen solchen Hyperlink aus, so veranlasst der Webbrowser 5, dass die ausgewählte Webseite über das WWW 4 heruntergeladen und auf dem Display 6 angezeigt wird.
  • Um zu verhindern, dass gewöhnliche Wörter wie „der", „und" als Stichwörter gekennzeichnet werden, kann eine STOP-Liste erstellt werden, die Wörter enthält, die nicht in der Worttabelle enthalten sein können. Um jedoch erhöhte Flexibilität zu schaffen, wird es bevorzugt, wenn die Worttabelle einen „Laufzeit"-Wert für ein Stichwort enthält, der eine Anzahl von Tagen darstellt.
  • Ist die Laufzeit negativ, kann ein Wort nicht zu einem Stichwort werden, bis der Laufzeitwert 0 erreicht. So kann beispielsweise die Laufzeit des Wortes „und" auf –1.000.000 Tage eingestellt werden, so dass es praktisch nie zu einem Stichwort werden kann. Für ein Wort wie „Computer", das tendenziell ein wenig markanter ist, kann die Laufzeit auf –30 Tage eingestellt werden. Man kann erwarten, dass nach einer Frist von 30 Tagen das System genügend „gelernt" hat, um festzustellen, ob der Begriff „Computer" tatsächlich ein relevantes Stichwort ist oder nicht.
  • Andererseits kann die Laufzeit positiv sein, so dass ein Benutzer ein Wort zwingend für einen festgelegten Zeitraum auf die Stichwortliste setzt. Wenn sich beispielsweise ein Benutzer gegenwärtig für Themen im Zusammenhang mit dem Internet interessiert, könnte die Laufzeit des Wortes „Internet" als +30 Tage definiert werden. So würde „Internet" 30 Tage lang als Stichwort geführt, wonach seine Beibehaltung von dem oben beschriebenen Stichwortbestimmungsprozess abhängt.
  • Der oben beschriebene Prozess kann einfach modifiziert werden, um es dem Benutzer zu ermöglichen, Webseiten zu identifizieren, die mit einer heruntergeladenen Webseite durch etwas anderes als herkömmliche Stichwörter in Zusammenhang stehen. Beispielsweise kann der Zusammenhang auf der Basis von Namen, Daten oder Aufgaben hergestellt sein, oder auf der Basis einer Kombination aus diesen.
  • Der Prozess kann auch ausgeweitet werden, um eine Hierarchie von „Wissensservern" bereitzustellen, die eine Kette zwischen dem WWW 4 und der Endbenutzerschnittstelle 7 bilden, wobei jeder Server mit einem Modul 8 ausgestattet ist. Server, die in der Kette weiter oben stehen, werden tendenziell einer Anzahl verschiedener PCs 1 zuarbeiten. Beispielsweise kann ein Firmenwissensserver und ein Gruppenwissensserver zwischen dem Endbenutzer-PC 1 und dem WWW bereitgestellt sein, in welchem Fall der Firmenserver Stichwörter aus den Webseiten sammelt, die zu allen Benutzern der Firma heruntergeladen werden, während der Gruppenserver Stichwörter aus den Webseiten sammelt, die nur zu Mitgliedern einer bestimmten Gruppe heruntergeladen werden.
  • Es ist auch möglich, den Prozess so zu erweitern, dass in die Datenbank Details von elektronischen Dateien aufgenommen werden, die keine Webseiten sind. Beispielsweise können Stichwörter in Dateien, die von Textverarbeitungsprogrammen erzeugt wurden, oder in elektronischer Post, die vom PC 1 versendet oder empfangen wird, identifiziert werden. Der Ort (d.h. der Pfad) dieser Dateien könnte dann als Dateilink in der Datenbank 10 gespeichert werden. Im Falle elektronischer Post kann die Funktion des Webbrowsers 5 durch einen E-Mail-„Client" wie etwa Microsoft Outlook ExpressTM ersetzt sein. Typischerweise verbindet sich dann der Client über das Modul 8 mit einem Mailserver.
  • Der Fachmann wird verstehen, dass an den oben beschriebenen Ausführungsformen Modifizierungen vorgenommen werden können, ohne den Geltungsbereich der vorliegenden Erfindung zu verlassen. Insbesondere kann bei der Berechnung des Unähnlichkeitskoeffizienten zwischen einem heruntergeladenen Dokument und einem bereits archivierten Dokument die Anzahl der Nennungen eines Stichwortes in den Dokumenten berücksichtigt werden. Beispielsweise kann die Tabelle 3 so modifiziert werden, dass die
    Figure 00200001
    durch die Anzahl der Nennungen eines gegebenen Stichworts in einem gegebenen Dokument ersetzt werden. Die oben beschriebene Gleichung zur Berechnung des Unähnlichkeitskoeffizienten wird durch eine neue Gleichung ersetzt, in der der Zähler für die Summe der absoluten Differenz für jedes Stichwort steht, während der Nenner für die Gesamtanzahl von Stichwörtern in den beiden verglichenen Dokumenten steht.
  • Betrachtet man beispielsweise Tabelle 3, sei angenommen, die Stichwörter I, J, K und L tauchen 2–, 3–, 1– bzw. 4mal in Dokument 1 auf, während die Stichwörter I, J, L, M und O 1-, 3-, 2-, 4- bzw. 2mal in Dokument Ref erscheinen. Der Zähler des Unähnlichkeitskoeffizienten ist gegeben durch: |2-1| + |3-3| + |1-0| + |4-2| + |0-4| + |0-2| = 10,während der Nenner gegeben ist durch: (2 + 3 + 1 + 4) + (1 + 3 + 2 + 4 + 2) = 22,so dass der Unähnlichkeitskoeffizient 45,5 % beträgt.
  • Die Berechnung des Unähnlichkeitskoeffizienten kann ferner so modifiziert werden, dass die Dokumentlänge berücksichtigt wird. Beispielsweise kann die Anzahl der Nennungen eines Stichwortes in einem Dokument mit Hilfe eines Vereinheitlichungsfaktors vereinheitlicht werden, der gleich der Länge des Standarddokuments dividiert durch die Länge des betreffenden Dokuments ist.
  • Anzahl von Nennungen/Dokument
    Figure 00210001
    Tabelle 1
  • Figure 00220001
    Tabelle 2
  • Figure 00220002
    Tabelle 3

Claims (10)

  1. Verfahren zum Betreiben eines Computersystems (1), wobei das Computersystem an ein Datennetzwerk (4) angeschlossen ist und ein Display (6) und eine Datenbank (12), in der eine Gruppe von Dokumenten und/oder Dokumentkennungen gespeichert ist, umfasst, wobei das Verfahren folgende Schritte umfasst: – das Herunterladen eines elektronischen Dokuments in das Computersystem (1) über das Datennetzwerk (4), wobei das Dokument in Form eines computerlesbaren Codes vorliegt, – das Identifizieren von Stichwörtern im heruntergeladenen Dokument, – das Modifizieren des computerlesbaren Codes solcherart, dass er Hyperlinks enthält, um dem Benutzer den Link zu Dokumenten zu ermöglichen, die in der Datenbank (12) gespeichert oder mit einer Kennung versehen sind und mindestens eines der Stichwörter enthalten, und – das Anzeigen des heruntergeladenen Dokuments auf dem Display (6) des Computersystems, wo die eingefügten Hyperlinks als vom Benutzer auswählbare Elemente erscheinen, dadurch charakterisiert, dass der Schritt des Identifizierens von Stichwörtern das Erstellen einer globalen Stichwortliste durch das Analysieren der Worthäufigkeitsverteilung über die Dokumente und das Identifizieren derjenigen globalen Stichwörter umfasst, die in dem heruntergeladenen Dokument vorliegen, – das Bestimmen, welche der gespeicherten und/oder mit einer Kennung versehenen Dokumente das entsprechende Stichwort enthalten, – das Bestimmen des Ähnlichkeits-/Unähnlichkeitskoeffizienten für mindestens eines der gespeicherten oder mit einer Kennung versehenen Dokumente im Vergleich zum heruntergeladenen Dokument, und – das Anzeigen einer Liste von mindestens einem gespeicherten und/oder mit einer Kennung versehenen Dokument zusammen mit dem Ähnlichkeits-/Unähnlichkeitskoeffizienten.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Schritt des Modifizierens des computerlesbaren Codes das Erstellen eines Hyperlinks für jedes identifizierte Stichwort umfasst.
  3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass nach dem Identifizieren der globalen Stichwörter, die in dem heruntergeladenen Dokument vorliegen, das Verfahren ferner folgenden Schritt umfasst – das Aktivieren eines der eingefügten Hyperlinks.
  4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das Verfahren das Anzeigen der Liste als eine Gruppe von Hyperlinks zu den aufgelisteten Dokumenten umfasst.
  5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der computerlesbare Code Hyper Text Markup Language (HTML) ist und die Schritte des Herunterladens und Anzeigens von einem Browser durchgeführt werden.
  6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Datennetzwerk, über das das elektronische Dokument heruntergeladen wird, das World Wide Web ist.
  7. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Dokumentkennungen ein Dokumenttitel, ein Computerlaufwerkpfad oder ein Universal Source Locator (URL) auf eine Webseite oder eine Kombination aus diesen sind.
  8. Programmiertes Computersystem, das Folgendes umfasst: – Kommunikationsmittel (5, 2), das mit einem Datennetzwerk (4) zum Herunterladen eines elektronischen Dokuments über das Datennetzwerk (4) gekoppelt ist, wobei das Dokument in Form eines computerlesbaren Codes vorliegt, – eine elektronische Datenbank (12), die eine Gruppe von Dokument und/oder Dokumentkennungen speichert, – erste Verarbeitungsmittel (12, 13), die zum Identifizieren von Stichwörtern in dem heruntergeladenen Dokument angeordnet sind, – ein zweites Verarbeitungsmittel (13), das zum Modifizieren des computerlesbaren Codes angeordnet ist, um Hyperlinks darin einzufügen, um es einem Benutzer zu ermöglichen, auf Dokumente, die in der Datenbank (12) gespeichert oder mit einer Kennung versehen sind und mindestens eines der Stichwörter enthalten, zuzugreifen, und – ein Display (6) des Computersystems und Displaytreibermittel (5, 7), die angeordnet sind, um das heruntergeladene Dokument in einer Form anzuzeigen, in der die eingefügten Hyperlinks als vom Benutzer auswählbare Elemente erscheinen, dadurch gekennzeichnet, dass das zweite Verarbeitungsmittel (13) im Gebrauch angeordnet ist, um Stichwörter zu identifizieren, indem es eine globale Stichwortliste durch das Analysieren der Worthäufigkeitsverteilung über die Dokumente erstellt, und um diejenigen globalen Stichwörter, die in dem heruntergeladenen Dokument vorliegen, zu identifizieren, das zweite Verarbeitungsmittel (13) angeordnet ist, um zu bestimmen, welche der gespeicherten und/oder mit einer Kennung versehenen Dokumente das entsprechende Stichwort enthalten, das zweite Verarbeitungsmittel (13) angeordnet ist, um einen Ähnlichkeits-/Unähnlichkeitskoeffizienten für mindestens eines der gespeicherten oder mit einer Kennung versehenen Dokumente im Vergleich zum heruntergeladenen Dokument zu bestimmen, und das Display (6) des Computersystems angeordnet ist, um eine Liste von mindestens einem gespeicherten und/oder mit einer Kennung versehenen Dokument zusammen mit dem Ähnlichkeits-/Unähnlichkeitskoeffizienten anzuzeigen.
  9. Programmiertes Computersystem nach Anspruch 8, dadurch gekennzeichnet, dass das Computersystem mit einem geeigneten programmierten Computer (1) ausgestattet ist, in dem das Kommunikationsmittel (2, 5) ein Datenmodem des Computers (1) und das erste und das zweite Verarbeitungsmittel (12, 13) einen Mikroprozessor oder einen digitalen Signalprozessor umfassen.
  10. Computerprogramm, das in einem computerlesbaren Medium ausgeführt ist, zum Betreiben eines Computersystems, wobei das Computersystem an ein Netzwerk (4) angeschlossen ist und ein Display (6), eine Datenbank (12), in der eine Gruppe von Dokumenten und/oder Dokumentkennungen gespeichert ist, umfasst, wobei das Computerprogramm eingerichtet ist, folgende Schritte durchzuführen, wenn es auf dem Datenverarbeitungsgerät ausgeführt wird: – das Einrichten einer Datenbank (12), in der eine Gruppe von Dokumenten und/oder Dokumentkennungen gespeichert ist, – das Herunterladen eines elektronischen Dokuments in das Computersystem (1) über ein Datennetzwerk (4), wobei das Dokument in einem computerlesbaren Code vorliegt, – das Identifizieren von Stichwörtern im heruntergeladenen Dokument, – das Modifizieren des computerlesbaren Codes solcherart, dass er Hyperlinks enthält, um dem Benutzer den Link zu Dokumenten zu ermöglichen, die in der Datenbank (12) gespeichert oder mit einer Kennung versehen sind und mindestens eines der Stichwörter enthalten, und – das Anzeigen des heruntergeladenen Dokuments auf dem Display (6) des Computersystems, wo die eingefügten Hyperlinks als vom Benutzer auswählbare Elemente erscheinen, dadurch charakterisiert, dass das Computerprogramm ferner eingerichtet ist, die folgenden Schritte durchzuführen, wenn es auf dem Datenverarbeitungsgerät ausgeführt wird: – das Identifizieren von Stichwörtern, indem durch das Analysieren der Worthäufigkeitsverteilung über die Dokumente eine globale Stichwortliste erstellt wird, und das Identifizieren derjenigen globalen Stichwörter, die in dem heruntergeladenen Dokument vorliegen, – das Bestimmen, welche der gespeicherten und/oder mit einer Kennung versehenen Dokumente das entsprechende Stichwort enthalten, – das Bestimmen des Ähnlichkeits-/Unähnlichkeitskoeffizienten für mindestens eines der gespeicherten oder mit einer Kennung versehenen Dokumente im Vergleich zum heruntergeladenen Dokument, und – das Anzeigen einer Liste von mindestens einem gespeicherten und/oder mit einer Kennung versehenen Dokument zusammen mit dem Ähnlichkeits-/Unähnlichkeitskoeffizienten.
DE69931256T 1998-06-11 1999-06-08 Verfahren und system zum zurückholen einer elektronischen akte Expired - Lifetime DE69931256T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FI981355A FI981355A (fi) 1998-06-11 1998-06-11 Elektroninen tiedoston noutomenetelmä ja -järjestelmä
FI981355 1998-06-11
PCT/FI1999/000492 WO1999064965A2 (en) 1998-06-11 1999-06-08 Electronic file retrieval method and system

Publications (2)

Publication Number Publication Date
DE69931256D1 DE69931256D1 (de) 2006-06-14
DE69931256T2 true DE69931256T2 (de) 2006-10-05

Family

ID=8551978

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69931256T Expired - Lifetime DE69931256T2 (de) 1998-06-11 1999-06-08 Verfahren und system zum zurückholen einer elektronischen akte

Country Status (6)

Country Link
US (1) US6415294B1 (de)
EP (1) EP1086433B1 (de)
AU (1) AU4620899A (de)
DE (1) DE69931256T2 (de)
FI (1) FI981355A (de)
WO (1) WO1999064965A2 (de)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6785740B1 (en) * 1999-03-31 2004-08-31 Sony Corporation Text-messaging server with automatic conversion of keywords into hyperlinks to external files on a network
US6886036B1 (en) * 1999-11-02 2005-04-26 Nokia Corporation System and method for enhanced data access efficiency using an electronic book over data networks
US20020059223A1 (en) * 1999-11-30 2002-05-16 Nash Paul R. Locator based assisted information browsing
US6848075B1 (en) * 2000-02-10 2005-01-25 International Business Machines Corporation Internet web browser with memory enhanced hyperlink display
JP3307625B2 (ja) * 2000-02-25 2002-07-24 株式会社ガーラ 電子掲示板システムおよびメールサーバー
US20050021862A1 (en) * 2000-03-31 2005-01-27 Dickens Coal Llc Automatic selection of content-delivery provider using link mapping database
US20020004803A1 (en) * 2000-04-07 2002-01-10 Oleg Serebrennikov Method and apparatus for the dynamic modification of relational information in electronic documents such as HTML pages and the like
AUPQ915600A0 (en) 2000-08-03 2000-08-24 Ltdnetwork Pty Ltd Online network and associated methods
WO2002013045A2 (en) * 2000-08-03 2002-02-14 Ltdnetwork Pty. Ltd. Online network and associated methods
US8060816B1 (en) * 2000-10-31 2011-11-15 International Business Machines Corporation Methods and apparatus for intelligent crawling on the world wide web
NZ508695A (en) * 2000-12-07 2003-04-29 Compudigm Int Ltd Method and system of searching a database of records
US20020124056A1 (en) * 2001-03-01 2002-09-05 International Business Machines Corporation Method and apparatus for modifying a web page
US20030018669A1 (en) * 2001-04-02 2003-01-23 International Business Machines Corporation System and method for associating a destination document to a source document during a save process
GB2374165A (en) * 2001-04-02 2002-10-09 Global Knowledge Network Secure distribution of electronic media
BR0201084A (pt) * 2001-04-27 2003-05-27 Boart Longyear Int Holding Inc Aparelho e operação de perfuração
US7398461B1 (en) * 2002-01-24 2008-07-08 Overture Services, Inc. Method for ranking web page search results
FR2837297A1 (fr) * 2002-03-13 2003-09-19 Phonere Der Systeme de distribution de documents numeriques comportant des fonctions de navigation etendues
US20040237037A1 (en) * 2003-03-21 2004-11-25 Xerox Corporation Determination of member pages for a hyperlinked document with recursive page-level link analysis
US20050188300A1 (en) * 2003-03-21 2005-08-25 Xerox Corporation Determination of member pages for a hyperlinked document with link and document analysis
US20050038861A1 (en) * 2003-08-14 2005-02-17 Scott Lynn Method and system for dynamically generating electronic communications
US7698626B2 (en) * 2004-06-30 2010-04-13 Google Inc. Enhanced document browsing with automatically generated links to relevant information
US8249929B2 (en) * 2004-08-11 2012-08-21 Adknowledge, Inc. Method and system for generating and distributing electronic communications for maximum revenue
US8429190B2 (en) * 2004-08-11 2013-04-23 Adknowledge, Inc. Method and system for generating and distributing electronic communications
JP4650927B2 (ja) * 2004-08-13 2011-03-16 ソニー株式会社 情報処理装置および方法、並びにプログラム
US20060149697A1 (en) * 2005-01-03 2006-07-06 Andre Wachholz-Prill Context data transmission
US7730021B1 (en) * 2005-01-28 2010-06-01 Manta Media, Inc. System and method for generating landing pages for content sections
US7788245B1 (en) * 2005-06-16 2010-08-31 Google Inc. Method and system for dynamically generating search links embedded in content
US8121895B2 (en) 2005-07-21 2012-02-21 Adknowledge, Inc. Method and system for delivering electronic communications
US20070028236A1 (en) * 2005-07-27 2007-02-01 Typefi System Pty Ltd. File transfer system
US8209222B2 (en) 2005-10-12 2012-06-26 Adknowledge, Inc. Method and system for encrypting data delivered over a network
US20130046751A1 (en) * 2010-05-07 2013-02-21 Telefonaktiebolaget L M Ericsson (Publ) Method and Arrangement for Control of Web Resources
US11455324B2 (en) * 2020-10-23 2022-09-27 Settle Smart Ltd. Method for determining relevant search results

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2285096C (en) * 1991-11-12 2000-05-09 Ibm Canada Limited-Ibm Canada Limitee Logical mapping of data objects using data spaces
US5794257A (en) * 1995-07-14 1998-08-11 Siemens Corporate Research, Inc. Automatic hyperlinking on multimedia by compiling link specifications
CA2233023A1 (en) * 1995-09-25 1997-04-03 Edward A. Taft Optimum access to electronic documents
US6073143A (en) * 1995-10-20 2000-06-06 Sanyo Electric Co., Ltd. Document conversion system including data monitoring means that adds tag information to hyperlink information and translates a document when such tag information is included in a document retrieval request
US5822539A (en) 1995-12-08 1998-10-13 Sun Microsystems, Inc. System for adding requested document cross references to a document by annotation proxy configured to merge and a directory generator and annotation server
EP0810534B1 (de) 1996-05-13 2003-03-19 Oki Electric Industry Co., Ltd. Dokumentanzeigesystem und elektronisches Wörterbuch
US5852820A (en) * 1996-08-09 1998-12-22 Digital Equipment Corporation Method for optimizing entries for searching an index
US5835905A (en) * 1997-04-09 1998-11-10 Xerox Corporation System for predicting documents relevant to focus documents by spreading activation through network representations of a linked collection of documents
US6070157A (en) * 1997-09-23 2000-05-30 At&T Corporation Method for providing more informative results in response to a search of electronic documents
US6256631B1 (en) 1997-09-30 2001-07-03 International Business Machines Corporation Automatic creation of hyperlinks
US6055538A (en) * 1997-12-22 2000-04-25 Hewlett Packard Company Methods and system for using web browser to search large collections of documents
JPH11195025A (ja) 1997-12-26 1999-07-21 Casio Comput Co Ltd ドキュメントデータのリンク付け装置、リンク先アドレスの表示/アクセス装置、及びリンク付けされたドキュメントデータの配付装置
US5983221A (en) * 1998-01-13 1999-11-09 Wordstream, Inc. Method and apparatus for improved document searching
US6101503A (en) * 1998-03-02 2000-08-08 International Business Machines Corp. Active markup--a system and method for navigating through text collections
US6112203A (en) * 1998-04-09 2000-08-29 Altavista Company Method for ranking documents in a hyperlinked environment using connectivity and selective content analysis
US6125361A (en) * 1998-04-10 2000-09-26 International Business Machines Corporation Feature diffusion across hyperlinks
US6125395A (en) * 1999-10-04 2000-09-26 Piiq.Com, Inc. Method for identifying collections of internet web sites with domain names

Also Published As

Publication number Publication date
WO1999064965A2 (en) 1999-12-16
AU4620899A (en) 1999-12-30
DE69931256D1 (de) 2006-06-14
FI981355A (fi) 1999-12-12
FI981355A0 (fi) 1998-06-11
EP1086433A2 (de) 2001-03-28
US6415294B1 (en) 2002-07-02
EP1086433B1 (de) 2006-05-10
WO1999064965A3 (en) 2000-02-17

Similar Documents

Publication Publication Date Title
DE69931256T2 (de) Verfahren und system zum zurückholen einer elektronischen akte
DE69729926T2 (de) Netzwerkbrowser
DE10252815B4 (de) Datenbanksuchsystem und Verfahren für ein Datenbanksuchsystem mit Zahlung für Platzierung von Suchlisten
DE10003907B4 (de) Verfahren, Vorrichtung und Datenverarbeitungsprogramm für die Anwendung beim Zugriff auf Hypertext-Dokumente
US6338059B1 (en) Hyperlinked search interface for distributed database
EP1311989B1 (de) Verfahren zur automatischen recherche
DE69723432T2 (de) Informationsauffindungssystem mit einer cachedatenbank
DE69636869T2 (de) Server mit automatischer Menüladefunktion
DE102010049891A1 (de) Ersatz von maschinell vorgegebenen Stichworten von Webseiten durch manuelle Eingaben
DE60003278T2 (de) Hierarchische Auflösung von Adressen in einem Datennetzwerk
DE10135444A1 (de) Verfahren für die Neuausrichtung der Quelle eines in einem HTML-Dokument dargestellten Datenobjekts
WO2009030246A1 (de) Erfassung von zusammenhängen zwischen informationen repräsentierenden daten
DE10052313A1 (de) Verfahren und Vorrichtung zur Beschränkung des freien Verweisens (Hyperlinking) auf Webseiten der ursprünglichen Inhaltserzeuger (Content producers) durch Internet-Inhaltsverteiler (Content distributors)
EP2193456A1 (de) Erfassung von zusammenhängen zwischen informationen repräsentierenden daten
EP1755049B1 (de) Verfahren zur Übermittlung von Informationen von einem Informationsserver an einen Client
EP1826685A1 (de) Verfahren zur Auswahl und Darstellung mindestens einer Zusatzinformation
DE19813884A1 (de) System und Verfahren zur Ermittlung und Darstellung von verbindungsbezogenen Leistungsdaten in Netzwerken
EP1030254B1 (de) Verfahren und System zum Verwalten von Dokumenten
DE10303070A1 (de) Erzeugen einer Liste von Adressen in einem Server
EP2193457A1 (de) Erfassung von zusammenhängen zwischen informationen repräsentierenden daten
EP1755048A1 (de) Verfahren zur Übermittlung von Informationen von einem Informationsserver an einen Client
EP1094405A2 (de) Verfahren zum Erzeugen einer dynamischen Auswahlmaske für den Abruf von Daten aus einer Datenbank
DE10303066A1 (de) Unterstütztes Eingeben von Adressen
DE10108564A1 (de) Verfahren zur Suche nach in einem verteilten System aktuell oder früher gespeicherten Daten oder Daten enthaltenden Ressourcen unter Berücksichtigung des Zeitpunkts ihrer Verfügbarkeit
DE10303067A1 (de) Erzeugen einer Liste von Adressen in einer Indexseite

Legal Events

Date Code Title Description
8364 No opposition during term of opposition