DE69725258T2 - System und Verfahren zur Wiederauffindung von Dokumenten in mehreren Sprachen - Google Patents

System und Verfahren zur Wiederauffindung von Dokumenten in mehreren Sprachen Download PDF

Info

Publication number
DE69725258T2
DE69725258T2 DE69725258T DE69725258T DE69725258T2 DE 69725258 T2 DE69725258 T2 DE 69725258T2 DE 69725258 T DE69725258 T DE 69725258T DE 69725258 T DE69725258 T DE 69725258T DE 69725258 T2 DE69725258 T2 DE 69725258T2
Authority
DE
Germany
Prior art keywords
search
documents
keyword
translation
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69725258T
Other languages
English (en)
Other versions
DE69725258D1 (de
Inventor
Makifumi Hiroshima-Shi Nosohara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mazda Motor Corp
Original Assignee
Mazda Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mazda Motor Corp filed Critical Mazda Motor Corp
Publication of DE69725258D1 publication Critical patent/DE69725258D1/de
Application granted granted Critical
Publication of DE69725258T2 publication Critical patent/DE69725258T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Description

  • Diese Erfindung bezieht sich auf ein Dokumentensuchsystem und -verfahren, welches ermöglicht, nach Ermessen die Dokumente, welche durch mehrere verschiedene Sprachen (mehrsprachige Dokumente) beschrieben sind, gemäß dem Schlüsselwort zu suchen, welches durch die bezeichnete bzw. bestimmte Sprache (z. B. Muttersprache) geschrieben ist, und das Suchresultat durch die bezeichnete Sprache anzuzeigen bzw. darzustellen.
  • In jüngster Zeit muß Information zwischen Bereichen, welche verschiedene Sprachen voneinander aufweisen, aufgrund der Entwicklung von Kommunikationsnetzwerken, beinhaltend das Internet, ausgetauscht werden. Ruf der anderen Seite ist die Information aktuell bzw. gegenwärtig durch die Verwendung der elektrischen Speichergeräte (wie z. B. Datenbanken, CD-ROMs, etc.) geliefert. Beispielsweise sind Informationssuchservicesystemanwendungen von Datenbanken von Dokumenten aus Wissenschaft, Technologie und Patenten vorherrschend bzw. weit verbreitet.
  • Wenn Dokumente auf die Worte durchsucht werden, welche in den Dokumenten verwendet werden, sollte beachtet werden, daß jeder Autor ihres Dokuments verschiedene Wörter verwenden kann, um die gleiche Bedeutung, Material, Art und Weise, etc. zu beschreiben. Dadurch kann das Suchergebnis einige erwartete Dokumente verfehlen bzw. übersehen, wenn der Suchende es unterläßt, einige alternative Wörter zu bezeichnen. Um solche Fehler zu verhindern, ist es bekannt, ein Synonymwörterbuch zu verwenden, um automatisch die Wörter oder Ausdrücke bzw. Begriffe zu sammeln, welche iden tische oder äquivalente Bedeutungen aufweisen, und um eine Suchformel zu entwickeln, welche die gesammelten Ausdrücke verwendet.
  • Wenn die zu durchsuchende Datenbank in einer anderen Sprache als der Muttersprache des Suchenden geschrieben ist, sollte der Suchende die Schlüsselwörter zum Suchen aus seiner Muttersprache in diejenige übersetzen, welche in der Datenbank verwendet ist, bevor die Suche eingegeben wird. Ein derartiges Suchsystem ist bereitgestellt worden, in welchem die Suchformeleingabe durch die Muttersprache des Suchenden geschrieben ist und dann automatisch zu derjenigen übersetzt wird, welche in der zur durchsuchenden Datenbank verwendet wird. Die Suche wird dann in der Datenbank ausgeführt. Ein derartiges System ist durch das japanische Kokai Patent Nr. 8-202721 geoffenbart, wo das Suchergebnis automatisch zu der Muttersprache des Suchenden übersetzt und dann angezeigt bzw. dargestellt wird.
  • Die zu durchsuchenden Dokumente sind im allgemeinen nur Textdaten, aber sie sind normalerweise durch Objekte bzw. Gegenständen, wie z. B. Zeichnungen, Fotographien oder Animationen, ergänzt. Betreffend das Suchergebnis ist jedes Objekt normalerweise in einem bezeichneten Bereich angeordnet und zusammen mit den Textdaten auf derselben Seite gezeigt. In diesem Fall ist das Objekt mit den Textdaten durch Zuordnung eines Zeichens bzw. einer Markierung mit einer festgelegten Funktion in dem Dokument verbunden, und ein solcher Text wird als ein hyperlinked Text bezeichnet. SGML und HTML, welche im WWW bzw. Internet verwendet werden, sind zwei Arten von Texten dieses Typs. Eine derartige Software, wie z. B. Viewer oder Browser, werden allgemein angewendet, um den Hyperlink-Text zu interpretieren und zu entwickeln und ihn dann anzuzeigen.
  • Ein derartiges System kann durch Kombination dieser oben erwähnten Techniken folgendermaßen konstruiert werden. Wenn die Sprache, welche verwendet wird, um die Suchbedingungsformel einzugeben, verschieden ist von derjenigen der zu durchsuchenden Dokumenten, wird die Suchbedingungsformel automatisch zu einer äquivalenten übersetzt, welche in einer anderen Sprache geschrieben ist, um Synonyme zu beinhalten. Die Suche wird dann durchgeführt und dann wird das Suchergebnis automatisch übersetzt und durch die Sprache angezeigt, welche während der Eingabe der Suchbedingungsformel definiert wurde.
  • Hong Yoon Kim et al.: "A Presentation Agent for Multilingual Services" ("Ein Präsentationsmittel für mehrsprachige Services bzw. Dienstleistungen"), Proceedings of the Network Operations and Management Symposium (Nom, Kissimmee, Feb. 14–17, 1994, Band 2 von 3, Februar 1994, IEEE, Seiten 635–644) offenbart ein Präsentationsmittel für mehrsprachige Dienstleistungen, wie z. B. Fluginformationssysteme, in welchen die Begriffe bzw. Gegenstände einer Datenbank in drei Arten klassifiziert sind. Die Begriffe bzw. Gegenstände, welche in allen Sprachen gemeinsam sind, werden nicht übersetzt, kurze Vokabelbegriffe werden durch einfache Umwandlungstabellen umgewandelt und Gegenstände eines langen Satzes müssen entweder durch einen Maschinenübersetzer übersetzt werden oder werden vorübersetzt, bevor sie in die Datenbank eingegeben werden.
  • EP-A-0 725 353 offenbart ein Dokumentenwiederherstellungs- bzw. Dokumentenabfrage- und -anzeigesystem, welches Quell dokumente in verschiedenen Sprachen von Servern wiederauffindet, welche durch ein Kommunikationsnetzwerk verbunden sind, die wiederaufgefundenen Quelldokumente, soweit notwendig, übersetzt, die übersetzten Dokumente speichert und die Quelldokumente und die übersetzten Dokumente bei einer Klientenvorrichtung anzeigt, welche mit dem Kommunikationsnetzwerk verbunden ist.
  • Die Patentzusammenfassung von Japan 01185724 offenbart eine Informationswiederauffindereinrichtung, in welcher ein Schlüsselwort aus dem Anfragetext entnommen bzw. gewonnen wird.
  • Es gibt für die oben beschriebenen Systeme einige zu lösende Probleme wie folgt.
  • Erstens erzeugt das System automatisch die Synonyme der Suchformel und übersetzt sie in andere Sprachen. Dies passiert sogar, wenn die zu durchsuchenden Dokumente in derselben Sprache geschrieben sind, welche in den Originalsuchausdrücken verwendet wird. Wenn sowohl die Muttersprache des Suchenden als auch die anderen Sprachen beinhaltet sind, kann dies folglich die Suche erschweren bzw. verkomplizieren.
  • Zweitens werden, wenn die zu durchsuchenden Dokumente mehr als drei Sprachen, wie beispielsweise Japanisch, Englisch, Französisch und Deutsch, beinhalten, mehrfache Übersetzungsfunktionen und -mittel benötigt, das ist von englisch in japanisch, von englisch in französisch, und von englisch in deutsch. Die Übersetzungsfunktion wird im allgemeinen auf Sätze angewendet und ist daher von einem hohen technischen Niveau, weist eine große Struktur auf und ist ein kompliziertes Programm. Dies bewirkt, daß Systemreaktion bzw. -antwort abgesendet wird, wenn das Programm zusammengepackt ist.
  • Drittens wird, wenn das Suchergebnis automatisch übersetzt ist, das gesamte Resultat bedingungslos in die Sprache übersetzt, welche in der Eingabe des Suchbefehls verwendet ist, und es ist daher eine längere Zeit erforderlich, um die Suchergebnisse automatisch zu übersetzen.
  • Viertens hängt, wenn das Hypertextdokument mit einem Format ähnlich zu dem Originaldokument angezeigt wird, dieses Format von der Absicht des Autors des Dokuments ab. Daher kann es manchmal für den Suchenden unbequem sein, weil es diesem Format an einem Verbinden bzw. Linken an einer erwarteten Stelle fehlt. Wenn der Textabschnitt, wie beispielsweise jedes Segment (Paragraph) in dem Text, und das bezogene Objekt separat angezeigt werden, wird eine sinnvolle Formatierung der Anzeige benötigt, um eine Analyse des Dokuments zu ermöglichen. Die Beziehung zwischen jedem Element auf der Anzeige, beispielsweise die Beziehung zwischen der Zeichnung und dem Abschnitt bzw. Bereich des Dokuments, welcher darauf Bezug nimmt, sollte auf der Anzeige bestätigt werden können.
  • Es ist daher das Ziel der Erfindung, ein Dokumentensuchsystem und -verfahren für mehrsprachige Dokumente bereitzustellen, welche eine Wiedergewinnung bzw. Entnahme der Suchresultate in einer effizienteren Art und innerhalb einer kürzeren Zeit erlauben.
  • Dieses Ziel ist durch ein Dokumentensuchsystem für mehrsprachige Dokumente, welches die in Anspruch 1 geoffenbar ten Merkmale aufweist, und ein Dokumentensuchverfahren für mehrsprachige Dokumente erfüllt, welches die nach Anspruch 9 oder 10 geoffenbarten Merkmale aufweist. Bevorzugte Ausführungen sind in den abhängigen Unteransprüchen definiert.
  • Das Dokumentensuchsystem für mehrsprachige Dokumente der vorliegenden Erfindung ist, wie unten beschrieben, gekennzeichnet, diese Probleme zu lösen.
  • Das System der vorliegenden Erfindung ist versehen mit und gekennzeichnet durch Eingabemittel, um einen Suchbefehl einschließlich eines Suchschlüsselwortes einzugeben, welches durch den Suchenden bezeichnet ist; Übersetzungssteuermittel für das Schlüsselwort, um das Schlüsselwort, welches durch den Suchenden eingegeben ist, in eine andere Sprache zu übersetzen, welche in dem zu durchsuchenden Dokument verwendet ist; Suchformelerzeugungsmittel, um eine Suchformel aus dem Schlüsselwort, welches von dem Übersetzungssteuerungsmitteln übertragen ist, basierend auf dem Schlüsselwort zu erzeugen bzw. zu generieren; Suchmittel, um Dokumentenspeichermittel gemäß der Suchformel zu durchsuchen, welche von den Suchformelerzeugungsmitteln übertragen ist; Suchresultatspeichermittel, um die gesuchten und ausgewählten Dokumente zu speichern; andere Übersetzungssteuerungsmittel für das Suchresultat, um die Dokumente, welche in den Suchresultatspeichermitteln gespeichert sind, zu der bezeichneten Sprache zu übersetzen; und Anzeigemittel, um die Resultate der Übersetzung anzuzeigen.
  • Das Dokumentensuchsystem für mehrsprachige Dokumente der vorliegenden Erfindung ist mit zwei voneinander unabhängigen Übersetzungsmitteln versehen. Eines ist ein Übersetzungssteuermittel für das Schlüsselwort, um das Schlüs selwort zu übersetzen, welches durch die Muttersprache des Suchenden geschrieben ist, und das andere ist ein Übersetzungssteuermittel für das Suchresultat, welches den gesamten Text der Dokumente übersetzen kann, welche als ein Suchresultat ausgewählt sind. Betreffend die Schlüsselwort-Übersetzungsmittel sollte ein einfaches Übersetzungssystem angewendet werden, weil die Objekte der Übersetzung Worte, wie beispielsweise Hauptwörter, Verben usw., sind. Auf der anderen Seite sollte für die Suchresultatübersetzungsmittel ein Übersetzungssystem mit einem hohen Niveau angewendet werden, weil die Objekte der Übersetzung allgemeine bzw. gebräuchliche Sätze sind und die geeignete Übersetzung durch ein Herleiten aus dem Kontext des Dokuments benötigt wird.
  • Infolge der Anwendung des einfachen Übersetzungssystems auf die Verarbeitungsschritte der freien Schlüsselwortübersetzungsmittel, wo die Suchformel geändert, hinzugefügt, modifiziert oder häufig gelöscht werden kann, um die Exaktheit des Suchresultats zu verbessern, wird die Verarbeitungsgeschwindigkeit in diesen Schritten nicht verringert, so daß die Antwort des gesamten Systems beschleunigt werden kann.
  • Diese und andere Ziele, Merkmale und Vorteile der vorliegenden Erfindung werden bei einer Lektüre der folgenden detaillierten Beschreibung und der angefügten Zeichnungen offensichtlicher werden, in welchen:
  • 1 ein funktionelles Blockdiagramm ist, um die bevorzugte Ausführungsform der vorliegenden Erfindung zu zeigen.
  • 2 ein Flußdiagramm ist, um den Betrieb der bevorzugten Ausführungsform der vorliegenden Erfindung zu beschreiben.
  • 3 ein Verarbeitungsflußdiagramm für die Übersetzungsmittel des freien Schlüsselworts der bevorzugten Ausführungsform der vorliegenden Erfindung ist.
  • 4 ein Verarbeitungsflußdiagramm für die Hauptroutine der Übersetzungsfunktion der bevorzugten Ausführungsform der vorliegenden Erfindung ist.
  • 5 ein Verarbeitungsflußdiagramm für die Synonymsuchroutine der bevorzugten Ausführungsform der vorliegenden Erfindung ist.
  • 6 ein Verarbeitungsflußdiagramm für die Suchformelerzeugungsmittel der bevorzugten Ausführungsform der vorliegenden Erfindung ist.
  • 7 ein Verarbeitungsflußdiagramm, um den Anzeigenbetrieb der Information der bevorzugten Ausführungsform der vorliegenden Erfindung zu zeigen ist.
  • 8A ein Verarbeitungsflußdiagramm der Suchresultatseditiermittel der bevorzugten Ausführungsform der vorliegenden Erfindung ist.
  • 8B ein anderes Verarbeitungsflußdiagramm der Suchresultatseditiermittel der bevorzugten Ausführungsform der vorliegenden Erfindung ist.
  • 9A ein Diagramm ist, um eine Variation bzw. Abwandlung des Bildes zu zeigen, welches an der Anzeige der bevorzugten Ausführungsform der vorliegenden Erfindung gezeigt ist.
  • 9B ein Diagramm ist, um eine andere Variation des Bildes zu zeigen, welches an der Anzeige der bevorzugten Ausführungsform der vorliegenden Erfindung gezeigt ist.
  • 9C auch ein Diagramm ist, um eine andere Variation des Bildes zu zeigen, welches an der Anzeige der bevorzugten Ausführungsform der vorliegenden Erfindung gezeigt ist.
  • Die vorliegende Erfindung wird im Detail in Bezug auf die folgenden Zeichnungen beschrieben. 1 ist ein Blockdia gramm, um die funktionelle Struktur des Systems der vorliegenden Erfindung zu zeigen. Wie in 1 gezeigt, ist ein Dokumentensuchsystem für mehrsprachige Dokumente mit einem Kunden- bzw. Klient-Computer A, einem Anwendungsserver B und einem Datenserver C versehen. Der Klient-Computer A weist Anzeigeeingabemittel 1 auf. die Anzeigeeingabemittel 1 nehmen die Information, die durch den Klienten eingegeben wird, in das System auf, und übertragen sie zu einem Kommunikationssteuermittel 2 in dem Anwendungsserver B durch das Kommunikationsnetzwerk und erhalten auch die Information aus den Kommunikationssteuermitteln und zeigen sie dann an.
  • Der Anwendungsserver B umfaßt die Kommunikationssteuermittel 2; Übersetzungssteuermittel 3 für ein freies Schlüsselwort, um das freie Schlüsselwort in die andere geforderte Sprache zu übersetzen; Synonymsuchmittel 4, welche mit den Funktionen zur Registrierung und Modifikation des Wortes versehen sind, um die Wörter zu suchen und auszugeben, welche eine identische oder äquivalente Bedeutung mit dem freien Schlüsselwort aufweisen, das durch den Klienten eingegeben ist; und Suchformelerzeugungsmittel 5, welche eine Suchformel gemäß den Schlüsselwörtern erzeugen, welche von den Übersetzungssteuermitteln 3 für das freie Schlüsselwort ausgegeben werden. Der Anwendungsserver B umfaßt ebenso primäre bzw. erste Speichermittel 8 zum temporären Speichern der Suchresultate; Übersetzungssteuermittel 9 zum optionalen bzw. wahlweisen Übersetzen des Suchresultates; und Editier- bzw. Bearbeitungsmittel 10 zum Bearbeiten bzw. Editieren der Suchresultate und zum Ausgeben der bearbeiteten Resultate zu den Kommunikationssteuermitteln 2. In dieser Ausführungsform sind sekundäre bzw. zweite Speichermittel 11 zu den primären Speichermitteln 8 hinzugefügt, um eine temporäre Speicherung des Dokumentes zu ermöglichen, welches das Suchresultat sein kann, unmittelbar bevor es angezeigt wird, oder das Dokument noch nicht übersetzt ist.
  • Der Datenserver C umfaßt Suchmittel 6, welche als eine Suchmaschine arbeiten; und Speichermittel 7 für mehrfache Dokumente, welche zu suchende, mehrfache Dokumente speichern.
  • Danach wird der Betrieb des Dokumentensuchsystems für mehrsprachige Dokumente beschrieben werden. Sobald das System startet, beginnt eine Serie von Prozessen bzw. Verfahren, welche in 2 gezeigt sind. Zuerst wird die Sprache, welche verwendet wird, um die Suchbedingungen zu definieren, durch den Suchenden (Schritt S100) ausgewählt, und dann werden die zu durchsuchenden Datenbanken bezeichnet (Schritt 101) und bei dem nächsten Schritt wird die Suchbedingung eingegeben (Schritt 102). Wenn der Suchstartknopf betätigt wird (Schritt 103), starten die Übersetzungssteuermittel 3 für das freie Schlüsselwort und die Synonymsuchmittel 4 eine Verarbeitung.
  • Wenn die Übersetzungssteuermittel 3 für das freie Schlüsselwort ihre Verarbeitung starten, wie in 3 gezeigt ist, wird die Anfangsbedingung festgelegt bzw. eingestellt (Schritt 200). Dann wird die Sprache, welche verwendet wird, um die Suchbedingungen zu definieren und einzugeben, überprüft, um zu sehen, ob sie mit jener der zu durchsuchenden Dokumente übereinstimmt. Im Fall, daß sie übereinstimmen, geht die Verarbeitung zu der Synonymsuchroutine 203 (5). Im Fall, daß sie nicht übereinstimmen, geht die Verarbeitung zu der Übersetzungsfunktions-Hauptroutine 202 (4) und bewegt sich dann zu der Synonym-Suchroutine 203. Bei dem Schritt 204 wird die Suchbedingung neu definiert, um die Synonyme zu der originalen bzw. ursprünglichen Suchbedingung hinzuzufügen, welche durch den Suchenden eingegeben wird, und bei einer Suchtabelle festzulegen (i). Das "i" ist eine Variable. Die zu durchsuchenden Datenbanken und die entsprechenden Suchformeln sind in der Suchtabelle festgelegt.
  • Bei dem Schritt 206 werden die zu durchsuchenden Datenbanken überprüft, um zu sehen, ob die nächste wartet oder nicht. Wenn eine Datenbank wartet, wird die Variable "i" um 1 erhöht und die Sprache für die nächste zu durchsuchende, wartende Datenbank wird festgelegt (Schritt 207) und dann kehrt der Verarbeitungszyklus zu dem Schritt 201 zurück. Wenn die nächste Datenbank nicht wartet, wird die Routine beendet.
  • 4 zeigt eine Hauptroutine für die Übersetzungsfunktion. Die Suchbedingung wird beim Schritt 300 eingegeben. Die Suchbedingung besteht aus der Sprache, welche durch den Suchenden verwendet wird, dem freien Wort, welches zum Suchen verwendet wird, und den Sprachen, welche in den zu durchsuchenden Datenbanken verwendet werden. Dadurch wird die Anzahl von Suchbedingungen durch die Kombination dieser Elemente entschieden. Sobald die Suchbedingung festgelegt ist, wird die Sprache, welche verwendet ist, um die Suchbedingungen zu definieren, in andere Sprachen übersetzt, die in den zu durchsuchenden Datenbanken verwendet werden (Schritt 301). Das Suchwort wird bei Schritt 302 überprüft, um zu sehen, ob es übersetzbar ist oder nicht. Wenn es übersetzbar ist, wird die übersetzte Suchbedingung hinzugefügt (Schritt 303). Wenn es nicht übersetzbar ist, wird nichts hinzugefügt und der entsprechende Abschnitt wird leer gelassen. Dann wird die Suchbedingung überprüft, um zu sehen, ob eine andere Suchbedingung wartet oder nicht (Schritt 304), und wenn eine wartet, kehrt der Ablauf bzw. Zyklus zu Schritt 301 zurück.
  • 5 zeigt eine Synonymsuchroutine. Wenn die Verarbeitung, die in 5 gezeigt ist, gestartet wird, wird die Suchbedingung überprüft, um zu sehen, ob das Wort festgelegt ist oder nicht (Schritt 400). Wenn das Wort festgelegt ist, werden die Synonyme des Wortes aus den Synonymtabellen aufgenommen, welche für jede Sprache definiert sind, welche zur Suche verwendet werden (Schritt 401). Wenn die Synonyme in der Tabelle (Schritt 402) gespeichert sind, werden diese Synonyme aufgegriffen bzw. aufgenommen (Schritt 403). Wenn kein Synonym in der Tabelle gespeichert ist, wird nichts aufgenommen. Dann wird die Suchbedingung bei Schritt 404 überprüft, um zu sehen, ob eine andere Suchbedingung wartet oder nicht, und wenn eine wartet, kehrt der Zyklus zu Schritt 400 zurück.
  • Als nächstes wird der Betrieb der Suchformel-Erzeugungsmittel mit Bezug auf das Flußdiagramm, welches in 6 gezeigt ist, beschrieben. Die Suchformel-Erzeugungsmittel 5 erhalten die Tabelle, in welcher die Synonyme für das freie Schlüsselwort in der Suchbedingung und der zu durchsuchenden Datenbank aus den Übersetzungsmitteln für das freie Schlüsselwort gespeichert werden bzw. sind (Schritt 500). Dann wird der Suchende befragt, um die Inhalte von jeder Suchbedingung zu bestätigen (Schritt 501). Der Suchende überprüft, ob die Suchbedingung geändert werden sollte oder nicht (Schritt 502), und wenn sie geändert ist, werden überarbeitete Daten festgelegt (Schritt 503). Die Überarbeitung durch den Suchenden beinhaltet die Bestätigung, die Zufügung und die Löschung von Synonymen. Wenn Schritt 502 in keiner Überarbeitung resultiert, wird die Information aus den Übersetzungsmitteln für das freie Schlüsselwort verwendet, so wie sie ist. Dann wird die Suchformel erzeugt (Schritt 504).
  • Danach wird der Betrieb der Suchformelerzeugung beschrieben. Der Fall, wo sowohl japanische Patente als auch US-Patente durch die Verwendung von japanischer Sprache durchsucht werden, wird jetzt beschrieben. Wenn das japanische Kanjizeichen, welches als "KURUMA" definiert ist, in dem Suchbefehl bezeichnet wird, übersetzen es die Übersetzungssteuermittel in das englische Wort "car" und die Synonymsuchmittel werden andere japanische Kanjizeichen, welche als "SHARYOU" und "JIDOUSHA" definiert sind, aus der japanischen Synonymtabelle als auch andere englische Wörter, wie "vehicle", "automotive" und "automobile", aus der englischen Synonymtabelle ausgeben. Dann werden diese Resultate zu den Übersetzungssteuermitteln zurückgegeben. Wenn die zu durchsuchenden Dokumente in der relationalen Datenbank (RDB) gespeichert werden, erzeugt der Suchformelerzeugungsabschnitt (Schritt 503) eine Suchformel, welche als SQL (Structure Query Language bzw. Strukturabfragesprache) bezeichnet wird, wie folgt:
    "Wähle Patent Nr., Titel von Japan, wo ein Text ähnlich den Kanjizeichen ist, welche KURUMA, SHARYOU oder JIDOUSHA repräsentieren;"
    "Wähle Patent Nr., Titel von USP, wo ein Text ähnlich "car" oder ein Text ähnlich "vehicle" oder ein Text ähnlich "automotive" oder ein Text ähnlich "automobile" ist;
    worin "Patent Nr., Titel" den Feldnamen bedeutet; JP den Tabellennamen bedeutet, in welcher japanische Patente gespeichert sind; bzw. USP den Tabellennamen bedeutet, in welcher US-Patente gespeichert sind.
  • Die oben erwähnte Suchformel bedeutet, daß das Patentnummernfeld der Aufzeichnungen, in welchen entweder "KURUMA", "SHARYOU" oder "JIDOUSHA" beinhaltet ist, und die Daten des entsprechenden Titelfeldes zu dem Textfeld aus der JP-Tabelle ausgegeben werden, in welcher die japanischen Patente gespeichert sind; und daß das Patentnummernfeld der Aufzeichnungen, in welchen entweder "car", "vehicle", "automotive" oder "automobile" beinhaltet ist, und die Daten des entsprechenden Titelfeldes zu dem Textfeld aus der USP-Tabelle ausgegeben werden, in welcher die US-Patente gespeichert sind.
  • Das Beispiel der oben erwähnten Suchformel ist geschrieben, um eine einfache Erklärung zur Erzeugung der Suchformel zu geben. Daher können andere Arten von Suchformeln mit individuellen oder allgemeinen Links bzw. Verbindungen erzeugt werden als das Suchverfahren des Dokumentes mit Links bzw. Verbindungen für den Datenserver, welcher mehrfache Speichermittel des Dokuments mit Links bzw. Verbindungen beinhaltet.
  • Die RDB-Suchmittel und die Suchmittel des Dokuments mit einem Link bzw. einer Verbindung führen die Suche gemäß der Information aus den Suchformelerzeugungsmitteln aus. Allgemeine und bekannte Suchverfahren werden auf diese Suchverfahren angewendet, so daß ihre Beschreibung weggelassen wurde.
  • Ein Prozeß bzw. Verfahren, um die Informationsausgabe durch die Suchmittel zu dem Suchenden zu zeigen, wird mit Bezug auf das Flußdiagramm beschrieben, welches in 7 gezeigt ist. Die Anzahl der ausgewählten Dokumente als das Suchre sultat, und ihre Information, welche die Identifikation des Satzes, den Titel, den Autor und dgl. und ihre Handhabungs- bzw. Managementinformation beinhalten, werden in den primären Speichermitteln 8 für das Suchergebnis gespeichert (Schritt 600). Diese Information wird allgemein als bibliographische Daten bezeichnet. Die Managementinformation umfaßt Sprachinformationen, um die Art der Sprachen zu identifizieren, und die Ortsinformation, um den Ort bzw. die Stelle des Satzes anzuzeigen. Die primären Speichermittel 8 für das Suchresultat reservieren eine bezeichnete Speichermenge, wenn der Suchende in das System eingeloggt bzw. eingestiegen ist. Die Speichermenge definiert das obere Limit der Anzahl von Suchen. Dieser Bereich des Speichers ist reserviert, bis der Suchende ausloggt bzw. aussteigt, und wird dann zur selben Zeit des Aussteigens freigegeben.
  • Der Suchende wird bei Schritt 601 befragt, ob die oben erwähnten bibliographischen Informationen übersetzt und angezeigt werden sollen oder nicht. Wenn eine Übersetzung gefordert wird (Schritt 602), werden die Informationen, welche in den primären Speichermitteln 8 für das Suchergebnis gespeichert ist, ausgelesen (Schritt 603). Dann werden die Übersetzungssteuermittel für die Suchergebnisse gemäß der geforderten, individuellen Sprachinformation aufgerufen und in dem nächsten Schritt wird die Übersetzung ausgeführt (Schritt 604). Dann wird die bibliographische Information zu jeder Übersetzungsfunktion (Schritt 605) übertragen und sie wird dann zu der Suchergebnis-Editier- bzw. -Bearbeitungsroutine (Schritt 606) übergeführt und bei dem nächsten Schritt 607 wird die Suchresultatliste dem Suchenden angezeigt. Wenn die Übersetzung bei Schritt 602 nicht benötigt wird, wird Schritt 606 direkt ausgeführt. Wenn der Suchende auswählt, daß der Satz (beispielsweise Titel) zu zeigen ist (Schritt 608), wird die Managementinformation für den ausgewählten Satz ausgelesen (Schritt S609) und die Managementinformation wird zu den Suchmitteln als eine Suchbedingung geliefert (Schritt 610). Bei dem nächsten Schritt 611 wird die Suche durch die Suchmittel ausgeführt und dann wird das Suchergebnis in den sekundären Speichermitteln 11 gespeichert (Schritt 612). Bei diesem Schritt werden das gesamte Dokument und die entsprechenden Objekte gespeichert. Die sekundären Speichermittel 11 sind mit den primären Speichermitteln 8 verbunden. Der Suchende wird bei dem Schritt 613 befragt, ob die Übersetzung ausgeführt werden soll oder nicht, und dann wird die Notwendigkeit der Übersetzung beurteilt (Schritt 614), und wenn notwendig, werden gesamte Sätze oder bezeichnete Abschnitte bei Schritt 615 übersetzt.
  • Ein Betrieb der Suchergebnisbearbeitungsmittel wird mit Bezug auf das Flußdiagramm beschrieben, welches in 8A und 8B gezeigt ist. 8A ist ein Verfahren, um die Liste der Suchresultate zu zeigen und ein Kennzeichen bzw. Symbol wird zugeordnet, um die Liste zu zeigen (Schritt 700), und dann wird ein anderes Kennzeichen zugeordnet, um die Anzahl von Treffern in dem Suchresultat zu zeigen (Schritt 701). In dem nächsten Schritt wird ein weiteres Kennzeichen für das Anzeigelayout bzw. die Bildschirmaufteilung zugeordnet, wobei es beispielsweise ein Kennzeichen für einen Knopf sein kann, um das Resultat der Übersetzung anzuzeigen (Schritt 702). 8B zeigt einen weiteren Fall, wo jeder anzuzeigender Inhalt entsprechend definiert ist und ein Kennzeichen zugeordnet ist, um den Knopf zu der Position der Zeichnung zuzuweisen (Schritt 703), und dann wird ein weiteres Zeichen zugeordnet, um es mit der Steuerstange auf dem Display bzw. der Anzeige zu verbinden (Schritt 704). In dem nächsten Schritt wird ein weiteres Zeichen zugeordnet, um das Anzeigenlayout zu strukturieren (Schritt 705). Das Anzeigenlayout, welches durch diese Verfahren erzeugt wird, wird mit Bezug auf 9 beschrieben.
  • 9 zeigt ein Beispiel, wo die vorliegende Erfindung auf das Suchsystem eines Patentjournals angewendet wird. 9A zeigt eine grundlegende Bildschirmaufteilung. Der Rahmen ist in drei Bereiche aufgeteilt: einen Bereich 20, einen Bereich 30 und einen Bereich 40. Der Bereich 20 wird verwendet, um eine Steuerstange zu zeigen, in welcher die bibliographische Information des Patents angeordnet ist. Beispielsweise kann ein Knopf 21 verwendet werden, um die Patentveröffentlichungsnummer anzuzeigen, den Assignee bzw. Zessionar und dgl. zu bezeichnen und sie im Bereich 30 anzuzeigen. Ein Knopf 22 kann verwendet werden, um die Zusammenfassung des Patentes zu zeigen; ein Knopf 23 kann verwendet werden, um den Anspruch des Patentes zu zeigen; und ein Knopf 24 kann verwendet werden, um alle Zeichnungen zu zeigen, welche in dem Patent beinhaltet sind. Der Bereich 30 wird verwendet, um die Inhalte des Gegenstands zu zeigen, welche durch diese Knöpfe bezeichnet sind. In dieser Ausführungsform wird die Zusammenfassungsinformation angezeigt. Die Zeichnungsnummer, welche vorher durch den Assignee ausgewählt wurde (beispielsweise 1), ist in der Zusammenfassungsinformation beinhaltet. Wenn die ausgewählte Zeichnungsnummer an der Anzeige angezeigt wird, wird die Bildzeichnung entsprechend dieser Figurnummer an dem Bereich 40 (Objektrahmen) angezeigt. Die Zeichnungsnummer, welche in der Zusammenfassung beinhaltet ist, kann auch die entsprechende Zeichnung auf der Anzeige durch Anklicken dieser Nummer aufrufen. Wenn der Knopf 24 zum Auswählen aller Zeichnungen des Bereichs 20 unter dieser Bedingung angeklickt wird, wird der Rahmen angezeigt, welcher in 9B gezeigt ist. Dieser Rahmen bzw. dieses Bild umfaßt einen Bereich 50, um die aktuelle Bildzeichnung zu zeigen; einen Knopf 51, um die vorhergehenden Bildzeichnung aufzurufen; einen Knopf 52, um die folgende Bildzeichnung aufzurufen; und einen Knopf 53, um alle Zeichnungen zur selben Zeit in einem Rahmen aufzurufen. Wenn der Knopf 53 unter dieser Bedingung ausgewählt wird, wird der Rahmen angezeigt, welcher in 9C gezeigt ist. In diesem Rahmen werden alle Zeichnungen, sieben Zeichnungen in dieser Ausführungsform, und ein Bereich 60 für die Bildzeichnungsauswahlliste angezeigt, welches dem Suchenden ermöglicht, die zu vergrößernde Zeichnung auszuwählen. Wenn der Suchende die Zeichnungsnummer aus der Bildzeichnungsauswahlliste bezeichnet, wird die Bildzeichnung in der Form, die in 9B gezeigt ist, angezeigt.
  • Das Dokumentensuchsystem für mehrsprachige Dokumente der vorliegenden Erfindung ist mit zwei Übersetzungsmitteln versehen, die unabhängig vom jeweils anderen sind, wie oben beschrieben wurde. Eines ist ein Übersetzungssteuermittel zum Übersetzen der Schlüsselwörter, welche durch die Sprache des Suchenden geschrieben sind, in eine andere Sprache. Die anderen Übersetzungssteuermittel dienen für die Suchresultate, welche die gesamten Dokumente übersetzen können, welche als ein Suchresultat ausgewählt wurden. Betreffend die Schlüsselwortübersetzungsmittel wird ein einfaches Übersetzungssystem angewendet, weil die Objekte der Übersetzung Wörter sind, wie beispielsweise Hauptwörter, Verben usw. Auf der anderen Seite kann für die Suchresultatübersetzungsmittel ein Übersetzungssystem mit einem hohen Niveau angewendet werden, weil die Objekte der Übersetzung allgemeine Sätze sind und die geeignete Übersetzung durch Herleitung aus dem Kontext des Dokuments gefordert wird. Daher wird in den Verfahrensschritten der Übersetzungsmittel für das freie Schlüsselwort, wo die Suchformel geändert, hinzugefügt, modifiziert oder häufig gelöscht werden kann, um die Exaktheit des Suchresultates zu verbessern, die Verarbeitungsgeschwindigkeit in diesen Schritten nicht verringert und es kann daher die gesamte Systemreaktion bzw. -antwort beschleunigt werden.
  • Teilliste:
  • 1
    Anzeigeneingabemittel
    2
    Kommunikationssteuermittel
    3
    Übersetzungssteuermittel für freies Schlüsselwort
    4
    Synonymsuchmittel
    5
    Suchformel-Erzeugungsmittel
    6
    Suchmittel
    7
    Speichermittel für mehrfache Dokumente
    8
    primäre Speichermittel für das Suchresultat
    9
    Übersetzungssteuermittel für das Suchresultat
    10
    Suchresultat-Editier- bzw. -Bearbeitungsmittel
    11
    sekundäre Speichermittel für das Suchresultat

Claims (10)

  1. Dokumentsuchsystem für mehrsprachige Dokumente, umfassend: Eingabemittel bzw. -einrichtungen zum Eingeben eines Suchbefehls, beinhaltend ein Suchschlüsselwort, eine Sprache, welche durch einen Suchenden bezeichnet ist, und eine Datenbank, welche zu durchsuchen ist, welche durch den Suchenden bezeichnet ist; Suchmittel zum Durchsuchen von Dokumentspeichermitteln für ein Speichern von Dokumenten; Suchresultat-Speichermittel zum Speichern der ausgewählten Dokumente; Suchresultat-Übersetzungsregel- bzw. -steuermittel zum Übersetzen des Suchresultats, welches in den Suchresultat-Speichermitteln gespeichert ist, in die in der Eingabe des Suchbefehls bezeichnete Sprache; und Anzeigemittel, um das Resultat der Übersetzung anzuzeigen, gekennzeichnet durch Schlüsselwort-Übersetzungssteuer- bzw. -regelmittel zum Übersetzen des Schlüsselworts, welches durch den Suchenden eingegeben wurde, in eine andere Sprache, welche in den zu durchsuchenden Dokumenten verwendet wird; Suchformel-Erzeugungsmittel zum Erzeugen einer Suchformel, umfassend Informationen für die Suche, wie beispielsweise das übersetzte Schlüsselwort, welches von den Schlüsselwort-Übersetzungssteuermitteln übertragen wurde, und die zu durchsuchende Datenbank; worin die Schlüsselwort-Übersetzungssteuermittel und die Suchresultat-Übersetzungssteuermittel unabhängig voneinander sind, so daß die Schlüsselwort-Übersetzungssteuermittel das Schlüsselwort übersetzen und die Suchresultat-Übersetzungssteuermittel wenigstens Sätze der ausgewählten Dokumente übersetzen, und die Suchmittel die Dokumentenspeichermittel gemäß der Suchformel durchsuchen, welche von den Suchformel-Erzeugungsmittel übertragen wurde.
  2. Dokumentensuchsystem für mehrsprachige Dokumente nach Anspruch 1, worin die Dokumente Dokumente mit Links bzw. Verbindungen sind.
  3. Dokumentensuchsystem für mehrsprachige Dokumente nach Anspruch 1 oder 2, worin das System zusätzlich Synonym-Suchmittel umfaßt, um Synonyme des Schlüsselworts auszugeben, welches durch den Suchenden eingegeben ist.
  4. Dokumentensuchsystem für mehrsprachige Dokumente nach einem der vorangehenden Ansprüche, worin die Synonym-Suchmittel zusätzlich Synonym-Speichermittel und Schreibmittel umfassen, um die Synonym-Speichermittel neu zu schreiben.
  5. Dokumentensuchsystem für mehrsprachige Dokumente nach einem der vorangehenden Ansprüche, worin die Suchformel-Erzeugungsmittel mit Synonym-Modifikationsmitteln versehen sind, welche ein Ändern der ausgewählten Synonyme ermöglichen.
  6. Dokumentensuchsystem für mehrsprachige Dokumente nach einem der vorangehenden Ansprüche, worin die Suchresultat-Übersetzungssteuer- bzw. -regelmittel mit Übersetzungsbereich-Bezeichnungs- bzw. -Bestimmungsmitteln versehen sind, um einen zu übersetzenden Bereich zu bezeichnen.
  7. Dokumentensuchsystem für mehrsprachige Dokumente nach einem der vorangehenden Ansprüche, worin die Suchresultat-Speichermittel mit primären Speichermitteln, um bibliographische Information des Suchresultats zu speichern, und sekundären Speichermitteln versehen sind, um den gesamten Text der Dokumente zu speichern.
  8. Dokumentensuchsystem für mehrsprachige Dokumente nach einem der vorangehenden Ansprüche, worin das Dokument mit einem Link ein HTML-Dokument ist.
  9. Dokumentensuchverfahren für mehrsprachige Dokumente, umfassend die Schritte: Eingeben eines Suchbefehls, umfassend ein Such-Schlüsselwort, eine Sprache, welche durch einen Suchenden bezeichnet ist, und eine Datenbank, welche zu durchsuchen ist, welche durch den Suchenden bezeichnet oder bezeichenbar ist; Übersetzen des Schlüsselworts, welches durch den Suchenden eingegeben wird, in eine andere Sprache, welche in den zu durchsuchenden Dokumenten verwendet wird; und Erzeugen einer Suchformel, welche Information für die Suche umfaßt, wie beispielsweise das übersetzte Schlüsselwort und die zu durchsuchende Datenbank; Durchsuchen von Dokumentenspeichermitteln zum Speichern von Dokumenten; Speichern der ausgewählten Dokumente in Suchresultat-Speichermitteln; Übersetzen der Dokumente, welche in den Suchresultat-Speichermitteln gespeichert werden, in die in der Eingabe des Suchbefehls bezeichnete Sprache; und Anzeigen des Resultats der Übersetzung, worin der Schritt eines Übersetzens des Schlüsselworts das Schlüsselwort, welches durch den Suchenden eingegeben wurde, übersetzt und der Schritt eines Übersetzens der ausgewählten Dokumente, welche in den Suchresultat-Speichermittel gespeichert werden, wenigstens Sätze der ausgewählten Dokumente übersetzt.
  10. Dokumentensuchverfahren für mehrsprachige Dokumente, umfassend die Schritte: Eingeben eines Suchbefehls, beinhaltend ein Suchschlüsselwort, eine Sprache, welche durch einen Suchenden bezeichnet ist, und eine Datenbank, welche zu durchsuchen ist, welche durch den Suchenden bezeichnet oder bezeichenbar ist; Übertragen des Schlüsselworts, welches durch den Suchenden eingegeben wurde, in ein Dokumentensuchsystem für mehrsprachige Dokumente, umfassend: Schlüsselwort-Übersetzungssteuer- bzw. -regelmittel zum Übersetzen des Schlüsselworts, welches durch den Suchenden eingegeben wurde, in eine andere Sprache, welche in den zu durchsuchenden Dokumenten verwendet wird; Suchformel-Erzeugungsmittel, um eine Suchformel zu erzeugen, umfassend Information für die Suche, wie beispielsweise das Schlüsselwort, welches von den Schlüsselwort-Übersetzungssteuer- bzw. -regelmitteln übertragen wird, und die zu durchsuchende Datenbank; Suchmittel zum Durchsuchen von Dokumentenspeichermitteln entsprechend der Suchformel, welche von den Suchformel-Erzeugungsmitteln übertragen wird; Suchresultat-Speichermittel zum Speichern der ausgewählten Dokumente; Suchresultat-Übersetzungssteuer- bzw. -regelmittel zum Übersetzen der ausgewählten Dokumente, welche in den Suchresultat-Speichermitteln gespeichert werden, in die bei dem Schritt einer Eingabe bezeichnete Sprache; und Übertragungsmittel zum Übertragen des übersetzten Suchresultats, wobei das Verfahren weiters umfaßt: Anzeigen des Resultats der Übersetzung; worin die Schlüsselwort-Übersetzungssteuer- bzw. -regelmittel und die Suchresultat-Übersetzungssteuer- bzw. -regelmittel unabhängig voneinander sind, so daß die Schlüsselwort-Übersetzungssteuer- bzw. -regelmittel das Schlüsselwort übersetzen und die Suchresultat-Übersetzungssteuer- bzw. -regelmittel wenigstens Sätze der ausgewählten Dokumente übersetzen.
DE69725258T 1996-10-23 1997-10-22 System und Verfahren zur Wiederauffindung von Dokumenten in mehreren Sprachen Expired - Fee Related DE69725258T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US740044 1996-10-23
US08/740,044 US5956740A (en) 1996-10-23 1996-10-23 Document searching system for multilingual documents

Publications (2)

Publication Number Publication Date
DE69725258D1 DE69725258D1 (de) 2003-11-06
DE69725258T2 true DE69725258T2 (de) 2004-08-05

Family

ID=24974807

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69725258T Expired - Fee Related DE69725258T2 (de) 1996-10-23 1997-10-22 System und Verfahren zur Wiederauffindung von Dokumenten in mehreren Sprachen

Country Status (4)

Country Link
US (3) US5956740A (de)
EP (1) EP0838765B1 (de)
JP (1) JP3666004B2 (de)
DE (1) DE69725258T2 (de)

Families Citing this family (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956740A (en) * 1996-10-23 1999-09-21 Iti, Inc. Document searching system for multilingual documents
JP3282976B2 (ja) * 1996-11-15 2002-05-20 株式会社キングジム 文字情報処理装置及び方法
US6542888B2 (en) * 1997-11-26 2003-04-01 International Business Machines Corporation Content filtering for electronic documents generated in multiple foreign languages
US8489980B2 (en) 1998-02-23 2013-07-16 Transperfect Global, Inc. Translation management system
US6623529B1 (en) * 1998-02-23 2003-09-23 David Lakritz Multilingual electronic document translation, management, and delivery system
US10541974B2 (en) 1998-02-23 2020-01-21 Transperfect Global, Inc. Intercepting web server requests and localizing content
US6526426B1 (en) * 1998-02-23 2003-02-25 David Lakritz Translation management system
JP3666005B2 (ja) * 1998-03-03 2005-06-29 マツダ株式会社 特許情報検索システム、特許情報検索装置、情報検索中継装置並びに特許情報検索方法
DE19814348A1 (de) * 1998-03-31 1999-10-07 Ibm System und Verfahren zur Kommunikation mit verschiedenen elektronischen Archivsystemen
GB2337611A (en) * 1998-05-20 1999-11-24 Sharp Kk Multilingual document retrieval system
GB2338089A (en) * 1998-06-02 1999-12-08 Sharp Kk Indexing method
US6735585B1 (en) * 1998-08-17 2004-05-11 Altavista Company Method for search engine generating supplemented search not included in conventional search result identifying entity data related to portion of located web page
US7191393B1 (en) * 1998-09-25 2007-03-13 International Business Machines Corporation Interface for providing different-language versions of markup-language resources
US6349276B1 (en) * 1998-10-29 2002-02-19 International Business Machines Corporation Multilingual information retrieval with a transfer corpus
US6381598B1 (en) * 1998-12-22 2002-04-30 Xerox Corporation System for providing cross-lingual information retrieval
EP1266313A2 (de) 1999-03-19 2002-12-18 Trados GmbH System zum verwalten von arbeitsabläufen
US6954767B1 (en) * 1999-03-31 2005-10-11 Fuji Photo Film Co., Ltd. Server and method for searching for image using image prefetch, designating database and storage devices for searching, and setting retrieval and processing parameters for search
JP2001022787A (ja) * 1999-07-13 2001-01-26 Nippon Telegr & Teleph Corp <Ntt> 多言語インタラクティブ情報検索システム及び多言語インタラクティブ情報検索プログラムを記録した記録媒体
US6418402B1 (en) * 1999-07-27 2002-07-09 International Business Machines Corporation Method and system for utilizing machine translation as input correction
CN1176432C (zh) * 1999-07-28 2004-11-17 国际商业机器公司 提供本国语言查询服务的方法和系统
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7925610B2 (en) 1999-09-22 2011-04-12 Google Inc. Determining a meaning of a knowledge item using document-based information
US7149964B1 (en) * 2000-02-09 2006-12-12 Microsoft Corporation Creation and delivery of customized content
KR100372582B1 (ko) * 2000-02-23 2003-02-17 가부시키가이샤 히타치세이사쿠쇼 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체
US7082456B2 (en) * 2000-03-17 2006-07-25 Filesx Ltd. Accelerating responses to requests made by users to an internet
US20040006560A1 (en) * 2000-05-01 2004-01-08 Ning-Ping Chan Method and system for translingual translation of query and search and retrieval of multilingual information on the web
US6604101B1 (en) * 2000-06-28 2003-08-05 Qnaturally Systems, Inc. Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network
FR2809509B1 (fr) * 2000-05-26 2003-09-12 Bull Sa Systeme et procede d'internationalisation du contenu de documents a balises dans un systeme informatique
GB2362971B (en) * 2000-05-30 2004-03-24 Com Nation Ltd A method of searching the internet and an internet search engine
US20010054011A1 (en) * 2000-06-15 2001-12-20 Nec Corporation Contents conversion fee charging system, contents conversion fee charging method and storage medium storing program for controlling same
JP2002024141A (ja) * 2000-07-05 2002-01-25 Nec Corp 電子メールの翻訳を代行する方法、そのための装置及びシステム
JP2002063201A (ja) * 2000-08-17 2002-02-28 Nova Asia:Kk コンピュータネットワークを用いた多言語対応情報検索方法及び検索兼翻訳ツールバー
US6999932B1 (en) * 2000-10-10 2006-02-14 Intel Corporation Language independent voice-based search system
JPWO2002035369A1 (ja) * 2000-10-13 2004-03-04 株式会社東芝 データ中継システム、データ中継方法、データ中継プログラム、情報処理方法及び情報処理プログラム
US20020099533A1 (en) * 2001-01-23 2002-07-25 Evan Jaqua Data processing system for searching and communication
JP3328913B1 (ja) * 2001-08-03 2002-09-30 学校法人 慶應義塾 多言語文献検索システム
US7146358B1 (en) 2001-08-28 2006-12-05 Google Inc. Systems and methods for using anchor text as parallel corpora for cross-language information retrieval
US7392173B2 (en) * 2001-09-06 2008-06-24 International Business Machines Corporation Method and system of presenting a document to a user
JP3452558B2 (ja) * 2001-09-25 2003-09-29 インターナショナル・ビジネス・マシーンズ・コーポレーション 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム
EP1300773A1 (de) * 2001-10-02 2003-04-09 Sun Microsystems, Inc. Informationsdienst unter Verwendung von einem Thesaurus
US20030131316A1 (en) * 2002-01-07 2003-07-10 Kyle Brown Internationalizing SGML documents
US20030144912A1 (en) * 2002-01-29 2003-07-31 Mcgee Todd Multilingual messaging system and method for e-commerce
US6952691B2 (en) * 2002-02-01 2005-10-04 International Business Machines Corporation Method and system for searching a multi-lingual database
JP2003296223A (ja) * 2002-03-29 2003-10-17 Fuji Xerox Co Ltd ウェブページ提供方法および装置並びにプログラム
EP1353280B1 (de) * 2002-04-12 2006-06-14 Targit A/S Verfahren zur Verarbeitung von mehrsprachigen Abfragen
CN1685341B (zh) * 2002-09-30 2014-09-10 开拧系统公司 跨语言搜索结果的闪烁注释标注加亮
EP1550033A2 (de) * 2002-09-30 2005-07-06 Ning-Ping Chan Durch zeiger eingeleitete sofort-zweisprachenannotation auf textinformationen in einem elektronischen dokument
US20040103087A1 (en) * 2002-11-25 2004-05-27 Rajat Mukherjee Method and apparatus for combining multiple search workers
US7627817B2 (en) 2003-02-21 2009-12-01 Motionpoint Corporation Analyzing web site for translation
US8306972B2 (en) 2003-03-31 2012-11-06 Google Inc. Ordering of search results based on language and/or country of the search results
US7451129B2 (en) * 2003-03-31 2008-11-11 Google Inc. System and method for providing preferred language ordering of search results
US7451130B2 (en) * 2003-06-16 2008-11-11 Google Inc. System and method for providing preferred country biasing of search results
US20040243391A1 (en) * 2003-05-28 2004-12-02 Nelson David D. Apparatus, system, and method for multilingual regulation management
US20100070265A1 (en) * 2003-05-28 2010-03-18 Nelson David D Apparatus, system, and method for multilingual regulation management
US7854009B2 (en) * 2003-06-12 2010-12-14 International Business Machines Corporation Method of securing access to IP LANs
US20040268306A1 (en) * 2003-06-30 2004-12-30 Cheng Ken Prayoon Methods, systems and computer program products for language independent data communication and display
US8014997B2 (en) * 2003-09-20 2011-09-06 International Business Machines Corporation Method of search content enhancement
US20050065774A1 (en) * 2003-09-20 2005-03-24 International Business Machines Corporation Method of self enhancement of search results through analysis of system logs
US20050177358A1 (en) * 2004-02-10 2005-08-11 Edward Melomed Multilingual database interaction system and method
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US20100262621A1 (en) * 2004-03-05 2010-10-14 Russ Ross In-context exact (ice) matching
JP2008527524A (ja) * 2005-01-10 2008-07-24 メリンゴ リミテッド 埋め込み型翻訳強化検索
JP4710417B2 (ja) * 2005-05-25 2011-06-29 富士ゼロックス株式会社 情報処理装置
US8521506B2 (en) * 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
KR100835172B1 (ko) * 2006-10-16 2008-06-05 한국전자통신연구원 동의어를 이용한 정보 검색 시스템 및 그 방법
DE102006060173A1 (de) * 2006-12-18 2008-04-10 Zettwerk Software Engineering Gmbh Rekursives sprachübergreifendes Recherche-System
US7720856B2 (en) * 2007-04-09 2010-05-18 Sap Ag Cross-language searching
US8117194B2 (en) * 2007-05-07 2012-02-14 Microsoft Corporation Method and system for performing multilingual document searches
US8799307B2 (en) * 2007-05-16 2014-08-05 Google Inc. Cross-language information retrieval
US7917840B2 (en) 2007-06-05 2011-03-29 Aol Inc. Dynamic aggregation and display of contextually relevant content
US8051061B2 (en) * 2007-07-20 2011-11-01 Microsoft Corporation Cross-lingual query suggestion
US7917488B2 (en) * 2008-03-03 2011-03-29 Microsoft Corporation Cross-lingual search re-ranking
KR100923936B1 (ko) * 2008-03-14 2009-10-29 엔에이치엔(주) 일본어 사전 서비스에 있어서 2개 단어 이상의 쿼리, 한글쿼리 또는 일반적인 쿼리의 입력 시 검색 결과를 제공하는방법 및 시스템
US8171041B2 (en) * 2008-05-15 2012-05-01 Enpulz, L.L.C. Support for international search terms
KR100956413B1 (ko) 2008-05-21 2010-05-06 한국과학기술정보연구원 언어 교차 검색 방법 및 시스템
US8312032B2 (en) * 2008-07-10 2012-11-13 Google Inc. Dictionary suggestions for partial user entries
JP2010039721A (ja) * 2008-08-04 2010-02-18 Just Syst Corp データ入力装置、方法、及びプログラム
JP2010055235A (ja) * 2008-08-27 2010-03-11 Fujitsu Ltd 翻訳支援プログラム、及び該システム
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
GB2468278A (en) * 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
CN101933017B (zh) * 2009-03-24 2013-07-03 三菱电机信息系统株式会社 文件检索装置、文件检索系统和文件检索方法
US20110251837A1 (en) * 2010-04-07 2011-10-13 eBook Technologies, Inc. Electronic reference integration with an electronic reader
US9569549B1 (en) 2010-05-25 2017-02-14 Amazon Technologies, Inc. Location based recommendation and tagging of media content items
US8843814B2 (en) * 2010-05-26 2014-09-23 Content Catalyst Limited Automated report service tracking system and method
US8769392B2 (en) * 2010-05-26 2014-07-01 Content Catalyst Limited Searching and selecting content from multiple source documents having a plurality of native formats, indexing and aggregating the selected content into customized reports
US11100098B2 (en) * 2010-05-28 2021-08-24 Oracle International Corporation Systems and methods for providing multilingual support for data used with a business intelligence server
US9864809B2 (en) 2010-07-13 2018-01-09 Motionpoint Corporation Dynamic language translation of web site content
US8639701B1 (en) 2010-11-23 2014-01-28 Google Inc. Language selection for information retrieval
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US8756120B2 (en) * 2011-11-01 2014-06-17 Sap Ag Hybrid context-sensitive matching algorithm for retrieving product catalogue information
US9098494B2 (en) * 2012-05-10 2015-08-04 Microsoft Technology Licensing, Llc Building multi-language processes from existing single-language processes
JP6110647B2 (ja) * 2012-12-10 2017-04-05 株式会社アイ・オー・データ機器 ストリーミングコンテンツ再生用セットトップボックスおよびテレビジョン
US20140181691A1 (en) * 2012-12-20 2014-06-26 Rajesh Poornachandran Sharing of selected content for data collection
CN103905515A (zh) * 2012-12-28 2014-07-02 北大方正集团有限公司 一种分布式互联网信息下载系统及方法
US10529013B2 (en) * 2013-07-01 2020-01-07 Intuit Inc. Identifying business type using public information
US20150370891A1 (en) * 2014-06-20 2015-12-24 Sony Corporation Method and system for retrieving content
US20180082307A1 (en) * 2016-09-19 2018-03-22 Experian Health, Inc. Selection of pre-arranged assistance from an electronic qualification transaction
CN107688614B (zh) * 2017-08-04 2018-08-10 平安科技(深圳)有限公司 意图获取方法、电子装置及计算机可读存储介质
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
CN111708911B (zh) * 2020-06-17 2022-06-24 北京字节跳动网络技术有限公司 搜索方法、装置、电子设备及计算机可读存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57152070A (en) * 1981-03-13 1982-09-20 Sharp Corp Electronic interpreter
JPH0743719B2 (ja) * 1986-05-20 1995-05-15 シャープ株式会社 機械翻訳装置
US4870610A (en) * 1987-08-25 1989-09-26 Bell Communications Research, Inc. Method of operating a computer system to provide customed I/O information including language translation
CA1280215C (en) * 1987-09-28 1991-02-12 Eddy Lee Multilingual ordered data retrieval system
JP2854000B2 (ja) * 1988-01-20 1999-02-03 エヌ・ティ・ティ・アドバンステクノロジ株式会社 検索装置
JPH0421180A (ja) * 1990-05-16 1992-01-24 Matsushita Graphic Commun Syst Inc 文書検索装置
JPH04209068A (ja) * 1990-12-05 1992-07-30 Nippon Telegr & Teleph Corp <Ntt> データベース検索方法
US5278980A (en) * 1991-08-16 1994-01-11 Xerox Corporation Iterative technique for phrase query formation and an information retrieval system employing same
JPH05165889A (ja) * 1991-12-13 1993-07-02 Canon Inc 文書検索装置
US5523946A (en) * 1992-02-11 1996-06-04 Xerox Corporation Compact encoding of multi-lingual translation dictionaries
US5692176A (en) * 1993-11-22 1997-11-25 Reed Elsevier Inc. Associative text search and retrieval system
JPH07319917A (ja) * 1994-05-24 1995-12-08 Fuji Xerox Co Ltd 文書データべース管理装置および文書データべースシステム
US6139201A (en) * 1994-12-22 2000-10-31 Caterpillar Inc. Integrated authoring and translation system
JP2780735B2 (ja) * 1995-01-31 1998-07-30 沖電気工業株式会社 翻訳機能付文書検索表示システム
US5987402A (en) * 1995-01-31 1999-11-16 Oki Electric Industry Co., Ltd. System and method for efficiently retrieving and translating source documents in different languages, and other displaying the translated documents at a client device
US5708825A (en) * 1995-05-26 1998-01-13 Iconovex Corporation Automatic summary page creation and hyperlink generation
WO1997008604A2 (en) * 1995-08-16 1997-03-06 Syracuse University Multilingual document retrieval system and method using semantic vector matching
JPH0981569A (ja) * 1995-09-12 1997-03-28 Hitachi Ltd 多カ国対応サービス提供システム
JPH09114852A (ja) * 1995-10-20 1997-05-02 Matsushita Electric Ind Co Ltd 情報検索装置
US5924089A (en) * 1996-09-03 1999-07-13 International Business Machines Corporation Natural language translation of an SQL query
US5956740A (en) * 1996-10-23 1999-09-21 Iti, Inc. Document searching system for multilingual documents

Also Published As

Publication number Publication date
US20010016860A1 (en) 2001-08-23
US5956740A (en) 1999-09-21
JP3666004B2 (ja) 2005-06-29
US6212537B1 (en) 2001-04-03
EP0838765A1 (de) 1998-04-29
JPH10232883A (ja) 1998-09-02
DE69725258D1 (de) 2003-11-06
US6356894B2 (en) 2002-03-12
EP0838765B1 (de) 2003-10-01

Similar Documents

Publication Publication Date Title
DE69725258T2 (de) System und Verfahren zur Wiederauffindung von Dokumenten in mehreren Sprachen
DE60304331T2 (de) Abrufen übereinstimmender dokumente durch abfragen in einer nationalen sprache
DE60029845T2 (de) System zum identifizieren der verhältnisse zwischen bestandteilen in aufgaben vom typ informations-wiederauffindung
DE60029732T2 (de) Phrasenübersetzungsverfahren und -system
DE60208604T2 (de) Automatisches Verfahren zur Erzeugung von Image-buttons
EP1311989B1 (de) Verfahren zur automatischen recherche
DE19709968C2 (de) Verfahren und System zum Übersetzen eines Dokumentes
DE69734400T2 (de) Verfahren und system zur prüfung der richtigkeit der rechtschreibung und grammatik eines dokuments
DE69911842T2 (de) Verfahren und Vorrichtung zum Wiederauffinden von Information und entsprechendes Speichermedium
DE69432575T2 (de) Dokumentenerkennungssystem mit verbesserter Wirksamkeit der Dokumentenerkennung
DE69931256T2 (de) Verfahren und system zum zurückholen einer elektronischen akte
DE69930690T2 (de) Verfahren und Gerät um einen Index herzustellen, Benutzung von einem Index und ein Speichermedium
DE102019001267A1 (de) Dialogartiges System zur Beantwortung von Anfragen
DE69628374T2 (de) Datenverwaltungssystem
DE60101668T2 (de) Verfahren und gerät zum erzeugen eines auf einer formatvorlage basierten index für ein strukturiertes dokument
DE10162418A1 (de) System zur Verarbeitung strukturierter Dokumente, damit sie sich zur Ablieferung über Netzwerke eignen
DE112020005268T5 (de) Automatisches erzeugen von schema-annotationsdateien zum umwandeln von abfragen in natürlicher sprache in eine strukturierte abfragesprache
DE69933123T2 (de) Zugriff auf eine semi-strukturierte datenbank
DE202013012665U1 (de) Methode zur Implementierung von strukturierten und unstrukturierten Daten in XML-Dokumenten
DE10303070A1 (de) Erzeugen einer Liste von Adressen in einem Server
EP1412875B1 (de) Verfahren zur verarbeitung von text in einer rechnereinheit und rechnereinheit
DE10303067A1 (de) Erzeugen einer Liste von Adressen in einer Indexseite
EP1160688A2 (de) Verfahren und Vorrichtung zum automatischen Verknüpfen von Datensätzen aus zumindest einer Datenquelle sowie System zum Abrufen von verknüpften Datensätzen
DE10303066A1 (de) Unterstütztes Eingeben von Adressen
DE10160920B4 (de) Verfahren und Vorrichtung zur Erzeugung eines Extrakts von Dokumenten

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)
8339 Ceased/non-payment of the annual fee