DE10124429A1 - System und Verfahren für eine verbesserte Rechtschreibprüfung - Google Patents
System und Verfahren für eine verbesserte RechtschreibprüfungInfo
- Publication number
- DE10124429A1 DE10124429A1 DE10124429A DE10124429A DE10124429A1 DE 10124429 A1 DE10124429 A1 DE 10124429A1 DE 10124429 A DE10124429 A DE 10124429A DE 10124429 A DE10124429 A DE 10124429A DE 10124429 A1 DE10124429 A1 DE 10124429A1
- Authority
- DE
- Germany
- Prior art keywords
- words
- user
- list
- document
- misspelled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
Abstract
Ein Rechtschreibprüfverfahren stellt eine wählbare Liste von ähnlich geschriebenen Wörtern dar, wenn ein falsch geschriebenes Wort vom Benutzer ausgewählt wird, der die korrekte Schreibweise herausfinden möchte. Ein Merkmal ermittelt den "Inhalt" oder das "Thema" eines Dokumentes. Auf der Grundlage des Inhaltes präsentiert das Rechtschreibprüfprogramm wahrscheinliche Ersatzwörter für ein falsch geschriebenes Wort. In einem anderen Merkmal prüft das Rechtschreibprüfprogramm für jeden Buchstaben im Wort "in der Nähe gelegene" Buchstaben auf Tastaturtasten, um die Liste von Ersatzwörtern des Rechtschreibprüfprogramms zu verbessern. Das System überwacht außerdem das Verwendungsprotokoll eines Benutzers bezüglich nahe liegenden Ersetzungen oder Tasten- (d.h. Buchstaben-) Ersetzungen und berücksichtigt diese Informationen bei der Darstellung von Listen von alternativen Wörtern. Ein anderes Merkmal korrigiert die Schreibweise durch Überwachen eines Protokolls von Rechtschreibprüfkorrekturen eines Benutzers. Datenverbundtabellen von Korrekturen für mehr als einen Benutzer können von Rechtschreibprüfprogrammen verwaltet, gemeinsam genutzt und bereitgestellt werden. Es können verschiedene Prioritäten verwendet werden, so dass eine Lösung vor einer anderen bevorzugt wird. Die Prioritäten können durch manuelle Eingabe eines Benutzers festgelegt oder von der Systemsoftware automatisch bereitgestellt werden. Ein anderes Merkmal stellt ein zusätzliches Fenster bereit, das die am ...
Description
Diese Erfindung betrifft Textverarbeitung und insbesondere ein
Verfahren und System zum Korrigieren der Schreibweise von
Wörtern in einem Textverarbeitungssystem.
Computer, insbesondere Personal-Computer, werden hauptsächlich
zur "Textverarbeitung" verwendet. Textverarbeitungsprogramme
(word processors) haben die Schreibmaschine als
hauptsächliches Mittel zur Dokumentenerstellung ersetzt. Bei
der Erstellung von Dokumenten ist es normalerweise sehr
wichtig, dass jedes Wort richtig geschrieben wird. In
Textverarbeitungsprogrammen wird oftmals ein
Rechtschreibprüfprogramm verwendet, um die Rechtschreibung von
Worten in einem Dokument zu überprüfen. Der Benutzer ruft
normalerweise ein Rechtschreibprüfprogramm (spell checker)
auf, indem er eine Rechtschreib-Hilfsprogrammoption (spelling
tool option) auswählt. Ein Rechtschreibprüfprogramm weist eine
zugeordnete Wörterbuchdatei (dictionary file) auf, die eine
Liste von richtig geschriebenen Wörtern enthält. Um die
Rechtschreibung eines Wortes im Dokument zu überprüfen, sucht
das Rechtschreibprüfprogramm nach diesem Wort. Falls das Wort
im Wörterbuch vorhanden ist, ist das Wort richtig geschrieben.
Andernfalls ist das Wort falsch geschrieben. Das
Rechtschreibprüfprogramm meldet dem Benutzer normalerweise
falsch geschriebene Wörter und fordert zur korrekten
Schreibweise auf. Das Rechtschreibhilfsprogramm (spelling
tool) kann den Benutzer bei jedem möglicherweise falsch
geschriebenen Wort auffordern, das Wort zu ersetzen, zu
ignorieren oder zu bearbeiten. Diese Aufforderung beinhaltet
oftmals die Darstellung einer wählbaren Liste von ähnlich
buchstabierten Wörtern, aus der der Benutzer wählen kann. Wenn
der Benutzer das gewünschte Wort auswählt, ersetzt das
Rechtschreibprüfprogramm das falsch geschriebene Wort durch
das richtig geschriebene Wort.
Eine Rechtschreibprüfung wird außerdem auf verschiedenen
Internet-Web-Seiten bereitgestellt, beispielsweise auf der
bekannten Web-Site von Alta Vista bei www.altavista.com, die
alternative Schreibweisen für falsch geschriebene Worte
bereitstellt, wenn Benutzer Wörter eingeben, um Informationen
im World-Wide-Web zu suchen. Ein System und Verfahren für ein
verbessertes Rechtschreibprüfprogramm ist daher hilfreich bei
der Textverarbeitung in jedem Bereich, in dem Text getippt
wird, beispielsweise in Computern oder in Web-Suchmaschinen
(web search engines). Die Verwendung eines verbesserten
Rechtschreibprüfprogramms ist nicht auf Dokumente begrenzt,
die durch Tippen auf einer Tastatur erzeugt werden, sondern
kann auch auf Text angewandt werden, der durch Spracheingabe
oder handschriftliche Eingabe erzeugt wurde.
Eine Rechtschreibprüfung gemäß dem gegenwärtigen Prozess ist
nicht leistungsfähig, da die wählbare Liste von ähnlich
buchstabierten Wörtern möglicherweise nicht tatsächlich das
Wort enthält, das der Benutzer zu buchstabieren versuchte.
Falls die Liste das Wort enthält, ist es oftmals mühsam, das
richtige Wort in einer Liste zu finden, die viele alternative
Schreibweisen enthält. Obwohl die gegenwärtige
Rechtschreibprüfung eine hilfreiche Funktion ist, ist sie
daher bezüglich der erforderlichen Benutzerinteraktion nicht
leistungsfähig.
Beispiele für Rechtschreibprüfprogramme, die Datenbanken von
ähnlich buchstabierten Wörtern verwenden, werden in der am 23.
Februar 1999 von Nielsen veröffentlichten US-Patentschrift Nr.
5 875 443 erläutert. Dieses Patent erläutert die Verwendung
von im Internet verfügbaren fernen Datenbanken und ist in
seiner Gesamtheit durch Bezugnahme hierin aufgenommen.
Beispiele für eine "Hintergrund"-Rechtschreibprüfung werden in
der am 28. Juli 1998 von Mogilevsky veröffentlichten US-
Patentschrift Nr. 5 787 451 erläutert, die in ihrer Gesamtheit
durch Bezugnahme hierin aufgenommen ist.
"Hintergrund"-Rechtschreibprüfung bezieht sich auf eine
Rechtschreibprüfung, die während Leerlaufperioden des
Textverarbeitungsprogramms ausgeführt wird. Das
Rechtschreibprüfprogramm führt eine "Hintergrund"-
Rechtschreibprüfung aus, so dass Rechtschreibfehler während
einer Bearbeitungssitzung im Dokument entsprechend
hervorgehoben werden können.
Um die Probleme und Nachteile vorhandener
Rechtschreibprüfprogramme anzugehen, stellt diese Erfindung
ein Verfahren zum Darstellen einer wählbaren Liste von ähnlich
buchstabierten Wörtern bereit, wenn ein falsch geschriebenes
Wort vom Benutzer ausgewählt wird, der die korrekte
Schreibweise herausfinden möchte. In einer Ausführungsform
ermittelt das Rechtschreibprüfprogramm den "Inhalt" oder das
"Thema" eines Dokumentes. Aufgrund des Inhaltes gibt das
Rechtschreibprüfprogramm geeignete Ersatzwörter für ein falsch
geschriebenes Wort an. In einer alternativen Ausführungsform
prüft das Rechtschreibprogramm für jeden Buchstaben im Wort
"nahe beieinander liegende" Buchstaben auf Tastaturtasten, um
die Liste von Ersatzwörtern des Rechtschreibprüfprogramms zu
verbessern. Das System überwacht außerdem das
Verwendungsprotokoll (history of use) eines Benutzers
bezüglich nahe beieinander liegenden Ersetzungen oder Tasten-
(d. h. Buchstaben-)Ersetzungen und geht bei der Darstellung
von Listen von alternativen Wörtern von diesen Informationen
aus. Ein Benutzer kann diese Informationen manuell ergänzen.
Das verbesserte Rechtschreibprüfprogramm korrigiert außerdem
die Rechtschreibung, indem es ein Benutzerprotokoll von
Rechtschreibprüfkorrekturen überwacht. Datenverbundtabellen
(aggregate tables) von Korrekturen für mehr als einen Benutzer
können von Rechtschreibprüfprogrammen verwaltet, gemeinsam
genutzt und bereitgestellt werden. Die zuvor erwähnten
Verfahren zur Verbesserung der Rechtschreibprüfung können
alleine verwendet oder als eine Folge von Prüfungen
sequenziell ausgeführt werden, wobei der Priorität der
verschiedenen Verfahren verschiedene Gewichtungen zugeordnet
werden. Es können verschiedene Prioritäten verwendet werden,
so dass eine Lösung gegenüber einer anderen bevorzugt wird.
Die Prioritäten können durch manuelle Eingabe eines Benutzers
ermittelt oder automatisch von der Systemsoftware
bereitgestellt werden.
Ein verbessertes Rechtschreibprüfprogramm kann außerdem ein
zusätzliches Fenster bereitstellen, das die am häufigsten oder
die kürzlich falsch geschriebenen Wörter eines Benutzers
zeigt. Der Benutzer kann eine Maus verwenden, um Wörter von
Interesse aus dem zusätzlichen Fenster in ein aktuelles
Dokument zu kopieren oder einzufügen, wobei die bei vielen
Betriebssystemen bereitgestellte "Zwischenablage"
("clipboard") verwendet wird. Das Sehen der korrekten Wörter
auf dem Bildschirm kann ebenfalls einen erzieherischen Wert
haben, indem die korrekte Schreibweise für jedes Wort im
Gedächtnis des Benutzers eingeprägt wird.
Obwohl Beispiele bezüglich einer Tastatureingabe angegeben
wurden, ist zu beachten, dass die hier dargestellten Verfahren
auf Systeme mit Spracheingabe und Handschrifterkennung
angewandt werden können. Daher kann das System und Verfahren
auch zur Verbesserung von Handschrift- und Spracherkennung
verwendet werden.
Die Erfindung wird besser mit Bezugnahme auf die folgende
ausführliche Beschreibung verstanden, wenn sie in Verbindung
mit den begleitenden Zeichnungen gelesen wird, in denen:
Fig. 1 eine bildliche Darstellung eines Beispielcomputersystems zeigt, das die vorliegende Erfindung
ausführt.
Fig. 2 zeigt eine bildliche Darstellung eines Fensters eines
Textverarbeitungsprogramms, das mit einem
Rechtschreibprüfprogramm ausgestattet ist.
Fig. 3 ist ein Flussdiagramm, das die Schritte darstellt, die
vom verbesserten Rechtschreibprüfprogramm in dem in Fig. 1
gezeigten Computersystem ausgeführt werden.
Fig. 4 ist ein Flussdiagramm, das darstellt, wie für die
Schritte 310, 330 und 340 räumlich eine Priorität vergeben
werden kann.
Mit Bezugnahme auf die Figuren und insbesondere auf Fig. 1
wird nun ein Computersystem 12 gemäß dem Verfahren und System
der vorliegenden Erfindung dargestellt. Das Computersystem 12
enthält einen Computer 36, eine Computeranzeige 38, eine
Tastatur 40 und mehrere Eingabezeigereinheiten (input pointing
devices) 42. Fachleute werden verstehen, dass die
Eingabezeigereinheiten 42 unter Verwendung eines Zeigestabes
44, einer Maus 46, einer Rollkugel 48, eines Stiftes 50, eines
Bildschirms 52 (z. B. eines berührungsempfindlichen Bildschirms
52) oder irgendeiner anderen Einheit realisiert werden können,
die es einem Benutzer ermöglicht, Objekte, Symbole und andere
Anzeigeelemente auf eine grafische Weise auf der
Computeranzeige 38 zu bearbeiten. Mit dem Computersystem 12
können außerdem Lautsprecher 54 und/oder Toneingabeeinheiten
(audio input devices) 51 verbunden sein. (Siehe beispielsweise
VoiceType-Diktiersystem von IBM. "VoiceType" ist ein
Warenzeichen der IBM-Corporation.)
Auf dem Bildschirm 52 kann eine grafische
Benutzerschnittstelle 53 angezeigt werden und unter Verwendung
irgendeiner Eingabezeigereinheit 42 bearbeitet werden. Die
grafische Benutzerschnittstelle 53 kann die Anzeige einer
Textverarbeitungsanwendung 60 enthalten, die Texte in einem
Dokument 62 unter Verwendung irgendeines bekannten
Textverarbeitungsprogramms 90 mit einer
Rechtschreibprüffunktion 93 anzeigt, die die Rechtschreibung
von Wörtern in einem Dokument überprüft. Das Dokument kann
grafische Informationen, akustische Informationen oder
Textinformationen 67 enthalten, die dem Benutzer über den
Bildschirm 52, Lautsprecher 54 oder andere Ausgabeeinheiten
dargeboten werden. Die Informationsseiten können wählbare
Verbindungen 66 enthalten, beispielsweise im World-Wide-Web
verwendete Hypertextverbindungen zu anderen Informationsseiten
62, wobei solche Verbindungen durch eine der Eingabeeinheiten
42 aktiviert werden können, um die zugeordneten
Informationsseiten anzufordern. Diese Hardware ist nach dem
Stand der Technik gut bekannt und wird auch in Verbindung mit
Fernsehen ("Web-TV") und Multimedia-Unterhaltungszentren
verwendet. Das Computersystem 12 enthält einen oder mehrere
Speicher 65, in denen die Erfindung Speicherplatz eines
Cachespeichers 80 reserviert. Ein Server 130, der über ein
Netz 110 mit dem Computersystem 12 verbunden ist, kann Seiten
von Multimediainformationen zum Cachespeicher 80 senden. Das
Netz 110 kann irgendein bekanntes lokales Netz (LAN) oder
Weitverkehrsnetz (WAN) sein, z. B. das Internet.
Mit Bezugnahme auf Fig. 1A wird nun ein Blockschaltbild der
Architektur des Computersystems 12 gemäß der vorliegenden
Erfindung dargestellt. Die Kernarchitektur (core architecture)
enthält eine Zentraleinheit 165, eine Speichersteuereinheit
162, einen Systemspeicher 65, einen Plattenspeicher 70 und
eine Plattenspeichersteuereinheit 75. Ein Teil des
Systemspeichers 65 wird für den Informationsseiten-
Cachespeicher 80 genutzt. Außerdem kann ein Dateispeicherplatz
85 in der Plattenspeichereinheit 70 als zusätzlicher
Dokumentseiten-Cachespeicher genutzt werden. Im Allgemeinen
ist ein Cachespeicher ein Ort, wo Daten (Dateien, Bilder und
andere Informationen) gespeichert werden können, um zu
verhindern, dass die Daten aus einer langsameren Einheit
gelesen werden müssen, beispielsweise aus einer fernen mit dem
Netz verbundenen Computerplatte. Ein Plattencachespeicher kann
beispielsweise Informationen speichern, die ohne Zugriff auf
einen fernen Plattenspeicher gelesen werden können.
Mit Bezugnahme auf Fig. 2 wird nun ein Bildschirm 52 mit
einer Anzeige einer Textverarbeitungsanwendung 60 gezeigt.
Falsch geschriebene Wörter, beispielsweise das falsch
geschriebene Wort "cimputee" 210 werden oftmals durch das
Rechtschreibprüfprogramm 93 eines Textverarbeitungsprogramms
90 (siehe Fig. 1) hervorgehoben 215, oder der Benutzer wird
auf andere Weise darauf aufmerksam gemacht. Wenn der Benutzer
das Wort 210 auswählt, wird dem Benutzer eine Liste von
alternativen ähnlichen Schreibweisen präsentiert, aus der der
Benutzer die korrekte Schreibweise des im Dokument
vorgesehenen Wortes wählen kann. Das erste korrekt
buchstabierte alternative Wort 225 ist beispielsweise
"compute".
Fig. 3 umfasst ein Flussdiagramm für einen bevorzugten
Rechtschreibprüfprozess 300, der vom Textverarbeitungsprogramm
90 und vom Rechtschreibprüfprogramm 93 realisiert wird. Im
Schritt 310 ermittelt das Rechtschreibprüfprogramm den
"Inhalt" oder das "Thema" eines Dokumentes. Dies kann erreicht
werden, indem die Wörter im Titel des Dokuments, in den
Hauptüberschriften und im Text überprüft werden, indem gezählt
wird, wie oft das Wort verwendet wurde. Das
Rechtschreibprüfprogramm 93 kann beispielsweise ermitteln,
dass das Wort "divination" im Titel des Dokuments vorkommt.
Außerdem kommt das Wort eventuell 20mal im Text vor. Dies
deutet daraufhin, das "divination" wahrscheinlich ein
wichtiges Wort ist, das sich auf den "Inhalt" des Dokuments
bezieht. Falls ein Benutzer "devination" manchmal falsch als
"duvonation" schreibt, muss das Rechtschreibprüfprogramm 93
zuerst das Wort "divination" als möglicherweise richtig
geschriebenes Wort 225 präsentieren (in der Liste 220 von
Fig. 2), bevor eine andere mögliche Wahl für Wörter
präsentiert wird, wie "deviation".
Falls das Rechtschreibprüfprogramm 93 im Schritt 310
feststellt, dass "divination" der Inhalt des Dokumentes ist
und für das Dokument wichtig ist, verwendet es außerdem eine
latente semantische Indizierung (latent semantic indexing),
synonyme Listen und Thesauren 92 (in Fig. 1 gezeigt) und/oder
verwandte Verfahren, um festzustellen, ob wahrscheinlich
verwandte Wörter, beispielsweise "fortune-telling", mit
einiger Wahrscheinlichkeit im Dokument vorkommen können, und
gibt diese wahrscheinlich verwandten Wörter in der Liste 220
von alternativen Wörtern zuerst an. Das falsch geschriebene
Wort "fotune-telling" ist wahrscheinlich "fortune-telling", da
"fortune-telling" ein mit "divination" verwandtes Wort ist,
was das Thema des Dokumentes ist oder für den Inhalt des
Dokumentes von Bedeutung ist. Die latente semantische
Indizierung ist ein Fachleuten gut bekanntes Verfahren, um den
Inhalt von Dokumenten festzustellen. Die Reihenfolge der Liste
220 von richtig geschriebenen Wörtern entspricht der
Wahrscheinlichkeit, mit der das Wort mit dem Thema des
Dokumentes verwandt ist. Falls beispielsweise "rodent"
zwanzigmal im Dokument vorkommt und "computer" zehnmal und das
Wort "shrew" (ein Art von Nagetier) als "shriw" falsch
geschrieben wird, erscheint das Ersatzwort "shrew" in der
Liste 220 vor "screw", da "shrew" eher mit Nagetieren verwandt
ist als mit Computern. Falls ein Wort in einer Überschrift
oder in einem Titel oder in einer expliziten Liste von
Schlüsselwörtern vorkommt, die entweder im Dokument vorhanden
sind oder vom Benutzer manuell eingegeben wurden, betreffen
diese Wörter mit hoher Wahrscheinlichkeit den Inhalt eines
Dokumentes. Die latente semantische Indizierung kann verwendet
werden, um die Bedeutung durch bekannte Verfahren
festzustellen, und kann daher ebenfalls verwendet werden, um
die Liste 220 von alternativen Wörtern so zu ordnen, dass sich
die wichtigsten Wörter am Anfang befinden.
Im Schritt 330 führt der Rechtschreibprüfprozess 300 zur
Verbesserung des Rechtschreibprogramms außerdem eine Prüfung
auf "nahe beieinander liegende" Tasten auf der Tastatur aus.
Diese Liste von Tasten und ihren Positionen wird in einer
Datei 91 gespeichert. Die Datei kann beispielsweise Datensätze
mit den Tastennamen (z. B. "Q", "W", "E" usw.) und (x, y)-
Positionen der Taste enthalten. Die Prüfung im Schritt 330
beinhaltet eine Berechnung einer Abstandsfunktion (distance
function) oder der Nähe auf der Grundlage des Abstandes von
einer Taste zur einer anderen. Die Taste V auf einer typischen
US-Tastatur befindet sich beispielsweise neben der Taste C.
Der Abstand von V zu C kann mit DV-C bezeichnet werden. Die
Taste G ist weiter von der Taste C entfernt als die Taste V.
Der Abstand von G zu C kann mit DG c bezeichnet werden. Es ist
zu beachten, dass DG-C < DV-C. Der Abstand kann unter Verwendung
von bekannten Abstandsformeln aus der Geometrie berechnet
werden. Diese Abstandsinformationen können verwendet werden,
um wahrscheinliche Kandidaten zu ermitteln, die in der Liste
220 von ähnlich buchstabierten Wörtern enthalten sind. Das
Wort "loce" ist wahrscheinlich "love", da die Taste "V" in der
Nähe der Taste "C" ist (z. B. benachbart). Der Schritt 320
berücksichtigt diese möglichen Buchstabenersetzungen und
präsentiert eine Liste von gültigen Wörtern mit diesen
wahrscheinlichen Ersetzungen. Kandidaten mit einer höheren
Wahrscheinlichkeit werden auf der Grundlage des Abstandes D
vor weniger wahrscheinlichen Kandidaten aufgelistet. Ein
geringerer Abstand ist mit einem wahrscheinlicheren
Ersatzzeichen verbunden als ein größerer Abstand. Es ist zu
beachten, dass eine solche Lösung bei verschiedenen Arten von
Tastaturen hilfreich wäre, beispielsweise bei chinesischen
Tastaturen mit über 100 Tasten.
Der Schritt 340 überwacht das Verwendungsprotokoll eines
Benutzers bezüglich Buchstabenersetzungen und berücksichtigt
diese Informationen bei der Darstellung von Listen von
alternativen Wörtern im Schritt 320. Falls der Benutzer
beispielsweise häufig "v" anstelle des nahegelegenen korrekten
"c" tippt, wird dies berücksichtigt, wenn eine wahrscheinliche
Liste von korrekten Wörtern zum Ersetzen des falsch
geschriebenen Wortes ermittelt wird. Informationen, die Listen
von vergangenen Tastenersetzungen enthalten, können in einer
Datenbank 94 (in Fig. 1 gezeigt) oder in einem fernen
Computer gespeichert werden, beispielsweise dem Server 130.
Jeder Datensatz in der Datenbank kann einen Buchstaben und
seinen wahrscheinlich falsch getippten Buchstaben enthalten.
Außerdem kann ein Benutzer Informationen zu wahrscheinlichen
Tastenersetzungen manuell ergänzen. Falls ein Benutzer
beispielsweise weiß, dass er häufig "v" anstelle von "c"
tippt, kann er das System darüber informieren, so dass es
diese Information bei der Darstellung einer Liste von
korrekten Wörtern (Schritt 320) zum Ersetzen des falsch
geschriebenen Wortes berücksichtigen kann. Der Schritt 340
zeigt außerdem das Verwendungsprotokoll eines Benutzers
bezüglich des "Vertauschens" ("swaps") von Buchstaben an und
berücksichtigt diese Informationen bei der Darstellung von
Listen von alternativen Worten im Schritt 320. Der Begriff
"Vertauschen" von Buchstaben bezieht sich auf das Verwenden
von zwei Buchstaben in der falschen Reihenfolge.
Beispielsweise vertauscht ein Benutzer möglicherweise häufig
die Buchstaben "i" und "s", so dass er "si" tippt, wenn er
"is" meint, oder er kann "is" tippen, wenn er "si" meint. Das
System kann dieses Vertauschen automatisch protokollieren,
oder ein Benutzer kann das System manuell informieren, dass
diese Vertauschvorgänge wahrscheinlich auftreten. Der Schritt
320 überwacht außerdem das Verwendungsprotokoll eines
Benutzers von Wortkorrekturen und verwaltet eine Liste von
wahrscheinlichen Ersetzungen, die automatisch von einem
früheren Tipp-Protokoll eines Benutzers abgeleitet wird. Falls
beispielsweise "dive" falsch "duve" geschrieben wird, nimmt
der Prozess 300 zur Kenntnis, dass ein falsches Tippen von u
statt i und das falsche Tippen von "duve" statt "dive"
stattfanden, und verwendet diese Informationen künftig, wenn
der Schritt 320 eine Liste von korrekten Wörtern zum Ersetzen
des falsch geschriebenen Wortes darstellt. Im Beispiel des
falschen Tippens von "duve" statt "dive" wird ein
Benutzerprotokoll von Rechtschreibprüfkorrekturen angezeigt.
In gewissem Sinne lernt das Programm die Muster von
Rechtschreibfehlern eines Benutzers, indem es die Anzahl und
die Art von früheren ausgewählten Korrekturen für Wörter
überwacht, die von einem Benutzer auf Rechtschreibfehler
geprüft wurden. Diese Informationen können in einer
Korrekturtabelle 96 (in Fig. 1 gezeigt) gespeichert werden.
Ein weiteres Beispiel ist, dass ein Benutzer häufig "behavior"
falsch als "behavoir" schreibt und diese Korrektur in früheren
Verwendungen über das Rechtschreibprüfprogramm ausführt. Der
Schritt 320 verwaltet die Tabelle 96 mit Datensätzen,
beispielsweise "behavior - behavoir", um Listen 220 von
alternativen richtig geschriebenen Wörtern leistungsfähig zu
präsentieren.
Die verschiedenen Korrekturtabellen können die persönlichen
Vorlieben eines Benutzers, ein Protokoll und so weiter
widerspiegeln, oder sie können Tabellen von Korrekturen
zusammenfassen, die mehr als einen Benutzer widerspiegeln. Die
Tabellen können von Rechtschreibprüfprogrammen verwaltet, über
Netze gemeinsam genutzt und bereitgestellt werden.
Die zuvor erwähnten Verfahren zur Verbesserung der
Rechtschreibprüfung können alleine verwendet oder als eine
Folge von Prüfungen sequenziell ausgeführt werden. Es können
verschiedene Prioritäten verwendet werden, so dass ein
Lösungsweg vor einem anderen bevorzugt wird. Falls
beispielsweise ein Verfahren mit einer höheren Priorität (z. B.
das Dokumenteninhalt-Verfahren im Schritt 310) eine Liste von
drei Alternativen liefert und ein Verfahren mit einer
geringeren Priorität (z. B. das Tastenabstand-Verfahren im
Schritt 330) eine Alternative liefert, werden die Alternativen
mit höherer Priorität vor den Alternativen mit geringerer
Priorität aufgelistet. Die Prioritäten können durch manuelle
Eingabe eines Benutzers festgelegt oder von der Systemsoftware
automatisch bereitgestellt werden.
Mit Bezugnahme auf die Fig. 2 und 3 kann der Schritt 350
außerdem ein zusätzliches Fenster 230 bereitstellen. Der
Schritt 355 stellt die am häufigsten falsch geschriebenen
Wörter eines Benutzers in einem zusätzlichen Fenster 230
bereit. Der Schritt 357 stellt die kürzlich falsch
geschriebenen Wörter eines Benutzers im zusätzlichen Fenster
230 bereit. Diese Informationen können in einer Datenbank
gespeichert werden, um im zusätzlichen Fenster 230 angezeigt
zu werden, wenn das Textverarbeitungsprogramm 90 aufgerufen
wird. Der Benutzer kann die Maus 46 verwenden, um Wörter von
Interesse aus dem zusätzlichen Fenster 230 in das aktuelle
Dokument 62 zu kopieren und einzufügen, wobei die in vielen
Betriebssystemen bereitgestellte "Zwischenablage" verwendet
wird. In einer Fensterumgebung, wie Microsoft Windows 95 oder
Macintosh Finder, ist ein Zwischenspeicherbereich im Speicher
("der Zwischenablagespeicher") vorhanden, in den Material aus
einem Dokument ausgeschnitten oder kopiert wird. Das Material
wird gespeichert, bis es der Benutzer an anderer Stelle
einfügt. Der Rechtschreibprüfprozess 300 stellt beispielsweise
fest, dass ein Benutzer häufig die Wörter "behavior" und
"dive" falsch schreibt. Diese Wörter werden im zusätzlichen
Fenster 230 aufgelistet. Der Benutzer kann die Wörter bei
Bedarf kopieren und einfügen oder ziehen und ablegen. Das
Sehen der richtigen Wörter auf dem Bildschirm kann außerdem
einen erzieherischen Wert haben, wodurch die korrekte
Schreibweise für jedes Wort im Gedächtnis des Benutzers
eingeprägt wird. Der Problembereich des Wortes, beispielsweise
die am häufigsten falsch ersetzten Buchstaben, kann
hervorgehoben werden 235. Dies kann ebenfalls einen
erzieherischen Wert haben. Das Hervorheben 235 wird durch den
Schritt 260 ausgeführt. Auf Wunsch kann die Hervorhebung 235
auch im Hauptfenster erfolgen, in dem sich das Wort befindet.
Ein Buchstabe in einem Wort kann beispielsweise eine Farbe 236
ändern, um anzuzeigen, dass er falsch ist.
Fig. 4 ist ein Flussdiagramm, das einen
Prioritätsvergabeprozess (prioritizing process) 400 darstellt,
durch den das Rechtschreibprüfprogramm 93 eine Priorität für
das Sammeln von Informationen im Rechtschreibprüfprozess 300
vergeben kann. Wenn das Rechtschreibprüfprogramm 93 den Inhalt
(Schritt 310) und das Protokoll eines Benutzers (Schritt 330)
prüft, kann es Prioritäten so vergeben, dass Informationen
bezüglich auf dem Bildschirm sichtbaren Wörtern "räumlich"
bevorzugt werden, anschließend Wörter im aktuellen
Dokumentteil (z. B. Kapitel), anschließend Wörter im Dokument,
anschließend Wörter in anderen offenen Dokumenten,
anschließend Wörter für alle Dokumente, die der Benutzer
bearbeitet hat. Auf diese Weise können Informationen gesammelt
werden, die für den Bedarf eines Benutzers von großer
Bedeutung sind. Insbesondere ermittelt der Schritt 410 den
Inhalt und Buchstabenersetzungen für den Text desselben
Satzes, der das falsch geschriebene Wort enthält. Der Schritt
415 ermittelt den Inhalt und Buchstabenersetzungen für den
Text desselben Absatzes, der das falsch geschriebene Wort
enthält. Der Schritt 420 ermittelt den Inhalt und
Buchstabenersetzungen für den Text, der auf dem Bildschirm
sichtbar ist. Der Schritt 425 ermittelt den Inhalt und
Buchstabenersetzungen für den Text desselben Dokumentteils,
der das falsch geschriebene Wort enthält. Ein Dokumentteil
kann sich auf Text zwischen Hauptüberschriften beziehen,
beispielsweise Text in einem Kapitel, in dem sich das falsch
geschriebene Wort befindet. Der Schritt 430 ermittelt den
Inhalt und Buchstabenersetzungen für das restliche Dokument.
Der Schritt 435 ermittelt den Inhalt und Buchstabenersetzungen
für alle offenen Dokumente. Der Schritt 440 ermittelt den
Inhalt und Buchstabenersetzungen für alle Dokumente, auf die
der Benutzer kürzlich zugegriffen hat. Der Begriff "kürzlich"
kann sich beispielsweise auf Dokumente beziehen, die während
der vorhergehenden N Stunden offen waren. Der Wert von N kann
vom Benutzer gesetzt werden. Der Schritt 445 ermittelt den
Inhalt und Buchstabenersetzungen für die Dokumente, auf die
ein Benutzer am häufigsten zugegriffen hat. Der Begriff "am
häufigsten" bezieht sich beispielsweise auf Dokumente, auf die
öfter als M-mal zugegriffen wurde. Der Wert von M kann vom
Benutzer gesetzt werden. Der Schritt 450 ermittelt den Inhalt
und Buchstabenersetzungen für alle Dokumente, auf die alle
Benutzer kürzlich zugegriffen haben. Das
Rechtschreibprüfprogramm 93 kann Zugang zu Dokumenten haben,
die von anderen Benutzern über das Internet erstellt wurden
oder in einem zugänglichen Verwahrungsort (repository) von
Dokumenten gespeichert wurden. Der Schritt 455 ermittelt den
Inhalt und Buchstabenersetzungen für die Dokumente, auf die
verschiedene Benutzer am häufigsten zugegriffen haben. Der
Schritt 460 ermittelt den Inhalt und Buchstabenersetzungen für
alle verfügbaren Dokumente. Diese Informationen können in
Datenbanken gespeichert werden. Diese zusätzlichen
Informationen können auf viele Arten verwendet werden. Falls
der Inhalt des Dokumentes für den auf dem Bildschirm
sichtbaren Text beispielsweise "Flut" ist (wie im Schritt 420
geprüft wurde) und der Inhalt des gesamten Dokumentes "Bibel"
ist (wie im Schritt 430 geprüft wurde), werden entsprechende
Wörter, die in der Liste 220 präsentiert werden, so geordnet,
dass korrekt geschriebene Wörter bezüglich "Flut"
möglicherweise vor den Wörtern bezüglich "Bibel" erscheinen.
Obwohl Beispiele bezüglich einer Tastatureingabe angegeben
wurden, ist zu beachten, dass die hier dargestellten Verfahren
auf Systeme mit Spracheingabe und Handschrifterkennung
angewandt werden können. Daher können das System und Verfahren
auch zur Verbesserung von Handschrift- und Spracherkennung
verwendet werden. Ein Benutzer spricht beispielsweise das Wort
"proof" in das Mikrofon 51. Ein Spracherkennungssystem 98 weiß
möglicherweise nicht, welches von mehreren Wörtern wie
"proof", "prude" oder "prune" der Benutzer ausgesprochen hat.
Durch das Erkennen des Inhaltes des erstellten Dokumentes
(Schritt 310) oder das Überwachen des Protokolls eines
Benutzers (Schritt 340) kann dem Benutzer jedoch eine
sachdienlichere Liste und Reihenfolge von alternativen Wörtern
dargestellt werden, aus denen er wählen kann.
Dieses intelligente Rechtschreibprüfprogramm 93 kann sich in
einem lokalen oder fernen Computer, einem Personal-Digital
Assistant, einer Telefonzelle (kiosk), einem Decoder (set-top
box), einem Fernsehgerät, einer Kamera oder einer anderen
Einheit befinden. Dieses Rechtschreibprüfprogramm ist in jeder
Textverarbeitungssituation hilfreich, in der ein Benutzer Text
eingibt, beispielsweise beim Ausfüllen von Online-Formularen
und beim Tippen von URLs oder Suchbegriffen in Web-Browsern.
Bei der Beschreibung der vorliegenden Erfindung mit besonderer
Bezugnahme auf die bevorzugten Formen davon ist es
offensichtlich, dass verschiedene Änderungen daran vorgenommen
werden können, ohne von der Wesensart und vom Umfang der
vorliegenden Erfindung abzuweichen, wie sie in den angehängten
Ansprüchen definiert wird.
Claims (52)
1. Verfahren zur Prüfung der Rechtschreibung eines
Dokumentes, das von einem Textverarbeitungsprogramm
verarbeitet wird, wobei das Verfahren Folgendes umfasst:
- a) Ermitteln einer Gruppe von Wörtern aus einem Inhalt des Dokumentes, die tatsächlich im Dokument vorkommende Wörter enthält;
- b) Ausgeben einer Meldung eines falsch geschriebenen Wortes an einen Benutzer; und
- c) Präsentieren einer Liste von Ersatzwörtern für den Benutzer, deren Schreibweisen ähnlich dem falsch geschriebenen Wort sind, wobei die Liste ein oder mehrere aus der Gruppe von Wörtern ausgewählte Wörter enthält.
2. Verfahren nach Anspruch 1, wobei der Inhalt den Text und
alle Titel, Themen, Überschriften oder Inhalte enthält,
die im Dokument enthalten sind.
3. Verfahren nach Anspruch 2, wobei der Schritt (a) die
Gruppe von tatsächlich vorkommenden Wörtern auf der
Grundlage der Position im Dokument und der Häufigkeit des
Auftretens darin aus dem Inhalt ableitet.
4. Verfahren nach Anspruch 3, das außerdem Folgendes
umfasst:
- a) Ermitteln von Wörtern, die wahrscheinlich mit den tatsächlich vorkommenden Wörtern verwandt sind, und Aufnahme der wahrscheinlich verwandten Wörter in der Gruppe von Wörtern.
5. Verfahren nach Anspruch 4, wobei der Schritt (e) einen
oder mehrere der Prozesse verwendet, die aus der Gruppe
der latenten semantischen Indizierung, der
Synonymauswahl, der Thesaurusauswahl ausgewählt werden.
6. Verfahren nach Anspruch 5, wobei die ausgewählten Wörter
in der Ersatzliste zuerst erscheinen.
7. Verfahren nach Anspruch 1, das außerdem das Darstellen
einer anderen Liste der falsch geschriebenen Wörter des
Benutzers für den Benutzer umfasst.
8. Verfahren nach Anspruch 7, wobei die andere Liste Wörter
enthält, die der Benutzer am häufigsten falsch schreibt
oder kürzlich falsch geschrieben hat.
9. Verfahren zur Rechtschreibprüfung eines Dokumentes, das
von einem Textverarbeitungsprogramm verarbeitet wird,
wobei das Verfahren Folgendes umfasst:
- a) Ausgeben einer Meldung eines falsch geschriebenen Wortes an einen Benutzer;
- b) Ermitteln einer Gruppe von einem oder mehreren Wörtern, die jeweils einen Ersatzbuchstaben für einen im falsch geschriebenen Wort enthaltenen Buchstaben enthalten, wobei eine Tastaturtaste des Ersatzbuchstabens eine nahe gelegene Tastaturtaste des im falsch geschriebenen Wort enthaltenen Buchstabens ist;
- c) Präsentieren einer Liste von Ersatzwörtern für den Benutzer, deren Schreibweise ähnlich dem falsch geschriebenen Wort ist, wobei die Liste ein oder mehrere aus der Gruppe von Wörtern ausgewählte Wörter enthält.
10. Verfahren nach Anspruch 9, wobei der Schritt (c)
feststellt, welche Wörter auf der Grundlage des Abstandes
zwischen den Tastaturtasten der jeweiligen
Ersatzbuchstaben und den jeweiligen Tastaturtasten der im
falsch geschriebenen Wort enthaltenen Buchstaben in die
Gruppe von Wörtern aufgenommen werden müssen.
11. Verfahren nach Anspruch 10, wobei die Reihenfolge eines
ersten und eines zweiten der ausgewählten Wörter in der
Ersatzliste durch den Abstand der ersten und zweiten
ausgewählten Wörter bestimmt wird, der geringer ist.
12. Verfahren nach Anspruch 10, wobei die ausgewählten Wörter
auf der Grundlage eines Protokolls der früheren
Buchstabenersetzungen des Benutzers ausgewählt werden.
13. Verfahren nach Anspruch 12, wobei das Protokoll die
vertauschten Buchstaben des Benutzers enthält und wobei
die Ersatzliste alternative Wörter auf der Grundlage des
Protokolls von vertauschten Buchstaben enthält.
14. Verfahren nach Anspruch 13, das außerdem Folgendes
umfasst:
- a) Überwachen der Tippfehler des Benutzers, die vertauschte Buchstaben enthalten, und Aufnehmen der Tippfehler in das Protokoll und wobei das Protokoll Wörter enthält, die Buchstabenersetzungen oder vertauschte Buchstaben enthalten, die vom Benutzer stammen.
15. Verfahren nach Anspruch 9, das außerdem das Darstellen
einer anderen Liste der falsch geschriebenen Wörter des
Benutzers für den Benutzer umfasst.
16. Verfahren nach Anspruch 15, wobei die andere Liste Wörter
enthält, die der Benutzer am häufigsten falsch schreibt
oder kürzlich falsch geschrieben hat
17. Verfahren zur Rechtschreibprüfung eines Dokumentes, das
von einem Textverarbeitungsprogramm verarbeitet wird,
wobei das Verfahren Folgendes umfasst:
- a) Ausgeben einer Meldung eines falsch geschriebenen Wortes an den Benutzer;
- b) Ermitteln einer ersten Gruppe von einem oder mehreren Wörtern, die jeweils einen Ersatzbuchstaben für einen im falsch geschriebenen Wort enthaltenen Buchstaben enthalten, wobei eine Tastaturtaste des Ersatzbuchstabens eine nahe gelegene Tastaturtaste des im falsch geschriebenen Wort enthaltenen Buchstabens ist;
- c) Ermitteln einer zweiten Gruppe von einem oder mehreren Wörtern aus einem Inhalt des Dokumentes, die tatsächlich im Dokument vorkommende Wörter enthält; und
- d) Darstellen einer Liste von Ersatzwörtern für den Benutzer, deren Schreibweisen ähnlich dem falsch geschriebenen Wort sind, wobei die Liste ein oder mehrere Wörter enthält, die aus einer oder beiden der ersten und zweiten Gruppen von Wörtern ausgewählt werden.
18. Verfahren nach Anspruch 17, wobei die Liste von
Ersatzwörtern so geordnet wird, dass die ausgewählten
Wörter der ersten Gruppe vor irgendwelchen ausgewählten
Wörtern der zweiten Gruppe erscheinen.
19. Verfahren nach Anspruch 18, wobei die Schritte (b) und
(c) die ersten und zweiten Gruppen ermitteln, indem alle
Wörter räumlich bevorzugt werden, die ähnlich dem falsch
geschriebenen Wort sind und die im selben Bereich des
Dokumentes auftreten, in dem das falsch geschriebene Wort
vorkommt.
20. Verfahren nach Anspruch 19, wobei der Bereich in der
Reihenfolge der Bevorzugung ein Satz und danach ein
Absatz ist.
21. Verfahren nach Anspruch 20, wobei der Bereich in der
Reihenfolge der Bevorzugung außerdem nach dem Absatz
einen Dokumentteil enthält, der für den Benutzer auf
einem Bildschirm sichtbar ist.
22. Verfahren nach Anspruch 21, wobei der Bereich in der
Reihenfolge der Bevorzugung außerdem ein Kapitel oder
einen Abschnitt und danach das ganze Dokument enthält.
23. Verfahren nach Anspruch 19, wobei die Schritte (b) und
(c) außerdem zusätzliche Dokumente räumlich bevorzugen,
die gegenwärtig offen sind, innerhalb eines festgelegten
Zeitraums der Öffnung des Dokumentes offen waren,
kürzlich vom Benutzer geöffnet wurden oder von anderen
Benutzern geöffnet wurden.
24. Verfahren zur Rechtschreibprüfung eines Dokumentes, das
von einem Textverarbeitungsprogramm verarbeitet wird,
wobei das Verfahren Folgendes umfasst:
- a) Ausgeben einer Meldung eines falsch geschriebenen Wortes an den Benutzer;
- b) Darstellen einer Liste von Ersatzwörtern für den Benutzer, deren Schreibweisen ähnlich dem falsch geschriebenen Wort sind; und
- c) Darstellen einer anderen Liste von Ersatzwörtern für den Benutzer, die Wörter enthält, die der Benutzer am häufigsten falsch schreibt oder kürzlich falsch geschrieben hat.
25. Verfahren nach Anspruch 24, das außerdem die Hervorhebung
des Buchstabens oder der Buchstaben eines Ersatzwortes in
der Liste oder in der anderen Liste umfasst, die
Buchstaben von Wörtern korrigieren, die der Benutzer in
der Vergangenheit falsch getippt hat.
26. Verfahren- nach Anspruch 25, wobei die Hervorhebung eine
Farbgebung ist.
27. Computerlesbares Medium, das von einem Computer
ausführbare Befehle zum Ausführen von Schritten enthält,
die Folgendes umfassen:
- a) Ermitteln einer Gruppe von Wörtern aus einem Inhalt des Dokumentes, die tatsächlich im Dokument vorkommende Wörter enthält;
- b) Ausgeben einer Meldung eines falsch geschriebenen Wortes an einen Benutzer; und
- c) Darstellen einer Liste von Ersatzwörtern für den Benutzer, deren Schreibweisen ähnlich dem falsch geschriebenen Wort sind, wobei die Liste ein oder mehrere aus der Gruppe von Wörtern ausgewählte Wörter enthält.
28. Computerlesbares Medium nach Anspruch 27, wobei der
Inhalt den Text und irgendeinen Titel, ein Thema oder
Überschriften enthält, die im Dokument enthalten sind.
29. Computerlesbares Medium nach Anspruch 28, wobei der
Schritt (a) die Gruppe von tatsächlich vorkommenden
Wörtern auf der Grundlage der Position im Dokument und
der Häufigkeit des Auftretens darin aus dem Inhalt
ableitet.
30. Computerlesbares Medium nach Anspruch 29, das außerdem
computerlesbare Befehle zum Ausführen des Schrittes des
(e) Ermittelns von Wörtern, die wahrscheinlich mit den
tatsächlich vorkommenden Wörtern verwandt sind, und des
Enthaltens der wahrscheinlich verwandten Wörter in der
Gruppe von Wörtern enthält.
31. Computerlesbares Medium nach Anspruch 30, wobei der
Schritt (e) einen oder mehrere der Prozesse verwendet,
die aus der Gruppe der latenten semantischen Indizierung,
der Synonymauswahl, der Thesaurusauswahl ausgewählt
werden.
32. Computerlesbares Medium nach Anspruch 31, wobei die
ausgewählten Wörter in der Ersatzliste zuerst erscheinen.
33. Computerlesbares Medium nach Anspruch 27, das außerdem
das Darstellen einer anderen Liste von falsch
geschriebenen Wörtern des Benutzers für den Benutzer
umfasst.
34. Computerlesbares Medium nach Anspruch 33, wobei die
andere Liste Wörter enthält, die der Benutzer am
häufigsten falsch schreibt oder kürzlich falsch
geschrieben hat.
35. Computerlesbares Medium, das von einem Computer
ausführbare Befehle zum Ausführen von Schritten enthält,
die Folgendes umfassen:
- a) Ausgeben einer Meldung eines falsch geschriebenen Wortes an einen Benutzer;
- b) Ermitteln einer Gruppe von einem oder mehreren Wörtern, die jeweils einen Ersatzbuchstaben für einen im falsch geschriebenen Wort enthaltenen Buchstaben enthalten, wobei eine Tastaturtaste des Ersatzbuchstabens eine nahe gelegene Tastaturtaste des im falsch geschriebenen Wort enthaltenen Buchstabens ist; und
- c) Präsentieren einer Liste von Ersatzwörtern für den Benutzer, deren Schreibweisen ähnlich dem falsch geschriebenen Wort sind, wobei die Liste ein oder mehrere aus der Gruppe von Wörtern ausgewählte Wörter enthält.
36. Computerlesbares Medium nach Anspruch 35, wobei der
Schritt (b) feststellt, welche Wörter auf der Grundlage
des Abstands zwischen den Tastaturtasten der jeweiligen
Ersatzbuchstaben und den entsprechenden Tastaturtasten
der im falsch geschriebenen Wort enthaltenen Buchstaben
in der Gruppe von Wörtern enthalten sein müssen.
37. Computerlesbares Medium nach Anspruch 36, wobei die
Reihenfolge eines ersten und eines zweiten der
ausgewählten Wörter in der Ersatzliste durch den Abstand
der ersten und zweiten ausgewählten Wörter ermittelt
wird, der geringer ist.
38. Computerlesbares Medium nach Anspruch 36, wobei die
ausgewählten Wörter auf der Grundlage eines Protokolls
der früheren Buchstabenersetzungen des Benutzers
ausgewählt werden.
39. Computerlesbares Medium nach Anspruch 38, wobei das
Protokoll die vertauschten Buchstaben des Benutzers
enthält und wobei die Ersatzliste alternative Wörter auf
der Grundlage des Protokolls von vertauschten Buchstaben
enthält.
40. Computerlesbares Medium nach Anspruch 39, das außerdem
ausführbare Befehle zum Ausführen des Schrittes des (d)
Überwachens der Tippfehler des Benutzers, die vertauschte
Buchstaben beinhalten, und des Aufnehmens der Tippfehler
in das Protokoll enthält, und wobei das Protokoll Wörter
enthält, die Buchstabenersetzungen oder vertauschte
Buchstaben beinhalten, die vom Benutzer ergänzt werden.
41. Computerlesbares Medium nach Anspruch 35, das außerdem
das Darstellen einer anderen Liste der falsch
geschriebenen Wörter des Benutzers für den Benutzer
umfasst.
42. Computerlesbares Medium nach Anspruch 41, wobei die
andere Liste Wörter enthält, die der Benutzer am
häufigsten falsch schreibt oder kürzlich falsch
geschrieben hat.
43. Computerlesbares Medium, das ausführbare Befehle zum
Ausführen von Schritten enthält, die Folgendes umfassen:
- a) Ausgeben einer Meldung eines falsch geschriebenen Wortes an einen Benutzer;
- b) Ermitteln einer ersten Gruppe von einem oder mehreren Wörtern, die jeweils einen Ersatzbuchstaben für einen im falsch geschriebenen Wort enthaltenen Buchstaben enthalten, wobei eine Tastaturtaste des Ersatzbuchstabens eine nahe gelegene Tastaturtaste des im falsch geschriebenen Wort enthaltenen Buchstabens ist;
- c) Ermitteln einer zweiten Gruppe von einem oder mehreren Wörtern aus einem Inhalt des Dokumentes, die tatsächlich im Dokument vorkommende Wörter enthält; und
- d) Präsentieren einer Liste von Ersatzwörtern für den Benutzer, deren Schreibweisen ähnlich dem falsch geschriebenen Wort sind, wobei die Liste ein oder mehrere Wörter enthält, die aus einer oder aus beiden der ersten und zweiten Gruppe von Wörtern ausgewählt werden.
44. Computerlesbares Medium nach Anspruch 43, wobei die Liste
von Ersatzwörtern so geordnet wird, dass die ausgewählten
Wörter der ersten Gruppe vor irgendwelchen ausgewählten
Wörtern der zweiten Gruppe erscheinen.
45. Computerlesbares Medium nach Anspruch 44, wobei die
Schritte (b) und (c) die erste und zweite Gruppe
ermitteln, indem alle Wörter räumlich bevorzugt werden,
die ähnlich dem falsch geschriebenen Wort sind und die im
selben Bereich des Dokumentes vorkommen, in dem das
falsch geschriebene Wort vorkommt.
46. Computerlesbares Medium nach Anspruch 45, wobei der
Bereich in der Reihenfolge der Bevorzugung ein Satz und
danach ein Absatz ist.
47. Computerlesbares Medium nach Anspruch 46, wobei der
Bereich in der Reihenfolge der Bevorzugung außerdem nach
dem Absatz einen Dokumentteil enthält, der für den
Benutzer auf einem Bildschirm sichtbar ist.
48. Computerlesbares Medium nach Anspruch 47, wobei der
Bereich in der Reihenfolge der Bevorzugung außerdem ein
Kapitel oder einen Abschnitt und danach das ganze
Dokument enthält.
49. Computerlesbares Medium nach Anspruch 45, wobei die
Schritte (b) und (c) außerdem zusätzlichen Dokumenten
eine räumliche Bevorzugung geben, die gerade geöffnet
sind, innerhalb eines festgelegten Zeitraumes der Öffnung
des Dokuments geöffnet waren, kürzlich vom Benutzer oder
von anderen Benutzern geöffnet wurden.
50. Computerlesbares Medium, das von einem Computer
ausführbare Befehle zum Ausführen von Schritten enthält,
die Folgendes umfassen:
- a) Ausgeben einer Meldung eines falsch geschriebenen Wortes an einen Benutzer;
- b) Präsentieren einer Liste von Ersatzwörtern für den Benutzer, deren Schreibweisen ähnlich dem falsch geschriebenen Wort sind, und
- c) Präsentieren einer anderen Liste von Ersatzwörtern für den Benutzer, die Wörter enthält, die der Benutzer am häufigsten falsch schreibt oder kürzlich falsch geschrieben hat.
51. Computerlesbares Medium nach Anspruch 50, das außerdem
die Hervorhebung des Buchstabens oder der Buchstaben
eines Ersatzwortes in der Liste oder in der anderen Liste
umfasst, die Buchstaben von Wörtern korrigieren, die der
Benutzer in der Vergangenheit falsch getippt hat.
52. Computerlesbares Medium nach Anspruch 51, wobei die
Hervorhebung eine Farbgebung ist.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US61200600A | 2000-07-07 | 2000-07-07 | |
US09/612,006 | 2000-07-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE10124429A1 true DE10124429A1 (de) | 2002-01-17 |
DE10124429B4 DE10124429B4 (de) | 2008-11-27 |
Family
ID=24451327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10124429A Expired - Fee Related DE10124429B4 (de) | 2000-07-07 | 2001-05-18 | System und Verfahren für eine verbesserte Rechtschreibprüfung |
Country Status (3)
Country | Link |
---|---|
US (1) | US7647554B2 (de) |
KR (1) | KR100455329B1 (de) |
DE (1) | DE10124429B4 (de) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7194684B1 (en) | 2002-04-09 | 2007-03-20 | Google Inc. | Method of spell-checking search queries |
US8667547B2 (en) * | 2002-07-31 | 2014-03-04 | Comverse, Ltd. | Method and system for editing text messages conveyed via a CATV infrastructure at a TV set-top box |
US7315811B2 (en) * | 2003-12-31 | 2008-01-01 | Dictaphone Corporation | System and method for accented modification of a language model |
US7912904B2 (en) | 2004-03-31 | 2011-03-22 | Google Inc. | Email system with conversation-centric user interface |
US7814155B2 (en) | 2004-03-31 | 2010-10-12 | Google Inc. | Email conversation management system |
US9819624B2 (en) * | 2004-03-31 | 2017-11-14 | Google Inc. | Displaying conversations in a conversation-based email system |
US8775931B2 (en) * | 2007-03-30 | 2014-07-08 | Blackberry Limited | Spell check function that applies a preference to a spell check algorithm based upon extensive user selection of spell check results generated by the algorithm, and associated handheld electronic device |
EP1986080B1 (de) * | 2007-04-25 | 2009-12-16 | Research In Motion Limited | Tippfehlerkorrekturverfahren |
US20080266261A1 (en) * | 2007-04-25 | 2008-10-30 | Idzik Jacek S | Keystroke Error Correction Method |
JP5638948B2 (ja) | 2007-08-01 | 2014-12-10 | ジンジャー ソフトウェア、インコーポレイティッド | インターネットコーパスを用いた、文脈依存言語の自動的な修正および改善 |
KR200449305Y1 (ko) * | 2007-12-17 | 2010-06-30 | 한국 고덴시 주식회사 | 광소자 패키지 및 그 실장구조 |
US8176419B2 (en) * | 2007-12-19 | 2012-05-08 | Microsoft Corporation | Self learning contextual spell corrector |
US20090254818A1 (en) * | 2008-04-03 | 2009-10-08 | International Business Machines Corporation | Method, system and user interface for providing inline spelling assistance |
US8219905B2 (en) * | 2008-11-17 | 2012-07-10 | International Business Machines Corporation | Automatically detecting keyboard layout in order to improve the quality of spelling suggestions |
JP5077210B2 (ja) * | 2008-12-04 | 2012-11-21 | 富士通モバイルコミュニケーションズ株式会社 | 携帯型情報処理装置 |
US8739055B2 (en) * | 2009-05-07 | 2014-05-27 | Microsoft Corporation | Correction of typographical errors on touch displays |
CA2787390A1 (en) | 2010-02-01 | 2011-08-04 | Ginger Software, Inc. | Automatic context sensitive language correction using an internet corpus particularly for small keyboard devices |
US8266528B1 (en) * | 2010-06-24 | 2012-09-11 | Google Inc. | Spelling suggestions based on an input sequence including accidental “delete” |
US8988365B2 (en) | 2010-09-01 | 2015-03-24 | Telefonaktiebolaget L M Ericsson (Publ) | Input precision method for minimizing erroneous entries stemming from instability of a mobile device using an accelerometer and apparatus to detect a shake and apparatus and computer program thereof |
US9489372B2 (en) * | 2013-03-15 | 2016-11-08 | Apple Inc. | Web-based spell checker |
EP3062212A1 (de) * | 2015-02-25 | 2016-08-31 | Kyocera Document Solutions Inc. | Textbearbeitungsvorrichtung und druckdatenspeicherungsvorrichtung |
US11093709B2 (en) * | 2017-08-10 | 2021-08-17 | International Business Machine Corporation | Confidence models based on error-to-correction mapping |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4847766A (en) | 1988-01-05 | 1989-07-11 | Smith Corona Corporation | Dictionary typewriter with correction of commonly confused words |
DE4323241A1 (de) * | 1993-07-12 | 1995-02-02 | Ibm | Verfahren und Computersystem zur Suche fehlerhafter Zeichenketten in einem Text |
JPH0793328A (ja) | 1993-09-24 | 1995-04-07 | Matsushita Electric Ind Co Ltd | 綴り不適切訂正装置 |
US5649222A (en) | 1995-05-08 | 1997-07-15 | Microsoft Corporation | Method for background spell checking a word processing document |
US5875443A (en) | 1996-01-30 | 1999-02-23 | Sun Microsystems, Inc. | Internet-based spelling checker dictionary system with automatic updating |
US5991742A (en) | 1996-05-20 | 1999-11-23 | Tran; Bao Q. | Time and expense logging system |
US6047300A (en) * | 1997-05-15 | 2000-04-04 | Microsoft Corporation | System and method for automatically correcting a misspelled word |
US6018735A (en) | 1997-08-22 | 2000-01-25 | Canon Kabushiki Kaisha | Non-literal textual search using fuzzy finite-state linear non-deterministic automata |
US6424983B1 (en) | 1998-05-26 | 2002-07-23 | Global Information Research And Technologies, Llc | Spelling and grammar checking system |
US6131102A (en) | 1998-06-15 | 2000-10-10 | Microsoft Corporation | Method and system for cost computation of spelling suggestions and automatic replacement |
US6507816B2 (en) | 1999-05-04 | 2003-01-14 | International Business Machines Corporation | Method and apparatus for evaluating the accuracy of a speech recognition system |
US6918086B2 (en) | 2000-03-28 | 2005-07-12 | Ariel S. Rogson | Method and apparatus for updating database of automatic spelling corrections |
US20020010639A1 (en) | 2000-04-14 | 2002-01-24 | Howey Paul D. | Computer-based interpretation and location system |
US20020103834A1 (en) | 2000-06-27 | 2002-08-01 | Thompson James C. | Method and apparatus for analyzing documents in electronic form |
US6578032B1 (en) | 2000-06-28 | 2003-06-10 | Microsoft Corporation | Method and system for performing phrase/word clustering and cluster merging |
-
2001
- 2001-05-18 DE DE10124429A patent/DE10124429B4/de not_active Expired - Fee Related
- 2001-06-26 KR KR10-2001-0036530A patent/KR100455329B1/ko not_active IP Right Cessation
-
2006
- 2006-06-02 US US11/446,354 patent/US7647554B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
DE10124429B4 (de) | 2008-11-27 |
US20060224586A1 (en) | 2006-10-05 |
KR100455329B1 (ko) | 2004-11-09 |
US7647554B2 (en) | 2010-01-12 |
KR20020005427A (ko) | 2002-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE10124429B4 (de) | System und Verfahren für eine verbesserte Rechtschreibprüfung | |
DE69630928T2 (de) | Vorrichtung und Verfahren zum Anzeigen einer Übersetzung | |
DE69833839T2 (de) | Ein Verfahren und System um ähnliche Dokumente vorzuschlagen | |
DE102016125783A1 (de) | Bereitstellen von Vorschlägen für die Interaktion mit einem automatisierten Assistenten in einem Multi-User-Nachrichtenaustausch-Thread | |
DE69922971T2 (de) | Netzwerk-interaktive benutzerschnittstelle mittels spracherkennung und verarbeitung natürlicher sprache | |
DE19842688B4 (de) | Verfahren zum Filtern von Daten, die von einem Datenanbieter stammen | |
DE102018007060A1 (de) | Hervorheben von Schlüsselabschnitten eines Texts innerhalb eines Dokuments | |
DE102013205737A1 (de) | System und Verfahren zum automatischen Erkennen und interaktiven Anzeigen von Informationen über Entitäten, Aktivitäten und Ereignisse aus multimodalen natürlichen Sprachquellen | |
DE102004012839B4 (de) | System und Verfahren zur Bereitstellung von Hilfeinformation | |
DE10308550A1 (de) | System und Verfahren zur automatischen Daten-Prüfung und -Korrektur | |
DE102016125509A1 (de) | Einbindung von auswählbaren Anwendungsverknüpfungen in Nachrichtenaustausch-Threads | |
DE102016125594A1 (de) | Automatisch augmentierende Nachrichtenaustauschthread basierend auf der Nachrichtenklassifizierung | |
DE10343228A1 (de) | Verfahren und Systeme zum Organisieren elektronischer Dokumente | |
DE112013004769T5 (de) | Leerstellenvorhersage für eine Texteingabe | |
DE60319586T2 (de) | Elektronisches wörterbuch mit beispielsätzen | |
DE102018007165A1 (de) | Vorhersage von stilbrüchen innerhalb eines textinhalts | |
DE202012013725U1 (de) | Kontextsensible Suche | |
DE202016008323U1 (de) | Das Einbeziehen auswählbarer Anwendungslinks in Konversationen mit persönlichen Assistenz-Modulen | |
DE112016005374T5 (de) | Identifizieren von Abfragemustern und zugeordneten aggregierten Statistikdaten unter Suchabfragen | |
DE112021006602T5 (de) | Verfeinern von abfrage-erzeugungsmustern | |
DE10033548C2 (de) | Verfahren zur Vorschau von Internetseiten | |
DE69928022T3 (de) | Funktionstaste zur computer-databearbeitung | |
EP0899715A2 (de) | Verfahren zum Betreiben eines ein Fernsehgerät und einen Personalcomputer aufweisenden Mediengeräts | |
DE102017103533A1 (de) | Verfahren und Vorrichtung zur textbezogenen Vorschau von Inhalten von Audiodateien | |
DE10132591B4 (de) | Verfahren zur Unterstützung von Lernvorgängen bei computergestützten Informationssystemen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8320 | Willingness to grant licences declared (paragraph 23) | ||
8364 | No opposition during term of opposition | ||
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: G06F0017270000 Ipc: G06F0040200000 |
|
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |