-
Die
vorliegende Erfindung bezieht sich auf ein Verfahren zum Aktualisieren
von Interessen und insbesondere zum Aktualisieren von Interessen
eines Anwenders.
-
In
dem momentanen informationsreichen Klima wird eine beträchtliche
Menge an Aufmerksamkeit der Entwicklung verbesserter Verfahren der
Informationswiedergewinnung gewidmet. Insbesondere das Gebiet der
Agententechnologie ist stark an der Entwicklung von Agenten zum
Suchen, zur Zusammenfassung, zur Filterung und zur Darstellung von
Informationen beteiligt, z. B. Davies, Weeks und Revett, 1997 ("Information Agents
for the WWW", in:
Software agents and soft computing, Hrsg. H. Nwana, N. Azarmi, Berlin,
Springer-Verlag).
Die meisten, wenn nicht alle, von diesen nutzen den Agenten mit
einer gewissen Kenntnis des Anwenders. Wie von der kürzlich vorgeschlagenen
Open-Profiling-Norm, Dunn, Gwertzman, Layman, und Partovi, 1997,
("Privacy and profiling
on the web", Technical
Note, WWW-Konsortium, 2. Juni 1997) demonstriert ist, wird die Aufnahme
von Anwenderinformationen schnell zu einem Schlüsselbereich nicht nur für die Agententechnologie,
sondern auch für
das Internet im Allgemeinen. Anwenderinformationen spielen als digitale
Bibliotheken zweifellos eine ständig
wachsende Rolle, wobei elektronischer Handel und personalisierte Anwendungen
weiter verbreitet werden.
-
Die
erste Generation von Agenten, die sich mit dem Management von Informationsvolumina
befassten, waren typisch Filteragenten (wie etwa E-Mail-Priorisierungsagenten).
Maes (1994) beschreibt die verschiedenen Motivationen, Verfahren
und Anwendungen solcher Agenten zur Verringerung der Informationsüberlastung
(Maes (1994), "Agents
that reduced workload and information overload", Communi cations of the ACM, Juli).
Tatsächlich
ist dies vielleicht der wichtigste Einzelgrund, dass Agenten in
der Internet-Umgebung Erfolg haben. Für irgendeine Person sind einfach
zu viele Ressourcen verfügbar,
um sie erschöpfend
zu Rate zu ziehen, und wenn es tatsächlich gelingen würde, alle
diese Seiten durchzusehen, würde
sich wahrscheinlich herausstellen, dass nur ein kleiner Prozentsatz
tatsächlich
von irgendeinem Interesse oder irgendeiner Bedeutung ist. Suchagenten
(wie etwa Amalthaea) erlangen zunehmend Bedeutung als ein Mittel
zur Verringerung dieser Arbeitsbelastung, wobei die meisten ein
Verfahren enthalten, das ermöglicht,
dass der Anwender den Agenten über
seine Interessen und Präferenzen
informiert. Weiterentwicklungen in der Agententechnologie haben
begonnen, vorausgehende Wechselwirkungen mit einem Anwender sowie
das Lernen seiner Interessen zu betrachten.
-
Viele
jüngste
Agenten enthalten eine Form der Anwenderprofilerzeugung, wie etwa:
- – Yenta
(Foner und Crabtree, 1997 ("Multi-agent
matchmaking", in:
Software agents and soft computing, Hrsg. H. Nwana, N. Azarmi, Berlin,
Springer-Verlag)),
- – Syskill
und Webert (Pazzani und Biilsus, 1997, "Learning and revising user profiles:
the identification of interesting web sites", Machine learning 27 (3)),
- – Personal
WebWatcher (Mladenic, 1996, "Personal
webwatcher: design and implementation", Technical report Ijs-DP-7472, School
of computer science, Carnegie-Mellon University, Pittsburgh, USA,
Oktober.),
- – Letizia
(Lieberman, 1995, "Letizia:
An agent that assists web browsing", Proceedings, 14th Joint
International Conference on artificial intelligence (IJDAI-95),
Montreal, Kanada),
- – NewsSIEVE
(Haneke, 1997, "Learning
based filtering of text Information using simple interest profiles", in P. Kandzia und
M. Klusch, Co-operative information agents. Berlin: Springer-Verlag"), und
- – INSOP
(Kindo u. a. 1997, "Adaptive
personal information filtering system that organizes personal profiles automatically", Proceedings 15th International Joint Conference on Artificial
Intelligence (IJCAI-97), S. 716–721,
Nagoya, Japan).
-
Der
Agent von Syskill und Webert lernt ein Anwenderprofil und verwendet
dieses zur Führung
seiner Vorschläge
für interessierende
Web-Seiten. Der Anwender bewertet die Relevanz der Vorschläge für das Interesse
des Anwenders, wobei der Agent einen naiven Bayes-Klassifizierer verwendet,
um das Anwenderprofil dementsprechend zu überarbeiten. Amalthaea (Moukas,
1997 (Moukas (1997) "User
modelling in a multiagent evolving system", Proceedings, workshop on Machine learning
for user modelling, 6th International Conference on
User modelling, Chia Laguna, Sardinien)) verwendet eine gewichtete
Schlüsselwortdarstellung
für ein
Anwenderprofil, die daraufhin hinzugezogen wird, um Internet-Suchmaschinen
abzufragen, so dass sie Seiten wiedergewinnen, die für einen
Anwender von Interesse sind. Amalthaeas Anwenderprofil umfasst eine
Anzahl von Informationsfilteragenten (IFAs), von denen jeder für ein besonderes
Thema spezialisiert ist. Diese IFAs können auf eine Anzahl von Arten
(z. B. durch die Analyse der Hotlist der beliebten Web-Seiten eines
Anwenders; durch Beobachter der Wechselwirkung des Anwenders mit
seinem Browser (unter Verwendung von Seitenzugriffs-Historienprotokollen
usw.) konstruiert werden. Außerdem
können
sich die IFAs mit der Zeit entwickeln, so dass sie sich näher an den
Anwender anpassen können,
während
der Anwender während
der Zeit mit Amalthaea in Wechselwirkung steht.
-
Viele
Web-Sites sammeln Informationen über
einen Anwender, um a) demographische Informationen zu verfolgen,
b) personalisierte Dienste und Informationen von der Site zu liefern.
Diese Technik wird wichtiger, damit Sites eine treue Kundenbasis
aufrechterhalten können.
Tatsächlich
haben Firefly, Autonomy und OpenSesamel alle kürzlich Produkte angekündigt, die
eine solche Anpassung ermöglichen.
-
Quintana
beschreibt in einer Abhandlung mit dem Titel "Knowledge based information filtering
of financial information",
veröffentlicht
in: Proceedings of the national online meeting, 13. Mai 1997, S.
279–285,
ein System, durch das ein Anwenderprofil, das interessierende Themen
umfasst, dazu verwendet wird, Dokumente zu identifizieren, die für einen
Anwender relevant sein können.
Diese interessierenden Themen werden von der Überwachung von Dokumenten,
die ein Anwender durchgesehen hat, von der Überwachung der Zeitdauer, die
beim Durchsehen des Dokuments vergangen ist, und von der Zeitdauer,
die vergangen ist, seit jedes Dokument durchgesehen wurde, sowie
vom Empfangen von Themen, die ein Anwender explizit als interessant spezifiziert
hat, abgeleitet. Obgleich Quintana ein Problem bei Informationswiedergewinnungs-/Anwenderprofil-Systemen identifiziert – d. h.
dass Anwender u. a. über
den Verlust der Kontrolle über
ihr Profil besorgt sind -, liefert er keine Lösung für dieses Problem. Tatsächlich stellt
er lediglich fest, dass Forschung über alternative Schnittstellen
ausgeführt
wird, die mehr Anwendereingabe in die Informationsfilterung ermöglichen.
-
Obgleich
weithin erkannt ist, dass ein Anwenderprofil entscheidend ist, falls
an den Anwender Dienste und Informationen von Interesse geliefert
werden sollen, sind die Probleme im Zusammenhang mit der Aktualisierung
von Anwenderprofilen somit bisher noch nicht gelöst worden.
-
Gemäß der vorliegenden
Erfindung wird ein Verfahren zum Ändern eines Profils geschaffen,
das Interessensgebiete eines Anwenders repräsentiert. Das Profil enthält mehrere
Mengen von themenbezogenen Daten, wobei das Verfahren die Schritte
umfasst, bei denen:
- (i) dem Anwender eine Änderung
des Profils vorgeschlagen wird, wobei der Vorschlag ein oder mehrere Auswahlelemente
enthält,
die für
die vorgeschlagene Änderung
repräsentativ
sind,
- (ii) eines oder mehrere Auswahlelemente von dem Anwender empfangen
werden,
- (iii) das Anwenderprofil in Übereinstimmung
mit dem oder jedem Auswahlelement modifiziert wird,
- (iv) die Anwendertätigkeit
in Bezug auf die Modifizierung überwacht
wird und, falls die Anwendertätigkeit vorgegebene
Kriterien erfüllt,
- (v) das Profil in Übereinstimmung
mit dem oder jedem Auswahlelement dauerhaft geändert wird.
-
Ein
Dokument mit dem Titel "Mobile
phone using user-defined location-dependent profiles", veröffentlicht
in: Kenneth Mason Publications, Hants GB, Nr. 438, Oktober 2000,
beschreibt ein System, durch das verschiedene Vorrichtungscharakteristiken
in Übereinstimmung
mit dem Ort des Anwenders modifiziert werden können. Diese Vorrichtungscharakteristiken
sind in einem Anwenderprofil gespeichert und umfassen u. a. die Klingellautstärke, die
Sprachantwort, die PHF-Unterstützung.
In dem Dokument beschriebenen System ist jedes Anwenderprofil einem
oder mehreren Orten zu geordnet, so dass das relevante Profil wiedergewonnen wird
und die Vorrichtung dementsprechend programmiert wird, wenn der
Ort eines Anwenders identifiziert ist. Obgleich das Dokument die
Tatsache offenbart, dass ein Anwender eine Zuordnung zwischen einem
Ort und einem Profil explizit spezifizieren kann, offenbart das
Dokument nicht, dass ein Anwender Einträge des Anwenderprofils selbst
modifiziert. Außerdem
umfasst die Modifizierung des Anwenderprofils so, wie es ist, nur
das Wechseln zwischen Anwenderprofilen je nach dem Ort. Somit enthält das Anwenderprofil
keine themenbezogenen Daten und offenbart es nicht, dass dem Anwender
eine Änderung
vorgeschlagen wird, dass eine Antwort auf den Vorschlag empfangen
wird oder dass die Anwendertätigkeit
in Bezug auf die Modifizierung überwacht
wird.
-
Anwenderprofile
werden ebenfalls im universellen mobilen Telekommunikationssystem
(UMTS) verwendet, wobei das Anwenderprofil in diesem Fall aber Einzelheiten
darüber
enthält,
welche Domänen
für einen Anwender
verfügbar
sind und unter welchen Bedingungen ein spezifischer Dienst für einen
Anwender verfügbar
ist. Eleftheriadis und Theologuo beschreiben in: "User profile identification
in future mobile telecommunications systems", veröffentlicht in: IEEE Network,
IEEE Inc., New York, USA, Bd. 8, Nr. 5, 1. September 1994, ein System,
durch das ein Anwender mehrere so genannte Anwenderprofileinheiten
besitzt, von denen jede einem spezifischen Abonnement entspricht;
ein Anwenderprofil ist dann die Kombination aller Anwenderprofileinheiten
in Bezug auf diesen Anwender. In einigen Situationen, insbesondere,
wo mehrere Anwenderprofileinheiten zutreffen könnten, werden Vorschriften
angewendet, die eine geordnete Präferenzliste der Profileinheitsnutzung
spezifizieren. Die Abhandlung legt dar, dass ein Profil modifiziert
werden kann, legt aber dar, dass die Profilmodifizierung hauptsächlich eine
Managementprozedur ist und lediglich durch einen berechtigten UMTS-Operator
modifiziert werden kann; dies ist aus dem Wesen des Anwenderprofilinhalts
offensichtlich. Obgleich die Abhandlung darlegt, dass eine begrenzte
Menge von Modifizierungen an dem Profil ausgeführt werden könnten, ohne
dass ein UMTS-Operator beteiligt ist, legt sie nicht dar, wie diese
Modifizierungen ausgeführt
werden könnten.
Wegen des Wesens des Inhalts eines Anwenderprofils ist es wieder äußerst unwahrscheinlich,
dass solche Modifizierungen Vorschläge an einen Anwender und das Überwachen
des Anwenderverhaltens in Bezug darauf umfassen.
-
Vorzugsweise
umfasst der Überwachungsschritt
(iv), der mit einer von dem Anwender konfigurierbaren Häufigkeit
stattfindet, die Schritte, bei denen
- dem Anwender wenigstens
ein weiteres Auswahlelement angeboten wird,
- das oder jedes weitere Auswahlelement empfangen wird und
- das oder jedes weitere Auswahlelement mit den vorgegebenen Kriterien
verglichen wird. Außerdem
umfasst das oder jedes weitere Auswahlelement die Zustimmung zu
dem einen oder den mehreren Auswahlelementen, die die im Schritt
(i) vorgeschlagene Änderung
repräsentieren.
-
Alternativ
kann der Überwachungsschritt
(iv) das Zählen
der Anzahl, in der der Anwender auf Informationen bezüglich des
Auswahlelements zugreift, und das Vergleichen der Anzahl mit einer
Schwellenzahl umfassen. Als eine weitere Alternative kann der Überwachungsschritt
(iv) das Beobachten der Muster des Anwenderzugriffs bezüglich des
Auswahlelements und das Vergleichen des beobachteten Musters mit
einem oder mehreren vorgegebenen Mustern umfassen. Diese Informationen
können
z. B. die beim Zugreifen auf Informationen in Bezug auf das Auswahlelement
verbrachte Zeit, die Tageszeit, in der auf die Informationen, die sich
auf das Auswahlelement beziehen, zugegriffen wird, und die Wiederholbarkeit
der Art, in der der Anwender auf die Informationen, auf die sich
das Auswahlelement bezieht, zugreift, enthalten.
-
Vorzugsweise
umfasst das Verfahren ferner das Ausführen wenigstens einer vergleichenden
Analyse und/oder einer Cluster-Analyse zwischen Profilen von zwei
oder mehr Anwendern und das Empfangen von Ausgangsinformationen
hiervon. Diese Ausgangsinformationen werden dann verwendet, um wenigstens
ein Auswahlelement zu liefern, das die vorgeschlagene Änderung
repräsentiert.
Wenn z. B. das Interesse A mit dem Interesse B verknüpft ist
und ein Anwender U1 das Interesse A besitzt, wäre das Interesse B somit eine vorgeschlagene Änderung.
Zum Identifizieren potenzieller Interessen können weitere Data-Mining- und
Analyseverfahren wie etwa Fuzzy-Logik,
heuristische und wissensgestützte
Verfahren verwendet werden.
-
Vorteilhaft
umfasst das Verfahren ferner das Bewerten von Vertrauenswerten,
die den Ausgangsinformationen der vergleichenden Analyse und/oder
der Cluster-Analyse zugeordnet sind, wobei der Schritt (i) des Vorschlagens
einer Änderung
an den Inhalten des Profils auf der Grundlage der Ausgangsinformationen
in Abhängigkeit
von den bewerteten Vertrauenswerten, die ihnen zugeordnet sind,
ausgeführt
wird. Diese Vertrauenswerte können
z. B. unter Verwendung statistischer Techniken auf eine dem Fachmann
auf dem Gebiet bekannte Weise berechnet werden.
-
Zweckmäßig umfasst
das Verfahren ferner das Vergleichen der Ausgangsinformationen mit
einer Liste von Änderungen,
von denen angenommen wird, dass sie für den Anwender nicht relevant
sind, und, falls irgendeines der Auswahlelemente in den Ausgangsinformationen
mit irgendeinem Element in der Liste übereinstimmt, das Entfernen
der übereinstimmenden
Auswahlelemente aus den Ausgangsinformationen. Somit wird das Interesse
B mit einer Liste von "Nichtinteressen" verglichen und dem
Anwender nur dann vorgeschlagen, wenn es nicht in die "Nichtinteressen"-Liste eingegeben
worden ist.
-
In
der folgenden Beschreibung sind die Begriffe "Interesse", "Anwenderprofil", "Informationsquelle", "Kontext", "instanziiertes Interesse" wie folgt verwendet
und definiert:
- "Interesse" enthält themenbezogene
Daten wie etwa eine Menge von Schlüsselwörtern und/oder Bildern und/oder
Musik, die repräsentativ
für ein
Thema sind. Üblicherweise
werden Bilder und Musik von einer Form der Beschreibung begleitet,
z. B. für
Musik "Faure-Requiem,
geschrieben 1887, das Stück
widerspiegelt Faures Vorstellung vom Tod". In diesem Fall könnten Schlüsselwörter aus der Beschreibung entnommen
werden und zur Beschreibung eines Interesses (z. B. für das Thema
Impressionist, Tod) verwendet werden.
- "Anwenderprofil" enthält eines
oder mehrere Interessen, die in Bezug auf einen Anwender gespeichert
sind.
- "Informationsquelle" enthält eine
Entität,
die Informationen enthält,
z. B. ein Dokument.
- "Kontext" enthält Darstellungen,
die den momentanen Status eines Anwenders beschreiben – z. B.
den Zustand (Arbeit, Spielen), die Situation (zu Hause, abwesend)
und das Unternehmen (Kollegen) be schreiben.
- "Instanziierte
Interessen". Wenn
der Status des Anwenders identifiziert worden ist, wird der Kontext
des Anwenders instanziiert – z.
B. wird identifiziert, dass der Anwender zu Hause arbeitet, so dass
der Kontext auf Arbeit, zu Hause, instanziiert wird. Daraufhin werden
die Interessen gemäß dem instanziierten
Kontext gefiltert und diese Interessen als instanziierte Interessen
bezeichnet.
-
Weitere
Aspekte, Merkmale und Vorteile der vorliegenden Erfindung gehen
aus der folgenden Beschreibung bevorzugter Ausführungsform der Erfindung hervor,
die auf die beigefügte
Zeichnung Bezug nimmt, in der
-
1 ein
schematisches Diagramm ist, das die Bitübertragungsschicht oder Transportschicht
eines Kommunikationssystems gemäß der Erfindung
veranschaulicht;
-
2 ein
schematischer Blockschaltplan ist, der Komponenten einer Informationsliefereinrichtung
gemäß der vorliegenden
Erfindung zeigt;
-
3 ein
schematischer Blockschaltplan ist, der Mittel zum Erzeugen von Tätigkeiten
durch eine Profilerzeugungseinrichtung, die einen Teil der Vorrichtung
der in 2 gezeigten Informationsliefereinrichtung bildet,
zeigt;
-
4 ein
schematischer Blockschaltplan ist, der externe Eingaben in ein Kontextbestimmungsmittel zeigt,
das einen Teil der Vorrichtung der in 2 gezeigten
Informationsliefereinrichtung bildet;
-
5a ein
schematischer Ablaufplan ist, der die Schritte zeigt, die an der
Bestimmung eines Anwenderkontexts gemäß der vorliegenden Erfindung
beteiligt sind;
-
5b ein
schematischer Blockschaltplan ist, der weitere externe Eingaben
in das in 4 gezeigte Kontextbestimmungsmittel
zeigt;
-
6 ein
schematischer Ablaufplan ist, der die Schritte zeigt, die von einem
zweiten Wiedergewinnungsmittel ausgeführt werden, das einen Teil
der Vorrichtung der in 2 gezeigten Informationsliefereinrichtung
bildet;
-
7 ein
schematischer Blockschaltplan ist, der das zweite Wiedergewinnungsmittel
der Informationsliefereinrichtung aus 2 zeigt,
das mit einer Überwachungsmittelkomponente
zusammenarbeitet; und
-
8 ein
schematisches Diagramm ist, das ein Bayes-Netz zeigt, das einen
Teil der Überwachungsmittelkomponente
bildet.
-
Übersicht
-
Wie
in 1 gezeigt ist, enthält die Kommunikationsumgebung
eines Anwenders U1 auf der physikalischen Ebene ein Zellentelephon
T1 und einen Personal Digital Assistant T2, den der Anwender trägt; sowie eine
Computer-Workstation T3, die ein Modem enthält. Die Workstation T3 befindet
sich höchstwahrscheinlich in
einer Entfernung von dem Anwender U1.
-
Die
Workstation T3 umfasst in diesem Fall einen Server eines lokalen Netzes
(LAN-Server), der mit weiteren Endgeräten (von denen lediglich T4
gezeigt ist) in verschiedenen Abständen von dem Anwender verbunden
ist. Mit den verschiedenen Endgeräten stehen eine Anzahl verschiedener
Kommunikationskanäle
in Verbindung, die Teile verschieden bezeichneter Netze bilden (obgleich
einige oder alle in gemeinsamem Besitz sein können). Die Workstation T3 ist
ebenfalls mit den Daten-Servern DB1, DB2 verbunden, die in demselben LAN
N3 wie das Endgerät
T3 gezeigt sind; selbstverständlich
könnten
sich die Datenbank-Server DB1, DB2 in LANs befinden, die über einen
oder mehrere Switches und/oder Router (nicht gezeigt) mit dem LAN
N3 verbunden sind.
-
Ein öffentliches
Fernsprechwählnetz
(PSTN) N1 ist über
einen Netzübergang
G1 (z. B. eine lokale oder internationale Vermittlungsstelle) mit
einem diensteintegrierenden digitalen Fernmeldenetz (ISDN) N2 verbunden
und über
eine ISDN-Leitung L1 mit dem Endgerät T3 und somit mit dem lokalen
Netz N3 verbunden. Ein Mobilfunknetz (PLMN) (z. B. ein GSM-kompatibles
digitales Zellennetz) N4 ist über
einen Netzübergang
G2 mit dem PSTN N1 und mit dem ISDN N2 verbunden. Eine Basisstation
B1 des PLMN liefert eine Pico-Zelle in der Umgebung des Gebäudes, in
dem sich der Anwender U1 befindet, und eine Basisstation B2 liefert
eine Zelle in dem gleichen allgemeinen Bereich. Somit können die
Netze N1–N4
Daten mit verschiedenen Raten an die verschiedenen Endgeräte T1–T3 liefern: über das
PLMN N4 Daten mit niedriger Geschwindigkeit, über das PSTN N1 Daten mit höherer Geschwindigkeit
und über
das ISDN N2 oder über
das LAN N3 Daten mit nochmals höherer
Geschwindigkeit.
-
Über die
gesamten Netze N1–N4
sind Informationsquellen verteilt, die z. B. in den Servern IS1–IS4 gehalten
werden. Obgleich andere Ver teilungen vorstellbar sind, sind lediglich
vier Server gezeigt. Der Anwender U1 möchte relevante Informationen
von irgendeiner oder allen Informationsquellen in dem System empfangen.
-
Übersicht über ein System zum Liefern
von Informationen, das eine Ausführungsform
der Erfindung nutzt
-
Der
Kontext eines Anwenders U1 zu einem Zeitpunkt bestimmt zum größten Teil
die Art und den Inhalt der Informationen, die für ihn zu diesem Zeitpunkt von
Interesse sind, wobei der Anwender U1 z. B. wahrscheinlich etwas über arbeitsbezogene
Interessen wissen möchte,
falls er sich an der Arbeit befindet. Falls Informationen gemäß dem Anwenderkontext
klassifiziert und angeboten werden, werden drei Dinge erreicht:
Zunächst
wird das Volumen an Informationen verringert, die dem Anwender U1
angeboten werden, zweitens braucht der Anwender manuell keine Informationen
herauszufiltern, die für
seinen derzeitigen Kontext nicht relevant sind, und drittens wird
der Anwender nicht durch Informationen abgelenkt, die für seinen
derzeitigen Kontext nicht relevant sind. Somit ist es zweckmäßig, die
Informationen in Abhängigkeit
vom Kontext eines Anwenders zu filtern, um das Volumen der Informationen
zu verringern, die für
den Anwender nicht relevant sind.
-
Anhand
von 2 befindet sich beim Endgerät T3 eine Ausführungsform
der Erfindung, die allgemein als eine Informationsliefereinrichtung 200 bezeichnet
wird. Die Informationsliefereinrichtung 200 umfasst im Wesentlichen
eine Profilerzeugungseinrichtung 201 zum Erzeugen eines
Profils, das die Interessen eines Anwenders umfasst, Schnittstellenmittel 203 als
Schnittstelle zu dem Anwender, den Indexgenerator 205 zum
Indizieren von in den Servern IS1–IS4 gespeicherten Informationsquellen
und die Wiedergewinnungsmaschine 207 zum Wiedergewinnen
von Informationen in Übereinstimmung
mit dem Kontext eines Anwenders.
-
Die
Komponenten der Informationsliefereinrichtung 200 werden
unten ausführlicher
beschrieben, wobei aber in der Übersicht
die Profilerzeugungseinrichtung 201 über die Schnittstellenmittel 203 Interesseninformationen
von dem Anwender empfängt
und ein persönliches
Profil erzeugt, das in der Profildatenbank DB 1 für den Anwender
gespeichert wird. Den Interessen, die in dem Profil enthalten sind,
sind Attribute, z. B. zu Hause/abwesend, Arbeit/Spiel, zugeordnet,
die allgemein einen Kontext des Anwenders beschreiben. Wie oben
erwähnt
wurde, indiziert der Indexgenerator 205 die in den Servern
IS1–IS4
gespeicherten Informationsquellen.
-
Die
Wiedergewinnungsmaschine 207 umfasst die Kontextbestimmungsmittel 209,
die ersten Wiedergewinnungsmittel 211 und die zweiten Wiedergewinnungsmittel 213.
Die Kontextbestimmungsmittel 209 empfangen von externen
Quellen Informationen, die sich auf den Anwender U1 beziehen – z. B.
den Ort des Anwenders, die Tageszeit und eine oder mehrere Eingaben
aus einem Terminkalender, woraus der Kontext des Anwenders U1 bestimmt
wird. Die ersten Wiedergewinnungsmittel 211 sind so beschaffen,
dass sie Informationen von dem durch die Profilerzeugungseinrichtung 201 erzeugten
persönlichen
Profil wiedergewinnen, so dass die ersten Wiedergewinnungsmittel 211,
nachdem die Kontextbestimmungsmittel 209 den Kontext des Anwenders
bestimmt haben, Interessen wiedergewinnen können, die sich auf diesen Kontext
beziehen. Die zweiten Wiedergewinnungsmittel 213 verwenden
die durch die ersten Wiedergewinnungsmittel 211 wiedergewonnenen
kontextbezogenen Interessen, um den Indexgenerator 205 abzufragen
und diesen Abfragen entsprechende Informationsquellen wiederzugewinnen.
-
Viele
Menschen haben Bedenken wegen der Zugreifbarkeit und Manipulation
von Aspekten ihres Anwenderprofils durch Dritte, zu denen sie keine
vertrauenswürdige
Beziehung haben. Außerdem
scheint es, dass viele Anwender keine automatische Profilanpassung
wünschen
und es stattdessen bevorzugen, die vollständige Kontrolle über irgendwelche
Profiländerungen
zu haben. Allerdings laufen Systeme, die anwenderintensiv sind,
wie etwa Systeme, in denen der Anwender Änderungen an seinem Profil
vornehmen muss, den Idealen agentengestützter Systeme, in denen Agenten
entwickelt werden, um die Belastung eines Anwenders zu verringern,
zuwider.
-
Im
Wesentlichen wird die vorliegende Erfindung, die Aspekte der Profilerzeugungseinrichtung 201 betrifft,
verwendet, um den Inhalt eines Anwenderprofils in Übereinstimmung
mit verschiedenen externen Eingaben und der Rückkopplung von dem Anwender
zu modifizieren. Durch das System werden Änderungen vorgeschlagen, die
aber lediglich mit Zustimmung des Anwenders ausgeführt werden.
Dies erspart dem Anwender somit das direkte Modifizieren des Profils,
wobei die Änderungen
aber lediglich in Reaktion auf die Zustimmung des Anwenders vorgenommen
werden. Außerdem
werden die Änderungen überprüft, so dass
eine Änderung,
wenn festgestellt wird, dass sie inakzeptabel ist, modifiziert und/oder
rückgängig gemacht
werden kann. Die Überprüfung der Änderungen
kann über
eine Zeitskale stattfinden, die von dem Anwender wählbar ist,
so dass der Anwender das System informieren kann, dass er keine
Zeit zum Prüfen
der Änderungen
hatte, wodurch die Überprüfungszeit
neu eingestellt wird.
-
Eine
solche Anordnung für
die personalisierte Informationsuwiedergewinnung findet den goldenen
Mittelweg zwischen den zwei in Konflikt stehenden Problemen der
Belastung des Anwenders und des überautomatisierten
Profilmanagements.
-
Profilerzeugugngseinrichtung
201
-
Die
Informationsliefereinrichtung 200 besitzt eine vorgegebene,
endliche Anzahl von Interessen, aus denen die einem Anwender U1
zugeordneten Interessen ausgewählt
werden können.
Diese Interessen fallen in die folgende nicht ausschließliche Liste
von Kategorien:
- – Allgemeine Interessen: z.
B. momentane Angelegenheiten, Finanzen, Wohnung, Geschäft, Freizeit,
Hobbys, Clubs usw.;
- – Orte:
z. B. Heimatstadt, Urlaubsziel, Geschäftsreise, Familienwohnungen
usw.
-
Es
gibt eine "Master-Kopie" allgemeiner Interessen,
die über
Verbindungsstücke
als ein azyklischer Graph verbunden sind. Die Master-Kopie ist in einer
Datenbanktabelle in der Profildatenbank DB1 gespeichert. Jedes der
Interessen (vom Typ allgemein oder Ort) besitzt eine oder mehrere
vorgegebene Schlüsselwörter, die
dem Interesse zugeordnet sind, wobei diese Schlüsselwörter ebenfalls in der Profileinrichtungs-Datenbank DB1
gespeichert und mit ihrem jeweiligen Interesse verknüpft sind.
(Wie später
ausführlicher
beschrieben wird, werden die Schlüsselwörter zum Wiedergewinnen von
für den
Anwender relevanten Informationen verwendet.) Jedes Interesse besitzt
eine eindeutige Kennung (ID), wobei die Verbinder in dem azyklischen
Graphen Interessen miteinander verknüpfen (so dass die Aufnahme
von Schlüsselwörtern für ein Interesse
wenigstens teil weise davon abhängen,
welche weiteren Interessen mit diesem Interesse verknüpft sind,
so dass z. B. das Interesse I1 von seinen Eltern- und Kind-Interessen
eine vorgegebene Anzahl von Schlüsselwörtern erbt).
-
Die
Profilerzeugungseinrichtung 201 ist so beschaffen, dass
sie Interesseninformationen von dem Anwender empfängt und
ein Profil erzeugt, das die Anwenderinteressen und Schlüsselwörter, die
sich auf diese Interessen beziehen, umfasst. Außerdem kann die Profilerzeugungseinrichtung 201 Interessen
in Übereinstimmung
mit vorgegebenen Vorschriften implizit identifizieren.
-
Explizite Modifizierung
des Profils
-
Ein
Anwender kann explizit Wörter
und/oder Satzglieder eingeben, die für das Anwenderinteresse repräsentativ
sind, woraufhin die Profilerzeugungseinrichtung 201 in
der Master-Kopie Interessen zu finden versucht, die mit der Eingabe übereinstimmen.
Dies umfasst das Durchsuchen des azyklischen Graphen nach einer Übereinstimmung
zwischen der Eingabe und den Interessen, möglicherweise unter Verwendung
von WORDNET, einem lexikalischen Referenzsystem, oder ähnlich,
um die Suche zu verbreitern. Falls die Profilerzeugungseinrichtung 201 kein
Interesse finden kann, das mit der Eingabe übereinstimmt, kann der Anwender U1
durch die Interessen navigieren und Interessen manuell auswählen.
-
Außerdem kann
die Profilerzeugungseinrichtung 201 mit einem (nicht gezeigten)
Analysealgorithmus zusammenarbeiten, um die eingegebenen Schlüsselwörter und/oder
Satzglieder in eines oder mehrere vorgegebene Interessen zu übersetzen;
viele bekannte Systeme könnten
so beschaffen sein, dass sie die Eingabe analysieren und die analysierte
Eingabe in ein Format übersetzen,
das von der Profilerzeugungseinrichtung 201 verstanden
wird.
-
Außerdem können die
Anwender jederzeit auf ihre Profile zugreifen. Somit kann ein Anwender
sein Profil betrachten, seinen instanziierten Kontext betrachten,
direkt Änderungen
an seinem Profil und tatsächlich an
den zum Wiedergewinnen von Informationen in Bezug auf die Interessen
in dem Profil verwendeten Informationsquellen vornehmen.
-
Implizite Modifizierung
des Profils
-
Die
Profilerzeugungseinrichtung 201 kann eine oder mehrere
Vorschriften enthalten, die Interessen in Beziehung bringen, so
dass die Profilerzeugungseinrichtung 201 automatisch das
Interesse B in das Anwenderprofil aufnimmt, falls das Interesse
A mit dem Interesse B verknüpft
ist und ein Anwender U1 das Interesse A besitzt. Die Vorschriften
können
ebenfalls auf Informationen beruhen, die von der Profilerzeugungseinrichtung 201 von
anderen Anwendern und/oder externen Quellen wiedergewonnen wurden.
Das Letztere kann besonders nützlich
für die
Lieferung dienstbezogener Informationen an Anwender sein – z. B.
besitzt die Informationsliefereinrichtung 200 die Fähigkeit,
bankbezogene Informationen an einen Anwender zu liefern, wenn eine
der Informationsquellen IS1–IS4
Informationen enthält,
die sich auf Banken beziehen. Allerdings muss die Informationsliefereinrichtung 200 wissen,
bei welcher Bank der Anwender U1 ein Konto hat, um bankbezogene Informationen
zu liefern, die für
den Anwender relevant sind. Der Anwender U1 könnte diese Informationen eindeutig
explizit eingeben, wobei es für
den Anwender U1 aber wesentlich zweckmäßiger wäre, falls diese Informationen
wiedergewonnen werden könnten,
ohne dass der Anwender U1 direkt daran beteiligt werden müsste. Zu
diesem Zweck kann die Profilerzeugungseinrichtung 201 ferner
so beschaffen sein, dass sie mit (nicht gezeigten) Web-Browsern
zusammenarbeitet, von denen sich einer an jedem Endgerät T1, T2,
T4 befindet, das von dem Anwender U1 verwendet wird. Insbesondere
könnte
die Profilerzeugungseinrichtung 201 Software für die Website-Verfolgung
auf das Festplattenlaufwerk des Endgeräts bzw, der Endgeräte T1, T2, T4
herunterladen. Unter der Annahme, dass der Anwender U1 am "Online"-Banking teilnimmt,
könnte
die URL der Bank des Anwenders für
die heruntergeladene Software zugreifbar sein, wobei die Profilerzeugungseinrichtung 201 daraus
den Namen der Bank wiedergewinnen und diesen zu dem Anwenderprofil
in der Profil-Datenbank DB1 hinzufügen könnte. Falls die Profilerzeugungseinrichtung 201 Zugang
zu Abrechnungsinformationen in Bezug auf Dienste und/oder Systeme
Dritter hat, die der Anwender verwendet, könnte die Profilerzeugungseinrichtung 201 alternativ
so beschaffen sein, dass sie von dem Abrechnungssystem Bankdaten
anfordert, die sich auf den Dritten beziehen. Das System des Dritten
könnte
sich in einem der Netze N1–N4
befinden.
-
Irgendwelche
Interessen, die implizit gefolgert wurden, kann der Anwender U1 überschreiben.
-
Die
Profilerzeugungseinrichtung 201 ist so beschaffen, dass
sie jedes Interesse mit einem Kontexttyp kennzeichnen kann. In dieser
Ausführungsform
sind zwei Kontextkategorien, d. h. Zustand und Situation, beschrieben,
obgleich viele weitere Kontextkategorien möglich sind. In ihren einfachsten
Formen haben diese Kontextkategorien zwei Typen: der Zustandkontext
besitzt Arbeit und Spiel und der Situationskontext besitzt zu Hause
und abwesend. Für
jede Kontextkategorie können
einige Interessen mit beiden Kontexttypen gekennzeichnet sein – z. B.
kann der Anwender U1 für
Arbeits- und Spielzwecke an Computern interessiert sein. Der Kontexttyp
kann explizit oder implizit eingegeben werden, wobei jedes Interesse
mit einem Standardkontexttyp gekennzeichnet werden kann.
-
Speicherung
des Profils
-
Wenn
ein Interesse für
einen Anwender U1 ausgewählt
worden ist, gibt die Profilerzeugungseinrichtung 201 für den Anwender
U1 zusammen mit dem Eintrag dieses Interesses in der Baumhierarchie
eine Kennung, die der ID dieses Interesses entspricht, in eine Datenbanktabelle
ein. Die Prozesse, die am Speichern von Daten in Datenbanken, am
Ausführen
von Abfragen in Datenbanken und am Empfangen von Daten aus Datenbanken
beteiligt sind, sind dem Durchschnittsfachmann auf dem Gebiet der
Datenbankadministration wohlbekannt. Für Ortsnamen-Interessen, z.
B. Ortsnamen im Vereinigten Königreich,
gibt es eine "Master-Kopie" von Ortsnamen, die
jeweils von Informationen über
die Graphschaft begleitet sind, wobei das Interesse in Bezug auf
einen Ortsnamen dynamisch unter Verwendung des Landes/der Graphschaft/des
Orts erzeugt wird, die aus der Master-Kopie wiedergewonnen worden
sind.
-
Die
Interessen können
außerdem
mit Attributen wie etwa Aktienwert und Ort gespeichert werden. Das Einstellen
des Aktienwert-Attributs gibt an, dass der Anwender U1 an Aktienwerten
in Bezug auf ein besonderes Interesse (wobei das Interesse z. B.
ein Unternehmen sein kann) interessiert ist. Das Einstellen des
Ortsattributs gibt an, dass der Anwender U1 an Ortsinformationen
in Bezug auf ein Interesse (wobei das Interesse z. B. Banken sein
kann, so dass die Angabe eines Ortsattributs wie etwa Bognor Regis
das Interesse an Banken in Bognor Regis verfeinert) interessiert
ist. Weitere Attribute umfassen Fachkenntnis, Privatsphäre, Relevanzwichtungen,
Prioritätswichtungen,
Zeiten, Tage, Informationsvolumen, Lieferkanäle, Gestaltung, Qualität der Informationsquellen
und Lesezeichen. Für
jedes der Attribute gibt es Standardeinstellungen, wobei der Anwender
U1 aber irgendwelche dieser Einstellungen über die (unten beschriebenen)
Schnittstellenmittel 203 ändern kann.
-
Außerdem kann
die Profilerzeugungseinrichtung 201 dem Anwender U1 Fragen "aufdrängen" – z. B., um ihm in Übereinstimmung
mit vorgegebenen Vorschriften Interessen vorzuschlagen. Die vorgegebenen
Vorschriften umfassen (z. B. über
Techniken wie etwa die Cluster-Analyse, den Click-Strom, Zusammenarbeitsfilterung
usw.) eine implizite Profilerzeugung, Änderungen an dem azyklischen
Interessengraphen, Informationen von dem Systemadministrator und
eine Rückkopplung
von dem Anwender U1. Die Profilerzeugungseinrichtung 201 überwacht
die Antwort des Anwenders auf die Fragen und modifiziert die Vorschriften
in Übereinstimmung
mit der Antwort.
-
Wie
in 3 gezeigt ist, umfasst die Profilerzeugungseinrichtung 201 somit
vorzugsweise zusätzlich eine
Profilmodifizierungseinrichtung 301 zum Empfangen von Informationen
von einer Vielzahl von Eingaben 311, 313, 315, 317, 319 (z.
B. Ausgangsinformationen von der Zusammenarbeitsfilterung, Änderungen
an den Systeminteressen usw. oder eine Rückkopplung von dem Anwender
U1), wobei sie anhand dieser Eingaben Tätigkeiten 305 erzeugt.
Die Eingaben können von
Bedingungen wie etwa dem Zeitpunkt, um dem Anwender U1 Informationen
aufzudrängen,
dem Prioritätsstatus
in Bezug auf den Typ der Interessen usw. begleitet sein. Die Profilmodifizierungseinrichtung 301 besitzt
Zugriff auf eine vorgegebene Liste von Funktionen F1 ... Fn und wählt anhand
des Wesens der Eingabe und der entsprechenden Bedingungen eine der
Funktionen aus, um eine Tätigkeit 305 zu
erzeugen. Die in der Liste gespeicherten Funktionen umfassen "Anwenderwechselwirkungsfunktionen", die die Funktionalität zum Aktivieren
von Vorschlägen
und Fragen, die dem Anwender U1 (durch den Fragetyp eingeschränkt) vorgelegt
werden, enthalten, sowie "Systemfunktionen" in Bezug auf Interessen,
die die Funktionalität
zum Hinzufügen
neuer Interessen, zum Löschen
erwähnter
Interessen, zum Modifizieren erwähnter
Interessen usw., enthalten. Die "Anwenderwechselwirkungsfunktionen" umfassen, dem Anwender über die
Schnittstellenmittel 203 Informationen aufzudrängen, wobei
sie mit dem Fragetyp einschließlich "zur Probe" und "zurück zu den
ursprünglichen
Einstellungen" usw.
gekennzeichnet und dem Anwender in Übereinstimmung mit der Priorität der Anforderung
geliefert werden können.
Die "Systemfunktionen" umfassen das Ausführen einer Änderung
an einem gespeicherten Anwenderprofil. Diese weitere Funktionalität der Profilerzeugungseinrichtung 201 ist
in dem folgenden Beispiel veranschaulicht:
-
Im
Ergebnis der Zusammenarbeitsfilterung von Interessen zwischen Anwendern
wird ein Interesse I1 an die Profilmodifizierungseinrichtung 301 übergeben.
Die Profilmodifizierungseinrichtung 301 erzeugt eine Vorschlagstätigkeit 305,
wobei der Vorschlag darin besteht, dass das neue Interesse I1 zum
Anwenderprofil hinzugefügt
werden sollte, wobei die Profilmodifizierungseinrichtung 301 dem
Vorschlag eine Bedingung niedriger Priorität zuweist, da das Interesse
ein neues In teresse ist. Daraufhin wird die Vorschlagstätigkeit 305 dem Anwender
U1 aufgedrängt.
Typisch wird ein neues Interesse außerdem mit "zur Probe" gekennzeichnet, so dass die dem Anwender
U1 aufgedrängte
Nachricht lautet:
"Wir
denken, dass Sie daran interessiert sein könnten, ihrem Profil ein neues
Interesse I1 hinzuzufügen.
Dies würde
bewirken, dass Geschichten wie Geschichte 1, Geschichte 2, Geschichte
3 zurückgegeben
werden. Möchten
Sie Ihrem Profil I1 hinzufügen?
Bitte antworten Sie mit ja nein, ich möchte es eine Woche versuchen."
-
Außerdem ist
die Profilmodifizierungseinrichtung 301 so betreibbar,
dass sie Antworten von dem Anwender U1 empfängt. Falls der Anwender die
Option "ich möchte es
für eine
Woche versuchen" auswählt, wird an
die Profilmodifizierungseinrichtung 301 eine Nachricht
gesendet, die die Art der Rückkopplung
identifiziert, die Nachricht speichert und in Bezug auf eine Tätigkeit
eine Zeitmesserbedingung erzeugt, die zu einer Anwenderrückkopplung
auffordert. Wenn der Zeitmesser abgelaufen ist, erzeugt die Profilmodifizierungseinrichtung 301 für die Rückkopplung
eine Rückkopplungstätigkeit 305,
schaltet sie den Zeitmesser ab und löscht sie die Nachrichten von
der Profilmodifizierungseinrichtung 301. Die dem Anwender
aufgedrängte
Nachricht lautet:
"In
der vergangenen Woche hat RF vorgeschlagen, Ihrem Profil das Interesse
I1 hinzuzufügen.
Möchten Sie
diese Änderung
beibehalten?
Bitte antworten Sie mit ja oder nein.
(Falls
die Antwort nein lautet, kehren Sie zu Ihren ursprünglichen
Einstellungen zurück.)"
-
Die
Rückkopplung
von dem Anwender U1 wird von der Profilmodifi zierungseinrichtung 301 empfangen,
die die Art der Rückkopplung
identifiziert. Falls die Rückkopplung
das Vornehmen einer Änderung
an dem Anwenderprofil umfasst, wird anhand der Systemfunktionen
eine Systemtätigkeit 305 erzeugt
und das Profil wie oben beschrieben modifiziert.
-
Alternativ
könnte
die Profilmodifizierungseinrichtung 301 die Anzahl überwachen,
in der der Anwender auf die Informationen in Bezug auf das vorgeschlagene
Interesse I1 zugreift, und, falls die Anzahl einen Schwellenwert übersteigt,
eine Systemtätigkeit 305 erzeugen,
die das Interesse I1 automatisch zu dem Profil hinzufügt. Außerdem könnte die
Profilmodifizierungseinrichtung 301 den Zeitpunkt, zu dem
der Anwender auf die Informationen in Bezug auf das Interesse I1
zugreift, und den Ort, an dem er auf sie zugreift, identifizieren und
dies als Kontextinformationen für
das Interesse I1 speichern. Wenn das Interesse I1 zu dem Profil
hinzugefügt
wird, kennzeichnet die Profilmodifizierungseinrichtung 301 das
Interesse daraufhin zusätzlich
mit den gespeicherten Kontextinformationen.
-
Außerdem oder
als eine Alternative zur Überwachung
der Anzahl, in der der Anwender auf die Informationen in Bezug auf
das vorgeschlagene Interesse I1 zugreift, könnte eingerichtet werden, dass
die Profilmodifizierungseinrichtung 301 die Art und Weise überwacht,
in der der Anwender auf Informationen in Bezug auf das vorgeschlagene
Interesse I1 zugreift. Daraufhin könnte eingerichtet werden, dass
die Profilmodifizierungseinrichtung 301 das Interesse I1
dem Profil nur dann hinzufügt,
wenn Aspekte seines Zugriffsverhaltens bestimmten Bedingungen genügen. Beispielsweise
könnte
eine Bedingung sein, dass ein Anwender wenigstens 2 Minuten mit
dem Zugreifen auf die Informationen verbringt oder dass der Anwender 3 Tage
lang jeden Tag wenigstens fünf
Mal auf die Informationen zugreift, auf die sich das Interesse bezieht.
Wie dem Fachmann auf dem Gebiet klar ist, könnten solche Zugriffsmuster
viele Formen annehmen.
-
Andere
Eingaben 319 umfassen Systemadministratoreingaben – z. B.
das Endgeräteformat,
in dem der Anwender bevorzugt Informationen empfängt.
-
Ferner
enthält
die Profilmodifizierungseinrichtung 301 Mittel zum Speichern
der Rückkopplung
von dem Anwender U1, insbesondere zum Aufrechterhalten von Listen 310 von
Interessen, an denen der Anwender U1 nicht interessiert ist (z.
B. als eine Liste gelöschter
Interessen). Somit vergleicht die Profilmodifizierungseinrichtung 301 jedes
Mal, wenn in Bezug auf ein neues Interesse eine Eingabe empfangen
wird, das neue Interesse mit der Liste gelöschter Interessen 310 (wobei
sie in Bezug auf gelöschte
Interessen keine Tätigkeit
erzeugt). Außer
dem strengen Vergleich zwischen ankommenden Eingaben und gelöschten Interessen kann
die Profilmodifizierungseinrichtung 301 in Bezug auf die
Interessen in der gelöschten
Liste auf das Lexikon WORDNET oder ähnlich zugreifen, wobei neue
Anforderungen mit Begriffen verglichen werden, die von WORDNET als äquivalent
gelöschten
Interessen identifiziert werden.
-
In
einer weiteren Ausführungsform
erzeugt die Profilmodifizierungseinrichtung 301 nur dann
eine Anwenderwechselwirkungsfunktion, wenn sie sicher ist, dass
das Interesse für
den Anwender relevant ist. Somit bewertet die Profilmodifizierungseinrichtung 301 für jedes
potenzielle neue Interesse einen Vertrauenswert und vergleicht diesen
mit einem Schwellenvertrauenswert. Falls der Vertrauenswert größer als
der Schwellenvertrauenswert ist, erzeugt die Profilmodifi zierungseinrichtung 301 wie
oben beschrieben eine Anwenderwechselwirkungsfunktion (z. B. die
vorgeschlagene Tätigkeit).
Dies ist in 3 gezeigt, wo den verschiedenen
Eingaben 311, 313, 315, 317, 319 ein
Vertrauenswert 321 zugeordnet ist.
-
Falls
durch statistische Techniken wie etwa Cluster-Bildung oder Filterung
ein neues Interesse identifiziert worden ist, können aus den bei der Cluster-Bildung
verwendeten Daten Vertrauenswerte berechnet werden. Falls z. B.
unter Verwendung der Cluster-Analyse ein Interesse identifiziert
worden ist, kann die Standardabweichung der Punkte in dem Cluster
berechnet und zur Ableitung eines der Cluster-Analyse zugeordneten Vertrauenswerts
verwendet werden.
-
Schnittstellenmittel 203
-
Die
Schnittstellenmittel 203 steuern die Übermittlung von Informationen
zwischen dem Anwender U1 und der Informationsliefereinrichtung 200.
Wie in 1 gezeigt ist, kann der Anwender U1 z. B. über irgendeines
der drei Endgeräte
T1, T2 und T4 mit der Informationsliefereinrichtung 200 kommunizieren,
die sich beim Endgerät
T3 befindet. Es kann eingerichtet werden, dass zwei der Endgeräte T1, T2
Daten unter Verwendung von WML senden und empfangen (die Endgeräte T1 und
T2 besitzen eine Bluetooth-Sende- bzw. -Empfangsvorrichtung, so
dass Informationen, die über
das Endgerät
T1 empfangen werden, im Endgerät
T2 empfangen werden können),
während
eingerichtet werden kann, dass das dritte Endgerät T4 Daten unter Verwendung
von HTML sendet und empfängt.
Jedes der Endgeräte
T1, T2, T4 kann Web-Browser ausführen.
Der Anwender gibt. auf bekannte Weise über ein Formular Daten in den
Browser ein, um eine Anzahl von Tätigkeiten auszuführen, einschließlich (nicht erschöpfende Liste):
- – Modifizieren
von Interessen, die in dem Anwenderprofil enthalten sind;
- – Modifizieren
des Anwenderkontexts;
- – Betrachten
von dem Anwender aufgedrängten
Einträgen;
und
- – Auswählen von
dem Anwender aufgedrängten
Einträgen.
-
Im
Wesentlichen erfasst dieses Formular irgendwelche durch einen Anwender
eingegebenen Parameter und überträgt die erfassten
Parameter an andere Teile der in dem Endgerät T3 untergebrachten Informationsliefereinrichtung 200.
Wegen weiterer Informationen siehe: "Client/Servier Programming With Java
and Corba"; 2. Auflage,
R. Orfali und D. Harkey, S. 239–242.
-
Wenn
der Anwender U1 explizit ein Interesse zu dem Anwenderprofil hinzufügt oder
aus ihm löscht, versendet
das Formular die Interessen zusammen mit der Tätigkeit, die in Bezug auf dieses
Interesse ausgeführt
werden soll (z. B. Hinzufügen,
Löschen),
an die Profilerzeugungseinrichtung 201, die diese Informationen wie
oben beschrieben verarbeitet. Das Formular kann Pull-Down-Menüs und dergleichen
enthalten, die ermöglichen,
dass der Anwender US1 aus einer vorgegebenen Liste auswählt, die
besonders zum Definieren von Interessen an Filmen, Nahrungsmitteln
usw. nützlich
ist, während
der Anwender U1 auswählen
kann, an welchem Film oder an welcher Nahrungsmittelart er interessiert
ist.
-
Alternativ
oder zusätzlich
können
die Schnittstellenmittel 203 mit (nicht gezeigten) Mitteln
konfiguriert sein, die wenigstens einen Teil der Kurzliste und/
oder der Wechselwirkungen mit dem Anwender U1 über ein Sprachmedium übergeben.
-
Indexgenerator 205
-
Der
Indexgenerator 205 erzeugt für jede in den Informationsquellen-Servern IS1–IS4 gespeicherte
Informationsquelle einen Index und speichert die Informationen in
Indextabellen in der Indexdatenbank DB2. Jede Indextabelle enthält wenigstens
eine der folgenden Informationen:
- 1. den Namen
der Informationsquelle (z. B. den Namen eines Dokuments),
- 2. Schlüsselbegriffe,
die aus der Informationsquelle entnommen worden sind,
- 3. die Netzadresse (URL) der Informationsquelle,
- 4. einen für
die Informationsquelle aufgezeichneten Ort,
- 5. das Datum und die Zeit, zu der die Informationsquelle erzeugt
wurde,
- 6. das Kontextattribut der Informationsquelle – d. h.
ob relevant für
Arbeit, Spiel, zu Hause oder abwesend (optional).
-
Ein
Ortsdatensatz ist ein in der Breite, in der Länge und in der Höhe definierter
Ort und eine dreidimensionale Gestalt, die die Örtlichkeit definiert, in der
der Datensatz gültig
ist, wobei sich der definierte Ort in der Mitte der dreidimensionalen
Gestalt befindet. Die Orte, denen die jeweiligen Informationsquellen
zugeordnet sind, sind einzeln konfigurierbar. Einige Informationen
(z. B. Wetterinformationen) könnten
somit durch den Anwender über
ein verhältnismäßig weites
Gebiet leicht zugänglich
sein, während
andere Informationen, die (wie etwa Informationen über lokale
Dienste) mehr ortsspezifisch sind, für alle Gebiete mit Ausnahme
einer schmal definierten Örtlichkeit
herausgefiltert werden könnten.
-
Die
Art der durch den Indexgenerator 205 indizierten Informationen
umfasst Nachrichtendaten, Aktienmarktlisten, Lycos, Wetterdaten,
klassifizierte Werbungen, Ereignisführer, Unterhaltungsinformationen
wie etwa Kinolisten, Plätze
zum Aufhalten, Plätze
zum Essen, Sport, Finanzinformationen, Einkaufsinformationen, z.
B. Kaufhausführer,
sowie Informationen über
Dienstleistungen, z. B. Orte von Geldautomaten, Orte von Tankstellen.
Es gibt viele Verfahren zum Aufbauen von Indizes für unstrukturierte
Informationsquellen, wobei das besondere verwendete Verfahren für diese
Ausführungsform
unwichtig ist. Somit kann irgendein Mittel verwendet werden, das
Daten in Übereinstimmung
mit der oben definierten Indextabelle auslesen und speichern kann
(wegen einer umfassenden Übersicht über viele
momentan in der Such- und Wiedergewinnungstechnologie verwendete
Verfahren siehe "Managing
Gigabytes" von Ian
H. Witten, Alistair Moffat, Timothy C. Bell Morgan Kaufmann; ISBN:
1558605703). Der Indexgenerator 205 greift in regelmäßigen Intervallen
(je nach dem Wesen der Informationsquelle und der Rate, mit der
sie sich ändert,
täglich,
stündlich,
wöchentlich)
auf die Informations-Server IS1–IS4
zu, so dass die Indextabellen aktuell sind.
-
Wiedergewinnungsmaschine
207
-
Die
Funktion der Wiedergewinnungsmaschine 207 ist es, den Anwenderkontext
in Echtzeit zu bestimmen und zu instanziieren, von der Profilerzeugungseinrichtung 201 Interessen
wiederzugewinnen, die dem instanziierten Kontext zugeordnet sind,
und anhand dieser Interessen über
den Indexgenerator 205 Informationen von den Informationsquellen
IS1–IS4
wiederzugewinnen.
-
Die
erste Phase – in
der die Wiedergewinnungsmaschine 207 den Anwenderkontext
bestimmt und instanziiert – wird
durch die Kontextbestimmungsmittel 209 ausgeführt und
ist anhand von 4 beschrieben. Die Kontextbestimmungsmittel 209 enthalten
eine konfigurierbare Liste 400, die jeden der Kontexttypen
definiert – wobei
z. B. ZU HAUSE als Breiten- und Längenwerte durch einen Ort definiert
sein kann, während
ABWESEND als irgendein Ort, der mehr als n1 km von zu Hause ist,
definiert sein kann. Ähnlich
kann ARBEIT durch die Tageszeit und durch den Ort definiert sein,
während
SPIEL durch die Tageszeit und irgendeinen Ort, der mehr als n2 km
von der Arbeit ist, definiert sein kann. Die Kontextbestimmungsmittel 209 sind
so beschaffen, dass sie Eingaben aus mehreren Quellen, z. B. von
einem Terminkalender 401, einer Uhr 403 und einer Personenverfolgungsvorrichtung 405,
empfangen und diese Eingaben mit Informationen in der vorgegebenen Liste
kombinieren können,
um den Kontext des Anwenders U1 abzuleiten. Die in 4 gezeigten
Beispiele dienen lediglich zur Veranschaulichung der Arten der Quellen,
die mit den Kontextbestimmungsmitteln 209 zusammenarbeiten
können
(weitere Beispiele werden unten gegeben).
-
Die
Uhr 403 könnte
eine Systemuhr sein, die sich in dem Endgerät T3 befindet. Der Terminkalender 401 könnte der
Kalender von Microsoft OutlookTM oder ein
speziell angefertigter Terminkalender sein, in den die Kontextbestimmungsmittel 209 zu
vorgegebenen Zeiten Abfragen eingeben können, die zeitlich gekennzeichnete
Daten in Bezug auf die vom Anwender geplanten Tätigkeiten anfordern. Informationen
bezüglich
der Schnittstelle zu OutlookTM sind zu finden
in "Programming
Microsoft Outlook and Microsoft Exchange" von Thomas Rizzo, Microsoft Press;
ISBN: 0735605092. Einträge
in einen Terminkalender 401 enthalten häufig Satzglieder, die in einem
Format analysiert werden müssen,
das von den Kontextbestim mungsmitteln 209 erkannt wird;
der Terminkalender 401 kann so konfiguriert werden, dass
er mit einem Analysealgorithmus in Wechselwirkung tritt und die
Einträge
dementsprechend übersetzt.
-
Die
Personenverfolgungsvorrichtung
405 wird von dem Anwender
U1 getragen und ermöglicht,
seinen Ort in der Kommunikationsumgebung zu verfolgen. Beispielsweise
umfasst die Verfolgungsvorrichtung
405 in dieser Ausführungsform
eine Karte, die einen Chip trägt,
oder "Chipkarte", die Daten trägt, die
den Anwender identifizieren, während
einige oder alle der Endgeräte
T1–T5,
die einen Kartenleser tragen, die Karte lesen können. Alternativ könnte sie
einen Transponder eines 'Intelligenten
Ausweises' enthalten,
dessen Ort in dem Gebäude
verfolgt wird. Genauer tragen die Workstations T1–T4 und
das Zellentelephon T1 solche Chipkartenleser. An den Zugangstüren in dem
Gebäude
sind zusätzliche
Chipkartenleser installiert, die mit dem LAN N3 verbunden sind,
um darin zu signalisieren. Ferner umfasst das Zellentelephon T1,
wie in
EP 0467651 (Motorola)
offenbart ist, außer
den Zellentelephon-Kommunikationskomponenten vorzugsweise einen
Empfänger für das globale
Positionsbestimmungssystem (GPS), wobei es seinen Ort periodisch
ableiten und signalisieren kann. Alternativ könnte das Zellentelephon T1
eine Positionierung außerdem
unter Verwendung eines landgestützten
Positionierungssignals wie etwa durch Differenz-GPS-Positionierung
oder rein unter Verwendung landgestützter Positionierungssignale
wie etwa durch Differenz-GSM-Triangulationssignale ausführen.
-
Wenn
die Kontextbestimmungsmittel 209 Informationen von dem
Terminkalender 401, von der Uhr 403 und von der
Verfolgungsvorrichtung 405 sowie von weiteren (nicht gezeigten)
solchen Vorrichtungen gesammelt haben, werden diese Informationen
kombiniert, um den Anwenderkontext zu instanzüeren. Als ein Beispiel ist
dieser Prozess anhand von 5a definiert:
- – S
5.1 Nimm die momentane Zeit (t) und vergleiche sie mit den für die Arbeit
vordefinierten Zeitschlitzen (Startzeit T1,
Endzeit T2, betrifft nominell Wochentage):
- i. falls (T1 < t < T2) und die Terminkalenderinformationen arbeitsbezogen
sind: Kontext ARBEIT
- ii. falls (T1 < t < T2) und die Terminkalenderinformationen spielbezogen
sind: Kontext SPIEL (z. B. Tag im Urlaub)
- iii. falls (t < T1 ODER t > T2) und die Terminkalenderinformationen arbeitsbezogen
sind: Kontext ARBEIT (z. B. Arbeit am Abend)
- iv. falls (t < T1 ODER t > T2) und die Terminkalenderinformationen spielbezogen
sind: Kontext SPIEL (d. h. am Abend frei)
- – S
5.2 Transformiere die Positionsdaten (Ii,
Ij) in Breite und Länge und vergleiche mit der
Position für
die Wohnung (loc1, loc2):
- (i) falls (loc1 Ii < loc1 +
n1) UND (loc2 < Ij < loc2 +
n1) : Kontext ZU HAUSE
- (ii) falls (Ii > loc1 + n1) ODER
(Ij > loc2 + n1) : Kontext ABWESEND,
- so dass
- S 5.1 (i oder iii) und S 5.2 (i) ARBEIT, ZU HAUSE (W, H) als
Kontexte geben
- S 5.1 (i oder iii) und S. 5.2 (ii) ARBEIT, ABWESEND (W, A) als
Kontexte geben
- S 5.1 (ii oder iv) und S 5.2 (i) SPIEL, ZU HAUSE (P, H) als
Kontexte geben
- S 5.1 (ii oder iv) und S 5.2 (ii) SPIEL, ABWESEND (P, A) als
Kontexte geben.
-
Außer dem
Instanziieren des Kontexts des Anwenders in Bezug auf den Zustand
und die Situation können
zusätzliche
Kontextinformationen, z. B. "draußen", "beansprucht", "beschäftigt" usw., bestimmt werden.
Um diese zusätzlichen
Kontextinformationen zu identifizieren, können Eingaben von den unten
in den Punkten 1–7
aufgeführten
Vorrichtungen verwendet werden, von denen einige in 5b gezeigt
sind. Wie unten ausführlicher
beschrieben wird, können
solche zusätzlichen
Kontextinformationen außerdem
verwendet werden, um zu bestimmen, ob dem Anwender Informationen
aufgedrängt
werden sollen oder nicht. Diese Vorrichtungen können umfassen:
- 1. Informationen von dem Anwender: Der Anwender U1 kann einen
vorgegebenen Schlüssel
oder eine vorgegebene Folge von Schlüsseln verwenden, um über das
Endgerät
T1 anzugeben, dass er abgelenkt oder unterwegs ist;
- 2. Wetterinformationen;
- 3. Lichtpegeldetektoren wie etwa photoelektrische Abtastvorrichtungen,
die von Remote Measurement Systems, 2633 Eastlake Ave. E, Suite
20, Seattle, WA 98102, verfügbar
sind (z. B. die Vorrichtung PVC-1)
- 4. Thermoelementsensoren wie etwa Temperaturindikatoren, die
von TC Ltd. (TC Ltd., P. O. Box 130, UXBRIDGE UB8 2YS, England)
verfügbar
sind und bestimmen helfen, ob der Anwender U1 draußen oder
drinnen ist,
- 5. eine Eingabe, die Belastungspegel repräsentiert – z. B. die Überwachung
der Körpertemperatur
oder der Wechselwirkungen des Anwenders mit dem Endgerät T1, T2,
T4. Die Überwachung
der Anwender/Endgerät-Wechselwirkung
ist offenbart in der veröffentlichten
Anmeldung WO00/25565 des Anmelders (IPD-Fall Ref. A25709);
- 6. eine Eingabe, die repräsentativ
für die
Rauschpegel ist – kann
durch Analyse des über
den Audioausgang an dem Endgerät
T1 empfangenen Audiosignals bestimmt werden;
- 7. Eingaben von zusätzlichen
physikalischen Sensoren, die über
eine (nicht gezeigte) serielle Schnittstelle mit dem Endgerät T1 verbunden sind, einschließlich Eingaben
von
– einem
Detektor 501 niedriger Beschleunigungen (z. B. ADXL202,
der die Beschleunigung einer niedrigen Kraft in zwei Richtungen
misst);
– einem
Detektor 503 hoher Beschleunigungen (ACH04–08–05, der
von Measurement Specialities Incorporated verfügbar ist (auf den über den
Universal Resource Locator (URL) http: //www.msiusa.com im Internet
Bezug genommen werden kann)), der Beschleunigungen einer hohen Kraft
in drei Richtungen misst;
– einem
Richtungsdetektor 505 (z. B. einen Kompass HMC2003, der
von Honeywell verfügbar
ist (Verweis über
die URL http: //www.ssechoneywell.com), der eine absolute Messung
der Ausrichtung des Endgeräts T1
gibt); und
– einem
Richtungs- und Geschwindigkeitssensor 507 (der ein piezoelektrisches
ENC-Schwingungsgyroskop (Teilenummer S42E-2, das unter dem eingetragenen
Warenzeichen GY-ROSTAR
verkauft wird) verwendet, das von der Murata manufacturing Company
Ltd. verfügbar
ist (URL: http://www.murata.com)). Der Beschleunigungs-, der Richtungs-
und der Geschwindigkeitsdetektor können über einen Multiplexer 509 (MUX)
mit den Kontextbestimmungsmitteln 213 verbunden sein.
-
Das
komplexe Wesen der physikalischen Daten macht die Verwen dung einfacher
Vorschriften zur Bestimmung des Anwenderkontexts aus allen diesen
Eingaben unzuverlässig.
Um den Anwenderkontext genauer zu bestimmen, wenn die Instanziierung
des Kontexts auf einer Kombination der Eingaben 1–7 beruht,
können
Hidden Markov Models (HMM) oder ein Kalman-Filter verwendet werden.
Eine gute Beschreibung der Mechanik und Anwendungen von Kalman-Filtern
wird gegeben von du Plessis, R. M., 1967; "Poor man's explanation of Kalman Filters or How
I stopped worrying and learned to love matrix inversion".
-
Die
zweite Phase – in
der die Wiedergewinnungsmaschine 207 von der Profilerzeugungseinrichtung 201 die
diesem instanziierten Kontext zugeordneten Interessen wiedergewinnt – wird durch
die ersten Wiedergewinnungsmittel 211 ausgeführt, die
eine Anforderung in Bezug auf den instanziierten Kontext an die
Profilerzeugungseinrichtung 201 einreichen. Die Profilerzeugungseinrichtung 201 fragt
die Profildatenbank DB1 ab, die in Übereinstimmung mit der Abfrage
Informationen wiedergewinnt, und gibt die Interessen, die sich auf
den instanziierten Kontext beziehen, an die ersten Wiedergewinnungsmittel 211 zurück. Wenn
der instanziierte Kontext z. B. Arbeit, Spiel ist, sucht die Datenbank
DB1 nach Interessen, die mit W, P gekennzeichnet sind.
-
Die
dritte Phase – in
der die Wiedergewinnungsmaschine 207 von den Informationsquellen
IS1–IS4 Informationen
wiedergewinnt, die relevant für
die vom Anwender instanziierten Interessen sind – wird wie in 6 gezeigt
von den zweiten Wiedergewinnungsmitteln 213 ausgeführt.
-
Zweite Wiedergewinnungsmittel
213
-
- – S
6.1 gewinnt von den ersten Wiedergewinnungsmitteln 211 die Daten
der instanziierten Interessen wieder;
- – S
6.2 wählt
eine der Indextabellen aus, die Daten enthält, die sich auf eine Informationsquelle
beziehen, und prüft
z. B. unter Verwendung einer Schlüsselwortübereinstimmung auf Korrespondenz
zwischen instanziierten Interessen und indizierten Schlüsselwörtern;
- – S
6.3 gewinnt die Netzadresse (URL) und den Namen der Informationsquelle
für positive
Schlüsselwortübereinstimmungen
wieder;
- – S
6.4 wiederholt S 6.2 und S 6.3 für
alle Informationsquellen, die durch den Indexgenerator 205 indiziert worden
sind;
- –S
6.5 stellt die Netzadresse (URL) und den Namen der Informationsquellen,
die in S 6.3 wiedergewonnen worden sind, zu Einträgen in einer
Kurzliste zusammen.
-
In
einer alternativen Ausführungsform
gewinnen die ersten Wiedergewinnungsmittel 211 alle Anwenderinteressen
wieder. Daraufhin ordnen die zweiten Wiedergewinnungsmittel 213 unter
Verwendung der Kontextattribute, mit denen die Interessen gekennzeichnet
sind, z. B. Fußball
P (Spiel), H (Spiel, zu Hause); Computer W, P (Arbeit, Spiel) die
Einträge
in Übereinstimmung
mit dem vom Anwender instanziierten Kontext in der Kurzliste ein.
Daraufhin werden die Einträge
in der in S 6.4 erzeugten Kurzliste in Übereinstimmung mit den Einordnungen
so organisiert, dass Einträge,
die für
den vom Anwender instanziierten Kontext die höchste Relevanz haben, oben
auf der Kurzliste angeordnet werden.
-
Wenn
ein erhebliches Datenvolumen, z. B. etwa 2 Gigabyte oder mehr Daten,
indiziert wird, bedeuten die Fähigkeiten
der momentanen Hardware, dass die Erfindung wahrscheinlich in Übereinstimmung
mit der ersten Ausführungsform
betrieben wird (d. h. Daten lediglich in Bezug auf instanziierte
Interessen wiedergewonnen werden). In diesem Fall können die
zweiten Wiedergewinnungsmittel 213 so eingerichtet werden, dass
sie Informationen in Bezug auf andere als die instanziierten Interessen
zu einem späteren
(vorgegebenen) Zeitpunkt wiedergewinnen.
-
Die
Kurzliste kann in der Datenbank DB1 gespeichert werden, und es können Kurzlistenseitenansichten
zur Lieferung über
die Schnittstellenmittel 203 an den Anwender U1 erzeugt
werden (z. B. werden HTML/WML-Seitenansichten erzeugt, die Kurzlistendaten
umfassen).
-
Es
kann eingerichtet werden, dass die Schnittstellenmittel 203 die
Kurzlistenseitenansichten in vorgegebenen Intervallen aus der Datenbank
DB1 empfangen und diese Daten zur Anzeige an das Anwenderendgerät T1, T2,
T4 versenden. In einer Anordnung werden die Kurzlistenseitenansichten
von den zweiten Wiedergewinnungsmitteln 213 angefordert
und von den zweiten Wiedergewinnungsmitteln 213 an die
Schnittstellenmittel 203 übergeben. Wie früher festgestellt
wurde, werden Einträge,
die am höchsten
eingeordnet sind, oben auf der Liste angezeigt. Der Anwender U1
kann irgendeinen der Einträge
in der Kurzliste auswählen,
wobei diese Auswahl an die zweiten Wiedergewinnungsmittel 213 versendet
wird, die eine Anforderung von Daten an die URL in dem Eintrag senden.
Daraufhin werden die von der URL zurückgegebenen Daten dem Anwender
U1 angezeigt.
-
In
einigen Fällen
kann der instanziierte Kontext des Anwenders U1 angeben, dass der
Anwender U1 keine Informationen empfangen möchte. Zum Beispiel könnte der
Anwender U1 auf Reisen, in einer Besprechung, müde, in einer schlecht beleuchteten
Umgebung usw. sein, wobei das Beantworten der Informationen in diesem
Fall schwierig ist. In diesen Situationen können die zweiten Wiedergewinnungsmittel
213 das
Senden von Informationen zurückhalten,
bis bestimmt worden ist, dass der Kontext des Anwenders besser für das Empfangen
der Informationen geeignet ist. Somit sind die zweiten Wiedergewinnungsmittel
213 so
beschaffen, dass sie Eingaben von den Kontextbestimmungsmitteln
209 empfangen,
die repräsentativ
für den
vom Anwender instanziierten Kontext sind, und diese mit vorgegebenen
Informationsliefervorschriften vergleichen wie etwa
Natürlich sind
andere Formen der Vorschriften möglich.
-
Anpassung des Profils
-
Die
oben dargestellte Ausführungsform
beschreibt die Einordnung von Einträgen in einer Kurzliste des Anwenders
in Übereinstimmung
mit dem vom Anwender instanziierten Kontext, so dass Einträge, die
sich auf die instanziierten Interessen beziehen, dem Anwender U1
zuerst angeboten werden. Außer
den Kontextinformationen werden auch Präferenzattribute wie etwa Relevanz,
Wichtigkeit usw. (oben beschrieben) in den Einordnungsprozess faktorisiert.
Allerdings ist es möglich,
dass der Anwender U1 Informationen, die sich auf ein besonderes
Interesse beziehen, gewohnheitsmäßig ignoriert
(dies ist besonders möglich
für Interessen,
die anhand von Vorschriften (siehe das Beispiel unten) implizit
abgeleitet worden sind).
-
Wie
in 7 gezeigt ist, kann die Informationsliefereinrichtung 200 ferner Überwachungsmittel 701 aufnehmen,
um die Art zu beobachten, in der der Anwender U1 auf Einträge in der
Kurzliste zugreift, und die Attribute der Anwenderinteressen dementsprechend
anpassen. Vorzugsweise umfassen die Überwachungsmittel 701 ein
Bayes-Netz 703 und
arbeiten sie mit den zweiten Wiedergewinnungsmitteln 213 zusammen.
Die Einträge
in der Kurzliste werden in das in 8 gezeigte
Bayes-Netz 703 eingegeben, um eine Priorität zu berechnen,
die den diesen Einträgen
entsprechenden Interessen entspricht. Wie im Gebiet bekannt ist,
betrachtet ein Bayes-Netz den Kausalzusammenhang der Historiendaten,
um die a-priori-Wahrscheinlichkeit des Auftretens eines Ereignisses
zu modifizieren. Eine Diskussion von Bayes-Netzen ist gegeben in "Artificial Intelligence – A Modern
Approach" von S.
Russell und P. Norvig, Prentice Hall, USA.
-
Das
Bayes-Netz 703 ist so betreibbar, dass es die Präferenzattribute
anhand der Beobachtung anpasst, wie der Anwender U1 Einträge in der
Kurzliste behandelt. Beispielsweise legen Einträge, die ganz oben in der Kurzliste
angeordnet sind, nahe, dass die Informationsquelle für den Anwender
relevant ist. In der Praxis kann sich der Anwender aber dafür entscheiden,
auf Informationen, die sich auf dieses Interesse beziehen, später am Tag
zuzugreifen. Wenn das der Fall ist, verwenden die Überwachungsmittel 701 das
Bayes-Netz 703, um die Präferenzattribute in der Weise
zu modifizieren, dass die Überwachungsmittel 701 das
nächste Mal,
wenn ein Eintrag, der sich auf das Interesse bezieht, in der Kurzliste
erscheint, voraussehen, wie sie der Anwender U1 behandeln möchte, und
dies dementsprechend in die Einordnung des Interesses faktorisieren.
-
Außer dem
wie oben beschriebenen impliziten Anpassen des Anwen derprofils können die
zweiten Wiedergewinnungsmittel 213 ferner so eingerichtet
werden, dass sie Informationen von der Profilmodifizierungseinrichtung 301 empfangen.
Wie oben beschrieben wurde, kann die Profilmodifizierungseinrichtung 301 dem
Anwender U1 Fragen aufdrängen,
die eine explizite Einordnung der Informationsquellen anfordern – z. B. könnten dem
Anwender U1 die Einordnungen von –2 bis +2 angeboten werden
und er gebeten werden anzugeben, wie relevant eine besondere Informationsquelle
für ihn
war. Falls ein Anwender einen hohen Punktestand zurückgibt,
senken die zweiten Wiedergewinnungsmittel 213 im Allgemeinen
den Schwellenwert des Relevanzpräferenzattributs
in Bezug auf Interessen, die sich auf diese Informationsquelle beziehen;
demgegenüber
erhöhen
die zweiten Wiedergewinnungsmittel 213 den Relevanzschwellenwert,
falls der Anwender einen niedrigen Punktestand zurückgibt.
-
Falls
ein Anwender Informationsquellen, die für ein Interesse identifiziert
worden sind, ständig
einen niedrigen Punktestand zuweist, könnte dies angeben, dass die
diesem Interesse zugeordneten Schlüsselwörter eine Modifizierung erfordern.
Entweder würde
der Systemadministrator eine explizite Modifizierung der Schlüsselwörter vornehmen
oder könnte
der Anwender aufgefordert werden, einige Schlüsselwörter vorzuschlagen. Die Antwort
des Anwenders auf die modifizierten Schlüsselwörter könnte durch die Rückkopplung überwacht
werden, was ein Mittel schafft, die Qualität der Schlüsselwörter in Bezug auf ein Interesse
zu verbessern.
-
Datenspeicherung
-
Die
Informationsliefereinrichtung 200 kann für viele
Anwender Informationen liefern, wobei jedes Mal, wenn der Anwender
(automa tisch oder manuell) Informationen anfordert, für jeden
Anwender auf Pro-Anwender-Grundlage eine Kurzlistenseitenansicht
erzeugt wird. Dies erlegt verschiedenen Komponenten der Informationsliefereinrichtung 200 erhebliche
Lasten auf, die durch das Caching von Daten verringert werden können. Das
Ziel besteht darin, Seiten, die von den Anwendern zu betrachten
sind, lediglich einmal in dem Cache zu erzeugen (d. h. Daten von
ihrem Speicherplatz lediglich einmal anzufordern), so dass irgendeine
nachfolgende Anforderung für
die Seite aus dem Cache geliefert werden kann. Dies verkürzt die
Anforderungs-Antwort-Kette, verbessert die Reaktionszeit und verringert
die Netzlast. Es werden mehrere Caching-Anordnungen verwendet:
-
1. Es werden
die Einträge
in der Kurzliste für
jeden Anwender gecached.
-
Vorzugsweise
werden die Einträge
in der Kurzliste für
jeden Anwender U1 durch die zweiten Wiedergewinnungsmittel 213 nachverarbeitet,
um Duplikate zu entfernen, und wie oben beschrieben vor dem Speichern
in der Datenbank DB1 in Übereinstimmung
mit dem vom Anwender instanziierten Kontext eingeordnet. Typisch
gibt es eine beträchtliche
Anzahl von Einträgen
in der Kurzliste, wobei dem Anwender wegen Einschränkungen
der Anzeige des Endgeräts
aber zu irgendeinem Zeitpunkt nur eine Auswahl angezeigt werden kann.
Somit müssen
die Einträge
in der Kurzliste in einem (nicht gezeigten) Inhalts-Cache gecached
werden, der durch einen Speicher in der Datenbank DB1 bereitgestellt
werden kann, so dass die oben beschriebene Nachverarbeitung nicht
für jede
Auswahl von Einträgen,
die dem Anwender angezeigt wird, ausgeführt zu werden braucht.
-
2. Es werden die Seitenansichten,
die Einträge
in der Kurzliste umfassen, gecached.
-
Wie
oben beschrieben wurde, werden die Seitenansichten, die die Kurzlistendaten
umfassen, typisch unter Verwendung von WML/HTML erzeugt (obgleich
weitere Formate möglich
sind, siehe unten). Diese Seitenansichten werden unter Verwendung
des HTTP wiedergewonnen, das ein Anforderungs-Antwort-Protokoll ist – wobei
in seiner einfachsten Konfiguration eine Client-Anwendung, hier
die Wiedergewinnungsmittel 213, eine Anforderung an einen
Server, hier den Indexgenerator 205, sendet, woraufhin
der Indexgenerator 205 mit dem Wiedergewinnen von Daten
aus dem Inhalts-Cache auf die Anforderung antwortet und sie an die
zweiten Wiedergewinnungsmittel 213 sendet. In dieser (nicht
gezeigten) Konfiguration gibt es einen Cache als einen Zwischen-Cache,
so dass die Wiedergewinnungsmittel 213 ihre Anforderung
(z. B. eine Anforderung für
eine Seitenansicht, die die Kurzliste zeigt) anstatt an den Indexgenerator 205 an
den Cache stellen. Daraufhin stellt der Cache im Auftrag der Wiedergewinnungsmittel 213 die
Anforderung an den Indexgenerator 205. Der Indexgenerator 205 antwortet
auf den Cache, woraufhin der Cache dies an die Wiedergewinnungsmittel 213 weiterleitet
(die die Informationen an die Schnittstellenmittel 203 übergeben).
Jede Seitenansicht sollte die HTTP-1.1-Caching-Vorschriften befolgen
(siehe "Illustrated
guide to HTTP",
Paul Hethmon, Manning Publications Co., oder RFC 2616 Hypertext
Transfer Protocol – HTTP/1.1
R. Fielding, J. Gettys, J. Mogul, H. Frystyk, L. Masinter, P. Leach,
T. Berners-Lee, Juni 1999. (Format: TXT = 422317, PS = 5529857,
PDF = 550558 Bytes) (überholt
RFC2068) (aktualisiert durch RFC2817) (Status: NORMENTWURF)); insbesondere
muss in dem Antwortanfangsblock der Seitenansichten Folgendes enthalten
sein:
- (i) Ablaufanfangsblock mit HTTP-Datum;
- (ii) Cache-Steuerung: max-age = sec-Tag, gibt die Lebensdauer
des Inhalts an;
- (iii) Inhaltslängen-Reaktions-Anfangsblock
(der ebenfalls beständige
Verbindungen ermöglicht)
-
In
einer Anordnung wird der Netzadresse (URL, Eintrag 3 in der Indextabelle)
vorher die Sitzungs-ID des Anwenders vorangefügt, wobei Änderungen an der Sitzungs-ID
wie etwa Änderungen
an dem Anwenderprofil, Aktualisierungen an Informationsquellen usw.
verwendet werden, um den Betrieb des Caches zu steuern (wenn ein
Anwenderprofil modifiziert wird (d. h. ein Interesse hinzugefügt wird),
sind die gecacheden Seitenansichten veraltet (da der Inhalt, der
die Seitenansicht bevölkert,
veraltet ist); um zu verhindern, dass diese alten Seiten an den
Anwender U1 gesendet werden, ändert
sich die Sitzungs-ID). Somit wird ausgelöst, dass der Cache neue Daten
von dem Indexgenerator 205 anfordert (der die Daten aus
dem Inhalts-Cache
wiedergewinnt, falls der Typ-1-Cache verwendet wird), wenn sich
die Sitzungs-ID ändert.
-
3. Die Ergebnisse der
Abfragen werden für
alle Anwender gecached.
-
Wenn
es eine große
Anzahl von Anwendern gibt, ist es möglich, dass sich einige der
Interessen überschneiden – d. h.
der Anwender U1 hat einige Interessen, die gleich den Interessen
des Anwenders U2 sind (obgleich sich das Kontextattribut, mit dem
das Interesse gekennzeichnet ist, zwischen den Anwendern unterscheiden
kann), wobei es somit unrationell wäre, mehrmals die gleiche Abfrage
auszuführen.
-
Es
wird die Ausführung
einer Abfrage (in Bezug auf die Interessen I1 ... In – für den Anwender
U1 betrachtet (wobei angenommen wird, dass diese Abfrage zuvor nicht
ausgeführt
worden ist).
- – In Übereinstimmung mit 6 gewinnen
die zweiten Wiedergewinnungsmittel 213 (Schritt S 6.3)
die URL und die Namen der Informationsquellen wieder, die Informationsquellen
entsprechen, die für
den vom Anwender instanziierten Kontext relevant sind. Diese werden
in einem (nicht gezeigten) Abfrage-Cache gespeichert.
- – An
den Schlüsselwörtern, die
sich auf die Interessen I1 ... In beziehen, wird ein Hash ausgeführt, wobei sie
z. B. in einer Datei oder ähnlich
gesichert und mit den jeweiligen Kennungen in dem Abfrage-Cache
verknüpft
werden.
- – Wenn
eine neue Abfrage in Bezug auf die Interessen J1 .... Jn (z. B.
für den
Anwender U2) ankommt, werden die entsprechenden Schlüsselwörter mit
den Hash-Schlüsselwörtern verglichen,
um zu identifizieren, ob eine Anfrage in Bezug auf diese Interessen
bereits verarbeitet worden ist.
- – Wenn
das der Fall ist:
- – brauchen
die zweiten Wiedergewinnungsmittel 213 keine Anfrage in
Bezug auf die Interessen J1 ... Jn auszuführen, und
- – werden
die Interessen J1 ... Jn mit den identifizierten Einträgen in dem
Abfrage-Cache verknüpft.
-
Die
Abfragen könnten über die
Anwendergemeinschaft auf ihre Abfragezeit und den Grad der Gemeinsamkeit überwacht
werden, so dass Abfragen in Bezug auf Anfragen, von denen bestimmt
worden ist, dass sie häufig
und in einem besonderen Zeitintervall auftreten, in einer vorgegebenen
Zeit automatisch ausgeführt werden
könnten.
-
Das
Folgende ist ein ausgearbeitetes Beispiel, das die Funktionalität der Informationsliefereinrichtung 200 veranschaulicht:
Es
wird angenommen, dass der Anwender ein Anwenderprofil besitzt, das
die folgenden Interessenmengen enthält:
- mobiles Internet
(Arbeit)
- WAP (Arbeit, Spiel)
- Durlacher (Arbeit)
- motorisierter Transport (Arbeit, zu Hause)
- Fernsehprogramme (zu Hause, Spiel)
- Vogelbeobachtung (Spiel)
- Essen gehen (teure Nahrungsmittel) (Spiel)
- Football – Startreck
United (Spiel)
- Tattingstone, Schimmel (Spiel, zu Hause)
-
Um
08:00 empfängt
der Anwender U1 auf dem Weg zur Arbeit eine SMS-Warnung, die ihn über örtliche
Verkehrsverzögerungen
um Martlesham informiert. Der Anwender ignoriert den Bericht, geht
weiter zur Arbeit und bleibt im Verkehrsstau stecken. Gelangweilt
entscheidet sich der Anwender U1, auf seinem WAP-Telephon die Nachrichten
zu betrachten, die von der Informationsliefereinrichtung 200 verfügbar sind. Der
Anwender scrollt durch die Kurzliste, die von den zweiten Wiedergewinnungsmitteln 213 geliefert
wird, und markiert jene Interessen, die er später lesen möchte. Da die Kontextbestimmungsmittel 209 bestimmt
hatten, dass der Kontext des Anwenders die Arbeit ist, wurden dem
Anwender U1 standardmäßig arbeitsbezogene Interessen
gezeigt. Allerdings gibt es Verknüpfungen zu freizeitbezogenen
Interessen.
-
Für 09:00
hat der Anwender 1 eine Besprechung bei Durlacher geplant. Der Anwender
U1 hat für
Informationen, die sich auf das Interesse Durlacher beziehen, einen
hohen Präferenzwert
eingestellt, so dass die Kurzliste Informationen, die sich auf Durlacher
beziehen, oben auf der Liste enthält. Glücklicherweise erscheint in
der Kurz liste eine Beschreibung eines Nachrichtenartikels, der sich
auf Durlacher bezieht, wobei der Anwender U1 den Artikel vor seiner
Besprechung um 09:00 Uhr betrachten kann.
-
Später am Tag
beginnt der Anwender U1, während
er an seinem Schreibtisch sitzt und etwas gelangweilt ist, über seine
Abendaktivitäten
nachzudenken. Der Anwender U1 ändert
den Kontext in den Kontext Spiel/zu Hause, wobei ihm eine Kurzliste
von Einträgen
präsentiert
wird, die die Fernsehprogramme für
diesen Abend, Nachrichten über
sein Football-Team und eine Nachricht über die nächste Vogelbeobachtungszusammenkunft
enthält.
-
Am
Wochenende besucht der Anwender U1 Norwich. Aus den Bankdaten des
Anwenders hat die Profilerzeugungseinrichtung 201 ein Interesse
an Orten von NatWest-Geldautomaten aufgenommen, während die Profilerzeugungseinrichtung 201 aus
dem Interesse des Anwenders an motorisiertem Transport ein Interesse an
Orten von Tankstellen aufgenommen hat. An diese beiden besagten
Interessen werden sämtliche
Kontexte (so in dieser Ausführungsform
Arbeit, zu Hause, Spiel, abwesend) angehängt. Die Kontextbestimmungsmittel 209 bestimmen,
dass der Kontext des Anwenders abwesend und Spiel ist, wobei die
zweiten Wiedergewinnungsmittel 213 auf der Grundlage des
bestimmten Orts des Anwenders durch die Verfolgungsvorrichtung 405 Informationen
wiedergewinnen, die den Ort teurer Restaurants, NatWest-Geldautomaten
und Tankstellen um Norwich ausführlich
schildern.
-
Zusätzliche
Einzelheiten und Modifizierungen
-
Kontextänderungen
-
In
der obigen Beschreibung wird der Kontext des Anwenders U1 durch
die Kontextbestimmungsmittel 209 bestimmt, wobei die Informationen
dazu verwlendet werden, die Daten in der Kurzliste anzuordnen. Allerdings
ist es möglich,
dass der Anwender U1 Informationen betrachten möchte, die sich auf einen anderen
als den gegenwärtigen
Kontext beziehen. Beispielsweise ist es möglich, dass der Anwender U1
Nachrichten sehen möchte,
die sich auf sein Football-Team
Startreck United beziehen, falls er an der Arbeit ist. Das Interesse Football
wird wahrscheinlich von den Kontexten Spiel, zu Hause, oder Spiel,
abwesend, begleitet. Unter der Annahme, dass die Informationsliefereinrichtung 200 so
beschaffen ist, dass sie Informationen wiedergewinnt, die sich lediglich
auf den vom Anwender instanziierten Kontext beziehen, muss der Anwender
U1 den Kontext explizit ändern,
um diese Informationen zu betrachten. Somit enthält das in den Browsern (in
einem der Endgeräte
T1, T2, T4) angezeigte Formular Mittel zur Eingabe einer Anforderung
zur Änderung
des Kontexts – entweder
durch Eingabe einer Zeit, von der ein Kontext abgeleitet wird, oder
durch explizite Eingabe des neuen Kontexts. Wenn dieses Formular
wie oben beschrieben durch die Schnittstellenmittel 203 versendet
wird, werden die neuen Kontextinformationen an die ersten Wiedergewinnungsmittel 211 gesendet
und Eingaben von den Kontextbestimmungsmitteln 209 gesperrt.
-
Außerdem können verschiedene
Arten von Kontexten enthalten sein – z. B. Freunde/Familie, wobei alle
diese Kontexte (da sich Wochenendfreizeitaktivitäten wahrscheinlich von Wochentagsfreizeitaktivitäten unterscheiden)
nach Wochentag und Wochenende klassifiziert sein können.
-
Klassifizierung der Anwendertypen
-
Wenn
ein Anwender U1 das System erstmals abonniert, kann das dem Anwender
U1 in seinem Browser dargestellte Formular mehrere Pull-Down-Menüs und Listen
enthalten, die von dem Anwender wählbare Interessen umfassen.
Als Alternative oder zusätzlich
kann das Formular Beschreibungen der Anwendertypen enthalten, wobei
der Anwender U1 angeben kann, von welchem Anwendertyp er ist. Beispielsweise
kann es mehrere Schuh-Schaltflächen
geben:
- – Schaltfläche Pantoffeln
- – Schaltfläche Stöckelschuhe
- – Schaltfläche moderne
Turnschuhe
- – Schaltfläche Wanderschuhe
- – Schaltfläche Cowboy-Schuhe
usw....
-
Jede
dieser Schaltflächen
besitzt eine vorkonfigurierte Liste ihr angehängter Interessen, wobei dem Anwender
U1 bei der Auswahl einer der Schaltflächen alle jeweiligen Interessen
zugewiesen werden.
-
Als
zusätzliche
oder alternative Verwendung für
die Schaltflächen
wird der Anwender U1 aufgefordert auszuwählen, welche dieser Schaltflächen ihn
am besten repräsentiert.
Die Profilerzeugungseinrichtung 201 kann so eingerichtet
sein, dass sie Listen von Anwendern in Abhängigkeit vom Typ der Schaltfläche aufrechterhält und eine
Art Zusammenarbeitsfilterung und implizite Filterung der Interessendaten
zwischen ähnlichen Anwendertypen
ausführt.
-
Datenformat
-
Die
Informationen können
für eine
Vielzahl von Formaten/Vorrichtungen zusammengefasst und geliefert
und optimiert werden. Die Formate umfassen, sind aber nicht beschränkt auf,
HTML, WML, I-Mode (CHTML),
VxML, XML, Postscript, PDF. Die Vorrichtungen umfassen, sind aber
nicht beschränkt
auf, PCs, Mobiltelephone, PDAs, weitere Kommunikationsvorrichtungen,
Spielekonsolen, Settop-Boxen, Multimedia-Kioske, tragbare Computer,
FAX und Ausdruck.
-
Die
Informationen können
bei Bedarf oder mit Warnung an den Anwender U1 geliefert werden.
Die Warnung kann eine Anzahl von Mechanismen einschließlich, aber
nicht beschränkt
auf, E-Mail, Internet-Offensivdienste, SMS, WAP-Offensivdienste,
Sprache, verwenden.
-
Die
Indizierung der Daten durch den Indexgenerator 205 umfasst
sowohl lokale als auch ferne Quellen, die in den Formaten einschließlich, aber
nicht beschränkt
auf, XML, HTML, WML, CHTML, Klartext, RTF und Sprache gehalten werden.
-
Die
Netze, über
die die Daten übertragen
werden, umfassen ferner UMTS, paketvermittelte GPRS-Mobilnetze.
-
Beispiel
der impliziten Anpassung des Profils: Verkehrsinformationen Es wird
angenommen, dass der Anwender U 1 für die Kontexte Arbeit und zu
Hause explizit ein Interesse an Motorsport, Transport und Autos usw.
spezifiziert hat und dass die Profilerzeugungseinrichtung 201 eine
Vorschrift enthält,
die besagt: "Nimm ein
Interesse an Verkehrsmeldungen auf, wenn ein Anwender Interesse
an Kraftfahrzeugen hat".
In Übereinstimmung
mit der obigen Beschreibung wird das Anwenderprofil modifiziert,
so dass es das Interesse Verkehr enthält. Ferner wird angenommen,
dass die Informationslieferein richtung 200 so beschaffen
ist, dass sie dem Anwender U1 jeden Tag um 08:30 automatisch Daten
sendet. Die Kontextbestimmungsmittel 209 bestimmen, dass
der Anwender auf seinem Weg zur Arbeit ist (Eingaben von der Verfolgungsvorrichtung 405 geben
an, dass sich der Anwender bewegt und dass die Bewegung den Anwender
U1 näher
zur Arbeit und weiter weg von zu Hause bringt; Eingaben von dem
Terminkalender und der Uhr 401, 403 bestätigen, dass
der Anwender auf seinem Weg zur Arbeit ist). Die ersten Informationswiedergewinnungsmittel 211 gewinnen
aus dem Anwenderprofil Informationen wieder, die sich auf seinen
instanziierten Kontext beziehen, und übergeben diese Informationen
an die zweiten Wiedergewinnungsmittel 213, die eine Kurzliste
von Informationsquellen zusammenstellen, die für die Interessen des Anwenders
relevant sind, und die Kurzliste an die Wiedergewinnungsmaschine 701 und
an das Endgerät
T1 des Anwenders senden. Da das Verkehrsinteresse für den momentanen
Kontext des Anwenders relevant ist, ist die dem Verkehrsinteresse
zugeordnete Einordnung wahrscheinlich hoch, so dass das Interesse
verhältnismäßig weit
oben auf der Kurzliste erscheint. Allerdings wird angenommen, dass
sich der Anwender dafür
entscheidet, das Verkehrsinteresse zu ignorieren: Das Bayes-Netz 703 modifiziert
das dem Verkehr zugeordnete Präferenzgewicht
in der Weise, dass am nächsten
Tag (unter der Annahme, dass bestimmt wird, dass der Anwender in
dem gleichen Kontext ist) dieses modifizierte Präferenzgewicht angewendet wird
und das Interesse wahrscheinlich weiter unten auf der Liste erscheint
(wobei die tatsächliche
Position von dem Grad abhängt,
in dem das Gewicht modifiziert wird).
-
Der
Grad, in dem das Präferenzgewicht
modifiziert wird, kann von der Anzahl der Tage abhängen, an denen
ein Interesse ignoriert wird, so dass zur Berechnung des Gewichts
eine Art zeitabhängige
Funktion angewendet wird.
-
Aspekte
der Informationsliefereinrichtung 200, insbesondere die
in der Datenbank DB1 gespeicherten Profilinformationen, können hinter
einer Firewall betrieben werden, so dass externe Dritte keinen Zugriff
auf Profilinformationen erlangen können. Alternativ könnte das
gesamte System von einem Intranet oder von einer sicheren Netzumgebung
aus ausgeführt
werden, so dass die einzige Kommunikation mit externen Systemen der
Empfang von aktualisierten Informationsquellen für Indizierungszwecke und die
Kommunikation mit einem mobilen Anwender ist.
-
Für den Fachmann
auf dem Gebiet ist selbstverständlich,
dass die oben beschriebene Erfindung in einem oder in mehreren Computerprogrammen
verkörpert
sein kann. Diese Programme können
in verschiedenen Übertragungs-
und/oder Speichermedien wie etwa einer Diskette, einer CD-ROM oder
einem Magnetband enthalten sein, so dass die Programme in einen
oder in mehrere Universalcomputer geladen werden können oder
unter Verwendung eines geeigneten Übertragungsmediums über ein
Computernetz heruntergeladen werden können.
-
Wenn
der Kontext nicht deutlich etwas anderes erfordert, sollen die Wörter "umfassen", "umfassend" und dergleichen
in der gesamten Beschreibung und in den gesamten Ansprüchen im
Gegensatz zu einem ausschließlichen
oder erschöpfenden
Sinn in einem einschließenden
Sinn, d. h. in dem Sinn von "enthalten,
aber nicht beschränkt
auf", verstanden
werden. Die Wörter "X enthält Y" und dergleichen
sollen so verstanden werden, dass X wenigstens Y be sitzt, wobei
X aber höchstwahrscheinlich
weitere Elemente außer
Y besitzt.