|
Seminar Wissensbasierte Systeme
Benno Stein
Wintersemester 2003/04
Worum es geht
In diesem Seminar werden ausgewählte Problemstellungen und Algorithmen aus dem Bereich des Information-Retrieval (IR) behandelt. Wir verstehen unter IR hier die Informationsgewinnung aus textuellen Datenbanken.
Die Aufgaben, die dabei zu meistern sind, umfassen die Indexierung (Abbildung des Inhaltes eines Dokumentes auf eine Menge von relevanten Begriffen, sogenannte Deskriptoren), automatisches Gruppieren und Klassifizieren von Texten, automatische Bestimmung von Deskriptoren, Genrierung von neuen Texten (z.B. Zusammenfassungen, Übersichten), Ähnlichkeitssuche (allgemein: Retrieval), Formulierung von Suchanfragen, effizientes Speichern, Analyse von Retrieval-Verfahren bzgl. ihrer Qualität und ihrer Effizienz, etc.
Anmeldung
Anmeldung (auch Erweiterungen oder Wünsche bzgl. der Themenliste) per Email an mich (stein@upb.de)
Was hier zu finden ist
Aktuelles und Termine zum Seminar |
 |
Themengebiet: Information-Retrieval
Voraussetzungen: Grundstudium
Zeit: nach Vereinbarung (zweite Semesterhälfte + Kompaktteil am Semesterende)
1. Treffen: 1. Dezemberwoche, Terminabsprache per Email
Ort: Campus E4.117
Ziele des Seminars |
 |
Erwerb von Wissen und Fähigkeiten im Bereich der modernen Datenanalyse.
Darüberhinaus sollen die Seminarteilnehmer lernen:
Literatur zu suchen und zu bewerten,
ein komplexes Thema verständlich darzustellen (Seminarausarbeitung),
ein komplexes Thema verständlich zu präsentieren (Seminarvortrag)
Zu jedem Vortrag (ca. 35 Minuten) ist auch eine Diskussion im Rahmen der Seminarteilnehmer vorgesehen: Es wird eine aktive Teilnahme an den Diskussionen der Vorträge anderer Seminarteilnehmer erwartet.
Themen und Literaturquellen zu dem Seminar |
 |
Algorithmen im Information-Retrieval zum Indexing:
Verfahren zum approximativen String-Matching
Part-of-Speech Tagger
Grundlagen und Algorithmen zur Datenstruktur der Suffix-Trees
Latent Semantic Indexing (LSI)
Klassifikation im Information-Retrieval:
Methoden zur Topic-Identification
Kategorisierende Suche mittels Suffix-Tree-Clustering
Verfahren zur Plagiat-Identifikation
Genre-Klassifikation mittels Diskriminanzanalyse
Pagerank-Verfahren für Standard- und für Meta-Suchmaschinen
Analyse kategorisierender Suchmaschinen: Prinzipien und Qualitätsvergleich
Ontologien:
Ontologien und das Semantic Web
Ontologien in der Informatik: Konstruktion und Verwaltung sprachbezogener Ontologien
Clusterverfahren:
Dichtebasierte Clusterverfahren
Hybride Clusterverfahren (u.a. Buckshot)
Neueste Trends bei Clusterverfahren
Clustervalidierung
Clustern in hochdimensionalen Räumen und "Curse of Dimensionality"
Verfahren der Multivariaten Statistik (Hauptkomponentenanlayse, Multidimensionale Skalierung)
(die Liste kann erweitert werden)
Seminararbeiten der Teilnehmer |
 |
folgen später...
Seminarvorträge der Teilnehmer |
 |
folgen später...
|