Seminar Wissensbasierte Systeme

Benno Stein

Wintersemester 2003/04

 

 

Worum es geht


In diesem Seminar werden ausgewählte Problemstellungen und Algorithmen aus dem Bereich des Information-Retrieval (IR) behandelt. Wir verstehen unter IR hier die Informationsgewinnung aus textuellen Datenbanken.

Die Aufgaben, die dabei zu meistern sind, umfassen die Indexierung (Abbildung des Inhaltes eines Dokumentes auf eine Menge von relevanten Begriffen, sogenannte Deskriptoren), automatisches Gruppieren und Klassifizieren von Texten, automatische Bestimmung von Deskriptoren, Genrierung von neuen Texten (z.B. Zusammenfassungen, Übersichten), Ähnlichkeitssuche (allgemein: Retrieval), Formulierung von Suchanfragen, effizientes Speichern, Analyse von Retrieval-Verfahren bzgl. ihrer Qualität und ihrer Effizienz, etc.

 

 

Anmeldung


Anmeldung (auch Erweiterungen oder Wünsche bzgl. der Themenliste) per Email an mich (stein@upb.de)

 

 

Was hier zu finden ist


Aktuelles Allgemeines und Termine zum Seminar
Ziele Ziele des Seminars
Themen Themen und Literaturquellen zum Seminar
Seminararbeiten Ausarbeitungen des Seminars
Seminarvorträge Präsentation des Seminars

 

 

Aktuelles und Termine zum Seminar

Themengebiet: Information-Retrieval

Voraussetzungen: Grundstudium

Zeit: nach Vereinbarung (zweite Semesterhälfte + Kompaktteil am Semesterende)

1. Treffen: 1. Dezemberwoche, Terminabsprache per Email

Ort: Campus E4.117

 

 

Ziele des Seminars

Erwerb von Wissen und Fähigkeiten im Bereich der modernen Datenanalyse.


Darüberhinaus sollen die Seminarteilnehmer lernen:

Literatur zu suchen und zu bewerten,

ein komplexes Thema verständlich darzustellen (Seminarausarbeitung),

ein komplexes Thema verständlich zu präsentieren (Seminarvortrag)


Zu jedem Vortrag (ca. 35 Minuten) ist auch eine Diskussion im Rahmen der Seminarteilnehmer vorgesehen: Es wird eine aktive Teilnahme an den Diskussionen der Vorträge anderer Seminarteilnehmer erwartet.

 

 

Themen und Literaturquellen zu dem Seminar

Algorithmen im Information-Retrieval zum Indexing:

Verfahren zum approximativen String-Matching

Part-of-Speech Tagger

Grundlagen und Algorithmen zur Datenstruktur der Suffix-Trees

Latent Semantic Indexing (LSI)



Klassifikation im Information-Retrieval:

Methoden zur Topic-Identification

Kategorisierende Suche mittels Suffix-Tree-Clustering

Verfahren zur Plagiat-Identifikation

Genre-Klassifikation mittels Diskriminanzanalyse

Pagerank-Verfahren für Standard- und für Meta-Suchmaschinen

Analyse kategorisierender Suchmaschinen: Prinzipien und Qualitätsvergleich



Ontologien:

Ontologien und das Semantic Web

Ontologien in der Informatik: Konstruktion und Verwaltung sprachbezogener Ontologien



Clusterverfahren:

Dichtebasierte Clusterverfahren

Hybride Clusterverfahren (u.a. Buckshot)

Neueste Trends bei Clusterverfahren

Clustervalidierung

Clustern in hochdimensionalen Räumen und "Curse of Dimensionality"

Verfahren der Multivariaten Statistik (Hauptkomponentenanlayse, Multidimensionale Skalierung)


(die Liste kann erweitert werden)

 

 

Seminararbeiten der Teilnehmer

folgen später...

 

 

Seminarvorträge der Teilnehmer

folgen später...

 

 


October 29th, 2003.