|
|
Veranstalter
|
Prof. Robert
Tolksdorf, Netzbasierte
Informationssysteme
|
Art
|
Vorlesung und Übung, 2+2 SWS, Hauptstudium
|
Inhalt
|
Netzbasierte Informationssysteme stellen mit der
Verbreitung des Web im weltweiten Maßstab Informationen bereit.
Die Vorlesung soll Kenntnisse um die wichtigsten Technologien, Probleme
und Lösungsansätze solcher Systeme vermitteln. Im
Übungsteil wird das Verständnis vertieft.
|
Themen
|
Die Veranstaltung gliedert sich grob in drei
Teile (in Klammern behandelte Technologien):
- Informationsquellen: Wie sind sie
repräsentiert (HTML/XML), wie findet man sie (Crawling, Deep Web),
wie kann man auf sie zugreifen (Internet Protokolle)
- Informationsintegration: Repräsentation von
aufbereiteten Informationen (DOM, Indexing), Anfragen (Indexing,
Ranking), semantische Informationen
(Metadaten), Wissensverarbeitung (Semantic Web). Systemarchitekturen
von Suchmaschinen, Metasuchmaschinen.
- Informationsauslieferung: Darstellungserzeugung,
Internationalisierung
Der Fahrplan der
Vorlesung wird noch erweitert und angepasst. Entsprechende Unterlagen
werden im Netz bereitgestellt.
|
Leistungsnachweise
|
Aktive Teilnahme an der Übung
Abschlussprüfung schriftlich oder mündlich, je nach
Teilnehmeranzahl angepasst
Der Leistungsnachweis wird mit der Note der Klausur oder
Rücksprache bewertet.
|
Zeit und Ort
|
Vorlesung: Mittwochs,14:15-15:45, SR 005
Übung: Donnerstags, 12:15-13:45, SR 006
Bei der Übung herrscht
Anwesenheitspflicht
|
Beginn
|
V: 20.10.2004., Ü: 21.10.2004
Eintrag in Mailingliste über http://lists.spline.inf.fu-berlin.de/mailman/listinfo/nbi_v_nbi
ist notwendig.
|
Themen der Vorlesung
|
Termin
|
|
Thema
|
20.10.
|
|
Einleitung und
Organisatorisches
|
27.10.
|
Das Web
|
Basis
Web (HTML,HTTP)
|
3.11.
|
|
Crawling,
Struktur des Web, Deep Web |
10.11.
|
Web Suche
|
Information Retrieval
für das Web, Indexing
|
17.11.
|
|
Multimedia
Indexing, Collaborative
Filtering |
24.11.
|
|
Nutzung der Web-Struktur
bei der Suche,
Metasuchmaschinen |
1.12.
|
Betrieb, Ausführung
und Darstellung
|
Nutzung
und Nutzer von Web-Sites, Betriebsaspekte
sehr grosser Dienste |
9.12.
|
|
Überblick
Server- und Clientenseitige Ausführung, Caching
in Web |
15.12.
|
|
5.1.
|
|
Clientenseitige
Darstellung, Mehrsprachigkeit
im Web |
12.1.
|
Termin entfallen
|
19.1.
|
|
26.1.
|
Semantic Web |
Semantic
Web Technologien
|
2.2.
|
|
Semantic
Web Anwendungen
|
9.2.
|
|
Rückschau
|
16.2.
|
|
Klausur
14:00-15:45, SR 005 |
|
Themen der Übungen
|
Termin
|
Thema
|
Vorgestellt
von
|
Foliensätze
|
21.10.
|
Themenvergabe
|
RT
|
Themenvergabe |
28.10.
|
- Modularization
of XHTML™
- 10 April 2001, Frank Boumphrey, Murray Altheim, Sam
Dooley, Shane McCarron, Sebastian Schnitzenbaumer, Ted Wugofski - (Errata)
|
Kranz
Nimz
|
Vortrag/1 (ppt, pdf)
Vortrag/2
Wissensfragen
|
4.11.
|
- Namespaces in XML 1.1
- 4 February 2004, Richard Tobin, Dave Hollander,
Andrew Layman, Tim Bray - (Errata)
|
Koske
Grote
|
Vortrag
Wissensfragen
|
11.11.
|
- Scalable Vector Graphics (SVG) 1.1 Specification
- First published 4 September 2001, revised 14 January
2003, 藤沢 淳, Jon Ferraiolo, Dean Jackson - (Errata)
|
Ganjineh
v. Prollius
|
Vortrag
Wissensfragen
|
18.11.
|
- Synchronized Multimedia Integration Language (SMIL 2.0)
Specification
- 7 August 2001, Debbie Newman, Aaron Cohen, Thierry
Michel, Ken Day,
Erik Hodge, Lloyd Rutledge, Philipp Hoschka, Warner ten Kate, Eric
Hyche, Muriel Jourdan, Bridie Saccocio, Kenichi Kubota, Patrick
Schmitz, Rob Lanphier, Nabil Layaïda, Jacco van Ossenbruggen, Jeff
Ayars, Dick Bulterman - (Errata)
|
Sisow
Hilliges
|
Wissensfragen |
25.11.
|
- XML Linking Language (XLink) Version 1.0
- 27 June 2001, Eve Maler, Steven DeRose, David Orchard
- (Errata)
|
Schymura
Breuer
|
Vortrag
(.sxi-Format)
Wissensfragen |
2.12.
|
- User Agent Accessibility Guidelines 1.0
- 17 December 2002, Jon Gunderson, Ian Jacobs, Eric
Hansen - (Errata)
|
Eric Talbot
Elias
|
Vortrag/1,
Vortrag/2
Wissensfragen |
16.12.
|
- XML Events
- 14 October 2003,
Steven Pemberton, T. V. Raman, Shane McCarron - (Errata)
|
Lim-Becker
O. Chagnaadorj |
Vortrag
Wissensfragen |
6.1.
|
- Document Object Model
(DOM) Level 2 HTML
Specification
- 9 January 2003, Philippe Le Hégaret, Johnny
Stenback, Arnaud Le Hors - (Errata
|
Opitz
Richter
|
Vortrag
Wissensfragen |
13.1.
|
- Voice Extensible Markup Language
(VoiceXML) Version 2.0
- 16 March 2004, Brad Porter, Andrew Hunt, Ken Rehor,
Bruce Lucas,
Steph Tryphonas, Scott McGlashan, Daniel C. Burnett, Jerry Carter,
Peter Danielsen, Jim Ferrans - (Errata)
- Termin und Vortrag
entfallen
|
|
|
20.1. |
- XForms 1.0
- 14 October 2003, T. V. Raman, Leigh L.
Klotz, Micah Dubinko, Roland Merrick - (Errata)
|
Keck |
Vortrag
|
20.1.
|
- RDF Primer
- 10 February 2004, Eric Miller, Frank Manola - (Errata)
|
Escher
Starosta
|
Vortrag
|
27.1.
|
- Composite
Capability/Preference Profiles (CC/PP): Structure and Vocabularies 1.0
- 15 January 2004, Chris Woodrow, Luu Tran, Johan
Hjelm, Hidetaka Ohto,
Graham Klyne, Mark H. Butler, Franklin Reynolds - (Errata)
|
Visapää
Schwarzhaupt
|
Vortrag
Wissensfragen |
3.2.
|
- OWL Web Ontology Language
Overview
- 10 February 2004, Frank van Harmelen, Deborah L.
McGuinness - (Errata)
- OWL Web Ontology Language Guide
- 10 February 2004, Deborah L. McGuinness, Chris Welty,
Michael K. Smith - (Errata
|
Sokolowskaya
Igor Kirianow
Baydon
|
Vortrag
|
10.2. |
Klausurvorbereitung |
|
Folien |
Abgabe
|
Themen
|
Bearbeitet von
|
25.11.
|
Namespaces, SVG, SMIL
|
Patrik Marschalik
|
23.12.
|
XLink, Accessibility, XEvents
|
Thomas Sliwa
|
27.1.
|
XEvents,
DOM, RDFPrimer
|
Wojtek Polcwiartek
|
10.2.
|
RDFPrimer, CC/PP, OWL
Overview
|
David Best
|
10.2. |
RDFPrimer, CC/PP, OWL
Overview |
Elisa Barrotta
|
|
Wissensfragen
zur
Vorlesung |
Gegenstand der Klausur ist der
Inhalt der Vorlesung. Dazu sollten Sie
einerseits diese Inhalte kennen und wiedergeben können,
andererseits sollten Sie in der Lage sein, das erworbene Wissen
anzuwenden.
Im Folgenden finden Sie eine Sammlung von Wissensfragen, die sich aus
der Vorlesung ergeben und die beherrscht werden sollen.
Basiswissen
World Wide Web |
- Nennen Sie die Grundkonzepte von
Auszeichnungssprachen in
der SGML/HTML/XML Welt
- Was sind Anker?
- Warum XML und nicht HTML6??
- Was ist eine DTD?
- Wie definiert man eine XML-Sprache?
- Was sind wohlgeformte und valide Dokumente?
- Stellen Sie Zusammenhänge und Unterschiede
zwischen HTML und XML dar
- Was ist das World Wide Web Konsortium?
- Wie ist der Weg zu einem Web-Standard?
- Wie werden Rechner im Internet
identifiziert?
- Was sind Ports, was ist ein
Socket?
- Was ist der Unterschied zwischen
TCP und UDP?
- Wie sind URLs aufgebaut?
- Wie nimmt ein Server
Verbindungen an?
- Wie kontaktiert ein Klient einen
Server?
- Was ist die IETF?
- Wie
heißen Internet-Standards?
- Wodurch sind Internet Dienste
definiert?
- Wie läuft die Abfrage eines
Objekts mit http ab?
- Wie sind
Anforderungsmitteilungen in http aufgebaut?
- Wie sind Antwortmitteilungen in
http aufgebaut?
- Wie funktioniert das bei FTP?
- Nennen Sie zwei Hauptunterschiede in der
Funktionsweise von FTP und http.
|
Crawling und Struktur
des Web
|
- Was macht ein Crawler?
- Wie ist der Grundlegende Crawler-Algorithmus?
- Wie ist ein Crawler aufgebaut?
- Welche möglichen Crawling-Strategien gibt es?
- Was macht man um effizient zu Crawlen?
- Wie kann ein Server das Crawler-Verhalten
beeinflussen?
- Kann eine Suchmaschine auch ohne Crawler arbeiten?
- Welche Aussagen kann man über die Struktur des
Web machen?
- Was ist das „Deep Web“?
|
Information Retrieval
|
- Was macht Information Retrieval
- Wie misst man die Güte eines IR Verfahrens?
- Triviales Verfahren für perfektes Recall?
- Triviales Verfahren für perfektes Precision?
- Was ist das Vektorraummodell?
- Wie kann man Terme in Vektoren gewichten?
- Welche wichtigen Ähnlichkeitsmasse im
Vektorraummodell gibt es?
- Wie bereitet man Dokumente vor?
- Wie sieht der Porter-Stemming Algorithmus aus?
- Ist Porter-Stemming universell für alle
Dokumente im Netz?
- Wie funktioniert das
Collaborative Indexing im Harvest System?
- Wie geht man beim Indexing von multimedialen
Informationen vor? Illustrieren Sie anhand des Indexings von
Audio-Daten.
- Was ist Collaborative Filtering?
- Auf welcher Grundannahme beruht es?
- Kann man alles, was in einem
Collaborative Filtering System enthalten ist auch in einem
herkömmlichen Index halten? Warum?
|
Web
Struktur
bei der Suche,
Metasuchmaschinen
|
- Was ist die Grundidee von Verfahren, die die Struktur
des Web verwenden?
- Wie funktioniert PageRank?
- Was braucht man um PageRank anzuwenden?
- Wie funktioniert HITS?
- Was braucht man im Gegensatz zu Pagerank für
HITS nicht?
- Was sind Metasuchmaschinen?
- Warum haben Metasuchmaschinen
überhaupt einen Vorteil?
- Was sind die Schritte und
Probleme bei Metasuchmaschinen?
|
Nutzung
und
grosse Dienste |
- Was ist Web Usage Mining
- Was steht in Web-Logfiles drin?
- Was ist das Problem der
Logfile-Daten?
- Welche Masse für
Nutzungsdaten gibt es?
- Was ist eine Session?
- Wie sieht ein Messmechanismus
durch Dritte aus?
- Was sind typische Fragen, die
durch Web-Usage Mining beantwortet werden sollen?
- Wie sind grosse Internet-Server
in der Regel aufgebaut?
- Warum nimmt man nicht einen sehr
großen Rechner?
- Wie funktioniert Round-Robin
Loadbalancing?
- Was sind Level-4 und Level-7
Loadbalancer?
- Was ist Partitionierung und was
Replikation?
- Wie kann man ein solches System
optimieren?
- Was ist das Hauptziel solcher
Optimierungen?
|
Client-
und
Serverseitige Ausführung, Caching |
- Welche Technologien für
dynamische Inhalte gibt es serverseitig?
- Wie funktioniert CGI?
- Was kann man mit SSI machen?
- Welche Technologien für
dynamische Inhalte gibt es Klientenseitig?
- Wie funktioniert ein Applet?
- Wie funktioniert Caching im Web,
was sind Proxy-Caches?
- Was machen forward Proxies,
welche gibt es?
- Was machen Reverse Proxies,
welche gibt es?
- Was
ist Prefetching?
- Welche Verfahren der Cache
Konsistenz sind im Web technisch realisiert und welche nicht, warum?
|
Clientenseitige
Darstellung, Internationalisierung/
Lokalisierung
|
- Warum sollte man Inhalt und
Darstellung trennen?
- Welche Technologien dazu gibt es?
- Was ist CSS, wie ist es
aufgebaut?
- Warum braucht man Medienarten in
CSS?
- Was ist XSLT und was
unterscheidet es von CSS?
- Nennen Sie Beispiele für
sprachabhängige Darstellung von Inhalten
- Was ist ein Zeichenrepertoire?
- Was ist Unicode?
- Was bezeichnet ein
Zeichenkürzel in HTML/XML/CSS?
- Welche http Mechanismen
unterstützen mehrsprachige Sites?
|
Semantic Web
|
- Was sind Metadaten?
- Was ist der Dublin Core Standard? Wie sieht er aus?
- Was ist RDF? Wie sehen Aussagen damit aus?
- Was führt RDFS zusätzlich zu RDF ein?
- Was sind Ontologien (aus Informatiksicht)?
- Was ermöglichen Ontologien?
- Was ist OWL?
- Was soll der Unterschied eines Semantic Web zum
heutigen Web sein?
|
|