Vorlesung Netzbasierte Informationssysteme (WS 2004/05)

Nehmen Sie an der Evaluation dieser Veranstaltung teil:
Token:


Veranstalter
Prof. Robert Tolksdorf, Netzbasierte Informationssysteme
Art
Vorlesung und Übung, 2+2 SWS, Hauptstudium
Inhalt
Netzbasierte Informationssysteme stellen mit der Verbreitung des Web im weltweiten Maßstab Informationen bereit. Die Vorlesung soll Kenntnisse um die wichtigsten Technologien, Probleme und Lösungsansätze solcher Systeme vermitteln. Im Übungsteil wird das Verständnis vertieft.
Themen
Die Veranstaltung gliedert sich grob in drei Teile (in Klammern behandelte Technologien):
  • Informationsquellen: Wie sind sie repräsentiert (HTML/XML), wie findet man sie (Crawling, Deep Web), wie kann man auf sie zugreifen (Internet Protokolle)
  • Informationsintegration: Repräsentation von aufbereiteten Informationen (DOM, Indexing), Anfragen (Indexing, Ranking), semantische Informationen (Metadaten), Wissensverarbeitung (Semantic Web). Systemarchitekturen von Suchmaschinen, Metasuchmaschinen.
  • Informationsauslieferung: Darstellungserzeugung, Internationalisierung
Der Fahrplan der Vorlesung wird noch erweitert und angepasst. Entsprechende Unterlagen werden im Netz bereitgestellt.
Leistungsnachweise
Aktive Teilnahme an der Übung
Abschlussprüfung schriftlich oder mündlich, je nach Teilnehmeranzahl angepasst
Der Leistungsnachweis wird mit der Note der Klausur oder Rücksprache bewertet.
Zeit und Ort
Vorlesung: Mittwochs,14:15-15:45, SR 005
Übung: Donnerstags, 12:15-13:45, SR 006
Bei der Übung herrscht Anwesenheitspflicht
Beginn
V: 20.10.2004., Ü: 21.10.2004
Eintrag in Mailingliste über http://lists.spline.inf.fu-berlin.de/mailman/listinfo/nbi_v_nbi ist notwendig.

Themen der Vorlesung
Termin

Thema
20.10.

Einleitung und Organisatorisches
27.10.
Das Web
Basis Web (HTML,HTTP)
3.11.

Crawling, Struktur des Web, Deep Web
10.11.
Web Suche
Information Retrieval für das Web, Indexing
17.11.

Multimedia Indexing,  Collaborative Filtering 
24.11.

Nutzung der Web-Struktur bei der Suche, Metasuchmaschinen
1.12.
Betrieb, Ausführung und Darstellung
Nutzung und Nutzer von Web-Sites, Betriebsaspekte sehr grosser Dienste
9.12.

Überblick Server- und Clientenseitige Ausführung, Caching in Web
15.12.

5.1.

Clientenseitige Darstellung, Mehrsprachigkeit im Web
12.1.
Termin entfallen
19.1.

26.1.
Semantic Web Semantic Web Technologien
2.2.

Semantic Web Anwendungen
9.2.

Rückschau
16.2.

Klausur 14:00-15:45, SR 005

Themen der Übungen
Termin
Thema
Vorgestellt von
Foliensätze
21.10.
Themenvergabe
RT
Themenvergabe
28.10.
Modularization of XHTML™
10 April 2001, Frank Boumphrey, Murray Altheim, Sam Dooley, Shane McCarron, Sebastian Schnitzenbaumer, Ted Wugofski - (Errata)
Kranz
Nimz
Vortrag/1 (ppt, pdf)
Vortrag/2
Wissensfragen
4.11.
Namespaces in XML 1.1
4 February 2004, Richard Tobin, Dave Hollander, Andrew Layman, Tim Bray - (Errata)
Koske
Grote
Vortrag
Wissensfragen
11.11.
Scalable Vector Graphics (SVG) 1.1 Specification
First published 4 September 2001, revised 14 January 2003, 藤沢 淳, Jon Ferraiolo, Dean Jackson - (Errata)
Ganjineh
v. Prollius
Vortrag
Wissensfragen
18.11.
Synchronized Multimedia Integration Language (SMIL 2.0) Specification
7 August 2001, Debbie Newman, Aaron Cohen, Thierry Michel, Ken Day, Erik Hodge, Lloyd Rutledge, Philipp Hoschka, Warner ten Kate, Eric Hyche, Muriel Jourdan, Bridie Saccocio, Kenichi Kubota, Patrick Schmitz, Rob Lanphier, Nabil Layaïda, Jacco van Ossenbruggen, Jeff Ayars, Dick Bulterman - (Errata)
Sisow
Hilliges
Wissensfragen
25.11.
XML Linking Language (XLink) Version 1.0
27 June 2001, Eve Maler, Steven DeRose, David Orchard - (Errata)
Schymura
Breuer
Vortrag (.sxi-Format)
Wissensfragen
2.12.
User Agent Accessibility Guidelines 1.0
17 December 2002, Jon Gunderson, Ian Jacobs, Eric Hansen - (Errata)
Eric Talbot
Elias
Vortrag/1, Vortrag/2
Wissensfragen
16.12.
XML Events
14 October 2003, Steven Pemberton, T. V. Raman, Shane McCarron - (Errata)
Lim-Becker
O. Chagnaadorj
Vortrag
Wissensfragen
6.1.
Document Object Model (DOM) Level 2 HTML Specification
9 January 2003, Philippe Le Hégaret, Johnny Stenback, Arnaud Le Hors - (Errata
Opitz
Richter
Vortrag
Wissensfragen
13.1.
Voice Extensible Markup Language (VoiceXML) Version 2.0
16 March 2004, Brad Porter, Andrew Hunt, Ken Rehor, Bruce Lucas, Steph Tryphonas, Scott McGlashan, Daniel C. Burnett, Jerry Carter, Peter Danielsen, Jim Ferrans - (Errata)
Termin und Vortrag entfallen


20.1.
XForms 1.0
14 October 2003, T. V. Raman, Leigh L. Klotz, Micah Dubinko, Roland Merrick - (Errata)
Keck Vortrag
20.1.
RDF Primer
10 February 2004, Eric Miller, Frank Manola - (Errata)
Escher
Starosta
Vortrag
27.1.
Composite Capability/Preference Profiles (CC/PP): Structure and Vocabularies 1.0
15 January 2004, Chris Woodrow, Luu Tran, Johan Hjelm, Hidetaka Ohto, Graham Klyne, Mark H. Butler, Franklin Reynolds - (Errata)
Visapää
Schwarzhaupt
Vortrag
Wissensfragen
3.2.
OWL Web Ontology Language Overview
10 February 2004, Frank van Harmelen, Deborah L. McGuinness - (Errata)
OWL Web Ontology Language Guide
10 February 2004, Deborah L. McGuinness, Chris Welty, Michael K. Smith - (Errata

Sokolowskaya
Igor Kirianow
Baydon



Vortrag
10.2. Klausurvorbereitung
Folien

Abgabe
Themen
Bearbeitet von
25.11.
Namespaces, SVG, SMIL
Patrik Marschalik
23.12.
XLink, Accessibility, XEvents
Thomas Sliwa
27.1.
XEvents, DOM, RDFPrimer
Wojtek Polcwiartek
10.2.
RDFPrimer, CC/PP, OWL Overview David Best
10.2. RDFPrimer, CC/PP, OWL Overview Elisa Barrotta

Wissensfragen zur Vorlesung Gegenstand der Klausur ist der Inhalt der Vorlesung. Dazu sollten Sie einerseits diese Inhalte kennen und wiedergeben können, andererseits sollten Sie in der Lage sein, das erworbene Wissen anzuwenden.
Im Folgenden finden Sie eine Sammlung von Wissensfragen, die sich aus der Vorlesung ergeben und die beherrscht werden sollen.

Basiswissen
World Wide Web
  • Nennen Sie die Grundkonzepte von Auszeichnungssprachen in der SGML/HTML/XML Welt
  • Was sind Anker?
  • Warum XML und nicht HTML6??
  • Was ist eine DTD?
  • Wie definiert man eine XML-Sprache?
  • Was sind wohlgeformte und valide Dokumente?
  • Stellen Sie Zusammenhänge und Unterschiede zwischen HTML und XML dar
  • Was ist das World Wide Web Konsortium?
  • Wie ist der Weg zu einem Web-Standard?
  • Wie werden Rechner im Internet identifiziert?
  • Was sind Ports, was ist ein Socket?
  • Was ist der Unterschied zwischen TCP und UDP?
  • Wie sind URLs aufgebaut?
  • Wie nimmt ein Server Verbindungen an?
  • Wie kontaktiert ein Klient einen Server?
  • Was ist die IETF?
  • Wie heißen Internet-Standards?
  • Wodurch sind Internet Dienste definiert?
  • Wie läuft die Abfrage eines Objekts mit http ab?
  • Wie sind Anforderungsmitteilungen in http aufgebaut?
  • Wie sind Antwortmitteilungen in http aufgebaut?
  • Wie funktioniert das bei FTP?
  • Nennen Sie zwei Hauptunterschiede in der Funktionsweise von FTP und http.
Crawling und Struktur
des Web

  • Was macht ein Crawler?
  • Wie ist der Grundlegende Crawler-Algorithmus?
  • Wie ist ein Crawler aufgebaut?
  • Welche möglichen Crawling-Strategien gibt es?
  • Was macht man um effizient zu Crawlen?
  • Wie kann ein Server das Crawler-Verhalten beeinflussen?
  • Kann eine Suchmaschine auch ohne Crawler arbeiten?
  • Welche Aussagen kann man über die Struktur des Web machen?
  • Was ist das „Deep Web“?
Information Retrieval
  • Was macht Information Retrieval
  • Wie misst man die Güte eines IR Verfahrens?
  • Triviales Verfahren für perfektes Recall?
  • Triviales Verfahren für perfektes Precision?
  • Was ist das Vektorraummodell?
  • Wie kann man Terme in Vektoren gewichten?
  • Welche wichtigen Ähnlichkeitsmasse im Vektorraummodell gibt es?
  • Wie bereitet man Dokumente vor?
  • Wie sieht der Porter-Stemming Algorithmus aus?
  • Ist Porter-Stemming universell für alle Dokumente im Netz?
  • Wie funktioniert das Collaborative Indexing im Harvest System?
  • Wie geht man beim Indexing von multimedialen Informationen vor? Illustrieren Sie anhand des Indexings von Audio-Daten.
  • Was ist Collaborative Filtering?
  • Auf welcher Grundannahme beruht es?
  • Kann man alles, was in einem Collaborative Filtering System enthalten ist auch in einem herkömmlichen Index halten? Warum?
Web Struktur
bei der Suche,
Metasuchmaschinen
  • Was ist die Grundidee von Verfahren, die die Struktur des Web verwenden?
  • Wie funktioniert PageRank?
  • Was braucht man um PageRank anzuwenden?
  • Wie funktioniert HITS?
  • Was braucht man im Gegensatz zu Pagerank für HITS nicht?
  • Was sind Metasuchmaschinen?
  • Warum haben Metasuchmaschinen überhaupt einen Vorteil?
  • Was sind die Schritte und Probleme bei Metasuchmaschinen?
Nutzung und grosse Dienste
  • Was ist Web Usage Mining
  • Was steht in Web-Logfiles drin?
  • Was ist das Problem der Logfile-Daten?
  • Welche Masse für Nutzungsdaten gibt es?
  • Was ist eine Session?
  • Wie sieht ein Messmechanismus durch Dritte aus?
  • Was sind typische Fragen, die durch Web-Usage Mining beantwortet werden sollen?
  • Wie sind grosse Internet-Server in der Regel aufgebaut?
  • Warum nimmt man nicht einen sehr großen Rechner?
  • Wie funktioniert Round-Robin Loadbalancing?
  • Was sind Level-4 und Level-7 Loadbalancer?
  • Was ist Partitionierung und was Replikation?
  • Wie kann man ein solches System optimieren?
  • Was ist das Hauptziel solcher Optimierungen?
Client- und Serverseitige Ausführung, Caching
  • Welche Technologien für dynamische Inhalte gibt es serverseitig?
  • Wie funktioniert CGI?
  • Was kann man mit SSI machen?
  • Welche Technologien für dynamische Inhalte gibt es Klientenseitig?
  • Wie funktioniert ein Applet?
  • Wie funktioniert Caching im Web, was sind Proxy-Caches?
  • Was machen forward Proxies, welche gibt es?
  • Was machen Reverse Proxies, welche gibt es?
  • Was ist Prefetching?
  • Welche Verfahren der Cache Konsistenz sind im Web technisch realisiert und welche nicht, warum?
Clientenseitige Darstellung, Internationalisierung/
Lokalisierung
  • Warum sollte man Inhalt und Darstellung trennen?
  • Welche Technologien dazu gibt es?
  • Was ist CSS, wie ist es aufgebaut?
  • Warum braucht man Medienarten in CSS?
  • Was ist XSLT und was unterscheidet es von CSS?
  • Nennen Sie Beispiele für sprachabhängige Darstellung von Inhalten
  • Was ist ein Zeichenrepertoire?
  • Was ist Unicode?
  • Was bezeichnet ein Zeichenkürzel in HTML/XML/CSS?
  • Welche http Mechanismen unterstützen mehrsprachige Sites?
Semantic Web
  • Was sind Metadaten?
  • Was ist der Dublin Core Standard? Wie sieht er aus?
  • Was ist RDF? Wie sehen Aussagen damit aus?
  • Was führt RDFS zusätzlich zu RDF ein?
  • Was sind Ontologien (aus Informatiksicht)?
  • Was ermöglichen Ontologien?
  • Was ist OWL?
  • Was soll der Unterschied eines Semantic Web zum heutigen Web sein?