wolfgang dalitz wolfram sperber konrad-zuse-zentrum für informationstechnik berlin (zib)...
TRANSCRIPT
IuK-Tagung, Darmstadt, 17.3.2004
Wolfram SperberWolfgang Dalitz
Konrad-Zuse-Zentrum für Informationstechnik Berlin (ZIB)
10. IuK-FrühjahrstagungEducation, Research and New
MediaDarmstadt
15.-18.03.2004
Der Server derInternational Mathematical Union
(IMU)www.mathunion.org
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Inhalt
1. Der IMU Webserver2. IMU-Net3. EWDM4. Professional Homepages5. Math-Net6. Ausblicke
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Was ist eigentlich die IMU?
The objectives of the International Mathematical Union (IMU)
are: a. To promote international cooperation in mathematics b. To support and assist the International Congress of
Mathematicians (ICMs) and other international scientific meetings or conferences
c. To encourage and support other international mathematical activities considered likely to contribute to the development of mathematical science in any of its aspects, pure, applied, or educational
....(aus den Statuten)
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Mitgliederstruktur der IMU
• IMU Mitglieder sind Länder – z.Z. 65 Länder aus 5 Kontinenten
• Jedes Land ist durch eine „adhering organization“ vertreten, welche sein kann:– academy society, – mathematical society– research council – or some other institution or association of
institutions, or an appropriate agency of its government
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Organisationsstruktur
• Executive Committee– „... IMU is administered by an Executive
Committee (EC) ...“• Genaral Assembly (GA)
– „... GA of the IMU consists of delegates appointed by the Adhering Organizations, together with the members of the Executive Committee ...“
• Commissions
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Commissions
• International Commission of Mathematical Instruction (ICMI) [Teaching]
• Commission on Development and Exchanges (CDE)
• International Commission on the History of Mathematics (ICHM)
• Committee on Electronic Information and Communication (CEIC)
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
IMU Webserver (www.mathunion.org)
• Das EC der IMU hat beschlossen, dass der IMU-Server (wieder) nach Berlin kommt
• Redesign (Inhalt und Struktur)• Erweiterungen
– IMU-Net– EWDM– (Awards, Prize Committees, etc.)
• Geplant:– Redaktionssystem– Security
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Ein paar Details
• Struktur lehnt sich an Math-Net Seite für mathematische Gesellschaften an
• z.Z. keine RDF-Daten• Kein Pagemaker• Vorwiegend Außendarstellung und
Berichte der verschiedenen Komitees (CDE, ICMI, CEIC, ...)
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
IMU-Net
• IMU-Newsletter– 2-monatiger elektronischer Rundbrief – „The newsletter aims to improve
communication between IMU and the worldwide mathematical community, by reporting decisions and recommendations of IMU ...“
• Editor– Mireille Chaleyat-Maurel,
Université René Descartes, Paris, France
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Kleines Fazit nach 3 Ausgaben
• Akzeptanz:– Fast 4.000 Abonnenten– Kontinuierlicher Anstieg
• Archiv• ICM 2006
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
EWDM (I)Aus IMU-Net #2:
...“After the discontinuation of the WDM was announced in IMU-Net 1 a number of colleagues asked whether it would be possible to establish an electronic version of WDM. ... Due to the limited financial means of the IMU there is no way to set up and maintain a central registry such as the combined membership list of AMS/MAA/SIAM/etc., ...It seems feasible, though, to keep a central list - based on distributed input and voluntary contributions. CEIC proposes to give this idea a try and start with a basic version of an Electronic World Directory of Mathematicians (EWDM). ...“
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
EWDM (II)
• Registrierungsseite auf dem IMU-Server• Minimalistische Lösung:
– Obligatorisch• Name (lastname, firstname)• E-mail
– Optional• Country• URL der Homepage
• Handshakeverfahren zur Verifikation der Daten (E-Mail)
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Bemerkungen
• Über 600 Einträge in 3 Monaten• Fast alle haben URL und Country• E-Mail-Angabe ist (in erster Näherung) „spam-
sicher“• Zum Teil deutlich mehr an Informationen als
in WDM• Sortierkriterium Namen (default) und Country• Kaum sog. „Professional Homepages“• Seriöse Liste
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Mittelfristige EWDM Aufgaben
• Suchmaschine (in Verbindung mit Persona Mathematica) einsetzen
• Weitere Sortierkriterien und -listen• Update seines Eintrages verbessern
– Z.Z.: Update = Aus- und Neueintragen
• Missbrauchmöglichkeiten verhindern– Spam-Mails– Es soll eine seriöse Liste bleiben, d.h. eine
für MathematikerInnen– Security allgemein
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Verknüpfung EWDM mit dem Personal Homepage Maker
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Langfristige Zielvorstellung
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
... Math-Net ...
• Math-Net wird offiziell von der IMU unterstützt und vom CEIC gelenkt (Steering Gremium)
• In 2003 kaum (nationale) Aktivitäten
• In 2004 Implementierung des Google-Algorithmus auf einer Testmenge der ZIB-Daten
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Google-Idee: PageRank
• Ian Rogers, IPR Computing Ltd., [email protected]
The Google Pagerank Algorithm and How It WorksLast edited: 16th May 2002
http://www.iprcom.com/papers/pagerank/index.html
In short:"PageRank is a „vote“, by all the other pages on the Web, about how important a page is.A link to a page counts as a vote of support."
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
PageRank als Maß
• Der PageRank eines Webdokumentes kann als ein Maß für die Wichtigkeit eines Dokumentes genommen werden
• Dieses Maß korrespondiert mit dem subjektiven Gefühl der Wichtigkeit eines Dokumentes
• Der PageRank ist relativ leicht (iterativ) zu berechnen
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
PageRank
Sergey Brin and Lawrence PageThe Anatomy of a Large-Scale Hypertextual Web Search Engine
http://www.iprcom.com/papers/pagerank/index.html
"We assume page A has pages T1...Tn which point to it (i.e., are citations). The parameter d is a damping factor which can be set between 0 and 1. We usually set d to 0.85. There are more details about d in the next section. Also C(A) is defined as the number of links going out of page A. The PageRank of a page A is given as follows:
)(
)(...
)1(
)1()1()(
TnC
TnPR
TC
TPRddAPR
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Bemerkungen
"Note that the PageRanks form a probability distribution over web pages, so the sum of all web pages' PageRanks will be one.
PageRank or PR(A) can be calculated using a simple iterative algorithm, and corresponds to the principal eigenvector of the normalized link matrix of the web.
Also, a PageRank for 26 million web pages can be computed in a few hours on a medium size workstation. "
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Einfaches Beispiel
Page A
Page D
Page B
Page C
for k=1 .. 40 { $a = 1 - $damp + $damp * $c; $b = 1 - $damp + $damp * ($a/2); $c = 1 - $damp + $damp * ($a/2 + $b + $d); $d = 1 - $damp;}
K = 1 0.15
0.39
0.15
0.21
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Einfaches Beispiel
Page A
Page D
Page B
Page C
for k=1 .. 40 { $a = 1 - $damp + $damp * $c; $b = 1 - $damp + $damp * ($a/2); $c = 1 - $damp + $damp * ($a/2 + $b + $d); $d = 1 - $damp;}
K = 5 0.19
1.34
0.15
0.65
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Einfaches Beispiel
Page A
Page D
Page B
Page C
for k=1 .. 40 { $a = 1 - $damp + $damp * $c; $b = 1 - $damp + $damp * ($a/2); $c = 1 - $damp + $damp * ($a/2 + $b + $d); $d = 1 - $damp;}
K = 10 1.45
1.54
0.15
0.76
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Einfaches Beispiel
Page A
Page D
Page B
Page C
for k=1 .. 40 { $a = 1 - $damp + $damp * $c; $b = 1 - $damp + $damp * ($a/2); $c = 1 - $damp + $damp * ($a/2 + $b + $d); $d = 1 - $damp;}
K = 20 1.48
1.57
0.15
0.78
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Einfaches Beispiel
Page A
Page D
Page B
Page C
for k=1 .. 40 { $a = 1 - $damp + $damp * $c; $b = 1 - $damp + $damp * ($a/2); $c = 1 - $damp + $damp * ($a/2 + $b + $d); $d = 1 - $damp;}
K = 40 1.49
1.57
0.15
0.78
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Bemerkungen
• Konvergiert relativ schnell• Algorithmus nicht kompliziert• Im „geschlossenem System“ ist
der Average PageRank = 1.0
PR(A) = 1.49PR(B) = 0.78PR(C) = 1.57PR(D) = 0.15----------------- 3.99 / 4 = 1.0
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
PageRank im Math-Net
• ZIB-Daten als Testmenge– 27.000 Dokumente vom Harvest System– Pro Dokument
• URL• URL-References• Weitere Attribute (Metadaten)
– URL-Normalisierung– Vernachlässigung externer Links– 20 Sekunden für k=10 (Perl-Skript)
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Ergebnisse
• Suche nach Groetschel– Homepage ist auf Rang 1 von 799 (!)– Harvest Ranking Algorithmus liefert: Rang 53
• Google reicht aber (ziemlich sicher) nicht:- Suche nach Deuflhard ergibt: Rang 6 von 725– Harvest Ranking Algorithmus liefert: Rang 1
• Kombination beider Bewertungen:– Rang 1 (!) bei beiden
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
Danke für die Aufmerksamk
eit
Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber
URLs• IMU-Server
– www.mathunion.org
• IMU-Net– www.mathunion.org/IMU-Net
• EWDM– www.mathunion.org/ewdm
• Professional Homepages und EWDM– www.mathunion.org/MPH-EWDM
• Ian Rogers: The Google Pagerank Algorithm ...– www.iprcom.com/papers/pagerank/index.html
• S. Brin, L. Page: The Anatomy of a Large-Scale Hypertextual Web Search Engine– www-db.stanford.edu/~backrub/google.html