Hier findet ihr hilfreiche Erklärungen
Webverzeichnis
aus
Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Webkatalog)
Als
Webverzeichnis, oder Webkatalog, bezeichnet man eine Sammlung
von Adressen von Webseiten im World Wide Web, die nach bestimmten Themen sortiert sind.
Aufgabe und Funktion
Webkatalog-Redaktionen
leisten für Online-Quellen das, was Bibliotheken für Print-Medien übernehmen: Sie sammeln und sichten Informationen,
entwickeln Taxonomien und katalogisieren ihre Sammlungen. Zu den gesammelten Quellen zählen dabei
nicht nur ganze Websites oder Newsgroups, sondern zusätzlich auch einzelne Dokumente und
Datenbankeinträge.
Über diese reine
Bibliotheks-Funktion hinaus bieten Webverzeichnisse ihren Nutzern oft
auch zusätzlichen Nutzen, wie
- kurze
Beschreibungen der einzelnen Kategorien und ihrer Inhalte,
- Querverweise
zu verwandten Themen,
- Querverweise
zu gleichen Themensammlungen in anderen Sprachen,
- eine auf
bestimmte Themen beschränkbare Suchfunktion.
Webverzeichnisse
sind nicht so umfangreich wie die automatisch erstellten Verzeichnisse
von Suchmaschinen. Durch ihre redaktionelle Kontrolle erreichen
Webverzeichnisse jedoch im Durchschnitt eine höhere Qualität. Die
Qualität eines Webverzeichnisses hängt immer stark von seiner Redaktion
ab.
Betreiber
kommerzieller Webseiten bemühen sich um Einträge in Webverzeichnisse,
um Besucher zu ihren Angeboten zu führen und – was für die Suchmaschinen-Optimierung von Bedeutung ist – die Zahl der bei ihnen eingehenden Links
zu erhöhen. Kommerzielle Webverzeichnisse bieten eine Eintragung gegen
Bezahlung an, die in der Regel zeitlich begrenzt ist. Verzeichnisse,
bei denen kommerzielle Interessen im Vordergrund stehen, erweisen sich
jedoch für Nutzer, der nach Informationen sucht, meist als wenig
hilfreich.
Arten von Webkatalogen
Diese
meisten heute bekannten Webkataloge werden manuell gepflegt, das heißt:
Alle Einträge werden von Menschen gesichtet, geprüft und katalogisiert.
Auf diese Art wird eine Qualität der Sammlung sichergestellt, welche
mit einem automatisierten Prozess nicht zu erreichen wäre.
Problematisch bei dieser Methode ist jedoch der hohe Aufwand und damit
der große Bedarf an Mitarbeitern, um ein umfassendes und aktuelles
Verzeichnis gewährleisten zu können. Oft beschränken sich manuell
erstellte Verzeichnisse deshalb auf kleine, eng abgegrenzte
Themengebiete. Bekannte Ausnahmen bilden der Yahoo-Katalog
oder das Open Directory Project.
Ein anderer
Ansatz zur Organisation von Linksammlungen besteht in der Bildung von Ad-hoc-Kategorien
aus Suchbegriffen. Diese automatisch generierten Kataloge enthalten
wesentlich umfangreichere und aktuellere Inhalte. In ihrer Qualität
erreichen sie aber heute noch nicht das Niveau, welches bei der
manuellen Sortierung besteht. Ein bekanntes Beispiel für
Ad-hoc-Katalogisierung ist der WiseGuide des Suchdienstes WiseNut.
Weiterhin kann
unterteilt werden in hierarchische und nichthierarchische
Webverzeichnisse. In hierarchischen Verzeichnissen werden Kategorien
von Einträgen und oft die Einträge der Verzeichnisse selbst in einer
eindeutigen Ordnung sortiert. Ein Eintrag befindet sich dabei oft nur
in einer bestimmten Kategorie, was ihn schwer auffindbar macht. Ein
Beispiel für ein sehr hierarchisches Webverzeichnis ist das Open
Directory Project. Nichthierarchische Verzeichnisse bestehen dagegen
aus einer Netzwerkartigen Struktur, mit deren Knoten die Einträge
(Links) verknüpft werden. Dadurch sind die Einträge und Kategorien
leichter zu finden, eine assoziative Suche ist eher möglich.
Schließlich
lässt sich zwischen kommerziellen und hauptsächlich nichtkommerziellen
Webverzeichnissen unterscheiden. Durch das Geschäftsmodell vieler
Webverzeichnisbetreiber besteht besonders bei ersteren die Gefahr einer
eingeschränkten Objektivität: Die Erhöhung der Ranghöhe in einem Verzeichnis für die eigene Webseite wird zur
offiziell angebotenen Dienstleistung (Beispiele siehe unten Liste von
Webverzeichnissen). Der Benutzer kann kaum unterscheiden, welche
Suchergebnisse (Katalogeinträge) sich einen hohen Rang durch hohe
Relevanz "verdient" haben und bei welchen ein hoher Rang "erkauft"
wurde. Hier verschwimmt die traditionelle Grenze von Publikationen
zwischen redaktionellem Teil einerseits und Anzeigenteil andererseits.
Rückverweis,Backlink
aus
Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Backlink)
Ein
Rückverweis (Backlink) auf einer Webseite ist
ein Link, der auf eine andere Seite zeigt (siehe auch Trackback).
Diese Seite hat dadurch einen Rückverweis. In vielen Suchmaschinen
wird die Anzahl der Backlinks als Indiz für die Linkpopularität
oder Wichtigkeit der Webseite verwendet; Googles PageRank-Algorithmus ist ein Beispiel hierfür.
Auf die
Backlinks hat der Betreiber der Webseite in der Regel keinen direkten
Einfluss (vgl. dazu Referrer-Spam), obwohl oft Methoden der Linksammlung wie beispielsweise des Textlinktausch angewendet werden. Das Aufspüren der Backlinks erfolgt mit
Hilfe von Suchmaschinen oder durch Auslesen der Referrer bei
der Logdateianalyse. Werten die Suchmaschinen auch die Linktexte der Backlinks
als Suchbegriffe, kann diese Eigenschaft durch eine so genannte Google-Bombe
missbraucht werden
Webbrowser
aus
Wikipedia, der freien Enzyklopädie
Webbrowser
(oder allgemein auch Browser genannt) [ˈbɹaʊ̯zə˞] (engl. für
„Durchstöberer“, „Blätterer“) sind spezielle Computerprogramme zum Betrachten von Webseiten im World Wide Web. Das Durchstöbern des World Wide Webs respektive das
aufeinanderfolgende Abrufen beliebiger Hyperlinks als Verbindung zwischen Webseiten mit Hilfe solch eines Programms wird
auch als Internetsurfen bezeichnet. Neben HTML-Seiten können sie verschiedene andere Arten von Dokumenten
anzeigen. Webbrowser stellen die Benutzeroberfläche für Webanwendungen
dar.
Browser und Webbrowser
Im allgemeinen sind Browser
spezielle Computerprogramme, mit denen sich Textdateien betrachten
bzw. lesen lassen.
Ursprünglich
bezeichnete der aus dem Englischen entlehnte Begriff browsen (engl. to browse
„stöbern, sich umsehen, schmökern“) am Computer lediglich das Nutzen von Navigationselementen (Vor, Zurück,
Index etc.) zum Lesen von Texten bzw. Textdateien. Erweitert wurde dieser Begriff später
durch das Aufkommen von Hypertext, bei dem man bestimmte, als Querverweis (auch „Hyperlinks“
genannt) wirkende Wörter auswählen kann, um zu einem anderen Text zu
gelangen. Später kamen dann Funktionen zur Anzeige von Bildern dazu und auch sogenannte verweissensitive Grafiken, bei denen man auf einer Computergrafik einen Bereich (zum Beispiel bei einer Weltkarte)
anklickt und dadurch zu einer verlinkten Textseite (zum
Beispiel über ein bestimmtes Land) gelangt.
Mit dem
fortschreitenden Trend zum Internet und später Multimedia wurde der Webbrowser immer mehr generalisiert und
somit eine zentrale Anwendersoftware auf einem heute üblichen PC. Moderne
Webbrowser können auch verschiedene Medien abspielen, wie etwa Musik oder Radio. Zudem
lassen sich damit Programme oder Dateien auf den PC laden (herunterladen), um sie dort zu
speichern und gegebenenfalls zu einem späteren Zeitpunkt zu öffnen oder
auszuführen. Insbesondere die Verbreitung von Breitband-Internetzugängen
förderte diese zentralen Funktionen heutiger Webbrowser. Somit
verschwimmt zunehmend auch der Unterschied zu einem Dateimanager,
der ursprünglich ausschließlich zum Öffnen, Kopieren oder Löschen von
Dateien verwendet wurde. Viele Dateimanager haben heute auch Browser-Funktionen
(Datei-Browser) und können so auch zum Anzeigen von Dokumenten
verwendet werden.
Aufgrund
ihrer großen Verbreitung haben Webbrowser eine wichtige Funktion als
sog. Thin Clients (Präsentationsschicht) von Webanwendungen.
Webbrowser
beherrschen neben HTTP auch weitere Protokolle der Anwendungsschicht des TCP/IP-Referenzmodells, z. B. FTP und Gopher. Einige Webbrowser haben auch Funktionen für E-Mail, Usenet oder BitTorrent.
Andere decken diese Funktionen durch externe Programme ab.
Die
gemeinsame Navigation durch das Internet oder Web, z. B. über synchronisierte Webbrowser, wird auch Cobrowsing
genannt.
Benutzung eines Webbrowsers für Tätigkeiten am
lokalen Computer, wie Administration [Bearbeiten]
Beispiel:
Unter UNIX-artigen Systemen lässt sich z. B. das Drucksystem CUPS mit dem
Webbrowser administrieren, die Adresse ist meist http:// localhost:631.
Es funktioniert, egal ob auf dem Computer ein Webserver
installiert ist oder nicht.
Der Vorteil
ist, dass die Softwareentwickler nicht die Oberfläche erfinden mussten, sie mussten
nur ihr Programm, hier im Beispiel CUPS, dazu bringen, richtig,
d. h. gemäß dem HTTP-Protokoll, mit dem Webbrowser zu
"reden".
Tim
Berners-Lee, ein Pionier der
Verwendung von Hypertext, schuf 1990 den ersten Webbrowser unter dem Namen WorldWideWeb
(später Nexus) auf einer NeXT-Workstation und präsentierte im März 1991 dieses Programm am
CERN.
Große
Verbreitung fanden Browser wie der NCSA
Mosaic, ein Browser mit grafischer Benutzeroberfläche (GUI), der ursprünglich auf Unix lief, aber bald schon auf Apple Macintosh
und Microsoft Windows portiert wurde. Die Version 1.0 von Mosaic erschien 1993.
Netscape
Marc
Andreessen, der Mosaics
Entwicklerteam leitete, gründete kurz danach die Netscape Communications Corporation. Netscape brachte seinen Navigator im Oktober 1994 auf den Markt. Er war der erste Web-Browser,
der in der Lage war, außer Text auch Grafiken anzuzeigen. Für einige
Jahre war der Netscape-Browser Marktführer.
Am 1. März 2008
wurde der Netscape Navigator „zu Grabe getragen“. Zwar wird der Browser
auch dann noch zum Download zur Verfügung stehen, jegliche
Weiterentwicklung und der Support wurden jedoch eingestellt.
Microsoft Internet Explorer
Aufgrund
des Erfolgs des Navigators brachte Microsoft, das bis dahin das
Internet unterschätzt hatte, 1995 seinen Internet
Explorer heraus, der nicht
selbst entwickelt, sondern von der Firma Spyglass (NCSA Mosaic) eingekauft worden war. Das war der Beginn des
sogenannten Browserkriegs zwischen Microsoft und Netscape. Eine Folge des
Browserkriegs war es, dass Browser sich stark verbreiteten, während
andererseits die Konkurrenz zwischen Microsoft und Netscape dazu
führte, dass die beiden Firmen in ihrem Wettkampf um Marktanteile eine
Vielzahl selbsterfundener Erweiterungen in ihre Programme integrierten,
die vom jeweiligen Konkurrenzprodukt zunächst nicht unterstützt wurden.
Dadurch wurde insgesamt die Verbreitung technischer Standards für
Browser in Mitleidenschaft gezogen.
Mozilla
Ab 1998
ging der Marktanteil von Netscape deutlich zurück – auch weil Microsoft
dazu überging, den Internet Explorer eng mit dem eigenen
Betriebssystem Microsoft Windows zu verzahnen. In den folgenden Jahren wurde Microsoft mit
einem Marktanteil von über 90 Prozent annähernd zum Monopolisten auf
dem Browsermarkt.
Netscape
reagierte darauf, indem es sich zu einem quelloffenen Projekt veränderte – unter dem Namen Mozilla,
welches parallel zur Netscape-Entwicklung betrieben wurde, wobei sich
die Projekte gegenseitig mit Ideen und Technologien ergänzten. Dennoch
ging der Marktanteil von Netscape weiter zurück, bis das Unternehmen
Ende 1998 von America Online
(AOL) aufgekauft wurde. Neue
Versionen von Netscape (Netscape 6.0, Netscape 7.0) hatten nur
bescheidenen Erfolg. Insbesondere Netscape 6.0 wurde durch deutliche
Mängel und eine hiermit verbundene geringe Benutzerfreundlichkeit zu
einem Fehlschlag.
Seit 2002
gewinnt der Mozilla-Browser allmählich Marktanteile zurück, vor allem
durch technische Vorzüge und durch Vorteile bei der Bedienung und der
Sicherheit. Dies wird unter anderem dadurch erreicht, dass der Browser
in einem eigenen Speicherbereich des Arbeitsspeichers läuft, der keinen
direkten Zugriff auf das Dateisystem des Host-Systems hat. Der
Nachfolger des Mozilla-Browsers, Firefox, wurde noch weiter verbessert und zeichnet sich, neben den
bereits genannten Vorzügen des Mozilla-Browsers, vor allem durch seine
verglichen mit dem Internet Explorer hohe Geschwindigkeit aus. Da
Firefox ein reiner Webbrowser ist, wird er durch den E-Mail-Client Thunderbird
ergänzt, während Mozilla noch einen integrierten E-Mail-Client besaß.
Die Versionen 1.0 von Firefox und Thunderbird erschienen nach einer
längeren Betaphase im Dezember 2004. Verschiedenen Quellen zufolge hat
Mozilla bis Anfang 2007 einen Marktanteil von 20 bis 30% erobert, wobei
starke nationale Schwankungen auftreten.
Die
Mozilla-Suite wird nicht mehr weiterentwickelt. Es gibt jedoch ein
Nachfolgeprojekt mit dem Namen „SeaMonkey“, das von einem freien Entwicklerteam unter dem Dach der
Mozilla Foundation weiterentwickelt wird. - In diesem „Sea Monkey“ ist
immer noch der Netscape Composer enthalten, eine freie
Software zum Erstellen von HTML-Seiten.
Die letzte
Version des Mozilla-Browsers lässt sich noch immer herunterladen.
Safari
Der Safari-Browser
ist ein Browser der Firma Apple. Dieser noch recht neue Browser wurde im Januar 2003 zum
ersten mal veröffentlicht und ist seit MacOS-X Panther (10.3) der
Standardbrowser, der den bis dahin genutzten Internet Explorer von
Microsoft ersetzte. Der Rendering
Engine Webkit liegt
die KHTML-Bibliothek des KDE-Projekts zugrunde, welche von Apple an eigene Bedürfnisse
angepasst wurde. Heute ist Safari einer der technisch
fortschrittlichsten Browser auf dem Markt, welcher in verschiedenen
Benchmarks als der schnellste hervorging. Zudem bestand Safari als
erster Browser überhaupt den äußerst anspruchsvollen Acid2-Test.
Seit Juni 2007 ist eine öffentliche Beta für Safari 3 zum ersten Mal
auch für Windows XP/Vista verfügbar.
Opera
Der Browser
Opera, eine kleine und anpassungsfähige Browser-Suite, erschien in
der ersten Version 1996 und hat sich seither vor allem in Europa eine
Nische gesichert. Opera zeichnet sich vor allem durch die Vielzahl
seiner Funktionen aus: Neben den eigentlichen Internetfunktionen bietet
er einen integrierten E-Mail-Client, Chatmodule,
BitTorrent-Unterstützung und viele, oft einmalige Funktionen mehr. Auch
ist er, verglichen mit Konkurrenzprodukten, sehr schlank und schnell.
Darüber hinaus ist er für eine Vielzahl von Betriebssystemen und
Benutzersprachen verfügbar. Außerdem war Opera einer der ersten
Browser, die Tabs und einen PopUp-Blocker fest integriert hatten. Die
Desktopversion enthält seit Version 8.50 (September 2005) keine
Werbebanner mehr und ist somit Freeware.
Nintendos neue Spielkonsole „Wii“ und der Nintendo DS verwenden den Opera-Browser, um Internetdienstleistungen
anzubieten. Der Marktanteil von Opera liegt weltweit unter 1 %.
Browser-Arten
Man unterscheidet
zwischen textbasierten und grafischen Browsern.
Textbasierte
Browser können nur einfachen Text und Textformate wie HTML oder XML
interpretieren und darstellen. Meist ermöglichen sie es, Computergrafik-Dokumente
abzuspeichern oder mit externen Programmen darzustellen. Textbrowser
sind besonders für Blinde nützlich, die das Internet barrierefrei nutzen wollen. Mit ihnen kann Text leicht in Sprache
umgewandelt werden. Sie eignen sich besonders zur schnellen Recherche,
da Bilder, Werbung u. ä. gar nicht geladen werden.
Beispiele
für textbasierte Browser: Links, ELinks, Lynx und w3m. Opera kann einen Textbrowser emulieren
Grafische
Browser setzen zumindest ein grafikfähiges Ausgabegerät voraus. Sie
sind die meistverwendete Browser-Art und für alle Betriebssysteme mit
einer grafischen
Benutzeroberfläche (zum Beispiel
Windows, Mac OS X oder Unix mit X11) verfügbar. Grafische Browser zeigen Inhalte wie
Computergrafiken, Filme oder Java-Applets überwiegend selbst an oder benutzen dazu externe Bausteine,
so genannte Plug-ins.
Manche Browser (wie Mozilla oder Opera) werden heute als Browser-Garnitur mit integrierten
Funktionen für zum Beispiel E-Mail und Usenet ausgeliefert, andere (wie Internet
Explorer und Konqueror)
sind kombinierte Browser und Dateimanager. In den letzten Jahren hat eine Gegenbewegung eingesetzt,
die sich für Browser ohne solche Zusatzfunktionen einsetzt, wie zum
Beispiel Galeon und Firefox.
Moderne
mobile Endgeräte (PDAs, Smartphones) verfügen ebenfalls über Browsersoftware, mit denen sie das
World Wide Web benutzen können.
Microsofts Internet Explorer hat z.Z eine herausragende Marktstellung. Die größten
Konkurrenten zu diesem sind derzeit das Mozilla-Projekt (Mozilla Application
Suite, Firefox und Camino), Opera Software ASA (Opera), KDE (Konqueror) und Apple (Safari).
Zwischenspeicherung von
Internetdateien
Der Browser
speichert gegebenenfalls für einen begrenzten Zeitraum Seiten und
Bilder auf der Festplatte des eigenen Arbeitsplatzes und/oder dem
Arbeitsspeicher zwischen, um die Übertragungsleitung von Datenverkehr
zu entlasten und den Seitenaufbau zu beschleunigen. Dabei sind meistens
benutzerspezifische Einstellungen möglich, wann diese Daten
letztendlich gelöscht werden sollen. Ein Nachteil dieses Verfahrens
ist, dass unter Umständen nicht die aktuelle Fassung einer gewünschten
Seite angezeigt wird. Es gibt jedoch bei allen Browsern (Tastatur-)
Befehle, um die zwischengespeicherten Seiten und Bilder zu löschen und
eine aktuelle Fassung der angezeigten Seite zu laden.
Manche Browser
verzichten aus Gründen der Privatsphäre auch komplett auf die
Zwischenspeicherung auf der lokalen Festplatte (bspw. APPOX-Browser).
Browser wie Internet Explorer, Firefox und Safari haben Funktionen, mit
den sich ein solcher Modus ein- und ausschalten lässt.
E-Mail
aus
Wikipedia, der freien Enzyklopädie
Die (auch das) E-Mail [ˈiːmeɪl] (von engl.:
„electronic mail“; zu dt.: „die elektronische Post“ oder „der elektronische Brief“;
kurz auch Mail genannt) bezeichnet eine auf elektronischem
Weg in Computernetzwerken übertragene, briefartige Nachricht. Eindeutschungen wie
„E-Brief“, „E-Post“ oder „Netzbrief“ sind weniger verbreitet.
E-Mail wird
– noch vor dem World Wide Web – als wichtigster und meistgenutzter Dienst des Internets
angesehen. Allerdings ist seit ca. 2002 über die Hälfte des weltweiten
E-Mail-Aufkommens auf Spam zurückzuführen.
Hyperlink
aus
Wikipedia, der freien Enzyklopädie
Als Hyperlink [ˈhaɪpɚlɪŋk],
auch kurz Link (engl. für Verknüpfung, Verbindung, Verweis), bezeichnet
man einen Verweis auf ein anderes Dokument innerhalb eines Hypertextes, der automatisch durch das „Hypertextsystem“ verfolgt werden
kann.
Der Begriff
wird meist auf das World Wide
Web bezogen.
Das Konzept
von Hyperlinks entspricht funktional dem Querverweis oder der Fußnote aus der konventionellen Literatur, bei der das Ziel des
Verweises allerdings in der Regel manuell aufgesucht werden muss.
Man spricht von
einem verlinktem Dokument, wenn es mindestens einen Hyperlink
enthält, der auf ein Drittes gerichtet ist.
Link
aus
Wikipedia, der freien Enzyklopädie
Link ist ein mit dem deutschen Wort "Gelenk" verwandtes Lehnwort aus
dem Englischen (engl. link "Kettenglied, Verbindungsglied"), das
im Deutschen ursprünglich als Neutrum aufgefasst wurde ("das Missing
Link", "das Link" als
Längenmaß), bei der erneuten Entlehnung in die deutsche Fach- und
Umgangssprache des Computerwesens dort aber zumeist als Maskulinum aufgefasst wurde ("der Hyperlink" neben "das Hyperlink") und
auch im Duden für die computersprachliche Verwendung nur noch in der
männlichen Form aufgeführt wird.
Link steht für:
- Hyperlink, eine Verknüpfung aus einem Webdokument zu einem anderen
- Dateiverknüpfung, in Betriebssystemen ein Verweis auf eine Datei
- Link
(Kommunikationstechnik),
automatisierte Inter-Rechner Verbindung
- Link
(Einheit), eine Maßeinheit der
Länge
PageRank
aus
Wikipedia, der freien Enzyklopädie
Der
PageRank-Algorithmus ist ein Verfahren, eine Menge verlinkter
Dokumente, wie beispielsweise das World
Wide Web, anhand ihrer Struktur
zu bewerten bzw. zu gewichten. Dabei wird jedem Element ein Gewicht,
der PageRank, aufgrund seiner Verlinkungsstruktur zugeordnet. Der Algorithmus
wurde von Larry Page (daher der Name PageRank) und Sergey
Brin an der Stanford University entwickelt und von dieser zum Patent angemeldet[1]. Er diente dem von Brin und
Page gegründeten Unternehmen Google als Grundlage für die Bewertung von Seiten.
Der
PageRank-Algorithmus ist eine spezielle Methode, die Linkpopularität
einer Seite bzw. eines Dokumentes festzulegen. Das Grundprinzip lautet:
Je mehr Links auf eine Seite verweisen, umso höher ist das Gewicht
dieser Seite. Je höher das Gewicht der verweisenden Seiten ist, desto
größer ist der Effekt. Der PageRank-Algorithmus bildet einen zufällig
durch das Netz surfenden User nach. Die Wahrscheinlichkeit, mit der
dieser auf eine Webseite stößt, korreliert mit dem PageRank.
Der PageRank-Algorithmus
Das Prinzip des
PageRank-Algorithmus ist, dass jede Seite ein Gewicht (PageRank)
besitzt, das umso größer ist, je mehr Seiten (mit möglichst hohem
eigenem Gewicht) auf diese Seite verweisen. Das Gewicht PRi einer
Seite i berechnet sich also aus
den Gewichten PRj
der auf i verlinkenden Seiten j. Verlinkt j
auf insgesamt Cj
verschiedene Seiten, so wird das Gewicht von PRj
anteilig auf diese Seiten aufgeteilt. Folgende rekursive Formel kann
als Definition des PageRank-Algorithmus angesehen werden:
Dabei ist N die Gesamtanzahl der Seiten und d ein Dämpfungsfaktor zwischen 0 und
1, mit dem ein kleiner Anteil des Gewichts (1 − d)
einer jeden Seite abgezogen und gleichmäßig auf alle vom Algorithmus
erfassten Seiten verteilt wird. Dies ist notwendig, damit das Gewicht
nicht zu Seiten „abfließt“, die auf keine andere Seite verweisen. Oft
wird die obige Formel auch ohne den Normierungsfaktor 1 / N angegeben.
Die
Gleichung kann sowohl als Eigenvektorproblem der Matrix
als auch
(für d < 1) als Lösung des linearen Gleichungssystems
mit
interpretiert
werden, wobei δij
das Kronecker-Delta bezeichnet. Die Lösung des linearen Gleichungssystems
kann
analytisch oder numerisch erfolgen. Für d
< 1 ist die Lösung des Gleichungssystems eindeutig. Durch
Verwendung der Jacobi-Iteration zur numerischen Lösung ergibt sich obige rekursive
Gleichung. Andere numerische Verfahren zur Matrixinvertierung, wie das
Minimale-Residuum-Verfahren oder die Gauss-Seidel-Methode, konvergieren jedoch in der Regel schneller.
Der heute
von Google verwendete Algorithmus hat vermutlich nicht mehr exakt diese
Form, geht aber auf diese Formel zurück. Alternative Algorithmen sind
das Verfahren der Hubs und
Authorities von Jon Kleinberg,
der Hilltop- und der TrustRank-Algorithmus.
Zufallssurfer-Modell
Normiert
man den PageRank auf 1, so kann man das Gewicht einer Seite als
Wahrscheinlichkeit interpretieren, dass ein zufälliger Surfer (siehe Zufallspfad)
sich auf dieser Seite befindet. Ein zufälliger Surfer bewegt sich durch
das Netz, indem er mit der Wahrscheinlichkeit d
zufällig einen der ausgehenden Links der aktuellen Seite wählt. Mit
Wahrscheinlichkeit 1 − d wählt
er eine beliebige neue Seite. Um Probleme mit Seiten ohne ausgehende
Links zu vermeiden, können bei diesen Links zu allen vorhandenen Seiten
hinzugefügt werden.
Toolbar- und Verzeichnis-Werte
Informationen
über den PageRank lassen sich aus der Google-Toolbar und dem Google-Verzeichnis entnehmen. Der von Google in der
Toolbar angezeigte PageRank liegt zwischen 0 und 10, der Wert im
Verzeichnis zwischen 0 und 7. Beide Werte bilden den realen PageRank
auf einer logarithmischen Skala ab und geben das Ergebnis als
gerundeten ganzzahligen Wert wieder.
Der in der
Google-Toolbar angezeigte PageRank wurde früher alle dreißig Tage
aktualisiert. Inzwischen ist das Intervall zwischen den Updates
angestiegen, auf teilweise mehr als hundert Tage.
Manipulation
Aufgrund
der wirtschaftlichen Bedeutung ist es inzwischen zu gezielten
Manipulationen und Fälschungen gekommen. So wurde dieses sinnvolle
System in der Praxis von Suchmaschinenoptimierern durch Spamming in Gästebüchern, Blogs und Foren, dem Betreiben von Linkfarmen und anderen unseriösen Methoden unterlaufen. Durch
Weiterleitung auf bestehende Seiten mit hohem PageRank wird gezielt
versucht, den PageRank-Algorithmus zu manipulieren.
Anfang 2005
implementierte Google mit rel="nofollow" ein neues Attribut für Verweise, als Versuch, gegen Spam
vorzugehen. Links, die mit diesem Attribut versehen werden, werden
nicht für die PageRank-Berechnung berücksichtigt. Durch Kennzeichnung
ausgehender Links kann so beispielsweise dem Gästebuch-, Blog- und
Forum-Spamming entgegengewirkt werden. Allerdings ist diese Methode
umstritten.
Server
aus
Wikipedia, der freien Enzyklopädie
Definitionen
- Der
Begriff Server (engl.: to serve = bedienen) bezeichnet entweder eine Software (Programm) im
Rahmen des Client-Server-Konzepts; oder eine Hardware[1][2] (Computer), auf der diese Software (Programm) im Rahmen dieses
Konzepts abläuft.
- Ein Server (Software) ist ein Programm, das mit einem anderen Programm, dem Client (engl.
= Kunde), kommuniziert, um ihm Zugang zu speziellen Dienstleistungen
(genannt Dienste) zu verschaffen.
- Ein Server (Hardware) ist ein Computer, auf dem ein oder mehrere Server (Software) laufen.
Für die Server (Hardware) wird in der Fachsprache der Begriff Host benutzt. Für den Server als Software-Begriff gibt es keine
weitere Bezeichnung. Ob es sich bei einem Server um einen Host oder um
einen Server (Software) handelt, ist daher nur aus dem Kontext oder
mit Hintergrundwissen erkennbar.
Die Aspekte
des Servers als Software sind im Artikel Server (Software) beschrieben, die der Servers als Hardware finden
sich im Artikel Host
(Informationstechnik).
Der
Mehrdeutigkeit des Begriffs Server wird im folgenden Abschnitt weiter
erklärt und erläutert.
Domain
aus
Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

schematische Darstellung der DNS-Hierarchie
Eine Domain
im Internet ist ein zusammenhängender Teilbereich des hierarchischen
DNS-Namensraumes. Zum Wortursprung siehe Domäne, vergleiche auch Domäne in lokalen Netzen.
Aufbau
Die gesamte
Darstellung des DNS-Namensraumes erfolgt als Wurzelbaum (siehe Graphentheorie und Beispiele). Jeder Knoten besitzt einen Namen (Label
genannt), der ohne die Angabe eines vollständigen (Fully Qualified)
Namens nicht eindeutig ist. So lässt sich beispielsweise die Position
des Knotens wikipedia nicht eindeutig bestimmen, da dieser
Knotenname zum einen unter wikipedia.org und zum anderen unter
wikipedia.de auftaucht.
Jeder
Domain-Name besteht aus mehreren Teilen, den sogenannten Labels, die
durch Punkte voneinander getrennt sind.
Der ganz
rechts stehende Knotenname (Label) steht in der Hierarchie des Wurzelbaums am
höchsten, der ganz linke Knotenname am niedrigsten. Die höchste Ebene
in der DNS-Hierarchie hat dabei die sogenannte Root-Domain.
Sie hat per Definition einen leeren Knotennamen (im Fachjargon: Null-Label).
Topologisch
unterhalb bzw. im Name links der Root-Domain folgen der Knotenname
einer Top Level Domains (TLD). Die Top Level Domain bezeichnet entweder
das Land, in dem der Domain-Name registriert wurde (z. B. .at für
Österreich, .de für Deutschland, .ch für Schweiz), einen Staatenverbund
(z. B. .eu für die Europäische Union) oder einen Bereich des
praktischen Lebens (z. B. .org, .com oder .biz). Topologisch unterhalb
bzw. im Name links der Top Level Domain folgen die
Knotennamen der sogenannten Second Level Domains, Third
Level Domains usw.
Subdomain
Als Subdomain
bezeichnet man eine Domain, welche in der Hierarchie unterhalb einer
anderen liegt. Im allgemeinen Sprachgebrauch sind damit meist Domains
in der dritten oder einer weiteren Ebene gemeint. Domains, die direkt
unterhalb der Top-Level-Domain liegen, werden umgangssprachlich nicht
als Subdomains, sondern als Second-Level-Domain oder nur Domain
bezeichnet.
In obigem
Beispiel gibt es die Top Level Domains de. und org..
Unter diesen Domains sind die Subdomains wikipedia.de. bzw. wikipedia.org.
angesiedelt. Die Subdomains direkt unter einer TLD werden als Second
Level Domains bezeichnet.
Jede
Subdomain, also zum Beispiel wikipedia.org. als Subdomain der
Top-Level-Domain .org oder de.wikipedia.org. als
Subdomain von wikipedia.org., ist eigenständig wieder eine
Domain, in der andere Domains und Hostnamen liegen können.
Anschauliches
Beispiel: Um Peter Müller in Hamburg von Peter Müller in München
unterscheiden zu können, gibt es Postleitzahl und Ort. Um zwei Peter
Müller in Hamburg unterscheiden zu können gibt es Straße und Hausnummer
(usw.). Diese Funktion übernimmt im Internet die Domain.
Zur logischen und
physischen Trennung von Diensten innerhalb einer Second Level
Domain werden traditionell Third Level Domains,
z. B. www.wikipedia.de für den Webserver oder mail.wikipedia.de
für den Mailserver, verwendet. Die historisch gewachsene Bezeichnung
des Hostnamens www für einen Webserver entspricht keinem
Standard und hat keine Bedeutung. Stattdessen könnte für den Aufruf des
Webservers z. B. web oder einfach nur die
Second-Level-Domain ohne einen Prefix herangezogen werden. Die
funktionelle Bezeichnung von Hostnamen für Web-, Mail-, Jabber- oder
FTP-Server ist nicht vorgegeben und kann frei gewählt werden.
Vorteile von Subdomains
Es gibt
verschiedene Gründe für den Einsatz von Subdomains.
Logische Gliederung [Bearbeiten]
Wird zum Beispiel
für verteilte Filialen oder Abteilungen einer Firma verwendet, für
eigenständige Web-Auftritte wie bei de.wikipedia.org, en.wikipedia.org,
… oder um E-Mails an Filialen mit eigenem Mailserver zu leiten.
Eine Subdomain zu
diesem Zweck anzulegen ist nur sinnvoll, wenn die entstandenen
Domainnamen unterschiedliche Zielseiten oder Server verwenden, zum
Beispiel mail.extern.wikipedia.de und ftp.extern.wikipedia.de.
Andererseits kann
man auch Subdomains anlegen, um so auf bestimmte Abteilungen und
Bereiche innerhalb einer Firma oder Organisation weiterzuleiten.
Beispiele für eine Subdomain zur Weiterleitung an einzelne Bereiche
oder Standorte einer Firma und/oder Organisation:
Top-Level-Domain
aus
Wikipedia, der freien Enzyklopädie
Jeder Name einer Domain im Internet besteht aus einer Folge von durch Punkte getrennten Zeichen.
Die Bezeichnung Top-Level-Domain (vom englischen top level domain,
übersetzt Bereich oberster Ebene; Abkürzung TLD) bezeichnet
dabei den letzten Namen dieser Folge und stellt die höchste Ebene der Namensauflösung
dar. Ist der vollständige Domain-Name eines Rechners bzw. einer Website
beispielsweise de.wikipedia.org, so entspricht das rechte
Glied (org) der Top-Level-Domain dieses Namens.
Im so
genannten Domain Name System (DNS) werden die kompletten Namen und damit auch die TLDs
referenziert und aufgelöst, also einer eindeutigen IP-Adresse
zugeordnet. Die Registrierungsstelle legt dabei einen Datenbank-Eintrag
über den Inhaber an, der Whois-Abfragen über das gleichnamige Protokoll, ähnlich einem Telefonbuch,
ermöglicht.
TLDs werden
von der IANA in zwei Hauptgruppen und einen Sonderfall unterteilt:
- allgemeine
TLDs: generic TLDs (gTLDs), unterteilt in sponsored
TLDs (sTLDs) und unsponsored TLSs (uTLDs)
- länderspezifische
TLDs: country-code TLDs oder ccTLDs
- die
Infrastruktur-TLD (iTLD) .arpa (Sonderfall) und das
(jedoch nie in Gebrauch gewesene) .root
Nicht mehr in
Gebrauch sind die Sonderfälle .bitnet und .uucp.
Länderspezifische
TLD-Bezeichner bestehen dabei immer aus zwei Buchstaben, allgemeine
TLD-Bezeichner bestehen aus drei oder mehr Buchstaben.
Generische Top-Level-Domains
Die
generischen Top-Level-Domains (gTLD) werden nach gesponserten (sTLD)
und nicht gesponserten (uTLD) unterschieden. Die (sehr viel
wichtigeren) nichtgesponserten Domains stehen unter der direkten
Kontrolle von ICANN und der Internet
Society. Die gesponserten
Domains werden von unabhängigen Organisationen kontrolliert und
finanziert. Diese Organisationen haben das Recht, eigene Richtlinien
für die Vergabe von Domainnamen anzuwenden. Ein Beispiel ist .mil.
Diese Domain wird vom US-amerikanischen Militär exklusiv genutzt.
Die mit großem
Abstand meist gebrauchte TLD ist .com. Ursprünglich wurde sie
von US-amerikanischen Firmen und Organisationen verwendet, heute ist
sie aber weltweit verbreitet. Die klassischen [1], in der Anfangsphase des DNS definierten
TLDs sind in Fettschrift dargestellt.
Nichtgesponserte Domains (uTLD)
Nichtgesponserte
Top Level Domains (engl. unsponsored top-level domain, uTLD) werden von
einer bestimmten Gruppe verwendet. Sie bestehen aus drei oder mehr
Zeichen und stehen für einen Begriff, der diese Gruppe auszeichnet.
Textlinktausch
aus
Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Linktausch)
Ein
Textlinktausch ist die Verknüpfung zweier Internetseiten untereinander,
die einen normalen, textbasierten HTML-Hyperlink verwenden. Als Linkpartner werden die beteiligten Webseiten
bezeichnet.
Der Begriff
Linkpartner kann nach einem Beschluss des Deutschen Patent- und
Markenamtes nicht als Marke geschützt werden, da er allgemein
beschreibend ist.
Ziele
Ein Textlinktausch hat das
Ziel, neue Besucherströme von der verlinkenden Seite auf Werbeseite zu
ziehen. Darüber hinaus wird die Methode für die Suchmaschinenoptimierung benutzt. Der Link dient dann zur Verbesserung der
Platzierung der verlinkten Webseite in den Suchergebnissen. Diese
ergibt sich aus der Funktionsweise von Suchmaschinen. Suchmaschinen
suchen Internetseiten nach Links ab, um auf diese Weise zum einem die
Anzahl der eingehenden Links auf eine bestimmte Seite zu ermitteln,
gleichzeitig aber auch die Linktexte mit dem Inhalt der Zielseite abzugleichen. Dieses Prinzip
der Linkpopularität hat das Ziel, die Wichtigkeit einer Seite in einem
bestimmten Kontext (Suchanfrage) zu bewerten.
Arten
Es gibt mehrere
Formen des Linktausches. Der am einfachsten zu handhaben Typ ist der
reziproke Linktausch: In diesem Fall werden zwei Webseiten direkt
miteinander verlinkt. Bei so genannten Nicht-reziproken-Links verlinkt
Seite A zwar auf Seite B, aber Seite B im Gegenzug nicht direkt auf
Seite A, sondern auf eine dritte Seite C.
Entwicklung
Wurden anfänglich nur die
Anzahl der eingehenden Links durch die Suchmaschinen gezählt, wurden
die Verfahren der Suchmaschinen aufgrund des sich rasant entwickelnden Spam
kontinuierlich verfeinert. Neben der Mitbewertung der Linktexte, spielt
heute auch der Typ eine Rolle. So werden von Suchmaschinen oft
Reziproke-Links von Nicht-Reziproke-Links unterschieden, was den Tausch
von Links erschwert.
Tauschbörsen und
Artikelverzeichnisse
Zur Vereinfachung
des Textlinktausches existieren Tauschbörsen. Diese lassen sich in
manuell verwaltete und automatisierte Systeme sowie kommerzielle und
nicht-kommerzielle unterteilen. Linktauschprogramme verstoßen meistens
gegen die Richtlinien der Suchmaschinenbetreiber. Teilnehmer laufen
somit Gefahr, bei Suchmaschinen negativ eingestuft zu werden. Dennoch
wird Linktausch derzeit noch immer als effektives Mittel zur
Suchmaschinenoptimierung eingesetzt.
Inzwischen
werden auch Artikelverzeichnisse zur Generierung von Links verwendet. Hier werden Links gegen
Inhalte getauscht.
|