Webkatalogportal-Live

Startseite Webkataloge Linkpartner
Blog
Erklärungen
Kontakt
Webkataloge PR 7, 8,9,10

Webkataloge PR 6

Webkataloge PR 5

Webkataloge PR 4

Webkataloge PR 3

Webkataloge PR 2

Webkataloge PR 1

Webkataloge PR 0

Webmaster Tools

Suchmaschinen

Eintragdienste

Blogs


Hier findet ihr hilfreiche Erklärungen


Webverzeichnis

aus Wikipedia, der freien Enzyklopädie

(Weitergeleitet von Webkatalog)

Als Webverzeichnis, oder Webkatalog, bezeichnet man eine Sammlung von Adressen von Webseiten im World Wide Web, die nach bestimmten Themen sortiert sind.

Aufgabe und Funktion

Webkatalog-Redaktionen leisten für Online-Quellen das, was Bibliotheken für Print-Medien übernehmen: Sie sammeln und sichten Informationen, entwickeln Taxonomien und katalogisieren ihre Sammlungen. Zu den gesammelten Quellen zählen dabei nicht nur ganze Websites oder Newsgroups, sondern zusätzlich auch einzelne Dokumente und Datenbankeinträge.

Über diese reine Bibliotheks-Funktion hinaus bieten Webverzeichnisse ihren Nutzern oft auch zusätzlichen Nutzen, wie

  • kurze Beschreibungen der einzelnen Kategorien und ihrer Inhalte,
  • Querverweise zu verwandten Themen,
  • Querverweise zu gleichen Themensammlungen in anderen Sprachen,
  • eine auf bestimmte Themen beschränkbare Suchfunktion.

Webverzeichnisse sind nicht so umfangreich wie die automatisch erstellten Verzeichnisse von Suchmaschinen. Durch ihre redaktionelle Kontrolle erreichen Webverzeichnisse jedoch im Durchschnitt eine höhere Qualität. Die Qualität eines Webverzeichnisses hängt immer stark von seiner Redaktion ab.

Betreiber kommerzieller Webseiten bemühen sich um Einträge in Webverzeichnisse, um Besucher zu ihren Angeboten zu führen und – was für die Suchmaschinen-Optimierung von Bedeutung ist – die Zahl der bei ihnen eingehenden Links zu erhöhen. Kommerzielle Webverzeichnisse bieten eine Eintragung gegen Bezahlung an, die in der Regel zeitlich begrenzt ist. Verzeichnisse, bei denen kommerzielle Interessen im Vordergrund stehen, erweisen sich jedoch für Nutzer, der nach Informationen sucht, meist als wenig hilfreich.

Arten von Webkatalogen

Diese meisten heute bekannten Webkataloge werden manuell gepflegt, das heißt: Alle Einträge werden von Menschen gesichtet, geprüft und katalogisiert. Auf diese Art wird eine Qualität der Sammlung sichergestellt, welche mit einem automatisierten Prozess nicht zu erreichen wäre. Problematisch bei dieser Methode ist jedoch der hohe Aufwand und damit der große Bedarf an Mitarbeitern, um ein umfassendes und aktuelles Verzeichnis gewährleisten zu können. Oft beschränken sich manuell erstellte Verzeichnisse deshalb auf kleine, eng abgegrenzte Themengebiete. Bekannte Ausnahmen bilden der Yahoo-Katalog oder das Open Directory Project.

Ein anderer Ansatz zur Organisation von Linksammlungen besteht in der Bildung von Ad-hoc-Kategorien aus Suchbegriffen. Diese automatisch generierten Kataloge enthalten wesentlich umfangreichere und aktuellere Inhalte. In ihrer Qualität erreichen sie aber heute noch nicht das Niveau, welches bei der manuellen Sortierung besteht. Ein bekanntes Beispiel für Ad-hoc-Katalogisierung ist der WiseGuide des Suchdienstes WiseNut.

Weiterhin kann unterteilt werden in hierarchische und nichthierarchische Webverzeichnisse. In hierarchischen Verzeichnissen werden Kategorien von Einträgen und oft die Einträge der Verzeichnisse selbst in einer eindeutigen Ordnung sortiert. Ein Eintrag befindet sich dabei oft nur in einer bestimmten Kategorie, was ihn schwer auffindbar macht. Ein Beispiel für ein sehr hierarchisches Webverzeichnis ist das Open Directory Project. Nichthierarchische Verzeichnisse bestehen dagegen aus einer Netzwerkartigen Struktur, mit deren Knoten die Einträge (Links) verknüpft werden. Dadurch sind die Einträge und Kategorien leichter zu finden, eine assoziative Suche ist eher möglich.

Schließlich lässt sich zwischen kommerziellen und hauptsächlich nichtkommerziellen Webverzeichnissen unterscheiden. Durch das Geschäftsmodell vieler Webverzeichnisbetreiber besteht besonders bei ersteren die Gefahr einer eingeschränkten Objektivität: Die Erhöhung der Ranghöhe in einem Verzeichnis für die eigene Webseite wird zur offiziell angebotenen Dienstleistung (Beispiele siehe unten Liste von Webverzeichnissen). Der Benutzer kann kaum unterscheiden, welche Suchergebnisse (Katalogeinträge) sich einen hohen Rang durch hohe Relevanz "verdient" haben und bei welchen ein hoher Rang "erkauft" wurde. Hier verschwimmt die traditionelle Grenze von Publikationen zwischen redaktionellem Teil einerseits und Anzeigenteil andererseits.

Rückverweis,Backlink

aus Wikipedia, der freien Enzyklopädie

(Weitergeleitet von Backlink)

Ein Rückverweis (Backlink) auf einer Webseite ist ein Link, der auf eine andere Seite zeigt (siehe auch Trackback). Diese Seite hat dadurch einen Rückverweis. In vielen Suchmaschinen wird die Anzahl der Backlinks als Indiz für die Linkpopularität oder Wichtigkeit der Webseite verwendet; Googles PageRank-Algorithmus ist ein Beispiel hierfür.

Auf die Backlinks hat der Betreiber der Webseite in der Regel keinen direkten Einfluss (vgl. dazu Referrer-Spam), obwohl oft Methoden der Linksammlung wie beispielsweise des Textlinktausch angewendet werden. Das Aufspüren der Backlinks erfolgt mit Hilfe von Suchmaschinen oder durch Auslesen der Referrer bei der Logdateianalyse. Werten die Suchmaschinen auch die Linktexte der Backlinks als Suchbegriffe, kann diese Eigenschaft durch eine so genannte Google-Bombe missbraucht werden

Webbrowser

aus Wikipedia, der freien Enzyklopädie

Webbrowser (oder allgemein auch Browser genannt) [ˈbɹaʊ̯zə˞] (engl. für „Durchstöberer“, „Blätterer“) sind spezielle Computerprogramme zum Betrachten von Webseiten im World Wide Web. Das Durchstöbern des World Wide Webs respektive das aufeinanderfolgende Abrufen beliebiger Hyperlinks als Verbindung zwischen Webseiten mit Hilfe solch eines Programms wird auch als Internetsurfen bezeichnet. Neben HTML-Seiten können sie verschiedene andere Arten von Dokumenten anzeigen. Webbrowser stellen die Benutzeroberfläche für Webanwendungen dar.

Browser und Webbrowser

Im allgemeinen sind Browser spezielle Computerprogramme, mit denen sich Textdateien betrachten bzw. lesen lassen.

Ursprünglich bezeichnete der aus dem Englischen entlehnte Begriff browsen (engl. to browse „stöbern, sich umsehen, schmökern“) am Computer lediglich das Nutzen von Navigationselementen (Vor, Zurück, Index etc.) zum Lesen von Texten bzw. Textdateien. Erweitert wurde dieser Begriff später durch das Aufkommen von Hypertext, bei dem man bestimmte, als Querverweis (auch „Hyperlinks“ genannt) wirkende Wörter auswählen kann, um zu einem anderen Text zu gelangen. Später kamen dann Funktionen zur Anzeige von Bildern dazu und auch sogenannte verweissensitive Grafiken, bei denen man auf einer Computergrafik einen Bereich (zum Beispiel bei einer Weltkarte) anklickt und dadurch zu einer verlinkten Textseite (zum Beispiel über ein bestimmtes Land) gelangt.

Mit dem fortschreitenden Trend zum Internet und später Multimedia wurde der Webbrowser immer mehr generalisiert und somit eine zentrale Anwendersoftware auf einem heute üblichen PC. Moderne Webbrowser können auch verschiedene Medien abspielen, wie etwa Musik oder Radio. Zudem lassen sich damit Programme oder Dateien auf den PC laden (herunterladen), um sie dort zu speichern und gegebenenfalls zu einem späteren Zeitpunkt zu öffnen oder auszuführen. Insbesondere die Verbreitung von Breitband-Internetzugängen förderte diese zentralen Funktionen heutiger Webbrowser. Somit verschwimmt zunehmend auch der Unterschied zu einem Dateimanager, der ursprünglich ausschließlich zum Öffnen, Kopieren oder Löschen von Dateien verwendet wurde. Viele Dateimanager haben heute auch Browser-Funktionen (Datei-Browser) und können so auch zum Anzeigen von Dokumenten verwendet werden.

Aufgrund ihrer großen Verbreitung haben Webbrowser eine wichtige Funktion als sog. Thin Clients (Präsentationsschicht) von Webanwendungen.

Webbrowser beherrschen neben HTTP auch weitere Protokolle der Anwendungsschicht des TCP/IP-Referenzmodells, z. B. FTP und Gopher. Einige Webbrowser haben auch Funktionen für E-Mail, Usenet oder BitTorrent. Andere decken diese Funktionen durch externe Programme ab.

Die gemeinsame Navigation durch das Internet oder Web, z. B. über synchronisierte Webbrowser, wird auch Cobrowsing genannt.

Benutzung eines Webbrowsers für Tätigkeiten am lokalen Computer, wie Administration [Bearbeiten]

Beispiel: Unter UNIX-artigen Systemen lässt sich z. B. das Drucksystem CUPS mit dem Webbrowser administrieren, die Adresse ist meist http:// localhost:631. Es funktioniert, egal ob auf dem Computer ein Webserver installiert ist oder nicht.

Der Vorteil ist, dass die Softwareentwickler nicht die Oberfläche erfinden mussten, sie mussten nur ihr Programm, hier im Beispiel CUPS, dazu bringen, richtig, d. h. gemäß dem HTTP-Protokoll, mit dem Webbrowser zu "reden".

Tim Berners-Lee, ein Pionier der Verwendung von Hypertext, schuf 1990 den ersten Webbrowser unter dem Namen WorldWideWeb (später Nexus) auf einer NeXT-Workstation und präsentierte im März 1991 dieses Programm am CERN.

Große Verbreitung fanden Browser wie der NCSA Mosaic, ein Browser mit grafischer Benutzeroberfläche (GUI), der ursprünglich auf Unix lief, aber bald schon auf Apple Macintosh und Microsoft Windows portiert wurde. Die Version 1.0 von Mosaic erschien 1993.

Netscape

Marc Andreessen, der Mosaics Entwicklerteam leitete, gründete kurz danach die Netscape Communications Corporation. Netscape brachte seinen Navigator im Oktober 1994 auf den Markt. Er war der erste Web-Browser, der in der Lage war, außer Text auch Grafiken anzuzeigen. Für einige Jahre war der Netscape-Browser Marktführer.

Am 1. März 2008 wurde der Netscape Navigator „zu Grabe getragen“. Zwar wird der Browser auch dann noch zum Download zur Verfügung stehen, jegliche Weiterentwicklung und der Support wurden jedoch eingestellt.

Microsoft Internet Explorer

Aufgrund des Erfolgs des Navigators brachte Microsoft, das bis dahin das Internet unterschätzt hatte, 1995 seinen Internet Explorer heraus, der nicht selbst entwickelt, sondern von der Firma Spyglass (NCSA Mosaic) eingekauft worden war. Das war der Beginn des sogenannten Browserkriegs zwischen Microsoft und Netscape. Eine Folge des Browserkriegs war es, dass Browser sich stark verbreiteten, während andererseits die Konkurrenz zwischen Microsoft und Netscape dazu führte, dass die beiden Firmen in ihrem Wettkampf um Marktanteile eine Vielzahl selbsterfundener Erweiterungen in ihre Programme integrierten, die vom jeweiligen Konkurrenzprodukt zunächst nicht unterstützt wurden. Dadurch wurde insgesamt die Verbreitung technischer Standards für Browser in Mitleidenschaft gezogen.

Mozilla

Ab 1998 ging der Marktanteil von Netscape deutlich zurück – auch weil Microsoft dazu überging, den Internet Explorer eng mit dem eigenen Betriebssystem Microsoft Windows zu verzahnen. In den folgenden Jahren wurde Microsoft mit einem Marktanteil von über 90 Prozent annähernd zum Monopolisten auf dem Browsermarkt.

Netscape reagierte darauf, indem es sich zu einem quelloffenen Projekt veränderte – unter dem Namen Mozilla, welches parallel zur Netscape-Entwicklung betrieben wurde, wobei sich die Projekte gegenseitig mit Ideen und Technologien ergänzten. Dennoch ging der Marktanteil von Netscape weiter zurück, bis das Unternehmen Ende 1998 von America Online (AOL) aufgekauft wurde. Neue Versionen von Netscape (Netscape 6.0, Netscape 7.0) hatten nur bescheidenen Erfolg. Insbesondere Netscape 6.0 wurde durch deutliche Mängel und eine hiermit verbundene geringe Benutzerfreundlichkeit zu einem Fehlschlag.

Seit 2002 gewinnt der Mozilla-Browser allmählich Marktanteile zurück, vor allem durch technische Vorzüge und durch Vorteile bei der Bedienung und der Sicherheit. Dies wird unter anderem dadurch erreicht, dass der Browser in einem eigenen Speicherbereich des Arbeitsspeichers läuft, der keinen direkten Zugriff auf das Dateisystem des Host-Systems hat. Der Nachfolger des Mozilla-Browsers, Firefox, wurde noch weiter verbessert und zeichnet sich, neben den bereits genannten Vorzügen des Mozilla-Browsers, vor allem durch seine verglichen mit dem Internet Explorer hohe Geschwindigkeit aus. Da Firefox ein reiner Webbrowser ist, wird er durch den E-Mail-Client Thunderbird ergänzt, während Mozilla noch einen integrierten E-Mail-Client besaß. Die Versionen 1.0 von Firefox und Thunderbird erschienen nach einer längeren Betaphase im Dezember 2004. Verschiedenen Quellen zufolge hat Mozilla bis Anfang 2007 einen Marktanteil von 20 bis 30% erobert, wobei starke nationale Schwankungen auftreten.

Die Mozilla-Suite wird nicht mehr weiterentwickelt. Es gibt jedoch ein Nachfolgeprojekt mit dem Namen „SeaMonkey“, das von einem freien Entwicklerteam unter dem Dach der Mozilla Foundation weiterentwickelt wird. - In diesem „Sea Monkey“ ist immer noch der Netscape Composer enthalten, eine freie Software zum Erstellen von HTML-Seiten.

Die letzte Version des Mozilla-Browsers lässt sich noch immer herunterladen.

Safari

Der Safari-Browser ist ein Browser der Firma Apple. Dieser noch recht neue Browser wurde im Januar 2003 zum ersten mal veröffentlicht und ist seit MacOS-X Panther (10.3) der Standardbrowser, der den bis dahin genutzten Internet Explorer von Microsoft ersetzte. Der Rendering Engine Webkit liegt die KHTML-Bibliothek des KDE-Projekts zugrunde, welche von Apple an eigene Bedürfnisse angepasst wurde. Heute ist Safari einer der technisch fortschrittlichsten Browser auf dem Markt, welcher in verschiedenen Benchmarks als der schnellste hervorging. Zudem bestand Safari als erster Browser überhaupt den äußerst anspruchsvollen Acid2-Test. Seit Juni 2007 ist eine öffentliche Beta für Safari 3 zum ersten Mal auch für Windows XP/Vista verfügbar.

Opera

Der Browser Opera, eine kleine und anpassungsfähige Browser-Suite, erschien in der ersten Version 1996 und hat sich seither vor allem in Europa eine Nische gesichert. Opera zeichnet sich vor allem durch die Vielzahl seiner Funktionen aus: Neben den eigentlichen Internetfunktionen bietet er einen integrierten E-Mail-Client, Chatmodule, BitTorrent-Unterstützung und viele, oft einmalige Funktionen mehr. Auch ist er, verglichen mit Konkurrenzprodukten, sehr schlank und schnell. Darüber hinaus ist er für eine Vielzahl von Betriebssystemen und Benutzersprachen verfügbar. Außerdem war Opera einer der ersten Browser, die Tabs und einen PopUp-Blocker fest integriert hatten. Die Desktopversion enthält seit Version 8.50 (September 2005) keine Werbebanner mehr und ist somit Freeware.

Nintendos neue SpielkonsoleWii“ und der Nintendo DS verwenden den Opera-Browser, um Internetdienstleistungen anzubieten. Der Marktanteil von Opera liegt weltweit unter 1 %.

Browser-Arten

 

Man unterscheidet zwischen textbasierten und grafischen Browsern.

Textbasierte Browser können nur einfachen Text und Textformate wie HTML oder XML interpretieren und darstellen. Meist ermöglichen sie es, Computergrafik-Dokumente abzuspeichern oder mit externen Programmen darzustellen. Textbrowser sind besonders für Blinde nützlich, die das Internet barrierefrei nutzen wollen. Mit ihnen kann Text leicht in Sprache umgewandelt werden. Sie eignen sich besonders zur schnellen Recherche, da Bilder, Werbung u. ä. gar nicht geladen werden.

Beispiele für textbasierte Browser: Links, ELinks, Lynx und w3m. Opera kann einen Textbrowser emulieren

Grafische Browser setzen zumindest ein grafikfähiges Ausgabegerät voraus. Sie sind die meistverwendete Browser-Art und für alle Betriebssysteme mit einer grafischen Benutzeroberfläche (zum Beispiel Windows, Mac OS X oder Unix mit X11) verfügbar. Grafische Browser zeigen Inhalte wie Computergrafiken, Filme oder Java-Applets überwiegend selbst an oder benutzen dazu externe Bausteine, so genannte Plug-ins.

Manche Browser (wie Mozilla oder Opera) werden heute als Browser-Garnitur mit integrierten Funktionen für zum Beispiel E-Mail und Usenet ausgeliefert, andere (wie Internet Explorer und Konqueror) sind kombinierte Browser und Dateimanager. In den letzten Jahren hat eine Gegenbewegung eingesetzt, die sich für Browser ohne solche Zusatzfunktionen einsetzt, wie zum Beispiel Galeon und Firefox.

Moderne mobile Endgeräte (PDAs, Smartphones) verfügen ebenfalls über Browsersoftware, mit denen sie das World Wide Web benutzen können.

Microsofts Internet Explorer hat z.Z eine herausragende Marktstellung. Die größten Konkurrenten zu diesem sind derzeit das Mozilla-Projekt (Mozilla Application Suite, Firefox und Camino), Opera Software ASA (Opera), KDE (Konqueror) und Apple (Safari).

Zwischenspeicherung von Internetdateien

Der Browser speichert gegebenenfalls für einen begrenzten Zeitraum Seiten und Bilder auf der Festplatte des eigenen Arbeitsplatzes und/oder dem Arbeitsspeicher zwischen, um die Übertragungsleitung von Datenverkehr zu entlasten und den Seitenaufbau zu beschleunigen. Dabei sind meistens benutzerspezifische Einstellungen möglich, wann diese Daten letztendlich gelöscht werden sollen. Ein Nachteil dieses Verfahrens ist, dass unter Umständen nicht die aktuelle Fassung einer gewünschten Seite angezeigt wird. Es gibt jedoch bei allen Browsern (Tastatur-) Befehle, um die zwischengespeicherten Seiten und Bilder zu löschen und eine aktuelle Fassung der angezeigten Seite zu laden.

Manche Browser verzichten aus Gründen der Privatsphäre auch komplett auf die Zwischenspeicherung auf der lokalen Festplatte (bspw. APPOX-Browser). Browser wie Internet Explorer, Firefox und Safari haben Funktionen, mit den sich ein solcher Modus ein- und ausschalten lässt.

E-Mail

aus Wikipedia, der freien Enzyklopädie

Die (auch das) E-Mail [ˈiːmeɪl] (von engl.: „electronic mail“; zu dt.: „die elektronische Post“ oder „der elektronische Brief“; kurz auch Mail genannt) bezeichnet eine auf elektronischem Weg in Computernetzwerken übertragene, briefartige Nachricht. Eindeutschungen wie „E-Brief“, „E-Post“ oder „Netzbrief“ sind weniger verbreitet.

E-Mail wird – noch vor dem World Wide Web – als wichtigster und meistgenutzter Dienst des Internets angesehen. Allerdings ist seit ca. 2002 über die Hälfte des weltweiten E-Mail-Aufkommens auf Spam zurückzuführen.

Hyperlink

aus Wikipedia, der freien Enzyklopädie

Als Hyperlink [ˈhaɪpɚlɪŋk], auch kurz Link (engl. für Verknüpfung, Verbindung, Verweis), bezeichnet man einen Verweis auf ein anderes Dokument innerhalb eines Hypertextes, der automatisch durch das „Hypertextsystem“ verfolgt werden kann.

Der Begriff wird meist auf das World Wide Web bezogen.

Das Konzept von Hyperlinks entspricht funktional dem Querverweis oder der Fußnote aus der konventionellen Literatur, bei der das Ziel des Verweises allerdings in der Regel manuell aufgesucht werden muss.

Man spricht von einem verlinktem Dokument, wenn es mindestens einen Hyperlink enthält, der auf ein Drittes gerichtet ist.

Link

aus Wikipedia, der freien Enzyklopädie

Link ist ein mit dem deutschen Wort "Gelenk" verwandtes Lehnwort aus dem Englischen (engl. link "Kettenglied, Verbindungsglied"), das im Deutschen ursprünglich als Neutrum aufgefasst wurde ("das Missing Link", "das Link" als Längenmaß), bei der erneuten Entlehnung in die deutsche Fach- und Umgangssprache des Computerwesens dort aber zumeist als Maskulinum aufgefasst wurde ("der Hyperlink" neben "das Hyperlink") und auch im Duden für die computersprachliche Verwendung nur noch in der männlichen Form aufgeführt wird.

Link steht für:

  • Hyperlink, eine Verknüpfung aus einem Webdokument zu einem anderen
  • Dateiverknüpfung, in Betriebssystemen ein Verweis auf eine Datei
  • Link (Kommunikationstechnik), automatisierte Inter-Rechner Verbindung
  • Link (Einheit), eine Maßeinheit der Länge

PageRank

aus Wikipedia, der freien Enzyklopädie

Der PageRank-Algorithmus ist ein Verfahren, eine Menge verlinkter Dokumente, wie beispielsweise das World Wide Web, anhand ihrer Struktur zu bewerten bzw. zu gewichten. Dabei wird jedem Element ein Gewicht, der PageRank, aufgrund seiner Verlinkungsstruktur zugeordnet. Der Algorithmus wurde von Larry Page (daher der Name PageRank) und Sergey Brin an der Stanford University entwickelt und von dieser zum Patent angemeldet[1]. Er diente dem von Brin und Page gegründeten Unternehmen Google als Grundlage für die Bewertung von Seiten.

Der PageRank-Algorithmus ist eine spezielle Methode, die Linkpopularität einer Seite bzw. eines Dokumentes festzulegen. Das Grundprinzip lautet: Je mehr Links auf eine Seite verweisen, umso höher ist das Gewicht dieser Seite. Je höher das Gewicht der verweisenden Seiten ist, desto größer ist der Effekt. Der PageRank-Algorithmus bildet einen zufällig durch das Netz surfenden User nach. Die Wahrscheinlichkeit, mit der dieser auf eine Webseite stößt, korreliert mit dem PageRank.

Der PageRank-Algorithmus

Das Prinzip des PageRank-Algorithmus ist, dass jede Seite ein Gewicht (PageRank) besitzt, das umso größer ist, je mehr Seiten (mit möglichst hohem eigenem Gewicht) auf diese Seite verweisen. Das Gewicht PRi einer Seite i berechnet sich also aus den Gewichten PRj der auf i verlinkenden Seiten j. Verlinkt j auf insgesamt Cj verschiedene Seiten, so wird das Gewicht von PRj anteilig auf diese Seiten aufgeteilt. Folgende rekursive Formel kann als Definition des PageRank-Algorithmus angesehen werden:

P\!R_i = \frac {1-d} {N} + d \, \sum_{\forall j \in \{(j,i)\}} {\frac {P\!R_j} {C_j}}

Dabei ist N die Gesamtanzahl der Seiten und d ein Dämpfungsfaktor zwischen 0 und 1, mit dem ein kleiner Anteil des Gewichts (1 − d) einer jeden Seite abgezogen und gleichmäßig auf alle vom Algorithmus erfassten Seiten verteilt wird. Dies ist notwendig, damit das Gewicht nicht zu Seiten „abfließt“, die auf keine andere Seite verweisen. Oft wird die obige Formel auch ohne den Normierungsfaktor 1 / N angegeben.

Die Gleichung kann sowohl als Eigenvektorproblem der Matrix

M_{\mathrm{EV} \,ij} = \frac {1-d} {N} + d \, T_{ij} \ ,
T_{ij} = \begin{cases} 1 / C_j, & \mbox{falls Seite }j\mbox{ zu Seite }i\mbox{ linkt} \\ 0, & \mbox{sonst} \end{cases}

als auch (für d < 1) als Lösung des linearen Gleichungssystems

M_{ij}\, P\!R_j = \frac {1-d} {N}

mit

M_{ij} = \delta_{ij} - d \, T_{ij}

interpretiert werden, wobei δij das Kronecker-Delta bezeichnet. Die Lösung des linearen Gleichungssystems

P\!R_i = \frac {1-d} {N} \sum_j {M^{-1}}_{ij}

kann analytisch oder numerisch erfolgen. Für d < 1 ist die Lösung des Gleichungssystems eindeutig. Durch Verwendung der Jacobi-Iteration zur numerischen Lösung ergibt sich obige rekursive Gleichung. Andere numerische Verfahren zur Matrixinvertierung, wie das Minimale-Residuum-Verfahren oder die Gauss-Seidel-Methode, konvergieren jedoch in der Regel schneller.

Der heute von Google verwendete Algorithmus hat vermutlich nicht mehr exakt diese Form, geht aber auf diese Formel zurück. Alternative Algorithmen sind das Verfahren der Hubs und Authorities von Jon Kleinberg, der Hilltop- und der TrustRank-Algorithmus.

Zufallssurfer-Modell

Normiert man den PageRank auf 1, so kann man das Gewicht einer Seite als Wahrscheinlichkeit interpretieren, dass ein zufälliger Surfer (siehe Zufallspfad) sich auf dieser Seite befindet. Ein zufälliger Surfer bewegt sich durch das Netz, indem er mit der Wahrscheinlichkeit d zufällig einen der ausgehenden Links der aktuellen Seite wählt. Mit Wahrscheinlichkeit 1 − d wählt er eine beliebige neue Seite. Um Probleme mit Seiten ohne ausgehende Links zu vermeiden, können bei diesen Links zu allen vorhandenen Seiten hinzugefügt werden.

Toolbar- und Verzeichnis-Werte

Informationen über den PageRank lassen sich aus der Google-Toolbar und dem Google-Verzeichnis entnehmen. Der von Google in der Toolbar angezeigte PageRank liegt zwischen 0 und 10, der Wert im Verzeichnis zwischen 0 und 7. Beide Werte bilden den realen PageRank auf einer logarithmischen Skala ab und geben das Ergebnis als gerundeten ganzzahligen Wert wieder.

Der in der Google-Toolbar angezeigte PageRank wurde früher alle dreißig Tage aktualisiert. Inzwischen ist das Intervall zwischen den Updates angestiegen, auf teilweise mehr als hundert Tage.

Manipulation

Aufgrund der wirtschaftlichen Bedeutung ist es inzwischen zu gezielten Manipulationen und Fälschungen gekommen. So wurde dieses sinnvolle System in der Praxis von Suchmaschinenoptimierern durch Spamming in Gästebüchern, Blogs und Foren, dem Betreiben von Linkfarmen und anderen unseriösen Methoden unterlaufen. Durch Weiterleitung auf bestehende Seiten mit hohem PageRank wird gezielt versucht, den PageRank-Algorithmus zu manipulieren.

Anfang 2005 implementierte Google mit rel="nofollow" ein neues Attribut für Verweise, als Versuch, gegen Spam vorzugehen. Links, die mit diesem Attribut versehen werden, werden nicht für die PageRank-Berechnung berücksichtigt. Durch Kennzeichnung ausgehender Links kann so beispielsweise dem Gästebuch-, Blog- und Forum-Spamming entgegengewirkt werden. Allerdings ist diese Methode umstritten.

Server

aus Wikipedia, der freien Enzyklopädie

Definitionen

  • Der Begriff Server (engl.: to serve = bedienen) bezeichnet entweder eine Software (Programm) im Rahmen des Client-Server-Konzepts; oder eine Hardware[1][2] (Computer), auf der diese Software (Programm) im Rahmen dieses Konzepts abläuft.
  • Ein Server (Software) ist ein Programm, das mit einem anderen Programm, dem Client (engl. = Kunde), kommuniziert, um ihm Zugang zu speziellen Dienstleistungen (genannt Dienste) zu verschaffen.
  • Ein Server (Hardware) ist ein Computer, auf dem ein oder mehrere Server (Software) laufen.

Für die Server (Hardware) wird in der Fachsprache der Begriff Host benutzt. Für den Server als Software-Begriff gibt es keine weitere Bezeichnung. Ob es sich bei einem Server um einen Host oder um einen Server (Software) handelt, ist daher nur aus dem Kontext oder mit Hintergrundwissen erkennbar.

Die Aspekte des Servers als Software sind im Artikel Server (Software) beschrieben, die der Servers als Hardware finden sich im Artikel Host (Informationstechnik).

Der Mehrdeutigkeit des Begriffs Server wird im folgenden Abschnitt weiter erklärt und erläutert.

Domain

aus Wikipedia, der freien Enzyklopädie

Wechseln zu: Navigation, Suche

schematische Darstellung der DNS-Hierarchie

schematische Darstellung der DNS-Hierarchie

Eine Domain im Internet ist ein zusammenhängender Teilbereich des hierarchischen DNS-Namensraumes. Zum Wortursprung siehe Domäne, vergleiche auch Domäne in lokalen Netzen.

Aufbau

Die gesamte Darstellung des DNS-Namensraumes erfolgt als Wurzelbaum (siehe Graphentheorie und Beispiele). Jeder Knoten besitzt einen Namen (Label genannt), der ohne die Angabe eines vollständigen (Fully Qualified) Namens nicht eindeutig ist. So lässt sich beispielsweise die Position des Knotens wikipedia nicht eindeutig bestimmen, da dieser Knotenname zum einen unter wikipedia.org und zum anderen unter wikipedia.de auftaucht.

Jeder Domain-Name besteht aus mehreren Teilen, den sogenannten Labels, die durch Punkte voneinander getrennt sind.

Der ganz rechts stehende Knotenname (Label) steht in der Hierarchie des Wurzelbaums am höchsten, der ganz linke Knotenname am niedrigsten. Die höchste Ebene in der DNS-Hierarchie hat dabei die sogenannte Root-Domain. Sie hat per Definition einen leeren Knotennamen (im Fachjargon: Null-Label).

Topologisch unterhalb bzw. im Name links der Root-Domain folgen der Knotenname einer Top Level Domains (TLD). Die Top Level Domain bezeichnet entweder das Land, in dem der Domain-Name registriert wurde (z. B. .at für Österreich, .de für Deutschland, .ch für Schweiz), einen Staatenverbund (z. B. .eu für die Europäische Union) oder einen Bereich des praktischen Lebens (z. B. .org, .com oder .biz). Topologisch unterhalb bzw. im Name links der Top Level Domain folgen die Knotennamen der sogenannten Second Level Domains, Third Level Domains usw.

Subdomain

Als Subdomain bezeichnet man eine Domain, welche in der Hierarchie unterhalb einer anderen liegt. Im allgemeinen Sprachgebrauch sind damit meist Domains in der dritten oder einer weiteren Ebene gemeint. Domains, die direkt unterhalb der Top-Level-Domain liegen, werden umgangssprachlich nicht als Subdomains, sondern als Second-Level-Domain oder nur Domain bezeichnet.

In obigem Beispiel gibt es die Top Level Domains de. und org.. Unter diesen Domains sind die Subdomains wikipedia.de. bzw. wikipedia.org. angesiedelt. Die Subdomains direkt unter einer TLD werden als Second Level Domains bezeichnet.

Jede Subdomain, also zum Beispiel wikipedia.org. als Subdomain der Top-Level-Domain .org oder de.wikipedia.org. als Subdomain von wikipedia.org., ist eigenständig wieder eine Domain, in der andere Domains und Hostnamen liegen können.

Anschauliches Beispiel: Um Peter Müller in Hamburg von Peter Müller in München unterscheiden zu können, gibt es Postleitzahl und Ort. Um zwei Peter Müller in Hamburg unterscheiden zu können gibt es Straße und Hausnummer (usw.). Diese Funktion übernimmt im Internet die Domain.

Zur logischen und physischen Trennung von Diensten innerhalb einer Second Level Domain werden traditionell Third Level Domains, z. B. www.wikipedia.de für den Webserver oder mail.wikipedia.de für den Mailserver, verwendet. Die historisch gewachsene Bezeichnung des Hostnamens www für einen Webserver entspricht keinem Standard und hat keine Bedeutung. Stattdessen könnte für den Aufruf des Webservers z. B. web oder einfach nur die Second-Level-Domain ohne einen Prefix herangezogen werden. Die funktionelle Bezeichnung von Hostnamen für Web-, Mail-, Jabber- oder FTP-Server ist nicht vorgegeben und kann frei gewählt werden.

Vorteile von Subdomains

Es gibt verschiedene Gründe für den Einsatz von Subdomains.

Logische Gliederung [Bearbeiten]

Wird zum Beispiel für verteilte Filialen oder Abteilungen einer Firma verwendet, für eigenständige Web-Auftritte wie bei de.wikipedia.org, en.wikipedia.org, … oder um E-Mails an Filialen mit eigenem Mailserver zu leiten.

Eine Subdomain zu diesem Zweck anzulegen ist nur sinnvoll, wenn die entstandenen Domainnamen unterschiedliche Zielseiten oder Server verwenden, zum Beispiel mail.extern.wikipedia.de und ftp.extern.wikipedia.de.

Andererseits kann man auch Subdomains anlegen, um so auf bestimmte Abteilungen und Bereiche innerhalb einer Firma oder Organisation weiterzuleiten. Beispiele für eine Subdomain zur Weiterleitung an einzelne Bereiche oder Standorte einer Firma und/oder Organisation:

Top-Level-Domain

aus Wikipedia, der freien Enzyklopädie

Jeder Name einer Domain im Internet besteht aus einer Folge von durch Punkte getrennten Zeichen. Die Bezeichnung Top-Level-Domain (vom englischen top level domain, übersetzt Bereich oberster Ebene; Abkürzung TLD) bezeichnet dabei den letzten Namen dieser Folge und stellt die höchste Ebene der Namensauflösung dar. Ist der vollständige Domain-Name eines Rechners bzw. einer Website beispielsweise de.wikipedia.org, so entspricht das rechte Glied (org) der Top-Level-Domain dieses Namens.

Im so genannten Domain Name System (DNS) werden die kompletten Namen und damit auch die TLDs referenziert und aufgelöst, also einer eindeutigen IP-Adresse zugeordnet. Die Registrierungsstelle legt dabei einen Datenbank-Eintrag über den Inhaber an, der Whois-Abfragen über das gleichnamige Protokoll, ähnlich einem Telefonbuch, ermöglicht.

TLDs werden von der IANA in zwei Hauptgruppen und einen Sonderfall unterteilt:

  • allgemeine TLDs: generic TLDs (gTLDs), unterteilt in sponsored TLDs (sTLDs) und unsponsored TLSs (uTLDs)
  • länderspezifische TLDs: country-code TLDs oder ccTLDs
  • die Infrastruktur-TLD (iTLD) .arpa (Sonderfall) und das (jedoch nie in Gebrauch gewesene) .root

Nicht mehr in Gebrauch sind die Sonderfälle .bitnet und .uucp.

Länderspezifische TLD-Bezeichner bestehen dabei immer aus zwei Buchstaben, allgemeine TLD-Bezeichner bestehen aus drei oder mehr Buchstaben.

Generische Top-Level-Domains

Die generischen Top-Level-Domains (gTLD) werden nach gesponserten (sTLD) und nicht gesponserten (uTLD) unterschieden. Die (sehr viel wichtigeren) nichtgesponserten Domains stehen unter der direkten Kontrolle von ICANN und der Internet Society. Die gesponserten Domains werden von unabhängigen Organisationen kontrolliert und finanziert. Diese Organisationen haben das Recht, eigene Richtlinien für die Vergabe von Domainnamen anzuwenden. Ein Beispiel ist .mil. Diese Domain wird vom US-amerikanischen Militär exklusiv genutzt.

Die mit großem Abstand meist gebrauchte TLD ist .com. Ursprünglich wurde sie von US-amerikanischen Firmen und Organisationen verwendet, heute ist sie aber weltweit verbreitet. Die klassischen [1], in der Anfangsphase des DNS definierten TLDs sind in Fettschrift dargestellt.

Nichtgesponserte Domains (uTLD)

Nichtgesponserte Top Level Domains (engl. unsponsored top-level domain, uTLD) werden von einer bestimmten Gruppe verwendet. Sie bestehen aus drei oder mehr Zeichen und stehen für einen Begriff, der diese Gruppe auszeichnet.


Textlinktausch

aus Wikipedia, der freien Enzyklopädie

(Weitergeleitet von Linktausch)

Ein Textlinktausch ist die Verknüpfung zweier Internetseiten untereinander, die einen normalen, textbasierten HTML-Hyperlink verwenden. Als Linkpartner werden die beteiligten Webseiten bezeichnet.

Der Begriff Linkpartner kann nach einem Beschluss des Deutschen Patent- und Markenamtes nicht als Marke geschützt werden, da er allgemein beschreibend ist.

Ziele

Ein Textlinktausch hat das Ziel, neue Besucherströme von der verlinkenden Seite auf Werbeseite zu ziehen. Darüber hinaus wird die Methode für die Suchmaschinenoptimierung benutzt. Der Link dient dann zur Verbesserung der Platzierung der verlinkten Webseite in den Suchergebnissen. Diese ergibt sich aus der Funktionsweise von Suchmaschinen. Suchmaschinen suchen Internetseiten nach Links ab, um auf diese Weise zum einem die Anzahl der eingehenden Links auf eine bestimmte Seite zu ermitteln, gleichzeitig aber auch die Linktexte mit dem Inhalt der Zielseite abzugleichen. Dieses Prinzip der Linkpopularität hat das Ziel, die Wichtigkeit einer Seite in einem bestimmten Kontext (Suchanfrage) zu bewerten.

Arten

Es gibt mehrere Formen des Linktausches. Der am einfachsten zu handhaben Typ ist der reziproke Linktausch: In diesem Fall werden zwei Webseiten direkt miteinander verlinkt. Bei so genannten Nicht-reziproken-Links verlinkt Seite A zwar auf Seite B, aber Seite B im Gegenzug nicht direkt auf Seite A, sondern auf eine dritte Seite C.

Entwicklung

Wurden anfänglich nur die Anzahl der eingehenden Links durch die Suchmaschinen gezählt, wurden die Verfahren der Suchmaschinen aufgrund des sich rasant entwickelnden Spam kontinuierlich verfeinert. Neben der Mitbewertung der Linktexte, spielt heute auch der Typ eine Rolle. So werden von Suchmaschinen oft Reziproke-Links von Nicht-Reziproke-Links unterschieden, was den Tausch von Links erschwert.

Tauschbörsen und Artikelverzeichnisse

Zur Vereinfachung des Textlinktausches existieren Tauschbörsen. Diese lassen sich in manuell verwaltete und automatisierte Systeme sowie kommerzielle und nicht-kommerzielle unterteilen. Linktauschprogramme verstoßen meistens gegen die Richtlinien der Suchmaschinenbetreiber. Teilnehmer laufen somit Gefahr, bei Suchmaschinen negativ eingestuft zu werden. Dennoch wird Linktausch derzeit noch immer als effektives Mittel zur Suchmaschinenoptimierung eingesetzt.

Inzwischen werden auch Artikelverzeichnisse zur Generierung von Links verwendet. Hier werden Links gegen Inhalte getauscht.