Wie Sie vielleicht mitbekommen haben, hat Giganews kürzlich ein Speicher-Upgrade angekündigt, das die Aufbewahrung von Binärdateien in den nächsten zwei Wochen auf 100 Tage erhöhen wird. Dies brachte mich zum Nachdenken darüber, wie die Aufbewahrung von verschiedenen Usenet-Servern gemessen und gemeldet wird.
Artikel auf einem Newsserver werden in der Regel nach dem Prinzip "first in / last out" gespeichert. Das bedeutet, dass jedes Mal, wenn ein neuer Artikel in ein Usenet-System eingestellt wird, der älteste Artikel gelöscht wird. Der älteste verfügbare Artikel auf einem Newsserver ist in der Regel das, was die Aufbewahrungsfrist eines Newsservers definiert.
Einige Usenet-Systeme wenden diese "first in / last out"-Regel auch auf der Grundlage der Hierarchie an.
Auf Giganews laufen zum Beispiel keine Textartikel ab, so dass unsere Textaufbewahrung 1300+ Tage beträgt. Die Aufbewahrungszeit für Binärdateien (basierend auf dem verfügbaren Speicherplatz) beträgt 100 Tage. Das bedeutet, dass es 100 Tage dauert, bis ein Newsgroup-Artikel in den Binärhierarchien von unseren Servern gelöscht wird.
Wenn Sie über die Vorratsspeicherung eines Newsservers diskutieren, sollten Sie genau wissen, auf welche Hierarchie Sie sich beziehen. Wenn Sie sehen, dass sich jemand auf die Beibehaltung eines Newsservers auf der Grundlage von Texthierarchien bezieht, dann ist es wahrscheinlich, dass derjenige beschönigt, um den Newsserver besser erscheinen zu lassen. In Wirklichkeit ist die Speicherung in den anspruchsvolleren Binärhierarchien wahrscheinlich viel geringer.
Es gibt nicht nur Leute, die die Textspeicherung benutzen, um die Qualität eines Newsservers zu beschönigen, sondern es gibt auch Usenet-Systeme mit hohen Speicherungsraten in nur einer Handvoll Newsgroups. Wenn wir unsere einfache Definition von Vorratsspeicherung verwenden - "der älteste verfügbare Artikel auf einem Newsserver" - dann wäre dies eine genaue Beschreibung der Vorratsspeicherung dieses Newsservers. Natürlich werden die meisten Leute nicht nur in einer Handvoll Newsgroups eine lange Speicherungszeit haben wollen, so dass man dies als irreführend ansehen könnte. Viele Leute melden sich bei Giganews an, nachdem sie andere Usenet-Server benutzt haben, die zwar mit hohen Speicherungsraten werben, diese aber nur in einigen wenigen Newsgroups bieten.
Der letzte Punkt, auf den man achten sollte, wenn man versucht, die Verweildauer zu messen, sind "ungültige Datumsüberschriften". In einigen Newsgroups enthalten die Kopfzeilen bestimmter Artikel das falsche Datum. Am Anfang dieses Beitrags habe ich gesagt, dass die meisten Newsserver eine "First in / Last out"-Regel für Newsgruppen anwenden und dass der älteste Artikel auf einem Newsserver die Aufbewahrungsfrist bestimmt. Was ich nicht erwähnt habe, ist, daß die "first in / last out"-Regel auf Artikelnummern basiert (Nummer, die einem Artikel zugewiesen wird, je nachdem, wann er gepostet wird) und nicht auf dem Datum, das in den Kopfzeilen angezeigt wird. Das bedeutet, dass ein Artikel mit einem Datum in der Kopfzeile, das älter ist als die Aufbewahrungsfrist des Newsservers, immer noch in der Newsgruppe erscheinen kann, da er nicht aufgrund seiner Artikelnummer gelöscht wurde.
Das beste Maß für die Vorhaltezeit eines Newsservers ist das Datum des ältesten Artikels in *vielen* beliebten binären Newsgroups. Dies gibt Ihnen in der Regel den besten Eindruck von der Vorhaltezeit des Newsservers. Wenn Sie feststellen, dass einige Gruppen eine längere Aufbewahrungszeit als üblich haben, wählt der Newsserver entweder bestimmte Newsgruppen aus, um die Gesamtaufbewahrungszeit falsch darzustellen, oder es gibt einen Artikel mit einem ungültigen Datumsvorsatz.
Anonym sagt
Hi there,
I bet and predict that by end of the year 2007, Giganews will offer 180+ days of binary retention 🙂
That’s 6+ months, really cool ^^
best regards,
iNsuRRecTiON
Anonym sagt
Many companies are able to claim higher retention rates, (is it really that important to have headers older than 90 days?! If you haven’t found what you need in 90 days, odds are you don’t really need it!), by restricting the amount of posts made to certain binary groups and by basically censoring the groups by which posts are allowed to be retained at all. Hopefully this isn’t happening at Giganews and that the sudden reduction of headers in certain binary groups since the end of January is only coincidental and caused by some other anomalous action…
Anonym sagt
Dieser Kommentar wurde von einem Blog-Administrator entfernt.
Anonym sagt
I don’t think there are any upper limit to where retention becomes excessive. If I want to find something I have double the chances if the retention is 180 days, compared to 90 days.
This may not be the correct assumption in all cases; but it seems quite logical if that which I’m trying to find is quite old.