Comme vous l'avez peut-être vu, Giganews a récemment annoncé une mise à niveau du stockage qui portera notre rétention binaire à 100 jours au cours des deux prochaines semaines. Cela m'a fait réfléchir à la façon dont la rétention est mesurée et signalée par les différents serveurs Usenet.
Les articles sur un serveur de nouvelles sont généralement stockés "premier entré / dernier sorti". Cela signifie que chaque fois qu'un nouvel article est publié sur un système Usenet, l'article le plus ancien est supprimé. L'article le plus ancien disponible sur un serveur de nouvelles est généralement ce qui définit la rétention d'un serveur de nouvelles.
Certains systèmes Usenet appliquent également cette règle du "premier entré / dernier sorti" en fonction de la hiérarchie.
Par exemple, Giganews n'expire aucun article de texte, de sorte que notre rétention de texte est de 1300+ jours. Notre rétention binaire (basée sur le stockage disponible) est de 100 jours. Cela signifie qu'il faut 100 jours pour qu'un article de groupe de discussion disparaisse de nos serveurs dans les hiérarchies binaires.
Lorsque vous discutez de la rétention d'un serveur de nouvelles, assurez-vous de comprendre exactement la hiérarchie à laquelle vous faites référence. Si vous voyez des gens faire référence à la rétention d'un serveur de nouvelles en se basant sur des hiérarchies textuelles, il y a de fortes chances qu'ils embellissent la situation pour faire paraître le serveur de nouvelles meilleur. En réalité, leur rétention dans les hiérarchies binaires, plus difficiles, est probablement beaucoup plus faible.
Outre les personnes qui utilisent la rétention de texte pour embellir la qualité d'un serveur de nouvelles, vous verrez également certains systèmes Usenet afficher des taux de rétention élevés dans une poignée de groupes de discussion. Si nous utilisons notre définition simple de la rétention - "l'article le plus ancien disponible sur un serveur de nouvelles" - alors ce serait une description précise de la rétention de ce serveur de nouvelles. Bien sûr, la plupart des gens ne vont pas vouloir une longue rétention sur une poignée de groupes de discussion, et on peut donc considérer que cette description est trompeuse. De nombreuses personnes s'inscrivent sur Giganews après avoir utilisé d'autres serveurs Usenet qui annoncent des taux de rétention élevés mais qui ne fournissent ces taux de rétention que pour quelques groupes de discussion.
La dernière chose à laquelle il faut faire attention lorsqu'on essaie de mesurer la rétention est "les en-têtes de date invalides". Dans certains groupes de discussion, les en-têtes de certains articles contiennent une date incorrecte. Au début de ce billet, j'ai dit que la plupart des serveurs de nouvelles appliquent la règle du "premier entré / dernier sorti" aux groupes de discussion et que l'article le plus ancien sur un serveur de nouvelles définit sa rétention. Ce que je n'ai pas mentionné, c'est que la règle du "premier entré / dernier sorti" est basée sur les numéros d'article (numéro attribué à un article en fonction de sa date de publication) et non sur la date affichée dans les en-têtes. Cela signifie que si un article contient une date dans l'en-tête plus ancienne que la rétention du serveur de nouvelles, il peut encore apparaître dans le groupe de nouvelles parce qu'il n'a pas été purgé sur la base de son numéro d'article.
La meilleure mesure de la rétention d'un serveur de nouvelles est de regarder la date de l'article le plus ancien dans *nombre* de groupes de discussion binaires populaires. Cela vous donnera généralement la meilleure idée de la rétention du serveur de news. Si vous remarquez que quelques groupes ont une rétention plus longue que la normale, soit le serveur de news sélectionne certains groupes de discussion pour donner une fausse image de son niveau de rétention global, soit un article a un en-tête de date invalide.
Anonyme dit
Bonjour,
Je parie et prédis que d'ici la fin de l'année 2007, Giganews offrira 180+ jours de rétention binaire 🙂 .
C'est 6+ mois, vraiment cool ^^
meilleures salutations,
iNsuRRecTiON
Anonyme dit
De nombreuses entreprises sont en mesure de revendiquer des taux de rétention plus élevés, (est-il vraiment si important d'avoir des en-têtes de plus de 90 jours ? ! Si vous n'avez pas trouvé ce dont vous avez besoin en 90 jours, il y a de fortes chances que vous n'en ayez pas vraiment besoin !), en limitant le nombre de messages dans certains groupes binaires et en censurant les groupes dans lesquels les messages peuvent être conservés. Espérons que ce n'est pas ce qui se passe sur Giganews et que la réduction soudaine des en-têtes dans certains groupes binaires depuis la fin du mois de janvier n'est qu'une coïncidence et causée par une autre action anormale...
Anonyme dit
Ce commentaire a été supprimé par un administrateur du blog.
Anonyme dit
Je ne pense pas qu'il y ait de limite supérieure à partir de laquelle la rétention devient excessive. Si je veux trouver quelque chose, j'ai deux fois plus de chances si la rétention est de 180 jours, par rapport à 90 jours.
Cette hypothèse n'est peut-être pas correcte dans tous les cas, mais elle semble assez logique si ce que j'essaie de trouver est assez ancien.