Re: Geeignetes Fiesystem f?r D

From: Michael Renner <renner(at)inqnet(dot)at>
To: Martin Spott <Martin(dot)Spott(at)mgras(dot)net>
Cc: pgsql-de-allgemein(at)postgresql(dot)org
Subject: Re: Geeignetes Fiesystem f?r D
Date: 2008-02-26 10:51:59
Message-ID: 47C3EF4F.8090601@inqnet.at
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-de-allgemein

Martin Spott schrieb:

> Ja, FUD ist hier tatsaechlich die treffende Bezeichnung.

[..]

> Fazit: Fragst Du drei Leute, bekommst Du meist vier Antworten. Mach'
> einfach eine kleine Testreihe mit der Hardware, auf der Du das spaeter
> laufen lassen willst, und dann weisst Du, woran Du bist.

Oder man schaut sich einfach an, was die Dateisysteme unter der Haube
machen und schließt von da weg auf mögliche Fehlerszenarien. Sei's Lines
of code, Komplexität/Robustheit der On-Disk-representation oder
generelle Qualität der Implementation. Auf dieser Basis kann man
ziemlich bequem und ohne viel herumgezetere sinnvolle Entscheidungen
treffen, ohne dass man mit flammenden Schwert gegen andersdenkende
vorgehen muss (und ich bin der erste der auf ext3 verzichtet wenn etwas
sinnvolleres daherkommt).

Weitere Diskussionen zu diesem Thema am besten abseits der Mailingliste
bei einem Bier, oder hier auf der Liste mit Fakten ("Was passiert wenn
ein Write truncated wird? Was explodiert alles wenn ein Bit/Byte/Block
durch Memory/CPU/kaputte Controller/Power Loss/Cosmic Rays
geflippt/gezappt/durchgenudelt wird?". Ich bin diese "ich habe
gehört/gesehen/gelesen, dass" Argumentationslinien satt)

Quintessenz: Fehler haben Ursachen. Diese Ursachen sind immer
deterministisch in der Definition, nicht im Auftreten. Jedes FS verhält
sich bei unterschiedlichen Fehlerquellen anders. Ein FS das "am Papier"
gut ist, bei dem "die Realität" aber kein Design Target war, ist
vermutlich kein gutes FS für Produktionssysteme.

Und zu deinem mysteriösen Permission-Flip am Produktionssystem: Wenns
dich _wirklich_ interessiert, frag auf der ext3-users Mailingliste
welche Code-Paths das ausgelöst haben könnten. Ich persönlich vermute
mal kaputte Startup/Shutdown-Scripts bzw. DB-Implementation oder ein
nicht zuende durchgespieltes Journal (Metadaten-Änderungen nicht korrekt
zu Ende durchgeführt). Das bei "mehreren" Dateien die selben Bits immer
auf den gleichen Wert "korrumpiert" werden ist denkbar unwahrscheinlich.

my 2 cents..

over'n'out,
Michael

P.s. Food for thought:
http://fuji.web.cern.ch/fuji/talk/2007/kelemen-2007-C5-Silent_Corruptions.pdf

In response to

Browse pgsql-de-allgemein by date

  From Date Subject
Next Message Robert Müller 2008-02-28 11:44:45 Re: Geeignetes Fiesystem für Datenbankpartition gesucht
Previous Message Martin Spott 2008-02-26 10:03:40 Re: Geeignetes Fiesystem f?r D