Workstation: erste Tests...

Arno Welzel · Jul 28, 2023

Axel Berger, 2023-07-28 11:01:

Arno Welzel wrote:
MD5 gilt mittlerweile nicht mehr als sicher,

Es macht aber schon einen Unterschied, ob ich mich nur gegen
Kopierfehler schÃ¼tzen will oder auch gegen bÃ¶swillige VerÃ¤nderung.

Ja, fÃ¼r letzteres genÃ¼gt MD5, um anhand des Hash zu prÃ¼fen, ob das
Original fehlerfrei kopiert wurde. Dass ein Kopierfehler *zufÃ¤llig* zum
gleichen MD5-Hash fÃ¼hrt, wie der originale Dateiinhalt, ist so
unwahrscheinlich, dass man dieses Risiko vernachlÃ¤ssigen kann.

--
Arno Welzel
https://arnowelzel.de

Arno Welzel · Jul 28, 2023

Hanno Foest, 2023-07-28 13:52:

Am 28.07.23 um 01:19 schrieb Axel Berger:

Sehr lustig. Ich hab memtest86+ 18 Stunden laufen lassen mÃÂ¼ssen,

Ist Memtest Ã¼berhaupt noch sinnvoll? Ich kenne es aus der Zeit, als
zweistellig MB RAM viel war. Schon mit einem halben Gigabyte schafft man
es kaum noch, den ganzen Zyklus auch nur einmal durchlaufen zu lassen.

Kann ich so nicht bestÃ¤tigen. Das mit den 18 Stunden ist ne Weile her,
es waren so 4GB, und memtest hat schon ein paar Runden geschafft.

Na ja - heutige PCs haben auch mal 32, 64 oder 128 GB RAM. Das wird dann
schon etwas zeitaufwendiger.

Die andere Frage ist, was du messen willst. Wenn memtest Fehler wirft,
weiÃ du definitiv, daÃ das RAM (in dieser Konfiguration) kaputt ist. Du
kannst aber nicht verifizieren, daÃ es heil ist. Das ist letztendlich
das alte Verifikationsproblem aus den Erkenntniswissenschaften: Das
Ergebnis *kÃ¶nnte* sich morgen spontan geÃ¤ndert haben.

FÃ¼r mich war obiges Erlebnis AnlaÃ, mich nach gÃ¼nstigen ECC LÃ¶sungen
umzusehen, und sie nach MÃ¶glichkeit (fÃ¼r Laptops kann man das knicken)
einzusetzen.

DDR4 ECC unbuffered lÃ¤uft auch auf vielen AMD-Boards mit Ryzen 7. Sowas
gibt\'s auch halbwegs gÃ¼nstig - z.B. 32 GB PC4-3200, ECC unbuffered von
Kingston ca. 80 EUR pro Modul.

--
Arno Welzel
https://arnowelzel.de

Arno Welzel · Jul 28, 2023

Helmut Schellong, 2023-07-26 16:24:

Am 26.07.2023 um 13:00 schrieb Rupert Haselbeck:
[...]
FÃ¼r einen bloÃen Vergleich von lediglich 33000 Dateien mit lÃ¤cherlichen 110GB braucht es sicher
keinen Monsterrechner, wie du ihn beschrieben hast. Auch das schafft locker der PC fÃ¼r 350 Euro.
Der braucht dann halt ein paar Minuten, wenn er nicht mit einer vernÃ¼nftigen SSD und mit zu wenig
RAM ausgestattet ist. Als CPU genÃ¼gt die billigste, welche zu haben ist.

Ein PC fÃ¼r 350 EUR wÃ¼rde wohl nicht ein paar Minuten, sondern eher Stunden benÃ¶tigen.
(Meine Festplatten kosten bereits 900 EUR.)

Und meine SSDs weit weniger als 900 EUR, trotzdem reicht\'s fÃ¼r fast 8 TB
SpeicherkapazitÃ¤t mit 0,9 - 3 GB/s Durchsatz lesend und schreibend und
entsprechend hohen IOPS-Zahlen. 128 GB ECC-RAM gibt\'s fÃ¼r die von mir
benutzte Plattform auch fÃ¼r unter 400 EUR (aktuell ca. 320 EUR). Und das
Mainboard hat weniger als 200 EUR gekostet.

Ich habe mehrfach dargestellt, daÃ die Workstation in der Regel
etwa 50-fach schneller ist, als meine alte Plattform mit E8600 3333 MHz.

Ja, das ist ja auch keine Kunst. So ziemlich *jede* aktuelle Hardware
ist vielfach schneller als das.

--
Arno Welzel
https://arnowelzel.de

Arno Welzel · Jul 28, 2023

Helmut Schellong, 2023-07-27 00:49:

Am 26.07.2023 um 22:00 schrieb Rupert Haselbeck:
Helmut Schellong schrieb:
Rupert Haselbeck:
Ein PC fÃ¼r 350 EUR wÃ¼rde wohl nicht ein paar Minuten, sondern eher Stunden benÃ¶tigen.

Selbst wenn dem so sein sollte - was solls? Ob eine einmalige Aktion zur Datenkonversion nun 10
Minuten oder mehrere Stunden dauert, ist regelmÃ¤Ãig vÃ¶llig egal.
[...]

Ja, eine einmalige solche Aktion ist mit Stunden an Zeitbedarf ziemlich egal.
Allerdings hatte ich 6 LÃ¤ufe.
Ich habe nÃ¤mlich die Suchmuster fortlaufend geÃ¤ndert/optimiert, aufgrund
des Inhalts der Resultat-Datei.
Bei 5 Minuten jeweiliger Laufzeit kein Problem.

100 GB Daten durchsuchen wÃ¼rde mein \"Mainstream-PC\" vermutlich auch in
weniger als 5 Minuten durchlaufen.

Es kann auch sein, daÃ ich mal Newsgroups inhaltlich analysiere.
Mit RegulÃ¤ren AusdrÃ¼cken der hÃ¶chsten Kategorie.

Wo sind die Kategorien von regulÃ¤ren AusdrÃ¼cken definiert?

Die Datenmengen sind gewaltig.
Und es sind immer wieder solche extrem aufwendigen DatenlÃ¤ufe notwendig.

Warum?

[...]

Ich habe mehrfach dargestellt, daÃ die Workstation in der Regel
etwa 50-fach schneller ist, als meine alte Plattform mit E8600 3333 MHz.

Ja, hast du. Aber wozu?

Damit der Sinn meines Kaufes einer Workstation klar wird.

Nein, das ist das Ergebnis des Kaufs. Der Sinn dahinter, warum sie so
schnell sein soll, ist nicht klar.

In meinem (Arbeits-)Alltag komme ich mit Laptops der Sorte Dell Latitude
5430 gut aus und daneben gibt es noch einen PC mit AMD Ryzen 7, viel RAM
und viele SSDs, auf dem in der Regel 2-3 VMs fast immer laufen. Da merke
ich auch nichts davon, dass irgendwas langsam wÃ¤re. Eine 4K-Video mit 2
Stunden Laufzeit umkodieren dauert je nach Codec und Einstellungen mit
Beteiligung der GPU ca. 10-15 Minuten - das reicht mir.

--
Arno Welzel
https://arnowelzel.de

Helmut Schellong · Jul 28, 2023

Am 28.07.2023 um 00:02 schrieb Hanno Foest:

Am 27.07.23 um 20:16 schrieb Helmut Schellong:

[memtest86+]

Test-Arten:
-----------
00Â Adressentest, fortschreitende Einsen
01Â Adressentest, eigene Adresse
03Â Bewegte Inversionen, Einsen & Nullen
04Â Bewegte Inversionen, 8-bit-Muster
05Â Bewegte Inversionen, Zufallsmuster
06Â Blockbewegung, 64-byte-BlÃ¶cke
07Â Bewegte Inversionen, 32-bit-Muster
08Â Zufallszahlensequenz
09Â Modulo 20, Einsen & Nullen
10Â Test auf verblassende Bits, 2 Muster
13Â Hammer-Test
14Â DMA-Test

Wer diese Tests mit 0 Fehlern durchlÃ¤uft, hat mit extrem hoher Wahrscheinlichkeit
ein vollkommen intaktes RAM.

Sehr lustig. Ich hab memtest86+ 18 Stunden laufen lassen mÃ¼ssen, bis sich die ersten Fehler
zeigten. Mit etwas mehr Pech hÃ¤tten es auch 3 Tage (oder mehr) sein kÃ¶nnen.

Sehr lustig?
Ich schrieb nicht, daÃ da nur 1 Pass eingestellt werden soll.

Voreingestellt sind 4 Passes, was erhÃ¶ht werden kann.
Es ist doch ganz klar, warum da 4 voreingestellt ist, und
warum es Ã¼berhaupt einstellbare Passes gibt!

--
Mit freundlichen GrÃ¼Ãen
Helmut Schellong

Rolf Bombach · Jul 28, 2023

Gerrit Heitsch schrieb:

On 7/27/23 14:25, Wolfgang Allinger wrote:

On 27 Jul 23 at group /de/sci/electronics in article u9tior$1s3t7$1@dont-email.me
rolfnospambombach@invalid.invalid>Â (Rolf Bombach)Â wrote:

Andererseits, irgendwie haben auch Kernspeicher funktioniert.
Dort kann man prinzipiell nur destruktiv auslesen.

und muss sie sofort wieder rÃ¼ckspeichern. Klappte hervorragend.

Das gleiche gilt fÃ¼r DRAMs, Auslesen ist destruktiv.Â Das ZurÃ¼ckschreiben ist allerdings im RAM integriert und passiert automatisch am Ende des Zugriffs.

THX, wusste ich nicht.

--
mfg Rolf Bombach

Helmut Schellong · Jul 28, 2023

Am 28.07.2023 um 01:19 schrieb Axel Berger:

Hanno Foest wrote:
Sehr lustig. Ich hab memtest86+ 18 Stunden laufen lassen mÃÂ¼ssen,

Ist Memtest Ã¼berhaupt noch sinnvoll? Ich kenne es aus der Zeit, als
zweistellig MB RAM viel war. Schon mit einem halben Gigabyte schafft man
es kaum noch, den ganzen Zyklus auch nur einmal durchlaufen zu lassen.
Ja, natÃ¼rlich habe ich es Ã¼ber Nacht laufen lassen und dann auch mal
einen ganzen Tag und eine ganze Nacht, aber so richtig weit im Programm
kam es nicht.

Es gibt zwei \'memtest\'.
Das \'memtest86\' von Passmark finde ich besser.
In einer knappen Stunde ist 1 Pass erledigt.

--
Mit freundlichen GrÃ¼Ãen
Helmut Schellong

Rolf Bombach · Jul 28, 2023

Arno Welzel schrieb:

Helmut Schellong, 2023-07-25 12:22:

Am 25.07.2023 um 10:41 schrieb Hans-Peter Diettrich:
[...]
Wenn schon, dann ein leistungsfÃ¤higeres Komprimierungsverfahren.

Geht nicht.
Executables lassen sich nicht nennenswert komprimieren.

Nicht? Komisch - hier lassen sich Binaries oft um Faktor 2-4
komprimieren. Da muss dann ja reichlich \"Luft\" vorhanden sein statt
echtem Code

Nunja, der Kompressor kennt ja den Inhalt nicht und geht
nach Schema F vor. WÃ¼rde er den Inhalt verstehen und tatsÃ¤chlich
den Code komprimieren, nicht auszudenken, was bei heutiger
Bloatware passieren wÃ¼rde. Wahrscheinlich Kompression
auf 0 Bytes und der Code passt in den Filenamen.

--
mfg Rolf Bombach

Rolf Bombach · Jul 28, 2023

Volker Bartheld schrieb:

On Thu, 20 Jul 2023 22:38:22 +0200, Rolf Bombach wrote:
Helmut Schellong schrieb:
WS = Xeon 3435X, 16 Kerne, 32 CPUs, Basis 3100 MHz, 128 GB
PC = 2006 E8600,Â 2 Kerne,Â 2 CPUs, 3333 MHz, 4 GB
Single-Thread:Â Â 683/272 =Â 2,5
Eigentlich traurig fÃ¼r 15 Jahre Fortschritt. Offenbar gibt
es keine wirklich grossen SprÃ¼nge mehr.

Weswegen Cryptominer, Videocutter, VFX-Artisten, CAD-Ingenieure,
Elementarteilchenphysiker und KI-Forscher ja auch auf 10 Jahre altem
Equipment beharren.

[sup] Oh, und Softwareentwickler. Die hatte ich vergessen.

Des Lesens mÃ¤chtig hast du sicher erkannt, dass es hier um
die Single-Fred-Leistung geht. Ausserdem mag es dich
Ã¼berraschen, dass es sehr viele, auch prozentual, User
gibt, die nicht Cryptos schÃ¼rfen oder CERN-Daten auswerten.
Und eher noch nach der N(atÃ¼rlichen)I suchen *duck*.
Und nicht jeder \"publiziert\" auf youtube.

Du redest von Zeuch, dass sich parallelisieren lÃ¤sst oder das
schon von sich aus tut.

Tut eigentlich LTspice auch, allerdings ist bei nicht allzu
grossen Schaltungen der Geschwindigkeitsgewinn nur
etwa -0.2% bis +1% (95% Konfidenz) pro zugeschalteten Kern,
bei nur schwach von 0 verschiedenem Korrelationskoeffizienten.

Also sind wir wieder bei single thread.
Und ja, Serverprozessoren mit 256 Kernen oder so was gibt es.
Ideal fÃ¼r Leute, welche beim Mining von \'in 100 Jahren nicht
fertig\' auf \'in vier Jahren nicht fertig\' beschleunigen wollen.
(Falls sie Ã¼berhaupt so doof sind, das auf einem PC-Prozessor
machen zu wollen).

--
mfg Rolf Bombach

Michael Schwingen · Jul 28, 2023

On 2023-07-27, Axel Berger <Spam@Berger-Odenthal.De> wrote:

Ist Memtest Ã¼berhaupt noch sinnvoll? Ich kenne es aus der Zeit, als
zweistellig MB RAM viel war. Schon mit einem halben Gigabyte schafft man
es kaum noch, den ganzen Zyklus auch nur einmal durchlaufen zu lassen.

Kann ich nicht bestÃ¤tigen. i7-2600 und 32GB RAM hat Ã¼ber Nacht mehr als einen
Durchlauf geschafft, also nutzbar.

cu
Michael
--
Some people have no respect of age unless it is bottled.

Helmut Schellong · Jul 28, 2023

Am 28.07.2023 um 08:49 schrieb Arno Welzel:

Helmut Schellong, 2023-07-25 22:45:

Am 25.07.2023 um 20:38 schrieb Arno Welzel:
[...]
Um festzustellen, ob Daten wirklich *absolut* korrekt sind, mÃ¼sste man
den vollstÃ¤ndigen Datensatz mit einem *bekannt* korrekten Original
vergleichen. Sobald die PrÃ¼fsumme weniger Bits umfasst als die geprÃ¼ften
Daten, gibt es zwangslÃ¤ufig Kollisionen in der Weise, dass es garantiert
auch eine andere Bitfolge gibt, die zur selben PrÃ¼fsumme fÃ¼hrt.

Das ist eine problematische Formulierung.

Nein, genau so ist es.

Ich glaube nicht daran. Siehe unten.

Du hast selbst geschrieben, Zitat:

\"Wenn ich zwei groÃe identische TestlÃ¤ufe mache und die Resultatdateien
8 MB sind vollkommen identisch und mit plausiblem Inhalt, dann ist das
ein Beweis, daÃ diese Tests ohne Datenfehler abliefen.\"

Man muÃ natÃ¼rlich die beiden Tests in mÃ¶glichst unterschiedlichen
RAM-Situationen durchfÃ¼hren.

Und damit hast Du ja vom Prinzip her genau das getan - zwei identische
TestlÃ¤ufe und anschlieÃend die PrÃ¼fung, ob beide Ergebnisse gleich sind.

Diese TestlÃ¤ufe sind ein gÃ¤nzlich anderer Algorithmus als eine Hash-Generierung.
Einerseits klarer als ein Hash, andererseits vielleicht weniger sicher.

Sicher ist, daÃ bei 1 Bit weniger mit allerhÃ¶chster Wahrscheinlichkeit ein
wirklich vollkommen anderer Hash entsteht.

Korrekt.

Eine Kollision liegt vor, wenn zwei (deutlich) unterschiedliche Dateien
den gleichen Hash generieren.

Und das ist zwangslÃ¤ufig mÃ¶glich, wenn der Hash kÃ¼rzer ist, als die
Ausgangsdaten, aus denen er erzeugt wurde. Bei als \"sicher\" geltenden
Hashes ist nur der Aufwand zur Auffindung zweier Bitfolgen, die den
selben Hash ergeben, extrem hoch.

Ich habe da meine Zweifel, weil ich Hash-Algorithmen selbst implementierte.
Diese verrechnen ihre Eingabe mit einer Art Fleischwolf-Maschine, die qualitativ
dicht an echten Zufall herankommt.
Die Eingabe wird also komplett mit einem Zufallsgenerator vermischt.

Ich meine daher, es kommt nur auf die GegenÃ¼berstellung an, wie viele
Zahlen der Hash bilden kann, und wie viele verschiedene Dateien es geben kann.
Kollisionen sind vorprogrammiert; die Hash-Werte mÃ¼ssen daher besonders gut
statistisch verteilt sein.

MD5 gilt mittlerweile nicht mehr als sicher, weil dort Kollisionen
bekannt sind und seit 2004 ein Verfahren, mit dem man diese auch in
relativ kurzer Zeit finden kann: <http://eprint.iacr.org/2004/199.pdf

Das ist mir bekannt, lange Zeit, bevor ich mehrere Hash-Algorithmen selbst implementierte.

--
Mit freundlichen GrÃ¼Ãen
Helmut Schellong

Helmut Schellong · Jul 28, 2023

Am 28.07.2023 um 09:03 schrieb Arno Welzel:

Helmut Schellong, 2023-07-26 16:37:

Am 26.07.2023 um 14:30 schrieb Gerrit Heitsch:
On 7/26/23 13:54, Helmut Schellong wrote:
Am 26.07.2023 um 06:48 schrieb Gerrit Heitsch:
On 7/25/23 22:45, Helmut Schellong wrote:

Wann immer es geht, verwende ich das Kommando \'cmp\'.
Das prÃ¼ft alle Bytes auf Gleichheit.

\'diff -r\' ist auch nÃ¼tzlich wenn man ganze VerzeichnisbÃ¤ume auf Gleichheit Ã¼berprÃ¼fen will.

Ja, es gibt unter Unix viele Wege, auf Gleichheit zu prÃ¼fen.

Bespielweise auch \'rsync\' oder
find /dir1 -type f -exec cmp [-o] {} /dir2/$(basename {}) || echo ERR {} \\;

Solche Konstrukte sind nett, aber man muss aufpassen, bei Dateinamen mit SPACE (was man vermeiden
sollte) passieren oft Ã¼berraschende Dinge wenn man vergisst an passenden Stellen Quotes zu verwenden.

Ja, das sowieso;
jedoch ich selbst produziere niemals Dateinamen mit enthaltenen SPACEs.
Fremde Dateien werden von mir auch entsprechend eingepflegt (oft ganz anderer Name).
Und der OS-Hersteller verwendet ebenso niemals SPACEs in Dateinamen.

Wer ist \"der OS-Hersteller\"? Welches OS? Bei Windows gibt es Dateinamen
mit Leerzeichen fÃ¼r sehr zentrale Verzeichnisse:

\"C:\\Program Files\"
\"C:\\Program Files (x86)\"

Kenne ich.
Aber ich meine SCO (Santa Cruz Operation), FreeBSD, Linux, Solaris.
Windows benutze ich Ã¼berwiegend fÃ¼r Programme, die ich woanders nicht starten kann.

--
Mit freundlichen GrÃ¼Ãen
Helmut Schellong

Helmut Schellong · Jul 28, 2023

Am 28.07.2023 um 09:13 schrieb Arno Welzel:

Helmut Schellong, 2023-07-27 00:24:

Am 26.07.2023 um 21:40 schrieb Rupert Haselbeck:
Helmut Schellong schrieb:
[...]
Es kommt auf die Definition von \"vollkommene Datenkorrektheit\" an.
Bisher habe nur ich eine Definition fÃ¼r den Kontext abgegeben.

Das ist schlicht falsch. \"Vollkommene Datenkorrektheit\" impliziert ohne jede weitere Definition
eines Kontextes, dass die Daten sÃ¤mtlich ohne jeden Fehler verarbeitet werden bzw. wurden.

Ja, korrekt, das definiere ich selbst ja auch andauernd so.

Die zeitliche Ebene muÃ einbezogen werden, andernfalls wird es ungenau und miÃverstanden.

Nein, Daten sind entweder korrekt oder nicht. \"Zeit\" ist in Bezug auf
*Daten* irrelevant.

Die \"zeitliche Ebene\" kann man nur auf die *Verarbeitung* der Daten
anwenden und z.B. beobachten, dass ein Verarbeitungsprozess, der 10
Minuten dauert, korrekte Daten liefert, wÃ¤hrend bei einer Dauer von 100
Stunden die Wahrscheinlichkeit fÃ¼r fehlerhafte Daten hÃ¶her ist, wenn man
Bitfehler nicht durch geeignete PrÃ¼fverfahren erkennen kann.

Ich verstehe Deine Denkweise nicht.
Ich definiere einen groÃen Testlauf, der 110 GB Daten aufwendig filtert.
Und der braucht seine Zeit - also sind wir bei Zeit.
WÃ¤hrend dieser Zeit kÃ¶nnen RAM-Fehler die Daten verfÃ¤lschen.
Wenn dieser riesige Testlauf am nÃ¤chsten Tag erneut gestartet wird, andere
RAM-Adressen verwendend, und exakt die gleichen Resultate (8 MB) generiert, gab es
keine RAM-Fehler in beiden LÃ¤ufen - als Praxis-Beweis.

Ein besserer Beweis wÃ¤re die mehrfache Hash-Generierung von einer 50 GB groÃen Datei.

--
Mit freundlichen GrÃ¼Ãen
Helmut Schellong

Helmut Schellong · Jul 28, 2023

Am 28.07.2023 um 09:23 schrieb Arno Welzel:

Helmut Schellong, 2023-07-25 21:29:

Am 25.07.2023 um 20:21 schrieb Arno Welzel:
[...]
Ein AMD Ryzen aus der 5000er- oder 7000er-Reihe mit B550 oder X750
Chipsatz kann auch ECC. Ist halt nicht so teuer und man kann damit nicht
angeben - aber schlechter als mit einem Xeon ist das auch nicht, was die
Fehlerkorrektur betrifft.

Was immer wieder untergeht:
DDR5 hat grundsÃ¤tzlich ein eingebautes ECC.
Dasjenige ECC+Registered ist das zusÃ¤tzliche Ã¤uÃere ECC.

AMD Ryzen 5 arbeitet mit DDR4 und unterstÃ¼tzt das \"zusÃ¤tzliche Ã¤uÃere ECC\".

[...]
Eben - ein Hobby. Ist ja auch ok so. Aber das kannst Du doch auch
einfach so sagen. Oder wÃ¤re das fÃ¼r Dich unehrenhaft, einfach sagen
\"weil es mit SpaÃ macht, egal ob man das unbedingt so braucht\"?

Genau das wÃ¤re falsch - eine VerbrÃ¤mung!
Ich fÃ¼hre ja diejenige Arbeit weiter, die ich zuvor am Arbeitplatz erbrachte.
Elektronik entwickeln und programmieren.

D.h. die Entwicklungen werden verÃ¶ffentlicht?

Ja, teilweise. Siehe meine Webseite.

Mein alter PC von 2006 muÃte nun durch etwas Modernes ersetzt werden.
Das tat ich nach 17 Jahren.
Es erschent so, als ob so mancher nicht damit klarkommt - seltsam.

Wenn es Dir SpaÃ macht, kannst Du gerne auch ein ganzes Rechenzentrum
kaufen. Nur die BegrÃ¼ndung, dass Du sowas aus brauchst, weil Du als
Ingenieur arbeitest, finde ich etwas eigenwillig.

[...]
Das ist doch schÃ¶n fÃ¼r Dich. Ich frage mich nur, was man da so konkret
tut, was zwingend so eine Hardware voraussetzt. Aber fÃ¼r Hobbies kann
man auch beliebig Ã¼berdimensionierte Dinge anschaffen, die man
eigentlich nie wirklich *braucht*.

Ich habe da Software entwickelt, um die Daten einer alten Datenbank
auf eine moderne Datenbank transportieren zu kÃ¶nnen.
Kundenstrukturen von etwa 3500 Kunden waren darunter.
DafÃ¼r brauchte ich die Workstation nicht.

Eben.

Es macht halt SpaÃ. Aber dass Dir etwas einfach SpaÃ macht, wÃ¼rdest Du
wohl nie zugeben. Nein, es muss begrÃ¼ndet werden mit sachlichen
Anforderungen.

Ich habe vor einigen Wochen 33000 Dateien im Umfang von 110 GB analysiert
und bestimmte Daten mit Suchmustern herausgefiltert, mit einem Multitasking-Shell-Skript.
DAFÃR und fÃ¼r Ahnliches brauche ich die Workstation.

Und das Ergebnis der Analyse dieser Dateien wird dann irgendwann
verÃ¶ffentlicht oder war eine Auftragsarbeit?

Nein, muÃ sie das, damit ich die Notwendigkeit einer Workstation belegen kann?
Das heiÃt, die Resultat-Datei habe ich hier verÃ¶ffentlicht.

--
Mit freundlichen GrÃ¼Ãen
Helmut Schellong

Helmut Schellong · Jul 28, 2023

Am 28.07.2023 um 15:48 schrieb Arno Welzel:

Helmut Schellong, 2023-07-27 00:49:

Am 26.07.2023 um 22:00 schrieb Rupert Haselbeck:
Helmut Schellong schrieb:
Rupert Haselbeck:
Ein PC fÃ¼r 350 EUR wÃ¼rde wohl nicht ein paar Minuten, sondern eher Stunden benÃ¶tigen.

Selbst wenn dem so sein sollte - was solls? Ob eine einmalige Aktion zur Datenkonversion nun 10
Minuten oder mehrere Stunden dauert, ist regelmÃ¤Ãig vÃ¶llig egal.
[...]

Ja, eine einmalige solche Aktion ist mit Stunden an Zeitbedarf ziemlich egal.
Allerdings hatte ich 6 LÃ¤ufe.
Ich habe nÃ¤mlich die Suchmuster fortlaufend geÃ¤ndert/optimiert, aufgrund
des Inhalts der Resultat-Datei.
Bei 5 Minuten jeweiliger Laufzeit kein Problem.

100 GB Daten durchsuchen wÃ¼rde mein \"Mainstream-PC\" vermutlich auch in
weniger als 5 Minuten durchlaufen.

Wirklich? Messung!
Ich hatte gemessen.

Es kann auch sein, daÃ ich mal Newsgroups inhaltlich analysiere.
Mit RegulÃ¤ren AusdrÃ¼cken der hÃ¶chsten Kategorie.

Wo sind die Kategorien von regulÃ¤ren AusdrÃ¼cken definiert?

Beispielsweise in den Manual-Seiten meiner bish-Shell.

Die Datenmengen sind gewaltig.
Und es sind immer wieder solche extrem aufwendigen DatenlÃ¤ufe notwendig.

Warum?

Beantworte ich nicht.

[...]
Ich habe mehrfach dargestellt, daÃ die Workstation in der Regel
etwa 50-fach schneller ist, als meine alte Plattform mit E8600 3333 MHz.

Ja, hast du. Aber wozu?

Damit der Sinn meines Kaufes einer Workstation klar wird.

Nein, das ist das Ergebnis des Kaufs. Der Sinn dahinter, warum sie so
schnell sein soll, ist nicht klar.

Ist mir egal; beantworte ich halt nicht.

--
Mit freundlichen GrÃ¼Ãen
Helmut Schellong

Helmut Schellong · Jul 28, 2023

Am 28.07.2023 um 15:43 schrieb Arno Welzel:

Helmut Schellong, 2023-07-26 16:24:

Am 26.07.2023 um 13:00 schrieb Rupert Haselbeck:
[...]
FÃ¼r einen bloÃen Vergleich von lediglich 33000 Dateien mit lÃ¤cherlichen 110GB braucht es sicher
keinen Monsterrechner, wie du ihn beschrieben hast. Auch das schafft locker der PC fÃ¼r 350 Euro.
Der braucht dann halt ein paar Minuten, wenn er nicht mit einer vernÃ¼nftigen SSD und mit zu wenig
RAM ausgestattet ist. Als CPU genÃ¼gt die billigste, welche zu haben ist.

Ein PC fÃ¼r 350 EUR wÃ¼rde wohl nicht ein paar Minuten, sondern eher Stunden benÃ¶tigen.
(Meine Festplatten kosten bereits 900 EUR.)

Und meine SSDs weit weniger als 900 EUR, trotzdem reicht\'s fÃ¼r fast 8 TB
SpeicherkapazitÃ¤t mit 0,9 - 3 GB/s Durchsatz lesend und schreibend und
entsprechend hohen IOPS-Zahlen. 128 GB ECC-RAM gibt\'s fÃ¼r die von mir
benutzte Plattform auch fÃ¼r unter 400 EUR (aktuell ca. 320 EUR). Und das
Mainboard hat weniger als 200 EUR gekostet.

Ich habe mehrfach dargestellt, daÃ die Workstation in der Regel
etwa 50-fach schneller ist, als meine alte Plattform mit E8600 3333 MHz.

Ja, das ist ja auch keine Kunst. So ziemlich *jede* aktuelle Hardware
ist vielfach schneller als das.

Um wieviel schneller? Messung!
Ich hatte eine Messung gemacht.

--
Mit freundlichen GrÃ¼Ãen
Helmut Schellong

Helmut Schellong · Jul 28, 2023

Am 28.07.2023 um 09:26 schrieb Arno Welzel:

Helmut Schellong, 2023-07-26 15:49:

Am 26.07.2023 um 12:16 schrieb Rolf Bombach:
Helmut Schellong schrieb:
[...]
Dasjenige ECC+Registered ist das zusÃ¤tzliche Ã¤uÃere ECC.

Da muss man sich fragen, was dieses dann eigentlich genau
tut. Fehler der Fehlerkorrektur finden? Geht das Ã¼berhaupt?

Das innere ODECC arbeitet vollkommen getrennt.
Es repariert 1-Bit-Fehler.

Die Frage war, warum man serienmÃ¤Ãig sowas einbaut, wenn man doch auch

Nein, das war nicht die Frage.
Die Frage war, _was_ dieses dann eigentlich genau tut.
Und die habe ich beantwortet.

RAM ohne ECC billiger anbieten kÃ¶nnte. Die Annahme ist, dass DDR5 ohne
ECC zu viele Fehler produzieren wÃ¼rde, weil es da kaum noch mÃ¶glich ist,
stabilen Betrieb ohne KorrekturmaÃnahmen sicherzustellen.

Ja, wurde hier kÃ¼rzlich umfangreich durchgekaut.
DDR5 arbeitet zu hochfrequent.

Das ist Ã¤hnlich wie bei Festplatten mit extrem hohen Schreibdichten, wo
ein erheblicher Aufwand nÃ¶tig ist, weil das, was der Lesekopf als Signal
liefert, schon lange nicht mehr direkt als Bits verarbeitbar ist.

Ja, die Spuren werden schon ineinander positioniert.

--
Mit freundlichen GrÃ¼Ãen
Helmut Schellong

Rupert Haselbeck · Jul 28, 2023

Helmut Schellong schrieb:

Arno Welzel:
Helmut Schellong:
Arno Welzel:
[...]
Um festzustellen, ob Daten wirklich *absolut* korrekt sind, mÃ¼sste man
den vollstÃ¤ndigen Datensatz mit einem *bekannt* korrekten Original
vergleichen. Sobald die PrÃ¼fsumme weniger Bits umfasst als die
geprÃ¼ften
Daten, gibt es zwangslÃ¤ufig Kollisionen in der Weise, dass es
garantiert
auch eine andere Bitfolge gibt, die zur selben PrÃ¼fsumme fÃ¼hrt.

Das ist eine problematische Formulierung.

Nein, genau so ist es.

Ich glaube nicht daran. Siehe unten.

Du hast selbst geschrieben, Zitat:

\"Wenn ich zwei groÃe identische TestlÃ¤ufe mache und die Resultatdateien
8 MB sind vollkommen identisch und mit plausiblem Inhalt, dann ist das
ein Beweis, daÃ diese Tests ohne Datenfehler abliefen.\"

Man muÃ natÃ¼rlich die beiden Tests in mÃ¶glichst unterschiedlichen
RAM-Situationen durchfÃ¼hren.

HÃ¤ttest du tatsÃ¤chlich eine ingenieurmÃ¤Ãige Ausbildung erfolgreich
absolviert oder auf andere Weise solche Kenntnisse erworben, dann
_wÃ¼sstest_ du, dass diese Aussage einfach nur BlÃ¶dsinn ist.
Nur weil man zweimal dasselbe Ergebnis sieht, heiÃt das in keinem Fall,
dass die Daten bzw. deren Verarbeitung korrekt sein _mÃ¼ssten_. Lediglich
die statistisch herzuleitende Wahrscheinlichkeit, dass Daten bzw.
Algorithmus korrekt sein kÃ¶nnten, steigt. Ein Beweis ist etwas deutlich
anderes

Eine Kollision liegt vor, wenn zwei (deutlich) unterschiedliche Dateien
den gleichen Hash generieren.

Es ist hier egal, ob der Unterschied nur in einem einzigen Bit oder
vielen vielen Bits besteht

Und das ist zwangslÃ¤ufig mÃ¶glich, wenn der Hash kÃ¼rzer ist, als die
Ausgangsdaten, aus denen er erzeugt wurde. Bei als \"sicher\" geltenden
Hashes ist nur der Aufwand zur Auffindung zweier Bitfolgen, die den
selben Hash ergeben, extrem hoch.

Ich habe da meine Zweifel, weil ich Hash-Algorithmen selbst implementierte.

O Gott! Ja, dann ist schon klar, woher deine Fehlvorstellungen mal
wieder kommen. Selbst gebastelte und damit unbrauchbare Algorithmen
erzeugen natÃ¼rlich unbrauchbare Ergebnisse.
Wer hat deine Hash-Algorithmen denn hinsichtlich ihrer QualitÃ¤t geprÃ¼ft?

Diese verrechnen ihre Eingabe mit einer Art Fleischwolf-Maschine, die
qualitativ dicht an echten Zufall herankommt.
Die Eingabe wird also komplett mit einem Zufallsgenerator vermischt.

Aha...

Ich meine daher, es kommt nur auf die GegenÃ¼berstellung an, wie viele
Zahlen der Hash bilden kann, und wie viele verschiedene Dateien es geben
kann.
Kollisionen sind vorprogrammiert; die Hash-Werte mÃ¼ssen daher besonders gut
statistisch verteilt sein.

Nicht wirklich. Einfach ausgedrÃ¼ckt ist der Clou bei derlei Dingen doch
nur, einen Algorithmus zu finden, welcher es mÃ¶glichst schwierig macht,
eine Datei zu finden, welche denselben Hash-Wert wie die Originaldatei
ergibt. Und es muss natÃ¼rlich auch unmÃ¶glich sein, aus dem Hash-Wert auf
die Eingabedaten RÃ¼ckschlÃ¼sse zu erhalten.
Diese, und weitere, Voraussetzungen sind durch einzelne Menschen kaum
(besser: nicht) erreichbar, schon garnicht durch Amateure.

MfG
Rupert

Rolf Bombach · Jul 28, 2023

Arno Welzel schrieb:

Die 64-Bit-CPU in meinem Smartphone hat 8 Kerne mit verschiedenen
Taktfrequenzen:

2x ARM Cortex-A76 mit 2,25 GHz
4x ARM Cortex-A55 mit 1,8 GHz
2x ARM Cortex-X1 mit 2,8 GHz

Der Akku von dem GerÃ¤t hat nominell eine KapazitÃ¤t von 16,97 Wh. Das
hÃ¤lt problemlos fÃ¼r 20-30 Stunden und selbst unter Last mehrere Stunden,
was ein Indikator ist, dass die CPUs selbst bei stÃ¤rkerer Last mit weit
unter 16 Watt auskommen. Eine besondere KÃ¼hlung braucht das GerÃ¤t auch
nicht, es wird gerade mal handwarm, wenn es stÃ¤rker ausgelastet wird.

Nominell hat die CPU eine TDP von gerade mal 5,6 Watt.

Die Story mit dem ersten ARM1 kennst du sicher....

Und ca. 2015 kam ja ein Apple-Rechner raus, der doppelt so
viel Rechenkraft hat wie die Cray 2.

--
mfg Rolf Bombach

Rupert Haselbeck · Jul 28, 2023

Helmut Schellong schrieb:

Arno Welzel:
Helmut Schellong:
Rupert Haselbeck:
Helmut Schellong schrieb:
[...]
Es kommt auf die Definition von \"vollkommene Datenkorrektheit\" an.
Bisher habe nur ich eine Definition fÃ¼r den Kontext abgegeben.

Das ist schlicht falsch. \"Vollkommene Datenkorrektheit\" impliziert
ohne jede weitere Definition
eines Kontextes, dass die Daten sÃ¤mtlich ohne jeden Fehler
verarbeitet werden bzw. wurden.

Ja, korrekt, das definiere ich selbst ja auch andauernd so.

Die zeitliche Ebene muÃ einbezogen werden, andernfalls wird es
ungenau und miÃverstanden.

Nein, Daten sind entweder korrekt oder nicht. \"Zeit\" ist in Bezug auf
*Daten* irrelevant.

Die \"zeitliche Ebene\" kann man nur auf die *Verarbeitung* der Daten
anwenden und z.B. beobachten, dass ein Verarbeitungsprozess, der 10
Minuten dauert, korrekte Daten liefert, wÃ¤hrend bei einer Dauer von 100
Stunden die Wahrscheinlichkeit fÃ¼r fehlerhafte Daten hÃ¶her ist, wenn man
Bitfehler nicht durch geeignete PrÃ¼fverfahren erkennen kann.

Ich verstehe Deine Denkweise nicht.

Das ist wohl zuvÃ¶rderst deiner zwangslÃ¤ufig laienhaften Herangehensweise
an wissenschaftliche Fragestellungen geschuldet

Ich definiere einen groÃen Testlauf, der 110 GB Daten aufwendig filtert.
Und der braucht seine Zeit - also sind wir bei Zeit.
WÃ¤hrend dieser Zeit kÃ¶nnen RAM-Fehler die Daten verfÃ¤lschen.
Wenn dieser riesige Testlauf am nÃ¤chsten Tag erneut gestartet wird, andere
RAM-Adressen verwendend, und exakt die gleichen Resultate (8 MB)
generiert, gab es
keine RAM-Fehler in beiden LÃ¤ufen - als Praxis-Beweis.

Das ist kein Beweis. Ein Beweis nach wissenschaftlichem, nach
ingenieurmÃ¤Ãigem Ansatz ist nicht das zufÃ¤llige Ergebnis amateurhafter
Ãberlegungen. Dazu bedarf es eines wohldefinierten, beliebig
wiederholbaren und jederzeit auch fÃ¼r Dritte nachvollziehbaren Vorgehens.

Ein besserer Beweis wÃ¤re die mehrfache Hash-Generierung von einer 50 GB
groÃen Datei.

Ein Beweis ist genug. Es gibt keinen \"besseren\" Beweis

MfG
Rupert

Workstation: erste Tests...

Arno Welzel

Guest

Arno Welzel

Guest

Arno Welzel

Guest

Arno Welzel

Guest

Helmut Schellong

Guest

Rolf Bombach

Guest

Helmut Schellong

Guest

Rolf Bombach

Guest

Rolf Bombach

Guest

Michael Schwingen

Guest

Helmut Schellong

Guest

Helmut Schellong

Guest

Helmut Schellong

Guest

Helmut Schellong

Guest

Helmut Schellong

Guest

Helmut Schellong

Guest

Helmut Schellong

Guest

Rupert Haselbeck

Guest

Rolf Bombach

Guest

Rupert Haselbeck

Guest

Log in

Welcome to EDABoard.com

Sponsor