Horst_h hat geschrieben:... soll ich NICHT als genervt auffassen?
Doch, das siehst Du schon richtig.
mschnell hat geschrieben:Dann macht es für mich (uns) wenig Sinn sich an der Durchführung der aufwändigen aber wenig aussagekräftigen Tests zu beteiligen.
Einverstanden!
Ich wundere mich nur: Ihr bekrittelt eine angeblich
furchtbar inhomogene Datenbasis (eine fundierte Begründung steht freilich noch aus) und schlagt
zufallsgeneriert inhomogene Strings als Alternative vor? Ach ja,
die werden ja statistisch geglättet! Das Lob der großen Zahl! Das gleiche gilt dann aber plötzlich
nicht mehr für Strings aus ein paar tausend Quelltextdateien?
Leute, ich bin dieser ewigen Besserwisserei in Blaue hinein wirklich langsam überdrüssig und hab jetzt einfach mal nachgekuckt.
Hier also die
empirische Basis Eurer vernichtenden Kritik:
Code: Alles auswählen
Strings Matches Charvergleiche / Call Durchnittl. Match Result
2,373,103 29.50 % 37.88 17.23
2,008,322 29,85 % 37,91 17,37
927,817 29.41 % 37.62 16.86
1,001,044 29,67 % 37,56 16,94
2,596,579 30,03 % 38,31 17,55
2,068,872 30,03 % 38,26 17,44
928,631 29.41 % 37.62 16.86
1,107,802 29.50 % 37.88 17.08
2,165,024 30,14 % 38,25 17,50
928,630 29.41 % 37.62 16.86
928,630 29.41 % 37.62 16.86
1,045,277 29.59 % 37.50 16.92
2,068,872 30,03 % 38,26 17,44
979,116 29,70 % 37,61 16,94
Bedenklich, bedenklich! Da muß man als Mathematiker glatt befürchten, daß bei Signalen zwischen 50 und 170% die zweite Nachkommastelle unrettbar verschmiert!
Das verstehe ich! Was ich nicht verstehe, ist, warum Ihr vollkommen ignoriert, daß es auf Datenhomogenität hier gar nicht ankommt, da hier überhaupt keine
Absolutwerte (zwischen verschiedenen Computern) miteinander verglichen werden, sondern vielmehr
Relativwerte, die aus jeweils bis aufs letzte Bit identischen Daten (auf dem jeweiligen Computer) gewonnen werden.
Oder um es mal anders auszudrücken: Eine Routine, die einen String nach einem Char durchsucht, und die doppelt so schnell ist wie eine zweite vergleichbare Funktion, wird in
hinreichender Näherung sowohl dann doppelt so schnell sein, wenn beide den Treffer nach 60 Zeichen finden, wie auch dann, wenn sie ihn erst nach 120 Zeichen finden. Und erst recht dann, wenn der Treffer mal auf der 59 und mal auf der 61 liegt!
Ist es zuviel verlangt von einem Mathematiker, das zu verstehen? Ich meine, wir sind doch alle keine Dummköpfe!
Aber irgendwie ist man ja immer auch Mensch, gell, Michael...
Gruß Rüdiger
PS: Wie Ihr seht, sind die Rückmeldungen bisher leider immer noch viel zu dünn.
Bitte beteiligt Euch, sofern Ihr das nicht schon getan habt. Es wäre wirklich schön, wenigstens 100 Datensätze zusammenzubekommen!