Re: tcatmの4-way SSE2 Linux 32/64ビット版 0.3.9 rc2

Quote from: Vasiliev on August 16, 2010, 03:17:07 AM

Quote from: satoshi on August 16, 2010, 02:57:57 AM Quote from: tcatm on August 16, 2010, 12:43:39 AM

sha256.cppを-O3 -march=amdfamk10でコンパイルすることを提案する(32ビットと64ビットの両方で動作する)。この命令セットをサポートするCPU(AMD Phenom、Intel i5以降)のみが-4wayの恩恵を受け、パフォーマンスが約9%向上する。

GCC 4.3.3は-march=amdfamk10をサポートしていない。以下のエラーが出る: sha256.cpp:1: error: bad value (amdfamk10) for -march= switch

-march=amdfam10を試してみてくれ。

動いた。

おかしいな……同じものだと確信できるか?tcatm、amdfam10で試して同じ速度測定結果が得られるか確認してくれ。