Re: SSE2 CPU向け4ハッシュ並列処理(0.3.6用)

参加者: petree

Quote from: impossible7 on August 02, 2010, 09:31:44 AM

Quote from: Ground Loop on August 02, 2010, 09:17:07 AM

上記のパッチでは、テストプログラムをビルドできなかった。そちらはどうだ?

x86ではオブジェクトファイルのリストにcryptopp/obj/cpu.oを含める必要があった。そうしないと”make test”が失敗する。x86_64ではその問題はなかった。

Quote from: petree on August 02, 2010, 09:22:29 AM

投稿されたオリジナルのパッチは自分の環境(Opteron 2376)で問題なく動作しており、標準の0.3.6クライアントと比較してパフォーマンスが2倍になった。そのわずかな変更を0.3.7にも移植でき、同じ結果が得られた。

変数が正しくアラインメントされていることを確認する方法はあるだろうか?Intel系のプロセッサはAMDよりもミスアラインメントに対する許容度が低いのではないかと思っている。

上で述べたように、パフォーマンスの向上は確認したが、パッチ版が正しく動作するか確信がない。パッチ版でブロックを生成できたか? Quote from: Ground Loop on August 02, 2010, 09:17:07 AM 上記のパッチでは、テストプログラムをビルドできなかった。そちらはどうだ? Quote from: petree on August 02, 2010, 09:22:29 AM 投稿されたオリジナルのパッチは自分の環境(Opteron 2376)で問題なく動作しており、標準の0.3.6クライアントと比較してパフォーマンスが2倍になった。そのわずかな変更を0.3.7にも移植でき、同じ結果が得られた。

変数が正しくアラインメントされていることを確認する方法はあるだろうか?Intel系のプロセッサはAMDよりもミスアラインメントに対する許容度が低いのではないかと思っている。

はい、このパッチ適用後に2ブロック生成した。