Re: SSE2 CPU向け4ハッシュ並列処理(0.3.6用)

参加者: tcatm

標準コードのパフォーマンス(テスト/ベンチマークプログラムで計測)は約1500khash/sだ。 私のコードは3500khash/sを出す。どちらも1コアの数値だ。128ハッシュを一度に処理し、データ構造をCPUキャッシュに収まるほど小さく保つのでスケーラビリティが良い。

2つのローカル衝突攻撃があり、さらに300khash/sを絞り出せるが、まだ安定していない。