#pragma once #include template inline T * align_32byte(T * mem) { return reinterpret_cast((((reinterpret_cast(mem) + 31) & ~31))); }