59 {
60 verify_key_set(m_round_key.empty() == false);
61
62#if defined(BOTAN_HAS_SERPENT_AVX2)
63 if(CPUID::has_avx2())
64 {
65 while(blocks >= 8)
66 {
67 avx2_encrypt_8(in, out);
68 in += 8 * BLOCK_SIZE;
69 out += 8 * BLOCK_SIZE;
70 blocks -= 8;
71 }
72 }
73#endif
74
75#if defined(BOTAN_HAS_SERPENT_SIMD)
76 if(CPUID::has_simd_32())
77 {
78 while(blocks >= 4)
79 {
80 simd_encrypt_4(in, out);
81 in += 4 * BLOCK_SIZE;
82 out += 4 * BLOCK_SIZE;
83 blocks -= 4;
84 }
85 }
86#endif
87
89 {
90 uint32_t B0, B1, B2, B3;
91 load_le(in + 16*i, B0, B1, B2, B3);
92
93 key_xor( 0,B0,B1,B2,B3);
SBoxE0(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
94 key_xor( 1,B0,B1,B2,B3);
SBoxE1(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
95 key_xor( 2,B0,B1,B2,B3);
SBoxE2(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
96 key_xor( 3,B0,B1,B2,B3);
SBoxE3(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
97 key_xor( 4,B0,B1,B2,B3);
SBoxE4(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
98 key_xor( 5,B0,B1,B2,B3);
SBoxE5(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
99 key_xor( 6,B0,B1,B2,B3);
SBoxE6(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
100 key_xor( 7,B0,B1,B2,B3);
SBoxE7(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
101 key_xor( 8,B0,B1,B2,B3);
SBoxE0(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
102 key_xor( 9,B0,B1,B2,B3);
SBoxE1(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
103 key_xor(10,B0,B1,B2,B3);
SBoxE2(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
104 key_xor(11,B0,B1,B2,B3);
SBoxE3(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
105 key_xor(12,B0,B1,B2,B3);
SBoxE4(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
106 key_xor(13,B0,B1,B2,B3);
SBoxE5(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
107 key_xor(14,B0,B1,B2,B3);
SBoxE6(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
108 key_xor(15,B0,B1,B2,B3);
SBoxE7(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
109 key_xor(16,B0,B1,B2,B3);
SBoxE0(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
110 key_xor(17,B0,B1,B2,B3);
SBoxE1(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
111 key_xor(18,B0,B1,B2,B3);
SBoxE2(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
112 key_xor(19,B0,B1,B2,B3);
SBoxE3(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
113 key_xor(20,B0,B1,B2,B3);
SBoxE4(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
114 key_xor(21,B0,B1,B2,B3);
SBoxE5(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
115 key_xor(22,B0,B1,B2,B3);
SBoxE6(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
116 key_xor(23,B0,B1,B2,B3);
SBoxE7(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
117 key_xor(24,B0,B1,B2,B3);
SBoxE0(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
118 key_xor(25,B0,B1,B2,B3);
SBoxE1(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
119 key_xor(26,B0,B1,B2,B3);
SBoxE2(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
120 key_xor(27,B0,B1,B2,B3);
SBoxE3(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
121 key_xor(28,B0,B1,B2,B3);
SBoxE4(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
122 key_xor(29,B0,B1,B2,B3);
SBoxE5(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
123 key_xor(30,B0,B1,B2,B3);
SBoxE6(B0,B1,B2,B3);
transform(B0,B1,B2,B3);
124 key_xor(31,B0,B1,B2,B3);
SBoxE7(B0,B1,B2,B3);
key_xor(32,B0,B1,B2,B3);
125
126 store_le(out + 16*i, B0, B1, B2, B3);
127 }
128 }
129
130
131
132
133void Serpent::decrypt_n(const uint8_t in[], uint8_t out[], size_t blocks) const
134 {
135 verify_key_set(m_round_key.empty() == false);
136
137#if defined(BOTAN_HAS_SERPENT_AVX2)
138 if(CPUID::has_avx2())
139 {
140 while(blocks >= 8)
141 {
142 avx2_decrypt_8(in, out);
143 in += 8 * BLOCK_SIZE;
144 out += 8 * BLOCK_SIZE;
145 blocks -= 8;
146 }
147 }
148#endif
149
150#if defined(BOTAN_HAS_SERPENT_SIMD)
151 if(CPUID::has_simd_32())
152 {
153 while(blocks >= 4)
154 {
155 simd_decrypt_4(in, out);
156 in += 4 * BLOCK_SIZE;
157 out += 4 * BLOCK_SIZE;
158 blocks -= 4;
159 }
160 }
161#endif
162
164 {
165 uint32_t B0, B1, B2, B3;
166 load_le(in + 16*i, B0, B1, B2, B3);
167
168 key_xor(32,B0,B1,B2,B3);
SBoxD7(B0,B1,B2,B3);
key_xor(31,B0,B1,B2,B3);
169 i_transform(B0,B1,B2,B3);
SBoxD6(B0,B1,B2,B3);
key_xor(30,B0,B1,B2,B3);
170 i_transform(B0,B1,B2,B3);
SBoxD5(B0,B1,B2,B3);
key_xor(29,B0,B1,B2,B3);
171 i_transform(B0,B1,B2,B3);
SBoxD4(B0,B1,B2,B3);
key_xor(28,B0,B1,B2,B3);
172 i_transform(B0,B1,B2,B3);
SBoxD3(B0,B1,B2,B3);
key_xor(27,B0,B1,B2,B3);
173 i_transform(B0,B1,B2,B3);
SBoxD2(B0,B1,B2,B3);
key_xor(26,B0,B1,B2,B3);
174 i_transform(B0,B1,B2,B3);
SBoxD1(B0,B1,B2,B3);
key_xor(25,B0,B1,B2,B3);
175 i_transform(B0,B1,B2,B3);
SBoxD0(B0,B1,B2,B3);
key_xor(24,B0,B1,B2,B3);
176 i_transform(B0,B1,B2,B3);
SBoxD7(B0,B1,B2,B3);
key_xor(23,B0,B1,B2,B3);
177 i_transform(B0,B1,B2,B3);
SBoxD6(B0,B1,B2,B3);
key_xor(22,B0,B1,B2,B3);
178 i_transform(B0,B1,B2,B3);
SBoxD5(B0,B1,B2,B3);
key_xor(21,B0,B1,B2,B3);
179 i_transform(B0,B1,B2,B3);
SBoxD4(B0,B1,B2,B3);
key_xor(20,B0,B1,B2,B3);
180 i_transform(B0,B1,B2,B3);
SBoxD3(B0,B1,B2,B3);
key_xor(19,B0,B1,B2,B3);
181 i_transform(B0,B1,B2,B3);
SBoxD2(B0,B1,B2,B3);
key_xor(18,B0,B1,B2,B3);
182 i_transform(B0,B1,B2,B3);
SBoxD1(B0,B1,B2,B3);
key_xor(17,B0,B1,B2,B3);
183 i_transform(B0,B1,B2,B3);
SBoxD0(B0,B1,B2,B3);
key_xor(16,B0,B1,B2,B3);
184 i_transform(B0,B1,B2,B3);
SBoxD7(B0,B1,B2,B3);
key_xor(15,B0,B1,B2,B3);
185 i_transform(B0,B1,B2,B3);
SBoxD6(B0,B1,B2,B3);
key_xor(14,B0,B1,B2,B3);
186 i_transform(B0,B1,B2,B3);
SBoxD5(B0,B1,B2,B3);
key_xor(13,B0,B1,B2,B3);
187 i_transform(B0,B1,B2,B3);
SBoxD4(B0,B1,B2,B3);
key_xor(12,B0,B1,B2,B3);
188 i_transform(B0,B1,B2,B3);
SBoxD3(B0,B1,B2,B3);
key_xor(11,B0,B1,B2,B3);
189 i_transform(B0,B1,B2,B3);
SBoxD2(B0,B1,B2,B3);
key_xor(10,B0,B1,B2,B3);
190 i_transform(B0,B1,B2,B3);
SBoxD1(B0,B1,B2,B3);
key_xor( 9,B0,B1,B2,B3);
191 i_transform(B0,B1,B2,B3);
SBoxD0(B0,B1,B2,B3);
key_xor( 8,B0,B1,B2,B3);
192 i_transform(B0,B1,B2,B3);
SBoxD7(B0,B1,B2,B3);
key_xor( 7,B0,B1,B2,B3);
193 i_transform(B0,B1,B2,B3);
SBoxD6(B0,B1,B2,B3);
key_xor( 6,B0,B1,B2,B3);
194 i_transform(B0,B1,B2,B3);
SBoxD5(B0,B1,B2,B3);
key_xor( 5,B0,B1,B2,B3);
195 i_transform(B0,B1,B2,B3);
SBoxD4(B0,B1,B2,B3);
key_xor( 4,B0,B1,B2,B3);
196 i_transform(B0,B1,B2,B3);
SBoxD3(B0,B1,B2,B3);
key_xor( 3,B0,B1,B2,B3);
197 i_transform(B0,B1,B2,B3);
SBoxD2(B0,B1,B2,B3);
key_xor( 2,B0,B1,B2,B3);
198 i_transform(B0,B1,B2,B3);
SBoxD1(B0,B1,B2,B3);
key_xor( 1,B0,B1,B2,B3);
199 i_transform(B0,B1,B2,B3);
SBoxD0(B0,B1,B2,B3);
key_xor( 0,B0,B1,B2,B3);
200
201 store_le(out + 16*i, B0, B1, B2, B3);
202 }
203 }
204
205#undef key_xor
206#undef transform
207#undef i_transform
208
209
210
211
212void Serpent::key_schedule(const uint8_t key[], size_t length)
213 {
214 const uint32_t PHI = 0x9E3779B9;
215
216 secure_vector<uint32_t> W(140);
217 for(size_t i = 0; i != length / 4; ++i)
218 W[i] = load_le<uint32_t>(key, i);
219
220 W[length / 4] |= uint32_t(1) << ((length%4)*8);
221
222 for(size_t i = 8; i != 140; ++i)
223 {
224 uint32_t wi = W[i-8] ^ W[i-5] ^ W[i-3] ^ W[i-1] ^ PHI ^ uint32_t(i-8);
225 W[i] = rotl<11>(wi);
226 }
227
228 SBoxE0(W[ 20],W[ 21],W[ 22],W[ 23]);
229 SBoxE0(W[ 52],W[ 53],W[ 54],W[ 55]);
230 SBoxE0(W[ 84],W[ 85],W[ 86],W[ 87]);
231 SBoxE0(W[116],W[117],W[118],W[119]);
232
233 SBoxE1(W[ 16],W[ 17],W[ 18],W[ 19]);
234 SBoxE1(W[ 48],W[ 49],W[ 50],W[ 51]);
235 SBoxE1(W[ 80],W[ 81],W[ 82],W[ 83]);
236 SBoxE1(W[112],W[113],W[114],W[115]);
237
238 SBoxE2(W[ 12],W[ 13],W[ 14],W[ 15]);
239 SBoxE2(W[ 44],W[ 45],W[ 46],W[ 47]);
240 SBoxE2(W[ 76],W[ 77],W[ 78],W[ 79]);
241 SBoxE2(W[108],W[109],W[110],W[111]);
242
243 SBoxE3(W[ 8],W[ 9],W[ 10],W[ 11]);
244 SBoxE3(W[ 40],W[ 41],W[ 42],W[ 43]);
245 SBoxE3(W[ 72],W[ 73],W[ 74],W[ 75]);
246 SBoxE3(W[104],W[105],W[106],W[107]);
247 SBoxE3(W[136],W[137],W[138],W[139]);
248
249 SBoxE4(W[ 36],W[ 37],W[ 38],W[ 39]);
250 SBoxE4(W[ 68],W[ 69],W[ 70],W[ 71]);
251 SBoxE4(W[100],W[101],W[102],W[103]);
252 SBoxE4(W[132],W[133],W[134],W[135]);
253
254 SBoxE5(W[ 32],W[ 33],W[ 34],W[ 35]);
255 SBoxE5(W[ 64],W[ 65],W[ 66],W[ 67]);
256 SBoxE5(W[ 96],W[ 97],W[ 98],W[ 99]);
257 SBoxE5(W[128],W[129],W[130],W[131]);
258
259 SBoxE6(W[ 28],W[ 29],W[ 30],W[ 31]);
260 SBoxE6(W[ 60],W[ 61],W[ 62],W[ 63]);
261 SBoxE6(W[ 92],W[ 93],W[ 94],W[ 95]);
262 SBoxE6(W[124],W[125],W[126],W[127]);
263
264 SBoxE7(W[ 24],W[ 25],W[ 26],W[ 27]);
265 SBoxE7(W[ 56],W[ 57],W[ 58],W[ 59]);
266 SBoxE7(W[ 88],W[ 89],W[ 90],W[ 91]);
267 SBoxE7(W[120],W[121],W[122],W[123]);
268
269 m_round_key.assign(W.begin() + 8, W.end());
270 }
271
272void Serpent::clear()
273 {
275 }
276
277std::string Serpent::provider() const
278 {
279#if defined(BOTAN_HAS_SERPENT_AVX2)
280 if(CPUID::has_avx2())
281 {
282 return "avx2";
283 }
284#endif
285
286#if defined(BOTAN_HAS_SERPENT_SIMD)
287 if(CPUID::has_simd_32())
288 {
289 return "simd";
290 }
291#endif
292
293 return "base";
294 }
295
296#undef key_xor
297
298}
#define BOTAN_PARALLEL_SIMD_FOR
void zap(std::vector< T, Alloc > &vec)
T load_le(const uint8_t in[], size_t off)
void store_le(uint16_t in, uint8_t out[2])
#define key_xor(round, B0, B1, B2, B3)
#define i_transform(B0, B1, B2, B3)
#define transform(B0, B1, B2, B3)
BOTAN_FORCE_INLINE void SBoxE6(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxE1(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxD6(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxE7(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxD1(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxD3(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxE3(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxD2(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxE4(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxE5(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxD4(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxD5(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxD0(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxE2(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxD7(T &a, T &b, T &c, T &d)
BOTAN_FORCE_INLINE void SBoxE0(T &a, T &b, T &c, T &d)