随缘的博客

Solution to S0DH in D3CTF 2024

2024-04-30T03:19:45.000Z

Here’s the official writeup for S0DH, including the challenge and solutions (intended and unintended).

The challenge

from sage.all import *

from Crypto.Util.number import bytes_to_long
from secret import flag
import hashlib

flag_start = b'd3ctf{'
assert flag.startswith(flag_start)
flag = flag[len(flag_start):-1]
assert len(flag) == 32

a = 38
b = 25
p = 2**a * 3**b - 1

assert is_prime(p)
Fp = GF(p)

Fpx = PolynomialRing(Fp, "x")
x = Fpx.gen()
Fp2 = Fp.extension(x**2 + 1, "ii")
ii = Fp2.gen()

A0 = Fp2(6)
E0 = EllipticCurve(Fp2, [0, A0, 0, 1, 0])
E0.set_order((p+1)**2)

"""
NOTE: Follow SIKE's spec in the generation of E[2^a] torsion basis.
It will allow you to compute the isogeny faster.
"""

sqrtof2 = Fp2(2).sqrt()
f = x**3 + A0 * x**2 + x

Pa = E0(0)
Qa = E0(0)
Pa_done = False
Qa_done = False
d = 0
for c in range(0, p):
    Rx = ii + c
    Ry_square = f(ii + c)
    if not Ry_square.is_square():
        continue
    Ra = E0.lift_x(Rx)
    Pa = 3**b * Ra

    Ta = 2 ** (a - 1) * Pa
    if Ta.is_zero():
        continue
    Tax_plus_3 = Ta.xy()[0] + 3
    if Tax_plus_3 == 2 * sqrtof2 or Tax_plus_3 == -2 * sqrtof2:
        Pa_done = True
    elif Tax_plus_3 == 3 and not Qa_done:
        Qa = Pa
        Qa_done = True
    else:
        raise ValueError('Unexcepted order 2 point.')

    if Pa_done and Qa_done:
        break

assert Pa.order() == 2**a and Qa.order() == 2**a
assert Pa.weil_pairing(Qa, 2**a) ** (2 ** (a - 1)) != 1



Pb = E0(0)
while (3**(b-1))*Pb == 0:
    Pb = 2**a * E0.random_point()
Qb = Pb
while Pb.weil_pairing(Qb, 3**b)**(3**(b-1)) == 1:
    Qb = 2**a * E0.random_point()

# print(Pa,Qa,Pb,Qb)
print(f'Pa = {Pa.xy()}')
print(f'Qa = {Qa.xy()}')
print(f'Pb = {Pb.xy()}')
print(f'Qb = {Qb.xy()}')



sa = randint(0, 2**a-1)
Ra = Pa + sa * Qa
phia = E0.isogeny(kernel=Ra, algorithm='factored', model='montgomery', check=False)
Ea = phia.codomain()

sb = randint(0, 3**b-1)
Rb = Pb + sb * Qb
phib = E0.isogeny(kernel=Rb, algorithm='factored', model='montgomery', check=False)

Ea, phia_Pb, phia_Qb = phia.codomain(), phia(Pb), phia(Qb)
Eb, phib_Pa, phib_Qa = phib.codomain(), phib(Pa), phib(Qa)

# This time, no Alice torsion point image.
# print(phia_Pb,phia_Qb)

print(f'phib_Pa = {phib_Pa.xy()}')
print(f'phib_Qa = {phib_Qa.xy()}')

print(f'Ea: {Ea}')
print(f'Eb: {Eb}')

phib_Ra = phib_Pa + sa * phib_Qa
Eab = Eb.isogeny(kernel=phib_Ra, algorithm='factored', model='montgomery', check=False).codomain()
jab = Eab.j_invariant()

phia_Rb = phia_Pb + sb * phia_Qb
Eba = Ea.isogeny(kernel=phia_Rb, algorithm='factored', model='montgomery', check=False).codomain()
jba = Eba.j_invariant()

assert jab == jba
h = bytes_to_long(hashlib.sha256(str(jab).encode()).digest())
enc = h ^ bytes_to_long(flag)
print(f'enc = {enc}')


"""
Pa = (199176096138773310217268*ii + 230014803812894614137371, 21529721453350773259901*ii + 106703903226801547853572)
Qa = (8838268627404727894538*ii + 42671830598079803454272, 232086518469911650058383*ii + 166016721414371687782077)
Pb = (200990566762780078867585*ii + 156748548599313956052974, 124844788269234253758677*ii + 161705339892396558058330)
Qb = (39182754631675399496884*ii + 97444897625640048145787, 80099047967631528928295*ii + 178693902138964187125027)
phib_Pa = (149703758091223422379828*ii + 52711226604051274601866, 112079580687990456923625*ii + 147229726400811363889895)
phib_Qa = (181275595028116997198711*ii + 186563896197914896999639, 181395845909382894304538*ii + 69293294106635311075792)
Ea: Elliptic Curve defined by y^2 = x^3 + (11731710804095179287932*ii+170364860453198752624563)*x^2 + x over Finite Field in ii of size 232900919541184113672191^2
Eb: Elliptic Curve defined by y^2 = x^3 + (191884939246592021710422*ii+96782382528277357218650)*x^2 + x over Finite Field in ii of size 232900919541184113672191^2
enc = 48739425383997297710665612312049549178322149326453305960348697253918290539788
"""

The Flag

d3ctf{is0geny_gr4ph_m33t_1n_7he_m1ddl3}

Intended Solution

The main idea

Meet in the middle attack has time and space complexity $O(2^{a/2}) = O(p^{1/4})$. Using the given isogeny computing function, it takes about 1h to solve Alice’s secret isogeny $\phi_a$.

MITM

Let $K_a = 2^{a/2}P_a + s_a \cdot 2^{a/2}Q_a$, where $\left \langle P_a + s_a \cdot Q_a\right\rangle$ is the kernel of $\phi_a$. As a path in the 2-isogeny graph, $\phi_a$ passes through the node $E_{mid1} := E_0/ \left\langle{K_a}\right\rangle$.

Therefore we can compute all possible $2^{a/2}$-isogenies and construct a hash table. The keys are the j-invariant of codomains and the values are ${s_a}\pmod{2^{a/2}}$.

Remark: In my script, I compute $2^{a/2+1}$-isogenies and construct the hash table. Because at first, I planned to set a=43 in the challenge.

Use the j-invariant as the key of hash table

Note that each node of isogeny graph is an isomorphism class (over $\mathbb{F_{p^2}}$) of elliptic curve, so we need to compute the j-invariant (an isomorphic invariant) and use it as the key of our hash table.

The j-invariant of a untwisted Montgomery curve $E_A$ is

$j_A = \frac{256(A^2-3)^3}{A^2 - 4}.$

To avoid unnecessary computation of inversion, write $A = A_x/A_z$ and we get

$j_A = \frac{256(A_x^2 - 3A_z^2)^3}{A_z^4(A_x^2 - 4A_z^2)}.$

See [1] for the j-invariant.

So we can use 1 inversion to compute the $j_A$ from the fractional representation of $A$.

Working with the given isogeny formula

Note that computing $2^a$-isogeny requires us to compute a chain a 2-isogeny and 4-isogeny. As SIKE’s spec pointed out in page 6~7, the input kernel point of isog2 cannot be $(0,0)$, and the input kernel point of isog4 cannot be $(1, \cdot)$ or $(-1, \cdot)$.

So how can we make use of this formula to compute isogenies starting from $E_a$?
The generation process of $P_a$ and $Q_a$ in challenge.py suggests that we can choose $Q_a’$ such that $2^{a-1} \cdot Q_a’ = (0,0)$, and choose a $P_a’$ such that $e_{2^{a}}(P_a’, Q_a’)$ is a primitive $2^a$-th root.

Searching from $E_a$

According to the structure of 2-isogeny graph, there are $3 \cdot 2^{a/2-1} $ isogenies to try. But taking $2^{a/2}P_a’ + s_a’ \cdot 2^{a/2}Q_a’$ as the kernel only makes $2^{a/2}$ isogenies.

In fact, the other isogenies correspond to $\left\langle{t_a’P_a’ + Q_a’}\right\rangle$, where $t_a’=0,2, …, 2^{a/2}$.

After MITM

The collision gives us ${s_a}\pmod{2^a}$ and $t_a’, s_a’$ , where $E_{mid2} := E_a/\left\langle K_a’\right\rangle \cong E_{mid1}$ and $K_a’ = 2^{a/2}(t_a’P_a’ + s_a’Q_a’)$

Denote $\phi_1: E_0 \to E_{mid1}$, $\phi_2: E_a \to E_{mid2}$, $\sigma: E_{mid1} \xrightarrow{\sim} E_{mid2}$ .
We can reconstruct the isogeny $\phi_a = \hat{\phi_2} \circ \sigma \circ \phi_1$ with the help of sagemath.

Since $\phi_a(P_a+s_aQ_a) = O$, we have $\phi_a(P_a) = -s_a\phi_a(Q_a)$. So we can solve the discrete logarithm to recover $s_a$

Now it is sufficient to follow SIDH protocol to find $j_{AB}$.

Some Further Optimization

In fact, there are some further optimization for the attack [3] and the computation of isogeny chain (optimal strategy) [2, 4].

code

from sage.all import *

from Crypto.Util.number import *
import hashlib

import json
# import multiprocessing as mp

import time

## Parameters

a = 38
b = 25
p = 2**a * 3**b - 1
assert is_prime(p)

Fp = GF(p)

Fpx = PolynomialRing(Fp, "x")
x = Fpx.gen()
Fp2 = Fp.extension(x**2 + 1, "ii")
ii = Fp2.gen()

A0 = Fp2(6)
E0 = EllipticCurve(Fp2, [0, A0, 0, 1, 0])
assert E0.is_supersingular(proof=False)


Pa = (199176096138773310217268*ii + 230014803812894614137371, 21529721453350773259901*ii + 106703903226801547853572)
Qa = (8838268627404727894538*ii + 42671830598079803454272, 232086518469911650058383*ii + 166016721414371687782077)
Pb = (200990566762780078867585*ii + 156748548599313956052974, 124844788269234253758677*ii + 161705339892396558058330)
Qb = (39182754631675399496884*ii + 97444897625640048145787, 80099047967631528928295*ii + 178693902138964187125027)


Pa = E0(Pa)
Qa = E0(Qa)
Pb = E0(Pb)
Qb = E0(Qb)

ka = 11731710804095179287932*ii+170364860453198752624563
kb = 191884939246592021710422*ii+96782382528277357218650
Ea = EllipticCurve(Fp2, [0, ka, 0, 1, 0])
Eb = EllipticCurve(Fp2, [0, kb, 0, 1, 0])
phib_Pa = (149703758091223422379828*ii + 52711226604051274601866, 112079580687990456923625*ii + 147229726400811363889895)
phib_Qa = (181275595028116997198711*ii + 186563896197914896999639, 181395845909382894304538*ii + 69293294106635311075792)
phib_Pa = Eb(phib_Pa)
phib_Qa = Eb(phib_Qa)

enc = 48739425383997297710665612312049549178322149326453305960348697253918290539788

## attack


### isogenys
def xA24(Aaffine):
    return Aaffine + 2, 4


def get_A_from_A24(A24: tuple):
    A2C, FOUR_C = A24
    FOUR_A = 2 * A2C - FOUR_C  # A+2C + A+2C - 4C = 2A
    FOUR_A = 2 * FOUR_A  # 2A + 2A = 4A
    return FOUR_A, FOUR_C


# Get j-invariant from coeff (coeff in the form of fraction)
def get_j_invariant(A: tuple):
    Ax, Az = A
    Ax_square = Ax**2
    Az_square = Az**2
    Jx = 256 * (Ax_square - 3 * Az_square) ** 3  # Jx = 256(Ax^2 - 3Az^2)^3
    Jz = Ax_square * Az_square**2 - 4 * Az_square**3  # Jz = Ax^2*Az^4 - 4Az^6
    if Jz == 0:
        print(f"A = {A}")
    return Jx * Jz ** (-1)


# phi: E -> E/ =: E2
# All points of input and output are projective x-coordinate,
# i.e. if P = (XP: YP: ZP) ∈ E, then P is (XP, ZP) in the code
# Input: E's A24, kernel point K of order 2, T the point to push
# Output: E2's A24, phi(T)
def isog2(K, T):
    if K[0] == 0:
        print("Meet the case we cannot use isog2.")
        return None

    # return new curve's A24 = (A+2C: 4C).q
    def xisog2(K):
        XP, ZP = K
        A24_plus = XP**2
        C24 = ZP**2
        A2C = C24 - A24_plus
        return A2C, C24

    # P: kernel point, Q: point to push
    def xeval2(P, Q):
        XP, ZP = P
        XQ, ZQ = Q
        T0 = XP + ZP
        T1 = XP - ZP
        T2 = XQ + ZQ
        T3 = XQ - ZQ
        T0 = T0 * T3
        T1 = T1 * T2
        T2 = T0 + T1
        T3 = T0 - T1
        XR = XQ * T2
        ZR = ZQ * T3
        return XR, ZR

    A24new = xisog2(K)
    # Anew = get_A_from_A24(A24new)
    phiT = xeval2(K, T)
    # return Anew, phiT
    return A24new, phiT


def isog4(K, T):
    # get new curve's A24 and three coeff for xeval4
    if K[0] == 1 or K[0] == -1:
        return None

    def xisog4(P):
        XP, ZP = P

        K2 = XP - ZP
        K3 = XP + ZP
        K1 = ZP**2
        K1 = K1 + K1
        C24 = K1**2
        K1 = K1 + K1
        A24_plus = XP**2
        A24_plus = A24_plus + A24_plus
        A24_plus = A24_plus**2
        return (A24_plus, C24), (K1, K2, K3)

    def xeval4(P, coeff):
        XP, ZP = P
        T0 = XP + ZP
        T1 = XP - ZP
        XP = T0 * coeff[1]
        ZP = T1 * coeff[2]
        T0 = T0 * T1
        T0 = coeff[0] * T0
        T1 = XP + ZP
        ZP = XP - ZP
        T1 = T1**2
        ZP = ZP**2
        XP = T1 + T0
        T0 = ZP - T0
        XR = XP * T1
        ZR = ZP * T0
        return XR, ZR

    A24, coeff = xisog4(K)
    phi_T = xeval4(T, coeff)
    return A24, phi_T


def xmul_2k(A24: tuple, k: int, T: tuple):
    assert k >= 0

    def xdbl(P: tuple, A24: tuple) -> tuple:
        XP, ZP = P
        # assert XP != 0 and ZP != 0
        if XP == 0 or ZP == 0:
            print(f"k={k}")
            # print(f'XP={XP}')
            # print(f'ZP={ZP}')
        V1 = XP + ZP  # line 1 of my pseudo code
        V1 **= 2
        V2 = XP - ZP
        V2 **= 2
        Z2P = A24[1] * V2
        X2P = Z2P * V1  # line 6 of my pseudo code
        V1 -= V2
        Z2P += A24[0] * V1
        Z2P *= V1
        return X2P, Z2P

    for _ in range(k):
        T = xdbl(T, A24)
    return T


# A: Estart affine coeff, T: kernel point (sagemath EC point object), k: T has order 2**k (same as the degree of this isogeny)
def isog_2k(A, T, k):
    T = T[0], T[2]
    A24 = xA24(A)
    if k % 2 == 1:
        # T has order 2^a
        P = T
        P = xmul_2k(A24, k - 1, P)  # now P has order 2
        result_isog2 = isog2(P, T)
        if result_isog2 is None:
            return None
        A24, T = result_isog2
        k -= 1
    assert k % 2 == 0
    for i in range(2, k + 2, 2):
        # T has order 2^(a-i+1)
        P = T
        P = xmul_2k(A24, k - i, P)  # now P has order 4
        result_isog4 = isog4(P, T)
        if result_isog4 is None:
            return None
        A24, T = result_isog4

    Anew = get_A_from_A24(A24)
    J = get_j_invariant(Anew)
    return J, Anew


### MITM

#### Building a hash table, start from E0


def compute_hash_table(sa_start=0, sa_stop=2 ** (a // 2 - 1), steps=a // 2 + 1):
    table = {}

    Pa_new = 2 ** (a - steps) * Pa
    Qa_new = 2 ** (a - steps) * Qa
    sa = sa_start

    Ra = Pa_new + sa * Qa_new
    while sa < sa_stop:
        # Using the basis in SIKE spec, our formula never fail.
        Jnew, Anew = isog_2k(A0, Ra, steps)
        # table[Jnew] = (Anew, sa)
        table[Jnew] = sa
        # table[str(Jnew)]
        Ra += Qa_new
        sa += 1
    return table


time1 = time.time()

steps = a // 2 + 1

print("Start computing table.")

# NOTE: The following code for parallel will raise segmentation fault on my PC...
# Maybe the problem has something to do with thread lock of finite field element?

## multiproc
# num_proc = 12
# # assert num_proc % 2 == 0
# size_per_proc = 2**steps // num_proc
# parameters = [[i*size_per_proc, (i+1)*size_per_proc, steps] for i in range(0, num_proc)]
# parameters[-1][1] = 2**steps
# print(f'parameters = {parameters}')
# with mp.Pool(num_proc) as p:
#     tables = p.starmap(compute_hash_table, parameters)

table2 = compute_hash_table(0, 2**steps, steps)

time2 = time.time()

print(f"Hash table built, takes {time2-time1} seconds")


# NOTE: You need to convert finite field type  to str, Integer type to int before json.dump
# with open('hash_table.json', 'w') as f:
#     json.dump(table2)


### from another side (start from Ea)

Pa_E0 = deepcopy(Pa)
Qa_E0 = deepcopy(Qa)

# First choose a nice basis for Ea[2^b]
Pa = Ea(0)
Qa = Ea(0)
while True:
    Qa = Ea.random_point()
    Qa = 3**b * Qa
    Ra = 2 ** (a - 1) * Qa
    if Ra.is_zero():
        continue
    assert Ra.order() == 2
    if Ra.xy()[0] == 0:
        break
    else:
        print(f"Ra = {Ra}")
print("Qa found.")
while True:
    Pa = Ea.random_point()
    Pa = 3**b * Pa
    if Pa.weil_pairing(Qa, 2**a) ** (a - 1) != 1:
        break
print("Pa found.")

assert Pa.order() == 2**a and Qa.order() == 2**a
assert Pa.weil_pairing(Qa, 2**a) ** (2 ** (a - 1)) != 1


steps = a - steps


def search_from_Ea(steps=steps):
    # Save the collision with hashtable where the kernel is taPa + saQa
    collision_isogenies = []
    # Save failed isogeny(ta, sa) where the kernel is taPa + saQa
    Pa_new = 2 ** (a - steps) * Pa
    Qa_new = 2 ** (a - steps) * Qa
    failed_isogenies = []

    def search_one_isogeny(ta, sa, Ra):
        result_isog2k = isog_2k(ka, Ra, steps)
        if result_isog2k is None:
            print(f"Isogeny failed for ta={ta}, sa={sa}")
            failed_isogenies.append((ta, sa))
            return
        Jnew, Anew = result_isog2k
        if Jnew in table2:
            collision_isogenies.append((ta, sa, table2[Jnew]))
            print("Found one collision.")
            print(f"Start from Ea, sa={sa}, ta={ta}")
            print(f"Start from E0, sa={table2[Jnew]}")
            print(f"Meet at A={Anew}")
        return

    # First try these 2**steps SIDH-like isogeny
    sa = 0
    Ra = Pa_new
    while sa < 2**steps:
        search_one_isogeny(ta=1, sa=sa, Ra=Ra)
        Ra += Qa_new
        sa += 1
    # Note that we also need to try these isogenies correspond to <(0, 1)>, <(2, 1)>, ..., <(2**steps, 1)>
    ta = 0
    Ra = Qa_new
    two_Pa_new = 2 * Pa_new
    if len(collision_isogenies) == 0:
        print("Collision not found in SIDH like isogenies")
    print("Start searching the second part!")
    while ta < 2**steps:
        search_one_isogeny(ta=ta, sa=1, Ra=Ra)
        Ra += two_Pa_new
        ta += 2
    return collision_isogenies, failed_isogenies


time1 = time.time()
print("Start searching from Ea!!")
collision_isogenies, failed_isogenies = search_from_Ea(steps)

time2 = time.time()

print(f"Collision search from Ea over, takes {time2-time1} seconds")

### reconstruct phi using sagemath

print(f"collision_isogenies = {collision_isogenies}")
print(f"failed_isogenies = {failed_isogenies}")

ta, sa, sa_E0 = collision_isogenies[0]

Pa_new_E0 = (2**steps) * Pa_E0
Qa_new_E0 = (2**steps) * Qa_E0
Ka_E0 = Pa_new_E0 + sa_E0 * Qa_new_E0
phi1 = E0.isogeny(kernel=Ka_E0, algorithm="factored", model="montgomery")
E_middle_1 = phi1.codomain()

Pa_new_Ea = 2 ** (a - steps) * Pa
Qa_new_Ea = 2 ** (a - steps) * Qa
Ka_Ea = ta * Pa_new_Ea + sa * Qa_new_Ea
phi2 = Ea.isogeny(kernel=Ka_Ea, algorithm="factored", model="montgomery")
E_middle_2 = phi2.codomain()

assert E_middle_1.j_invariant() == E_middle_2.j_invariant()

sigma = E_middle_1.isomorphism_to(E_middle_2)
phi2_hat = phi2.dual()
phi = phi2_hat*sigma*phi1

phi_Pa_E0 = phi(Pa_E0)
phi_Qa_E0 = phi(Qa_E0)
sa = -phi_Qa_E0.discrete_log(phi_Pa_E0)
if sa < 0:
    sa += 2**a

Ea_solved = E0.isogeny(kernel=Pa_E0+sa*Qa_E0, algorithm='factored',model='montgomery').codomain()
assert Ea_solved == Ea

Eab = Eb.isogeny(kernel=phib_Pa + sa*phib_Qa, algorithm='factored',model='montgomery').codomain()
jab = Eab.j_invariant()
print(f'jab = {jab}')

## decryption
h = bytes_to_long(hashlib.sha256(str(jab).encode()).digest())
flag = long_to_bytes(h ^ enc)
print(f'flag = {flag}')

Unintended Solution

Actually, there are some alternative ways to find a collision.

In [5] there’s an attack leverages modular polynomial, and it compute the j-invariant only when computing 2-isogeny, instead of computing coefficient of the codomain. That’s really cool!

Another way is to get order-two points with sagemath’s division_points when going one step in DFS. (I thank hash_hash for telling me that) It seems that division_points make use of division polynomial to get these order-two points with low cost. Usually, when the degree of isogeny $l$ is a larger prime, we need to sample a random point $R$ and compute $(p+1)/l * R$. This is one of the main reasons why isogeny is slow! Another way is to push some points through the isogeny, but I think this is complicated in the scenario of MITM attack, perhaps not doable.

Here’s a MITM snippet using division_points and DFS from hash_hash.

# NOTE: from Hash Team hash_hash

from Crypto.Util.number import *
    
def dp(way, E):
    if len(way) > deepth:
        return 0
    ker = E(0).division_points(2)[1:]
    j_next = [E.isogeny_codomain(k).j_invariant() for k in ker]
    for j in j_next:
        if j not in forward.keys():
            forward[j] = way+[j]
            dp(way+[j], EllipticCurve(j=Fp2(j)))

def dp_find(way, E):
    if len(way) > deepth:
        return 0
    ker = E(0).division_points(2)[1:]
    j_next = [E.isogeny_codomain(k).j_invariant() for k in ker]
    for j in j_next:
        if j in forward.keys():
            col = forward[j]+way[::-1]
            print("FIND!", len(col))
        elif j not in back.keys():
            back[j] = way+[j]
            dp_find(way+[j], EllipticCurve(j=Fp2(j)))

a = 38
b = 25
p = 2**a * 3**b - 1

assert is_prime(p)
Fp = GF(p)

Fpx = PolynomialRing(Fp, "x")
x = Fpx.gen()
Fp2 = Fp.extension(x**2 + 1, "ii")
ii = Fp2.gen()

A0 = Fp2(6)
E0 = EllipticCurve(Fp2, [0, A0, 0, 1, 0])

A1 = Fp2(11731710804095179287932*ii+170364860453198752624563)
A2 = Fp2(191884939246592021710422*ii+96782382528277357218650)

Ea = EllipticCurve(Fp2, [0, A1, 0, 1, 0])
Eb = EllipticCurve(Fp2, [0, A2, 0, 1, 0])

E_now = EllipticCurve(j=Fp2(0))
E_start = E0
E_end = Ea

forward = {}
back = {}
deepth = 19

forward[E_start.j_invariant()] = [E_start.j_invariant()]
back[E_end.j_invariant()] = E_end.j_invariant()
print("dp start")
dp([E_start.j_invariant()], E_start)
print("Search")
dp_find([E_end.j_invariant()], E_end)

By the way, a similar challenge had already appeared in the race SEETF 2023. Only after the race did I recognize that… See maple’s writeup for IsogenyMaze [6].

Reference

And you don’t want to miss this interesting song! Kani came in like a wrecking ball

LadderLeak论文分享

2023-11-03T03:42:03.000Z

去年在课上讲过一篇论文：LadderLeak: Breaking ECDSA With Less Than One Bit Of Nonce Leakage，现在把幻灯片发出来

LadderLeak幻灯片.pdf

复变函数笔记

2023-09-05T13:38:40.000Z

（9.21更新，不过当时部署之后没更新显示…）

学习了史济怀的《复变函数》第2~4章。第五章没细看，因为个人需求是会洛朗展开和留数定理去计算就行，而这两个东西早就知道了，因此就看了Borcherds的课，跟着用草稿纸去算一算特定的积分。

笔记有很多习题空着了，部分内容也跳过了。不过确实是写了自己思考的一些东西… 也许有一天再用复分析的时候干脆讲一讲，再完善一下这些笔记。还有二次剩余分布问题也可以讲一讲。

感觉数位板还是适合手头有纸质的初步笔记，然后边讲边写。直接对着电脑看效果差一点。

史济怀《复变函数》第二章笔记

史济怀《复变函数》第三章笔记

史济怀《复变函数》第四章笔记

其他参考资料

Richard E. Borcherds的复分析课程
Complex Analysis by Alhfors
龚昇 - 《简明复分析》
之前学习点集拓扑和初步代数拓扑的笔记
Complex Analysis Cheat Sheet by BhorisDhanjal (github)

知识分享会：密码学中的椭圆曲线

2023-04-17T04:18:02.000Z

(2023.4) 计划增加一些新内容（但可能没时间了…）

椭圆曲线密码学实际上涉及到不少高深的数学知识。2022年10月在Nepnep战队做了一次线上分享，听众还有其他对密码学感兴趣的朋友以及geek学院的朋友等。主要内容是代数学基础回顾、射影几何基础以及GTM 106前三章的部分内容。

勘误和补充

勘误

观看视频时请打开弹幕，其中提示了一些错误

补充

$E/K$和$E(K)$的定义，以及两者之间的区别：
- $E/K$：一种简写，表明$E$是定义在域$K$上的椭圆曲线，即曲线方程的系数属于$K$. 注意曲线 $E$ 的点为 $\mathbb{P}^2=\mathbb{P}^2(\overline{K})$中所有满足方程的点，因此其坐标分量不必属于$K$
- $E(K)$：椭圆曲线$E$的所有$K-$有理点，即坐标分量均属于$K$的那些点，是一个群。
自然地，$E=E(\overline{K})$.
注意扭点群的定义、Weil对的反对称性等

主要内容

2022.10 分享

群环域回顾和一点概形的精神
射影空间基础
椭圆曲线的方程、椭圆曲线点群公式、代数曲线上的有理函数域、曲线间的态射、二次孪生曲线(quadratic twist)、阶数、映射度、分歧指数、非零有理函数零极点的重数之和相等。
除子、主除子、黎曼罗赫定理及其推论、Picard群（特别是Jacobian）、椭圆曲线点群与它的Jacobian同构、双线性对及其应用

待补充（同源密码用）

椭圆曲线的黎曼面视角与代数曲线视角
同源基本概念：同源的定义、映射度、扭点与核、映射度与核的关系
Velu公式及其优化，以及其他的计算同源的算法
对偶同源（黎曼面视角和除子视角）
同构及其概念问题（所在的域，映射度）
Weil猜想和Sato-Tate定理
子群与同源的对应
超奇异椭圆曲线：几种等价定义、自同态环的结构
同源图，特别是超奇异椭圆曲线同源图，以及Richelot同源和超特殊主极化阿贝尔面同源图(isogeny graph of superspecial principally polarized abelian surfaces over $\overline{\mathbb{F}_p}$)等等
“Kani wreck SIKE” (i.e. Kani’s “reducibility criterion” and Castryck-Decru attack and maybe more)
除子的推前拉回、函数的推前拉回、主除子度数为0的一个代数证明
除子定义的Weil对、函数定义的Weil对、Tate对、Ate对等等及相关的计算算法
除子的几何对应——线丛
~~线性系统(linear system)、充沛除子(ample divisor)、充沛线丛(very ample line bundle)~~
曲线的点数

上述条目的2/3可以在黎曼面相关的书籍中学到（书籍见后）

视频、手写稿

B站视频合集：https://www.bilibili.com/video/BV15V4y1V71d

2022年10月分享手写稿：https://pan.baidu.com/s/1b_Whla_qhKVqu2KyLz6tCQ?pwd=hxd7

后续推荐资料

适用于密码学的

Elliptic Curves Notes
可以看下Weil对和Tate对是怎么用除子定义的。
Paper from JoC 2004: The Weil Pairing, and Its Efficient Calculation
JoC，密码界最强顶刊，其含金量甚至大于顶会。干脆来看这篇学Weil对
Elliptic Curves Number Theory and Cryptography
前言中说明了适用于密码学的学习章节，不过isogeny那章也可以看一看，是椭圆曲线同源密码的那个同源。
基于椭圆曲线中配对的密码学研究综述（综述论文）
安全的椭圆曲线
安全性问题比如Ladder, Twist，MOV攻击，FR约化攻击… Weil Descent Attack就很难了，我到现在都感觉自己还差不少才能看懂。GTM106也只讲到2-descent。Milne的Elliptic Curves讲义可能有Weil restriction。
椭圆与超椭圆曲线公钥密码的理论和实现
难得的一本中文书，各种高级的攻击在里面都有写…
双线性对的应用，如：双线性对的三方一轮密钥协商，各种IBE、ABE方案… 双线性对曾经是密码学中最强大的数学工具，用它可以实现一些功能非常强大的、让人意想不到的密码学功能。
Mathematics of Isogeny Based Cryptography
关注同源，谢谢！

适用于数学的

Fulton的代数曲线
入门古典代数几何用，有配套讲义。
Elliptic Curves Number Theory and Cryptography
比GTM106简单些。
GTM 106 The Arithmetic of Elliptic Curves
后半要会一些代数数论才能看，有网上课程
Algebraic Curves and Riemann Surfaces by Rick Miranda
如果想绕过代数几何直观地搞懂视频中的一些结论，应该看这个紧黎曼面的内容。非常友好的书，稍微学一些点集拓扑、基本群、微分流形，再看一个基础的单变量复变函数课就可以读的很顺畅。Geek学院的Ultra做过一次紧黎曼面的沙龙，推荐看视频配着书，把握住重点。
椭圆与超椭圆曲线公钥密码的理论和实现
感受一下椭圆曲线密码学攻击中的各种数学吧，你能看到De Rham上同调，同调群，Brauer群、Weil restriction等等…
不过有些地方作者似乎试图写得初等一点可能乍一看看不出来，例如Smart Attack实际上用到GTM 106第五章的一些知识（这还被写在了“一些初等的攻击”那一章…）。

参考资料

GTM 106 - The Arithmetic of Elliptic Curves by Joseph H. Silverman
Algebraic Curves and Riemann Surfaces by Rick Miranda
Geek学院紧黎曼面沙龙（配套Miranda）：https://www.bilibili.com/video/BV1FY4y1k7x
一个 GTM 106 的课程：https://www.bilibili.com/video/BV1gN411o7un
李卫平的代数几何短课：https://www.bilibili.com/video/BV1BD4y1o74e
⑨代数：概形的灵感：https://www.bilibili.com/video/BV1Qx411i7b2
刘思齐的《几何与对称》课程：https://www.bilibili.com/video/BV1AU4y1A7u9

致谢

感谢@朱子阳的热心解惑。

另外这次分享中有几次挂黑板，也有很多很多没讲到位的地方。感谢各位听众的理解与支持！

NepCTF2022 - COA_RSA解读

2023-02-23T08:23:03.000Z

之前给NepCTF 2022出了几道密码题，其中就包括这道… 官方题解WP在这里。当时是想出一道反论文题，不过赛后发现做出来的选手中很多还是看论文做的。题目对应的论文本身写得很差，不推荐阅读。

后来跟shallow师傅讨论了一下，又看了下当时的WP发现有很多细节没说，并且有点小问题。因此现在补充一下。

本题涉及内容

Carmichael定理, $\mathbb{Z}_{N}^{\ast}$ 的阶, Minkowski定理, Gauss reduction算法

模N乘法群中元素的阶（一个Carmichael定理的推导）

(2023.8 补充)： 不知道为什么之前自己写得那么复杂，实际上在群同构$\mathbb{Z}_{N}^{\ast} \cong \mathbb{Z}_{p}^{\ast} \times \mathbb{Z}_{q}^{\ast}$ 的视角下Carmichael定理是很容易看出来的。取模$p$原根$g_1$，模$q$原根$g_2$，$\mathbb{Z}_{N}^{\ast}$ 的元素在同构下对应某一个$(g_{1}^{x}, g_{2}^{y})$，于是他们的阶显然整除$\lambda(N)$。

以下思路过于繁琐，不过这里仍然保留一下。

WP中已经说明本题 $m^{1-e} \pmod n$ 比较小，这意味着$1-e$以极大的概率接近 $\text{ord}(m)$的倍数，据此我们可以推断出$1-e$的形式。现在关键问题是 $\text{ord}(m)$ 应该是什么样的形式？当时在这个问题上，很多师傅都翻车了。当时一位师傅做这个题的时候把 $\text{ord}(m)$ 想成了$\phi(N)$。那么 $\text{ord}(m)$ 实际上应该是什么样的形式呢？

先说结论：$\text{ord}(m)$ 整除 $\lambda := \lambda(N)=\text{lcm}(p-1, q-1)$

定理：设 $G$ 是有限Abel群，记 $ o = \max_{a \in G}{\text{ord}(a)} $ （ $o$ 为 $G$ 中阶最大的元素的阶），那么 $\forall a \in G, \ \text{ord}(a) \,| \,o$

为了说明 $ m^{\lambda} \equiv 1 \pmod{N} $，考虑群 $G = \mathbb{Z}_{N}^{}$. 这是一个有限交换的乘法群。假设$\mathbb{Z}_{N}^{}$中阶最大的元素是 $g$ ，考虑中国剩余定理。那么想让 $\text {ord}(g) = o$ 尽量最大的话，最好的可能就是 $g$ 同时是模 $ p $ 和模 $ q $ 的原根。这时 $o = \text{lcm}(p-1, q-1) = \lambda$.

如果不存在一个元素同时是模 $ p $ 和模 $ q $ 的原根，那么 $o$ 也一定整除 $\text{lcm}(p-1, q-1)$.

_不过根据原根的数量这种情况的概率应该很低？也可能根本不存在这种情况？我不清楚。好像有限Abel群结构定理能说明存在性，懒得想了。_

总之， $o$ 一定整除 $\lambda = \text{lcm}(p-1, q-1)$.

结合上个定理，可以推出以下定理。

Carmichael定理： 设 $N = p \cdot q$，其中 $p, q$ 皆为素数。设 $\lambda = \text{lcm}(p-1, q-1) $，则

$\forall a \in \mathbb{Z}_{N} ^{\ast}, \ a^{\lambda} \equiv 1 \pmod{N}$

因此 $\text{ord}(m)$ 整除 $\lambda$ ，因此 $\text{ord}(m)$ 也必然整除 $\phi(N)$

解题思路

总体概括

在challenge.sage中结合Description.md的提示发现 get_e()是从secret中import的没有给出，但是 $e$ 的值是给出的，猜测这个 $e$ 可能有特殊形式所以不能给出。
分析出attack_experiment.sage 攻击原理，写出使用的格。
再根据参数满足理论上的攻击条件使用Minkowski定理（上界），分析出 $e$ 约等于 $\text{ord}(m)$ 的倍数，然后开始找 $e$ 和 $\phi(N)$ 的关系。
计算 $N/e$ 发现非常接近7，因此 $\phi(N)/e$ 也非常接近7。
据此对$\phi(N)$进行爆破，然后用 $\phi(N)$ 分解 $N$ 。

具体细节

阅读attack_experiment.sage代码，推出其攻击原理如下：

$c \equiv m^{e} \pmod{n} \Rightarrow \ c \equiv m^{x} \cdot m^{e-x} \pmod{n} \\ \Rightarrow m^{x-e} \cdot c \equiv m^{x} \pmod{n} \\ \text{令} \ x = 1, \text{则有} \ \ m^{1-e} \cdot c \equiv m \pmod{n} \ \text{。记}\ A = m^{1-e} \! \mod{n}，可得 \\ A\cdot c = m + B\cdot n \ \Rightarrow \ m = A \cdot c - B\cdot n \\ \Rightarrow \begin{bmatrix} A\\m \end{bmatrix} = A \begin{bmatrix} 1\\c \end{bmatrix} - B \begin{bmatrix} 0\\n \end{bmatrix} \ \ \text{，其中} \ A,B \in \mathbb{Z} \text{。} \\ 因此 \begin{bmatrix} A\\m \end{bmatrix} 为格中非零最短向量时可用格基规约算法恢复明文 m。$

根据分析，$\begin{bmatrix} A\\m \end{bmatrix}$ 满足Minkowski界. 于是有

$A^{2} + m^2 = ( m^{1-e} \ \text{mod}\ n )^2 + m^2 \leq 2n$

可见 $m^{1−e} \mod n$ 的量级最大为 $\sqrt{n}$ ，然而很难找到一般的 $e$ 来满足这一点.

可以猜测出 $1−e$ 约等于 $\text{ord}(m)$ 的倍数。考虑找 $e$ 和 $\phi(N)$ 的关系。计算$N/e$发现很接近7，于是 $\phi(N)/e$很接近7。因此 $e= \phi(N)/7 - b$，并且 $b$ 很小。
对 $b$ 进行穷举。已知 $ \phi(N) = (p-1)(q-1) $ 分解 $N=pq$ 是容易的（中学数学），用 $n \mod p = 0$ 来判断当前分解是否正确即可。之后再做常规RSA解密就好了。

出题反思

get_e()没给出，可能有一点脑洞。应该写得再明白一些，e是为了试图满足原攻击条件的特殊的e。
应该直接告诉大家，x在这里等于1。当时是想让大家不看论文并根据attack_experiment.sage的代码逻辑，自己推出论文中那个攻击的原理。但是CTF中大家无疑都是会去看论文的…
附件中Description.md中的提示还是有点少，应该写明白预期解不是基于格的攻击。
WP的一个小问题：这道题的 $\phi(n)/7$ 是 $\text{ord}(m)$ 吗？不可能，注意到 $\lambda$ 是偶数，实际上两者是倍数关系。但是当时太懒就少打了几个字。
正解的思路太复杂，招新赛出这个有点难了。

同态加密：Paillier方案学习

2023-02-23T08:23:03.000Z

本文总结Paillier及其变种Paillier-DJN方案。

Paillier(original)

方案细节

懒得写方案，因为到处都能找到。直接看（知乎）Paillier半同态加密：原理、高效实现方法和应用。

Carmichael定理背后的数学原理

(2023.8) 之前写了一大段，不过因为跟COA_RSA那篇的内容重复，所以现在删掉了

见本博客的另一篇文章：NepCTF2022 - COA_RSA解读

方案的设计思路

待补充…

Paillier-DJN

以下方案与原论文有出入。我这里写的是 section 4.1中，$s=1$时的情况。

KeyGen

Choose two random safe primes $p$, $q$ such that $p,q\equiv 3 \pmod 4$ and $\text{gcd}(p-1, q-1) = 2$
Compute $n = pq \ , \ \lambda = \text{lcm}(p-1, q-1) = (p-1) (q-1) / 2$
Choose $g = n+1$
Choose random $x\leftarrow \mathbb{Z}_n^{*}$ , then compute $h = -x^{2}\ , \ h_s = h^{n} \mod {n^2}$
$pk = (n, h_s)\ , \ sk = \lambda$

Enc

Let $|n|$ denote the bit length of n.

Choose random $a\leftarrow \mathbb{Z}_{ 2^ \left \lceil |n|/2 \right \rceil }$.
Compute ciphertext $c = (1+mn)\cdot h_s^{a} \mod n^{2}$ //We can use CRT to calc $h_s^a \mod n^2$

Dec1

Note that here we assume $m \in \mathbb{Z}_{n}^{*}$ ( i.e. $m < n$)

Compute $m\lambda = L( c^{\lambda} \!\mod n^{2})$, where $L(x) = \frac{x-1}{n}$
Recover $m$ by compute $m = m\lambda \cdot \lambda^{-1} \mod n^{2}$

Dec2

Note that here we assume $m \in \mathbb{Z}_{n^2}^{}$ . *This is the case in the original paper, but it’s far more complicated then Dec1…

这种解密方案似乎没有在实际中应用，并且细节比较繁琐，这里就不写了。

Reference

CatCTF出题小记

2023-02-23T08:22:30.000Z

CatCTF的题目总结以及出题的动机、想法。

DDH_Game

图片来自 A Graduate Course in Applied Cryptography(Version 0.5)

这道题就是在让大家求解椭圆曲线上的DDH问题(ECDDHP)。

解法一

由于题目中的BLS曲线是配对友好曲线，所以可以计算双线性对。

双线性对满足 $e(aG, bG) = e(G, abG)$

这就给了我们一个解DDHP的后门。因此如果随便选一个椭圆曲线点群，ECDDH假设通常是不成立的，并且攻击方法很简单：看等式$e(aG, bG) = e(G, cG)$ 是否成立。个人认为这是一个很优美的做法。

# sagemath 9.5
from Crypto.Util.number import long_to_bytes

# Before running, modify your filename and add "DDH_instances = " at the beginning of the file.
load('DDH_instances.sage')

# curve
p = 0x1a0111ea397fe69a4b1ba7b6434bacd764774b84f38512bf6730d2a0f6b0f6241eabfffeb153ffffb9feffffffffaaab
K = GF(p)
a = K(0x00)
b = K(0x04)
E = EllipticCurve(K, (a, b))
# G = E(0x17F1D3A73197D7942695638C4FA9AC0FC3688C4F9774B905A14E3A3F171BAC586C55E83FF97A1AEFFB3AF00ADB22C6BB, 0x08B3F481E3AAA0F1A09E30ED741D8AE4FCF5E095D5D00AF600DB18CB2C04B3EDD03CC744A2888AE40CAA232946C5E7E1)
E.set_order(0x73EDA753299D7D483339D80809A1D80553BDA402FFFE5BFEFFFFFFFF00000001 * 0x396C8C005555E1568C00AAAB0000AAAB)

G = E(3745324820672390389968901155878445437664963280229755729082200523555105705468830220374025474630687037635107257976475, 2578846078515277795052385204310204126349387494123866919108681393764788346607753607675088305233984015170544920715533)
n = G.order()

# Embedding degree of the curve
k = 12


def solve_ECDDHP(DDH_instances, G, Ep, m, n):
    """
    Parameters:
        DDH_instances - list consists of (aG, bG, cG), where aG, bG, cG are EC_point.xy()
        m - embedding degree of 
        n - G's order. 
    """
    sols = []
    
    Fpm. = GF(p^m)
    Epm = Ep.base_extend(Fpm) 
    
    G = Epm(G)
    
    for ins in DDH_instances:
        aG, bG, cG = ins
        aG = Epm(aG); bG = Epm(bG); cG = Epm(cG)
        
        # e_aG_bG = aG.weil_pairing(bG, n)
        e_aG_bG = aG.tate_pairing(bG, n, m)
        
        e_G_cG = G.tate_pairing(cG, n, m)
        if e_aG_bG == e_G_cG:
            sols.append(True)
        else:
            sols.append(False)
    
    return sols

sols = solve_ECDDHP(DDH_instances, G, E, k, n)
# print(sols)

pt = 0
for i in range(len(sols)):
    pt += sols[i] * (2^i)

flag = long_to_bytes(pt)
print(flag)
print(b'CatCTF{' + flag + '}')

解法二

其实是非预期解，不过测题的时候队里有其他师傅想到了，这个思路也是直击DDH问题中的’Decisional’ 。

题目中点G的阶为

做法类似Pohlig-Hellman算法中使用的原理，不过我们不用算出a, b和c，而是在模3，模11，模10177等的意义下计算出a,b和c。再对应考察同余式是否成立： $ab \equiv c \pmod{3}$ $ab \equiv c \pmod{11}, … $ 。如果成立那么大概率有$ab = c$。打印出来看看flag对不对就行了。

# sagemath 9.5
from Crypto.Util.number import long_to_bytes
# Before running, modify your filename and add "DDH_instances = " at the beginning of the file.
load('DDH_instances.sage')


p = 0x1a0111ea397fe69a4b1ba7b6434bacd764774b84f38512bf6730d2a0f6b0f6241eabfffeb153ffffb9feffffffffaaab
K = GF(p)
a = K(0x00)
b = K(0x04)
E = EllipticCurve(K, (a, b))
E.set_order(0x73EDA753299D7D483339D80809A1D80553BDA402FFFE5BFEFFFFFFFF00000001 * 
0x396C8C005555E1568C00AAAB0000AAAB)
G = E(3745324820672390389968901155878445437664963280229755729082200523555105705468830220374025474630687037635107257976475, 
      2578846078515277795052385204310204126349387494123866919108681393764788346607753607675088305233984015170544920715533)


def Pohlig_Hellman(G, Y, ord_G, facts):
    """
    Using the idea of Pohlig-Hellman.
    G: EC group generator G
    facts: list, some small factors of the group order
    return x: discrete log of Y modulo prod(facts) 
    """
    new_bases = [(ord_G // facts[i])*G for i in range(len(facts))]
    assert len(new_bases) == len(facts)
    xi = [new_bases[i].discrete_log((ord_G // facts[i])*Y, facts[i]) for i in range(len(facts))]
    # print(f"xi = {xi}")
    
    x = CRT(xi, facts)
    return x

order = G.order()
# factors of order, pairwise coprime
facts = [3, 11, 10177]
s = prod(facts)
m = ''

import tqdm
for i in tqdm.tqdm(range(len(DDH_instances))):
    aG, bG, cG = DDH_instances[i]
    aG = E(aG); bG = E(bG); cG = E(cG)
    a, b, c = [Pohlig_Hellman(G, E(Pt), order, facts) for Pt in (aG, bG, cG)]
    if (a*b) % s == c:
        m += '1'
    else:
        m += '0'
print(m)

print(long_to_bytes(int(m[::-1], 2)))

动机和细节

早就想把密码理论与密码攻击相结合出一个题目，之前想到DDH，上面写嵌入度较低的椭圆曲线上DDH假设不成立。于是我找了一条BLS曲线来出这道题，题面非常简单就是进行DDH Game。DDH假设是一个很重要的话题，Game则是密码理论中的security game，双线性对也是很重要的密码学工具。不过题目难度比较低，希望能够抛砖引玉。

cat_theory

题解

根据交换图，两个明文先做加法再加密，其结果与先加密再做密文乘法相同。因此CatCrypto是一个同态加密，具有加法同态性。

其实这道题是Paillier-DJN算法，Paillier的一个变种。见Paillier半同态加密：原理、高效实现方法和应用

from Crypto.Util.number import long_to_bytes

m1_plus_m2 = 127944711034541246075233071021313730868540484520031868999992890340295169126051051162110
m2_plus_m3 = 63052655568318504263890690011897854119750959265293397753485911143830537816733719293484
m3_plus_m1 = 70799336441419314836992058855562202282043225138455808154518156432965089076630602398416

m = (m1_plus_m2 + m2_plus_m3 + m3_plus_m1) // 2
print(long_to_bytes(m))

"""
b'CatCTF{HE_sch3m3_c4n_b3_a_c4t_eg0ry}'
"""

动机

因为是Cat CTF，并且说出题可以不限于传统的CTF思路，所以想涉及一些猫论(category theory, 范畴论)。找了一些资料来看：Categorical & Diagrammatic methods In Cryptography and Communication
确实有一些人提出范畴论与密码学结合，想法很有意思（比如p35~36的内容）。但这些想法似乎还没有太多应用。并且我自己对范畴论了解也很有限，也没试过自己编造一个密码方案。一时间想不到怎么用这个出一道题。

正好想到Craig Gentry（第一个全同态方案的提出者）给出的用交换图概括同态加密，交换图可以算是范畴论的东西，并且在密码学中也还是经常能看到的。于是干脆来个Paillier-DJN同态加密方案（Paillier的改进方案），给一张交换图来提示同态性。

cat’s gift

题解

跨年气氛题，想起Amann的Analysis上有一只猫猫，翻了一会儿找到一个与pi相关的公式。注意到flag示例中 CatCTF{apple} CatCTF{banana}是小写开头英文单词，都是食物，以及题目中提到这是一份礼物，因此提交的flag不是pi而是pie。

有四种解法

法一：直接猜结果是pie
法二：手算，写出arctanx的幂级数展开，然后把x=1带进去

法三：编程算近似值，然后猜

def solve_gift(n=100):
    ans = 0
    for i in range(n):
        ans += (-1)**i * 1/(2*i + 1)
        
    return ans * 4
    
solve_gift(n=10000000)

法四：问猫猫（根据题目描述的提示）

找到Amann的 Analysis I p389

后记

其实pi=pie也是一种数学文化，3.14那天有一些人会吃派庆祝，因此就把这个题放在了跟数学最相近的crypto里面。出题时感觉应该很自然能想到pie吧，没想到很多朋友因为没有get到所以没做出来…

忘记了这是一种小众文化，出题人随缘在此向各位深表歉意。

几个对CBC模式分组密码的简单攻击

2022-11-19T04:56:39.000Z

总结CBC模式下的字节翻转攻击和Padding Oracle Attack。由于时间关系，padding oracle attack的原理部分暂时上传手稿截图。

CBC模式

参考CTF Wiki即可。

除了CBC的结构需要掌握，还要知道一个很重要的结论：标准的CBC是CPA安全的，但不是CCA安全的。也就是说我们有一些选择密文攻击(Chosen Ciphertext Attack)。

字节翻转攻击(Bit Flip)

攻击条件

假设我们知道采用的加密算法和IV值，并且我们知道一个明密文对$(P_1||P_2, C_1||C_2)$。假设我们可以控制待解密的$C_1||C_2$。（这里$A||B$表示两个连续的明/密文分组）

攻击原理和效果

我们可以伪造密文，使得解密后的明文为$P_1||A$。其中第二个明文分组$A$是我们自己随意选择的。这是因为我们有：

$C_{i} = E_{K}\left(P_{i} \ \oplus \ C_{i-1}\right) \Longrightarrow \\ P_{i} = D_{K}(C_{i}) \ \oplus \ C_{i-1} \Longrightarrow \\ P_{2} = D_{K}(C_{2}) \ \oplus \ C_1$

如果我们想伪造$P_2’ = A$，我们只需要取$C_{1}’ = C_{1} \oplus P_{2} \oplus A$。可以验证等式$P_{2}’ = D_{K}(C_{2}) \ \oplus \ C_1’$ 成立。因此$C_{1}’ || C_{2}$对应的明文确实是$P_1||A$。

可以控制IV的情况

如果我们能控制$IV$和密文值，由于$IV = C_{0}$，我们也有类似的攻击方法。考虑到

$P_{1} = D_{K}(C_{1}) \ \oplus \ C_0, \ \text{where} \ C_0 = IV$

那么我们按照上面改$C_1$的方法修改$IV$即可。

Cryptohack有一个CTF题，感兴趣的可以找到它练一下。但是考虑到cryptohack的规则，我不说是哪个。

Padding Oracle Attack

以下攻击条件和攻击效果两部分基本引用了CTF Wiki - padding oracle attack中的内容。但是我在看CTF Wiki攻击原理部分的时候感觉有一些不清晰的地方，因此我还是自己手推了一下攻击原理。

攻击条件

Padding Oracle Attack 攻击一般需要满足以下几个条件

加密算法
- 采用 PKCS5/PKCS7 Padding 的加密算法。当然，非对称加密中 OAEP 的填充方式也有可能会受到影响。
- 分组模式为 CBC 模式。
攻击者能力
- 攻击者可以拦截上述加密算法加密的消息。
- 攻击者可以和 padding oracle（即服务器）进行交互：客户端向服务器端发送密文，服务器端会以某种返回信息告知客户端 padding 是否正常。

攻击效果

Padding Oracle Attack 攻击可以达到的效果如下

在不清楚 key 和 IV 的前提下解密任意给定的密文。

攻击原理

大思路是根据padding格式推出最后一个字节，然后在此基础上再考虑推出倒数第二个字节…最终发现可以对任意一个密文分组做解密。直接贴手稿图。

一些对攻击的防御

采用一些别的padding（例如One and Zeroes Padding）可以防止这个攻击，但是会有一些别的问题。参考：Securing CBC mode Against Padding Oracle Attacks
引用Cryptopals: Exploiting CBC Padding Oracles的Defenses部分

This attack is a chosen-ciphertext attack. It depends on the attacker being able to submit arbitrary ciphertexts to the oracle. As such, you can prevent the attack by authenticating your ciphertexts. You might do this by switching from CBC mode to an authenticated encryption mode like GCM or OCB; alternately, keep CBC mode but start MACing your ciphertexts using something like HMAC.
Removing the oracle would also prevent the attack. However, hopefully the example oracles above gave you some sense of how nontrivial this actually can be in practice. This is a cryptographic problem and it calls for a cryptographic solution; anything less is likely to be fragile and error-prone.
By adding authentication tags and checking them prior to decryption, we guarantee that we’ll be able to reject any attacker-crafted messages without ever decrypting them, preventing us from leaking any information at all about their decrypted contents, padding-related or otherwise.

现实中的攻击实例

POODLE attack

Reference

CTF Wiki
Robert Heaton - The Padding Oracle Attack
Cryptohack’s CTF challenges. Symmetry category
According to the rule of cryptohack, I won’t tell you which challenge is it. Sorry about that.
Securing CBC mode Against Padding Oracle Attacks
Cryptopals: Exploiting CBC Padding Oracles

WSL2配置个人开发环境(C + Rust + sagemath)

2022-10-23T14:00:00.000Z

之前把电脑恢复出厂设置了所以重新配了环境。这次正好把上次的问题解决了，记录下基于WSL2的开发环境配置。包括WSL2, sagemath, vscode, rust, C/C++.

我vim等工具玩的也不多，而且感觉也没需求（不过这次重装其实就是打N1CTF半截，vscode连不上WSL2，然后WSL2也炸了）。所以不搞花里胡哨的，一切从简..
但是sagemath 10.x版本对我来说很有必要，而apt包管理器目前只能下到9.5，所以sagemath是自己编译的。

前置

WSL2 + vscode

安装

默认是装C盘的，上次我C盘空间不足，很折磨。 所以这次选择手动安装。

正确做法是import或者先官方安装 export再import，千万别自己解压缩包然后像下面这样安装！！

先升级Windows11到23H2，否则不方便让WSL2科学上网。这会影响到sagemath高版本的编译。23H2应该很快就发布了，急着用就看这篇的2023.9.19更新
下载WSL2并做安装所需的前置步骤：下载发行版里面选个ubuntu的LTS高版本下载，同时往上翻完成前五步
下载的.appx文件后缀改为.zip，架构的.appx包拖出来再改为.zip，解压到你想安装的文件夹。然后点击ubuntu.exe
直接装vscode，打开右下角自动提示安装WSL2扩展。下面改xxx文件就可以直接code xxx了。没写权限先chmod，再改回去
Windows上装点东西：设置 WSL 开发环境的最佳做法分步指南。 Windows Terminal 肯定还是要装，别的看着办。

ubuntu配置

换国内源
安装实用工具（可选）：thefuck, ag, …

给WSL2加内存、处理器核心数等等。根据官方文档示例，新建或编辑WSL的全局配置文件内容如下（根据自己电脑的配置自行修改），文件路径为C:\Users\\.wslconfig

# Settings apply across all Linux distros running on WSL 2
[wsl2]

# Limits VM memory to use no more than 14 GB, this can be set as whole numbers using GB or MB
memory=14GB

# Sets the VM to use six virtual processors
processors=6

# Specify a custom Linux kernel to use with your installed distros. The default kernel used can be found at https://github.com/microsoft/WSL2-Linux-Kernel
# kernel=C:\\temp\\myCustomKernel

# Sets additional kernel parameters, in this case enabling older Linux base images such as Centos 6
# kernelCommandLine = vsyscall=emulate

# Sets amount of swap storage space to 14GB, default is 25% of available RAM
swap=14GB

# Sets swapfile path location, default is %USERPROFILE%\AppData\Local\Temp\swap.vhdx
swapfile=E:\\temp\\wsl-swap.vhdx

# Disable page reporting so WSL retains all allocated memory claimed from Windows and releases none back when free
pageReporting=false

# Turn off default connection to bind WSL 2 localhost to Windows localhost
localhostforwarding=true

# Disables nested virtualization
nestedVirtualization=false

# Turns on output console showing contents of dmesg when opening a WSL 2 distro for debugging
debugConsole=true

# Enable experimental features
[experimental]
sparseVhd=true

# For network purpose. Only useful when windows version is 23H2, and wsl --update --pre-release 
# Currently only a windows insider of Release Preview Channel can use this..
networkingMode=mirrored
dnsTunneling=true
firewall=true
autoProxy=true

其中swapfile设定的路径所在文件夹必须存在。编辑之后，让WSL2关机再重启才会生效。Powershell wsl --shutdown 关机

让WSL2能科学上网，eg. clash. 评论区也写了怎么一键配置和取消配置。

Rust

官网或直接一句话安装：

1	curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs \| sh

vscode扩展插件装上rust-analyzer。

C/C++

需要读一些项目代码，既安装了gcc又安装了clang。
目前vscode配上了扩展： call graph（LuoZhihao写的那个）。感觉效果差一些，准备摸索一下用doxygen + codeviz生成call graph。

conda+sage源码安装sage

自己编译sagemath真的很坑，很难装上，基本上得去google group请教sagemath的人。但是用anaconda安装还是不难的。

此处参考sagemath conda安装方法的’Using conda to provide all dependencies for the Sage library’章节

先把sage源码 git clone下来, checkout 到 master分支：

ORIG=https://github.com/sagemath/sage.git
# git clone -c core.symlinks=true --branch develop --tags $ORIG
git clone $ORIG
cd sage
git checkout master

找个合适地方下载conda。注意读LICENSE环节，然后全部选择yes

1 2	curl -L -O https://github.com/conda-forge/miniforge/releases/latest/download/Mambaforge-$(uname)-$(uname -m).sh sh Mambaforge-$(uname)-$(uname -m).sh

配置conda源为阿里源，据说清华源中科大源现在不好用了：配置说明
conda install mamba
配置mamba源，类似conda源的配置：说明. 实际上直接把 .condarc 的拷一下就行. 然后也是 mamba clean -i

回到clone的sage文件夹，然后开始安装环境

1
2
3

# 可以把sage改成XXX，以后activate时 mamba activate XXX
mamba env create --file src/environment-3.11.yml --name sage
mamba activate sage

1
2
3

./bootstrap
pip install --no-build-isolation -v -v --editable ./pkgs/sage-conf_conda ./pkgs/sage-setup
pip install --no-build-isolation --config-settings editable_mode=compat -v -v --editable ./src

验证sagemath已安装
1
sage -c 'print(version())'

【论文翻译】BKZ 2.0: Better Lattice Security Estimates

2022-04-15T13:24:44.000Z

这是我毕业设计的论文翻译。之前用word写的，转为markdown发在csdn上发现公式显示不全。现在采用pdf格式上传到这个博客上。

BKZ 2.0论文翻译.pdf

密码学的抽代基础总结

2022-04-05T16:00:00.000Z

整理一下密码学常用的抽代知识。分成两个部分：基本框架、重要内容。

这是密码学常用的抽代知识清单。分成两个部分：基本框架、重要内容。

我在B站上录制了一个课程（建议1.5倍速），2小时即可快速回顾抽代知识：密码学的数学基础：课程简介

基本框架和语言

几个重要术语：代数结构、子结构、同态、商结构

在线性代数中对应：线性空间、子空间、线性映射、商空间

代数结构	子结构	同态	商结构
群	子群	群同态	正规子群->商群
环	子环	环同态	理想->商环
域	子域	/（同上）	/（同上）
线性空间	子空间	线性映射	商空间

直积（直和）、生成子集对应线性代数中的直和、基。

其他重要内容

群、环

拉格朗日定理——费马小定理、欧拉定理
同构第一定理——$\mathbb{Z}_{N} \cong \mathbb{Z}/N\mathbb{Z}$（模运算）、中国剩余定理
循环群——离散对数问题
多项式环——NTRU、多变量公钥
一些概念：整环、除环、域、主理想、素理想、极大理想…
$UFD \geq PID \geq ED$

域

素域、域的特征
由整环构造域：分式域、$R/M$ ( $PID$ 中 $R/(p)$ )
域的分类：按元素个数分为有限域、无限域，可用特征区分
域的扩张：代数扩张与有限扩张、超越扩张与无限扩张
多项式的分裂域，例如 $\mathbb{R}$ 上 $x^2+1$ 的分裂域，$x^n - 1$ 的分裂域。
有限域的结构：子域格、$\mathbb{F}_q$ 作为向量空间，$\mathbb{F}_q$ 作为分裂域、本原元
一般有限域的结论（与$\mathbb{F}_p$类似）：费马小定理、欧拉定理、Wilson定理…
有限域上的运算、元素的表示
本原多项式——LFSR相关理论、周期计算等

这是我的新博客！

2022-01-21T04:00:00.000Z

感觉写得好的文章放到csdn就是浪费，所以决定整一个新的。除了数学、密码学和技术，这个博客里可能还会放一些其他的东西。下面是以前博客的链接。

我原来的csdn博客：https://blog.csdn.net/qq_42667481

掌灯人

2021-10-30T13:07:38.000Z

2021年10月底，写了一些反映当时心境的文字。当时想把它写成小说之类的东西，不过后来没有继续。

正文请点击阅读更多查看

掌灯人

其一

与同行者从黑暗中走出时，他才发现不知何时手里已拿着一盏灯。其实世界还是一片黑，只不过为了方便自己探路，在某个地方偶然发现了一盏还能点亮的煤油灯拿了起来。就这样，他决定成为一名掌灯人。

点着了灯，便有顺路的人同行。可惜这灯并不强力，当寒风吹来时灯火便摇摇欲坠，于是众人便紧紧的围在一起，以防灯火被寒风吹灭。不过也因为这样，原本就不是很亮的灯只能照亮周围几个身位的距离，因此这队伍也无法壮大。况且，掌灯人听说过有人并不喜欢灯光，甚至会将灯偷偷灭掉，因此他总是戒备着那些在远处，看不清脸上表情的人。

每个人都有自己要走的道路，即使是掌灯的人也不例外。在一个错综复杂的路口，将与众人分道扬镳的。突然，身边的一人拿起一抔雪要将掌灯人手里的灯扑灭。

掌灯人知道自己手里的灯不能承受这袭击。好在，掌灯人毕竟是掌灯人，他及时护住自己的灯，让雪打在了自己身上。

（待续）

RSA的共解密指数攻击

2021-06-29T04:00:00.000Z

本文总结了一个基于格的攻击，该攻击针对的是多个共用同一个私钥的RSA实例。当私钥$\,d\,$满足一定条件时，即可根据这些RSA实例的公钥求出$\,d\,$，从而将这些RSA实例全部破解。

理解本文所需的前置背景：

格论，可以先看看格基规约算法：数学基础
格基规约算法的用途，见格基规约算法：算法详解

攻击描述

符号约定和假设

首先我们给出攻击中的假设条件和符号约定。设同一个RSA加密系统中有$\,r\,$个RSA实例共用同一个私钥$\,d\,$，这些实例的公钥分别为$\, \left(e_1,\ N_1\right),\ldots,\left(e_r,\ N_r\right)\,$ 。不妨设$\,N_1,\ldots,\ N_r\,$依次增大，并且由于是同一个系统中的实例，故认为$\, N_1,\ldots,\ N_r\,$具有相同的比特长度，于是有$\,N_1

由RSA加密的原理可以得到如下$\,r\,$个方程：

$\begin{array}{c}e_{1} d=1+k_{1} \varphi\left(N_{1}\right) \\e_{2} d=1+k_{2} \varphi\left(N_{2}\right) \\\vdots \\e_{r} d=1+k_{r} \varphi\left(N_{r}\right)\end{array}$

对任意的$\,i\,$，设$\, e_i<\varphi\left(N_i\right)\ ,\ \ \varphi\left(N_r\right)=N_i-s_i\,$.我们假定生成$\, N_1,\ldots,\ N_r\,$ 的素数具有相同的比特长度，则${\, s}_{i\ }<3N_1^{1/2}\,$ 。并且最关键的，假设以下命题成立：若$\, v\,$是格$\, \mathcal{L}\,$中满足Minkowski’s bound的一个向量，则$\, \pm v\,$为格中所有的非零最短向量，除此以外没有其他向量范数为$\,\lambda_{1}\!\left(\mathcal{L}\right)\,$ 。

攻击原理和方法

设$\, M=\left\lfloor N_r^{1/2}\right\rfloor\,$ ，由之前假设中的等式可得方程组

$\begin{array}{c}d M=d M \\e_{1} d-N_{1} k_{1}=1-k_{1} s_{1} \\e_{2} d-N_{2} k_{2}=1-k_{2} s_{2} \\\vdots \\e_{r}-N_{r} k_{r}=1-k_{r} s_{r}\end{array}$

下面将方程组写为矩阵形式。记

$\, x_r=\left(d,k_1,k_2,\cdots,k_r\right)\ ,v_r=\left(dM,1-k_1s_1,\cdots,1-k_rs_r\right)$ $\mathcal{B}_{r}=\left[\begin{array}{ccccc}M & e_{1} & e_{2} & \cdots & e_{r} \\0 & -N_{1} & 0 & \cdots & 0 \\0 & 0 & -N_{2} & \cdots & 0 \\\vdots & \vdots & \vdots & \ddots & \vdots \\0 & 0 & 0 & \cdots & -N_{r}\end{array}\right]$

则有$\, x_r\mathcal{B}_r=v_r\,$。注意到$\, \mathcal{B}_r\,$的行向量组生成了一个$\, r+1\,$维的格$\, \mathcal{L}\,$，而$\, v_r\in\mathcal{L}\,$。那么由假设可知，当不等式$\left|v_{r}\right| < \sqrt{r+1} \det(\mathcal{L})^{1 /(r+1)}$ 成立时（即满足Minkowski’s bound时），攻击者只要解出格$\, \mathcal{L}\,$上的SVP问题即可解出$\, v_r\,$，从而得到$\, v_r\,$第一个分量$\, dM\,$。$\,M\,$已知，因此攻击者可求出$\, d\,$，从而攻破这些共解密指数实例。

攻击条件

经过一些简单的不等式推导可得，当$\, d

攻击的提出者Hinek在对RSA-2048/4096进行实验时发现要想保证攻击一定成功，实际的$\,\delta_r\,$要比满足前面这个不等式的$\,\delta_r\,$最大值小一点（大概小0.005左右）。

共用私钥的RSA实例个数$\,r\,$越大，攻击效果越好。Hinek进行了全面的攻击实验，当设定$\,r=35\,$，当$\, d

攻击代码

以下代码在sagemath 9.1上运行。

攻击算法

当攻击成功时会计算并打印出正确的私钥$\,d\,$，当攻击失败时计算出的$\,d\,$是错误的。

"""
instance: 共私钥的RSA实例，为一个列表。该列表的每一项都是字典，instance[i]['e']为第i个RSA实例的e，instance[i]['n']为第i个RSA实例的n。
"""
def common_private_attack(instance, debug=False, algo="LLL"):
    r = len(instance)
    instance.sort(key=lambda x: x['n'])
    M = isqrt(instance[r-1]['n'])  
    
    # Build up Lattice basis B
    B = zero_matrix(r+1)
    B[0,0] = isqrt(instance[r-1]['n'])
    for i in range(1, r+1):
        B[0,i] = instance[i-1]['e']
        B[i,i] = - instance[i-1]['n']
    if debug:
        print("The basis of the lattice we build is:"); print(B)
    
    if algo == "LLL":
        print("Performing LLL reduction..."); B = B.LLL(); print("Done.")
    elif algo == "BKZ":
        print("Performing BKZ reduction..."); B = B.BKZ(block_size=len(instance)); print("Done.")
    
    dM = B[0,0]; d = dM // M;
    # 有时会算出负数
    d = abs(d)
    print(" dM = {} \n d = {}".format(dM, d))

    if dM % d != 0:
        print("Fail to attack these instances.")

测试代码

调用以下方法即可生成满足攻击条件的RSA实例。

from Crypto.Util.number import getStrongPrime, getPrime, getRandomNBitInteger
from gmpy2 import gcd, invert
from math import floor, log

# Generate r instances of RSA with the same d.
def gen_instance(r=2, bit_len=2048, delta_r=None,delta=0, debug=False):
    
    if delta_r is None:
        delta_r = 0.5 -  0.5 / (r+1) - log(6, 2^bit_len) + delta
    #     d = getRandomNBitInteger(int(2 * bit_len * delta_r))
    d = getPrime(floor(bit_len * delta_r))

    if d & 1 == 0:
        d += 1
    print("The d we choose is: {}".format(d))
    print("d satisfy the condition: d < Nr^{}".format(delta_r))
    print("\n")
    
    print("Generating instances ...")
    instance = []
    
    for i in range(r):
        while True:
            p = getStrongPrime(bit_len//2)
            q = getStrongPrime(bit_len//2)
#             p = getPrime(bit_len)
#             q = getPrime(bit_len)
            n = p * q
            phi = (p-1)*(q-1)
            if gcd(d, phi) == 1:
                e = invert(d, phi)
                this = {'n':n, 'e':e, 'd':d}
                instance.append(this)
            
                break
  
    print("Done.")
    
    if debug:
        print("The RSA Instances we choose is below:")
        for i in range(r):
            print("instance {}: {}".format(i, instance[i]))
    return instance

参考资料

M. Jason Hinek. On the Security of Some Variants of RSA. 2007.
M. Jason Hinek. Cryptanalysis of RSA and Its Variants. 2009

格基规约算法：数学基础

2021-06-20T03:10:01.000Z

本篇主要介绍学习格密码和格基规约算法必备的格论知识，以下内容为理解格基规约算法必备的数学基础。

欧氏空间

想理解格基约化算法，首先必须理解施密特正交化。有了向量空间，就可以在空间中随意对向量进行数乘和加减法（怎么做都不会跑出这个空间）。再定义向量的长度和夹角，施密特正交化就显得很自然了。

欧氏空间和范数

向量空间

向量空间的定义保证了向量的数乘和加减法有很好的性质。具体定义略，可参阅蓝以中的《高等代数简明教程》等。

欧氏空间

欧氏空间：设$\,V\,$是实数域$\,\mathbb{R}\,$上的向量空间。如果$\,V\,$内任意两个向量$\,\alpha,\ \beta\,$都按某一法则对应于$\mathbb{R}$内一个唯一确定的数，记作$\,\langle\alpha,\beta\rangle\,$，且满足以下三个条件：

对任意$\,k_1,k_2\in\mathbb{R}\,$和任意$\,\alpha_1,\alpha_2,\beta\in V\,$，有 $\left\langle{k_1\alpha}_1+k_2\alpha_2,\beta\right\rangle=\ k_1\left\langle\alpha_1,\beta\right\rangle+\ k_2\left\langle\alpha_2,\beta\right\rangle;$
对任意$\,\alpha,\ \beta\in V\,$，有 $\left\langle\alpha,\beta\right\rangle=\ \langle\beta,\alpha\rangle;$
（非退化性）对任意$\,\alpha\in V\,$，有$\,\left\langle\alpha,\alpha\right\rangle \geq 0\,$，且$\,\left\langle\alpha,\alpha\right\rangle = 0\,$的充分必要条件是$\,\alpha=0,$

则称$\,\left\langle\alpha,\beta\right\rangle\,$为向量$\,\alpha,\ \beta\,$的内积。$V\,$称为欧几里得空间，简称欧氏空间。

内积是一种具有非退化性的双线性映射，与密码学中常用的双线性对非常类似。

取$\mathbb{R}^{m} \,$的内积为向量的点乘，可以验证向量空间$\, \mathbb{R}^m\,$是欧氏空间。

对于$\mathbb{R}^m$中的向量$\,\alpha\,$，定义其欧氏范数为$\, \left| \alpha \right| = \sqrt{\left\langle\alpha,\alpha\right\rangle} \,$。实际上，欧氏范数就是平时所说的向量长度。

向量的欧氏范数计算方法是对其各分量的平方和开方，因此也称$\, 2 - \,$范数。格密码中还会用到$\, \infty \,-$范数。在本篇中，“范数”默认指欧氏范数。

子空间的正交补

正交补：设$\,V\,$是一个$\,n\,$维欧氏空间，$\,M\,$是它的一个子空间，易知$\,M\,$关于$\,V\,$的内积也成一欧氏空间。定义$\,M^\bot \!\subset \!\ V\,$为

$M^\bot=\left\{\alpha\in V:\forall\beta\in M,\left\langle\alpha,\beta\right\rangle=0\right\}.$

称$\,M^\bot\,$为$\,M\,$的正交补。$\,M^\bot\,$关于$\,V\,$中向量的加法及数乘运算显然封闭，故$\,M^\bot\,$也为$\,V\,$的子空间。

为了从几何的角度理解正交补，不妨思考一下$\,\mathbb{R}^{2}\,$和$\,\mathbb{R}^{3}\,$中过原点的直线、平面的正交补分别是什么。

施密特正交化

在欧氏空间$\,\mathbb{R}^m\,$中有施密特正交化方法。施密特正交化方法是由一个线性无关向量组得到一个正交向量组的方法，并且输入的向量组和输出的向量组张成的是同一个向量空间。格基约化算法的思路与施密特正交化相似并且算法中会调用施密特正交化，因此理解向量空间中的施密特正交化方法是理解格基约化算法的一个关键。

设$\mathbf{b}_1,\ldots,\mathbf{b}_n$为$\mathbb{R}^m$上一组线性无关的向量，施密特正交化方法如下：
令$\,\mathbf{b}_1^\ast=\mathbf{b}_1,$ 依次计算$\, \mathbf{b}_i^\ast=\mathbf{b}_i-\sum_{j=1}^{i-1}{\mu_{i,j}\mathbf{b}_j^\ast},\quad i>1\,$，其中$\,\mu_{i,j}=\frac{\left\langle\mathbf{b}_i,\mathbf{b}_j^\ast\right\rangle}{\left\langle\mathbf{b}_j^\ast,\mathbf{b}_j^\ast\right\rangle}\ ,\ 1\le j\,$。那么$\,\mathbf{b}_1^\ast,\cdots,\mathbf{b}_n^\ast\,$就是$\,\mathbb{R}^m\,$上的一组正交向量。

核心思路：先选$\,\mathbf{b}_1^\ast=\mathbf{b}_1$作为基准，然后将$\, \mathbf{b}_2 \,$分解为与$\, \mathbf{b}_1 \,$平行和正交的两个分量，只保留正交的那个分量。

更进一步的理解是，$\mathbf{b}_i^\ast\,$是$\, \mathbf{b}_i\,$在$\, \sum_{j=1}^{i-1}{\mathbb{R}\mathbf{b}}_j=\sum_{j=1}^{i-1}{\mathbb{R}\mathbf{b}_j^\ast}$ 的正交补上的投影。理解这一点才能搞懂格基约化算法的具体细节和优化。

格论基础

格的相关概念

格和格基

这部分没有贴图，可以结合An Introduction to Mathematical Cryptography中格的图像方便理解

格：给定$n$个线性无关的向量$\mathbf{b}_1,\ldots,\mathbf{b}_n\in\mathbb{R}^m$，则称其整系数线性组合构成的集合

$\mathcal{L}=\sum_{i=1}^{n}\mathbf{b}_i\cdot\mathbb{Z}=\left\{\sum_{i=1}^{n}{c_i\mathbf{b}_i}:c_i\in\mathbb{Z}\right\}$

为$\mathbb{R}^m$上的格。我们称$\mathcal{L}$的秩为$n$，$\mathcal{L}$的维数为$m$。我们称上述格的定义中出现的$\mathbf{b}_1,\ldots,\mathbf{b}_n$为格$\mathcal{L}$的一组基，简称格基。

记$\ \mathbf{B}={(\mathbf{b}}_1,\ldots,\mathbf{b}_n)$，称$\mathbf{B}$为基矩阵，那么格$\mathcal{L}$可以进一步表示为
$\mathcal{L}=\sum_{i=1}^{n}\mathbf{b}_i\cdot\mathbb{Z}=\{\mathbf{B}x:x\in\mathbb{Z}^n\}$
可以验证$\, \mathcal{L}\,$为$\,\mathbb{R}^{m}\,$的离散加法子群。与向量空间$\mathbb{R}^m$类似地，格$\mathcal{L}$的基不止一个。事实上[3]，任意一个秩为1的格有两组基，而秩大于等于2的格有无数组基。取格$\mathcal{L}$的任意两组基，一组基矩阵可由另一组基矩阵左乘一个幺模矩阵$\mathbf{U}$得到，$\mathbf{U}$是两个格基之间的过渡矩阵。

基本域和体积(volume)

称格$\mathcal{L}$的一组格基围成的基本平行体为格$\mathcal{L}$的基本域，其严谨定义如下。

基本域：设$\mathcal{L}$为一个$n$维的格，且$\mathcal{L}$的一组基为$\mathbf{v}_1,\mathbf{v}_2,\ldots,\mathbf{v}_n$。则格$\mathcal{L}$（就格基$\mathbf{v}_1,\mathbf{v}_2,\ldots,\mathbf{v}_n$而言）的基本域$\mathcal{F}$为

$\mathcal{F}\left(\mathbf{v}_1,\ldots,\mathbf{v}_n\right)=\left\{t_1\mathbf{v}_1+t_2\mathbf{v}_2+\cdots+t_n\mathbf{v}_n:0\le t_i<1\right\}$

之后定义格$\mathcal{L}$的行列式如下。
行列式：设$\mathcal{L}$为一个$n$维的格，其基本域为$\mathcal{F}$，则称$\mathcal{F}$的体积(volume)为格$\mathcal{L}$的行列式，记作$\mathrm{det}{(\mathcal{L})}=\mathrm{Vol}(\mathcal{F})$。设$\mathbf{B}={(\mathbf{b}}_1,\ldots,\mathbf{b}_n)为\mathcal{L}$的一组基，根据$\mathrm{det}{(\mathcal{L})}$的几何含义可知$\mathrm{det}(\mathcal{L})= \left | \mathrm{det}{(\mathbf{B})} \right |$。由此易知，虽然$\mathrm{det}{(\mathcal{L})}$被定义$\mathcal{F}$的体积，且$\mathcal{F}$与选取的格基有关，但$\mathrm{det}{(\mathcal{L})}$是格$\mathcal{L}$的一个不变量。即任意选取格$\mathcal{L}$的基本域（或者说选取格$\mathcal{L}$的任何一个格基），$\mathrm{det}{(\mathcal{L})}$的值都相同。这也是我们将其记为$\mathrm{det}{(\mathcal{L})}$的理由：其值只与格$\mathcal{L}$本身有关。

整格(integral lattice)

密码学中的运算对象基本都是整数，因此实际应用中往往使用整格(integral lattice)，其定义如下：若格$\mathcal{L}$中任意向量的坐标，其每个分量均为整数，则称格$\mathcal{L}$为整数格。当$\mathcal{L}$为整格时，$\mathcal{L}$是$\mathbb{Z}^m$的加法子群。

整格有时候也称为整数格(integer lattice)。

格上的短向量

格上的最短向量问题(SVP)是格密码方案安全性基于的难题，也是在格密码和传统公钥密码分析时常使用的问题。SVP及近似SVP问题正是格基约化算法求解的问题。

为了更好地描述格上短向量的长度，首先给出逐次最小长度的概念。

逐次最小长度(successive minima)

逐次最小长度：设$\mathcal{L}$是$\mathbb{R}^m$中秩为$n$的格，设$\lambda_1,\ldots,\lambda_n\in\mathbb{R}$，若$\lambda_{i}\left(1\le i\le n\right)$为满足以下条件的最小值：
存在$i$个线性无关的的向量$\mathbf{v}_1,\ldots,\mathbf{v}_i\in\mathcal{L}$，使得$v_j ≤λ_i (1≤j≤i)$
则称$\lambda_1,\ldots,\lambda_n$为$\mathcal{L}$的逐次最小长度。为了表明$\lambda_i$是格$\mathcal{L}$的逐次最小长度，记$\lambda_i=\lambda_i(\mathcal{L})$。
用通俗的语言来讲，$\lambda_1$是$\mathcal{L}$中非零最短向量的长度，$\lambda_2$是所有非零向量长度中（并列）第二小的长度。这就是逐次最小长度的意义。

短向量的长度

为了让读者对$\lambda_1$的大小有一个认识，这里给出一系列相关定理来描述$\lambda_1$的上界。首先给出Minkowski定理作为引理。

Minkowski定理：设$\mathcal{L}$是$\mathbb{R}^m$中的格，$S \subset \mathbb{R}^m$是一个关于原点对称的可测凸集，若$S$的体积为$\mathrm{Vol}(S)\geq2^m\mathrm{det}(\mathcal{L})$，则$\, S\cap\mathcal{L}\,$中有非零向量。

解读：看起来有些高深，但是在$\mathcal{L} = \mathbb{Z}^{2}$中是显然的。要想让对称的凸集$S$尽量大，且$\ S\cap\mathcal{L}\ = \mathbf{0}$，那么正方形应该是最好的选择，此时$\mathrm{Vol}(S) = 2^2\mathrm{det}{(\mathcal{L})}$。类似地，在$\mathcal{L} = \mathbb{Z}^{m}$选取超立方体是最好的。照此思路，$\mathcal{L}$为整数格时Minkowski定理也是很显然的。这样就理解了密码学所用的格中该定理成立。

利用Minkowski定理可证明下面的Minkowski第一定理（一些文献称其为Hermite定理）。
Minkowski第一定理：设$\mathcal{L}$是$\mathbb{R}^m$中秩为$n$的格，则$\lambda_1(\mathcal{L}) \leq \sqrt n\mathrm{det}(\mathcal{L})^{1/n}$。称$\sqrt n\mathrm{det}(\mathcal{L})^{1/n}$为$\lambda_1\left(\mathcal{L}\right)$的Minkowski’s bound。

解读：如果$\mathcal{L} = \mathbb{Z}^{n}$，那么$\mathrm{det}(L)^{1/n}$就是超立方体$S$的边长，而$\sqrt n\mathrm{det}(\mathcal{L})^{1/n}$就是它的对角线长度。由于对角线的另一端就是一个格点，因此$\lambda_1\left(\mathcal{L}\right) \leq \sqrt n\mathrm{det}(\mathcal{L})^{1/n}$。

以上两个解读参考了Steven Yue的笔记，推荐看一下。

对于$\lambda_1\left(\mathcal{L}\right)$，我们还能得到比Minkowski’s bound更好的理论上界。下面给出Hermite因子的概念。
Hermite因子：给定格的维度$n$，定义Hermite因子$\gamma_n\in\mathbb{R}$为满足以下条件的最小值：
对于任意维度为$n$的格$\mathcal{L}$，存在$\, \mathbf{v}\in\mathcal{L}\,$满足$\ \left|\mathbf{v}\right|^{2} ≤γ_{n}\mathrm{det}{(\mathcal{L})}^{2/n}$。称$\sqrt{\gamma_n}\mathrm{det}\left(\mathcal{L}\right)^{1/n}$为$\ \lambda_1\left(\mathcal{L}\right) \,$的Hermite bound。
根据定义可知，Hermite因子的大小只与$n$有关，目前我们只知道$\gamma_n$在 $1\le n\le 8$ 和 $n=24$ 时的精确值：

$\gamma_2^2=\frac{4}{3},\gamma_3^3=2,\gamma_4^4=4,\gamma_5^5=8,\gamma_6^6=\frac{64}{3},\gamma_7^7=64,\gamma_8^8=256,\gamma_{24}=4.$

在格密码学中我们更关心$n$较大$(n > 200)$时$\gamma_n$的值，此时$\gamma_n$满足

$\frac{n}{2\pi e}\le\gamma_n\le\frac{n}{\pi e} \, .$

由Hermite因子能够得到比Minkowski’s bound更精确的$\lambda_1$上界。以维度为$n=2$的格$\mathcal{L}$为例，Minkowski’s bound告诉我们$\ \lambda_{1}(\mathcal{L})<\sqrt2\mathrm{det}(\mathcal{L})^{1/2}$ ，而由Hermite因子可得$\lambda_{1}(\mathcal{L}) < \sqrt{4/3} \mathrm{det}\left(\mathcal{L}\right)^{1/2}$。

下面的高斯启发函数与Hermite因子的下界很好地对应了起来。

高斯启发函数(Gaussian Heuristic)：$GH(\mathcal{L})= \sqrt{\frac{n}{2\pi e}}\mathrm{det}(\mathcal{L})^{1/n}$

上述GH函数只能用于估计高维格的$\lambda_1\left(\mathcal{L}\right)$，在低维格中有另一个公式。然而低维格一般只在公钥密码分析中用的比较多，并且很多公钥密码分析中采用的是Minkowski’s bound作为假设。因此这里不给出（~~其实就是不想起敲公式了~~），具体可以看An Introduction to Mathematical Cryptography的相关小节。

我们往往不知道某个高维格的$\, \lambda_1\left(\mathcal{L}\right)\,$到底是多少，因此我们用$GH(\mathcal{L})$作为参考。在[SVP Challenge (latticechallenge.org)]中，若格基中最短向量的范数小于$1.05GH(\mathcal{L})$，就视为成功求解了SVP。

如果以上内容还有疑问，可以看看 An Introduction to Mathematical Cryptography 这本书的相关章节，也可以看看这个视频：数学潜水艇：初等数论、初等群论

参考资料

蓝以中. 高等代数简明教程.下册, 2002.
王小云, 王明强, 孟宪萌. 公钥密码学的数学基础, 2013.
Hoffstein J , Pipher J C , Silverman J H . An Introduction to Mathematical Cryptography, 2014.
Galbraith S D . Mathematics of Public Key Cryptography: Lattices. 2012.
Steven Yue的笔记
Coinc1dens’s blog

格基规约算法：算法详解

2021-06-20T03:10:01.000Z

本文详细了介绍原始格基规约算法，并简单介绍目前对算法的改进。这些改进算法非常实用，被广泛应用于密码分析中。

阅读本篇前需要先了解格论，可以先看看格基规约算法：数学基础

原始格基规约算法

高斯算法

在18到19世纪间，拉格朗日和高斯先后提出了一种二维格基规约算法，现今称为高斯算法。下面介绍原始的高斯算法。

算法描述

以下内容基本来自 Lattice Basis Reduction: An Introduction to the LLL Algorithm and its Application .

首先先给出算法中出现的概念和符号。

最小基：设$\, \mathbf{x},\mathbf{y}\,$是二维格$\,\mathcal{L}\subset\mathbb{R}^2\,$的一组基。若$\, \mathbf{x},\mathbf{y}\,$满足$\,\left | \mathbf{x}\right | =\lambda_1\left(\mathcal{L}\right)\,$ 且$\, \mathbf{y}\,$是与$\, \mathbf{x}\,$线性无关的一个最短向量，则称$\, \mathbf{x},\mathbf{y}\,$是最小的(minimal)。最小基也被称为Minkowski约化基。
取整：记$\, \lceil\mu\rfloor\,$为距$\,\mu\,$最近的整数，即$\, \lceil\mu\rfloor=\left\lceil\mu-\frac{1}{2}\right\rceil\,$。我们规定对于整数$\,n\,$，$\lceil n+\frac{1}{2}\rfloor\,$的值为$\, n\,$ 。

下面给出高斯算法的伪代码描述。

输入：$\mathbb{R}^2$上的二维格$\mathcal{L}$的一组基 $\mathbf{x},\mathbf{y}$，其中$\left|\mathbf{x}\right|<\left|\mathbf{y}\right|$
输出：格$\,\mathcal{L}\,$的一组最小基$\,\mathbf{v}_1,\mathbf{v}_2$
算法步骤：高斯算法伪代码

高斯算法中蕴含的思想与欧几里得算法类似，两者都是不断地实施先约化后交换的策略。在伪代码中，(2)(b)是约化步，(2)(c)(ii)是交换步。在约化步中会计算施密特正交化的系数，并且为了确保在格$\,\mathcal{L}\,$上运算，不能直接用施密特正交化系数，而是要将其取整后得到的$\,m\,$作为约化步中减去$\,\mathbf{v}_2\,$的系数。当$\, \left|\mathbf{v}_1\right|\le\left|\mathbf{v}_2\right|\,$时，算法结束并输出此时的${\, \mathbf{v}}_1\,$和${\ \mathbf{v}}_2\,$。可以证明算法输出的${\ \mathbf{v}}_1$和${\ \mathbf{v}}_2\,$是一组最小基，下面简述证明思路。

证明思路：首先，由取整的定义易知在算法的步骤(2)(b)执行后，有$\,\left|\mathbf{v}_2^\prime\cdot\mathbf{v}_1\right|\le\frac{1}{2}\left|\mathbf{v}_1\right|^2\,$，其中$\, \mathbf{v}_2^\prime\,$是步骤执行后所得新基的第二个向量。或者说，每次(2)(b)执行完毕后有 $\mu_{2,1} \le \frac{1}{2}$（此时称${\, \mathbf{v}}_1,{\ \mathbf{v}}_2\,$是 size-reduced的）。结合算法终止时$\, \left|\mathbf{v}_1\right|\le\left|\mathbf{v}_2\right|\,$这一条件即可证明$\, \left|\mathbf{v}_1\right| = \lambda_{1}(\mathcal{L}) \,$。这一点从几何上非常直观，读者不妨考虑一下$\, \left|\mathbf{v}_1\right| = \left|\mathbf{v}_2\right|\,$时的情形。接下来再证$\,\mathbf{v}_2\,$是与$\,\mathbf{v}_1\,$线性无关的最短向量即可（证这一步有点繁琐）。

上述证明思路来源于二维空间上的几何直观，后面会看到在高维格中无法用类似的思路证明。在高维空间中，长度（2-范数）就没那么符合直觉了。由此也能侧面理解，为什么SVP问题在低维格中是容易的，在高维格中是困难的。

纵观高斯算法的流程，其实就是在不停地让两个向量互相约化，直到它们无法变得更短为止。因此，高斯算法可以视为一种贪心算法，且可以推广至高维（见后面的推广高斯算法）。

算法实现

sagemath代码如下。

def Gauss(x,y):
    # step 1
    v1 = x; v2 = y
    finished = False
    # step 2
    while not finished:
        # (a)
        m = round(( v2.dot_product(v1) / v1.dot_product(v1) ))
        # (b)
        v2 = v2 - m*v1
        # (c)
        if v1.norm() <= v2.norm():
            finished = True
        else:
            v1, v2 = v2, v1
    
   return v1, v2

算法效能

高斯算法能够以平方级别的运行时间求解出一组Minkowski约化基（最小基），具体如下。

约化能力：设$\, \mathbf{x},\mathbf{y}\in\mathbb{R}^\mathbf{2}\,$是二维格$\,\mathcal{L}\,$的一组基，将$\mathbf{x},\mathbf{y}$作为高斯约化算法的输入，则算法一定能够在有限步内执行完成，且其输出的$\ \mathbf{v}_1,\mathbf{v}_2\,$是格$\,\mathcal{L}\,$的一组Minkowski约化基。
运行时间：输入二维格$\,\mathcal{L}\,$的任意一组基$\,\mathbf{u},\mathbf{v}\,$，假设$\, \left|\mathbf{u}\right|\le\left|\mathbf{v}\right|\,$，那么高斯算法会在$\, O\left(\log\left|\mathbf{v}\right|\cdot\left[1+\log\left|\mathbf{v}\right|-\log\lambda_1\left(\mathcal{L}\right)\right]\right)\,$的时间内运行完毕。

LLL算法

1982年诞生的LLL算法可视为高斯算法在高维格中的推广。接下来详细介绍原始LLL算法。

算法描述

设$\ \mathcal{L}\subset\mathbb{R}^m\,$是$\,n\,$维格，算法输入$\, \mathcal{L} \,$的任意一组基，并以多项式时间输出一组LLL约化基。首先介绍LLL约化基的概念。

LLL约化基：设$\, \mathbf{b}_1,\ldots,\mathbf{b}_n \,$是$\, \mathcal{L}\,$的一组格基，若其满足以下两个性质：

(size-reduce)：对于任意的$\, j
(Lovász condition)：对于任意的$\,\mathbf{b}_i,\ \mathbf{b}_{i+1}\,$有$\,\delta\left| \mathbf{b}_i^\ast \right|^2\le\left|\mathbf{b}_{i+1}^\ast+\mu_{i+1,i}\mathbf{b}_i^\ast \right|^2\,$.

则称$\, \mathbf{b}_1,\ldots,\mathbf{b}_n \,$是$\, \mathcal{L}\,$的一组$\delta-$LLL约化基。

性质2中的不等式$\,\delta\left| \mathbf{b}_i^\ast \right|^2\le\left|\mathbf{b}_{i+1}^\ast+\mu_{i+1,i}\mathbf{b}_i^\ast \right|^2\,$可以等价替换为$\, \left| \mathbf{b}_{i+1}^\ast \right|^2 \ge \left(\delta - \mu^{2}_{i+1,i} \right)\left| \mathbf{b}_{i}^\ast \right|^2 \ge \left(\delta - \frac{1}{4} \right)\left| \mathbf{b}_{i}^\ast \right|^2 \,$。性质1表明，LLL约化基中的向量是相对较短且近似正交的。性质2是为了根据范数对基中向量进行大致的排序。

下面给出LLL算法的伪代码：

原始LLL算法伪代码

简易实现

sagemath代码如下，参考 https://kel.bz/post/lll/

def max(a, b):
    return a if a > b else b

def LLL_v0(M, delta=0.75):
    B = deepcopy(M)
    Q, mu = B.gram_schmidt()
    n, k = B.nrows(), 1
    
    while k < n:
        
        # size reduction step
        for j in reversed(range(k)):
            if abs( mu[k][j] ) > 0.5:
                B[k] = B[k] - round( mu[k][j] ) * B[j]
                Q, mu = B.gram_schmidt()
        
        # swap step 
        if Q[k].dot_product(Q[k]) >= (delta - mu[k][k-1]^2) * Q[k-1].dot_product(Q[k-1]):
            k = k + 1
        else:
            B[k], B[k-1] = B[k-1], B[k]
            Q, mu = B.gram_schmidt()
            k = max(k-1,1)
    
    return B

常规实现

在进行一次交换步或约化步之后，实际上只需要修改mu（施密特正交化系数）和Q（正交向量组）的个别值。而简易实现中，每次都会重新计算整个施密特正交化，这样的实现是低效的。

参考的伪代码不贴了，来源于 Lattice Basis Reduction - An Introduction to the LLL Algorithm and its Applications P.63

sagemath代码如下：

def LLL_v1(M, delta=0.75):

    if delta < 0.25:
        print("delta should be greater than 0.25. Choose delta = 0.75 now.")
    alpha = delta if 0.25 < delta < 1 else 0.75
    
    x = M
    n = M.nrows()
    
    def reduce(k, l):
        do_reduce = False
                   
        if abs(mu[k,l]) > 0.5:
            do_reduce = True
            
            y[k] = y[k] - mu[k,l].round() * y[l]
            for j in range(l):
                mu[k,j] -=  mu[k,l].round() * mu[l,j]
            mu[k,l] = mu[k,l] - mu[k,l].round()       

        return
    
    def exchange(k):
        
        y[k-1], y[k] = y[k], y[k-1]
        NU = mu[k,k-1]
        delta = gamma[k] + NU ^ 2 * gamma[k-1]
        mu[k,k-1] = NU * gamma[k-1] / delta    # all above is right
        gamma[k] = gamma[k] * gamma[k-1] / delta
        gamma[k-1] = delta

        for j in range(k-1):
            mu[k-1,j], mu[k,j] = mu[k,j], mu[k-1,j]
        for i in range(k+1, n):
            xi = mu[i,k]
            mu[i,k] = mu[i,k-1] - NU * mu[i,k]
            mu[i,k-1] = mu[k,k-1] * mu[i,k] + xi      
            
        return
    
    # step (1) 
    y = deepcopy(x)
    # step (2) 
    y_star, mu = y.gram_schmidt()
    gamma = [y_star[i].norm() ^ 2 for i in range(n)]
    
    # step (3)
    k = 1
    
    # step (4)
    while k < n:      
        # step (4)(a)    
        reduce(k, k-1)

        # step (4)(b)
        if gamma[k] >= (alpha - mu[k,k-1]^2) * gamma[k-1]:
            # (i)
            for l in reversed(range(k-1)):
                reduce(k, l)
            # (ii)
            k = k + 1
        else:
            # (iii)
            exchange(k)
            # (iv)
            if k > 1:
                k = k-1

    return y

注：这两个版本的算法输出会有所不同，但这并不是因为代码写的有错误。两个算法求出的结果都是一组LLL-约化基。

理论效能

在密码分析的使用中，一般会选取$\,\delta=0.99\,$或其他合适的值。我们最关心LLL求解SVP的能力，下面给出$\, \delta\,$取任意值时所得$\, \mathbf{b}_1\,$范数的上界。

约化能力：设$\, \mathbf{b}_1,\ldots,\mathbf{b}_n\,$是$\, n\,$维格$\, \mathcal{L}\,$的一组$\ \delta\,$- LLL约化基，则$\ \left| \mathbf{b}_1\right| \le\left(\frac{2}{\sqrt{4\delta-1}}\right)^{n-1}\lambda_1(\mathcal{L})\,$。

由定理可知，在LLL中$\, \delta\,$的选取会显著影响输出基的质量，$\, \delta\,$越大则基的范数越小。但算法中$\, \delta<1\ ,$，因此常见的选取为$\, \delta=0.99\,$。根据定理3.2.2，此时$\, \left|\mathbf{b}_1\right|<\left(1.35136\right)^\frac{n-1}{2}\lambda_1(\mathcal{L})\,$。

实际上，LLL算法输出基的质量在实践中一般优于上述定理给出的上界，以此估算LLL的实际表现是悲观的。与此相似，下面给出的时间复杂度上界也是一个悲观估计。

时间复杂度：设$\, \mathcal{L}\subset\mathbb{R}^m\,$为$\, n\,$维格，LLL算法输入基为$\, \mathbf{b}_1,\ldots,\mathbf{b}_n\,$，则LLL算法会在$\ O\left(n^6\ln^3\!{B}\right)\,$的时间内运行完毕。其中$\ \forall1\le i\le n\ ,\ \left|\mathbf{b}_i\right|

LLL算法的理论效能总结如下：算法能够在$\ O\left(n^6\ln^3{B}\right)\,$的时间内，输出质量较高的约化基。当算法中的参数选取为$\, \delta=0.99\,$时，输出基中第一个向量的欧氏范数满足$\, \left|\mathbf{b}_1\right|<\left(1.352\right)^\frac{n-1}{2}\lambda_1(\mathcal{L})\,$。再次强调，这些结论仅仅是算法性能的下限，直接用这些值来预测算法性能过于悲观。后面还会看到，改进LLL算法的时间复杂度明显优于这个上界。

BKZ算法

1994年，Schnorr等人提出了BKZ算法。该算法比LLL算法的约化能力更强，可视为LLL算法的一种改进，其中使用了KZ约化(Korkin-Zolotarev reduction)和深插法(deep insertion)。下面介绍原始BKZ算法，而目前使用的BKZ 2.0在后面介绍。

算法描述

KZ约化：KZ约化基是一组size-reduced，且其正交化后的向量范数为逐次最小长度的格基（特别地，基中第一个向量的长度即为$\,\lambda_1\,$）。计算高维格的KZ约化基是不切实际的，因为这需要要在输入格的投影子格上对SVP求解算法进行迭代式调用，其时间复杂度一般为超指数级。

为了以合理的时间代价得到比LLL约化基质量更好的基，Schnorr等人提出让格基的每个分块为KZ约化基即可。并且在原始BKZ中，分块的大小一般只会选取为10~30左右。下面给出BKZ约化基的概念。

BKZ约化：若$\, {\mathbf{b}}_1,\ldots,\mathbf{b}_n\,$为格$\,\mathcal{L}\,$的LLL约化基，且对于任意的$\,i\,$，有

$\ \left\|\mathbf{b}_i^\ast\right\|=\lambda_1\left(\mathcal{L}_{\left[i,min{\left(i+\beta-1,n\right)}\right]}\right)\$ ，

则称${\ \mathbf{b}}_1,\ldots,\mathbf{b}_n\,$为格$\,\mathcal{L}\,$的一组$\,\beta-$BKZ约化基，称其中的$\, \beta\,$为BKZ的分块大小。
在BKZ算法中，只需在分块投影子格$\, \mathcal{L}([\pi_i(\mathbf{b}_i),\pi_i(\mathbf{b}_{i+1}),\ldots,\pi_i(\mathbf{b}_{min\left(i+\beta-1,n\right)})]) \,$上求解SVP，这要比KZ约化容易得多。BKZ中这个求解SVP的子算法称为SVP oracle，一般使用格枚举(lattice enumeration)实现。

原始的BKZ使用精确格枚举算法，这个算法一定能够在输入投影子格上求解出SVP，但它的时间开销很大。实用的BKZ使用的是剪枝枚举算法，这种算法只能以一定的概率求解SVP，但它的时间开销比前者小很多。

枚举算法可视为对枚举树的DFS，剪枝枚举则是剪枝DFS。

原始BKZ伪代码如下。
输入：格$\,\mathcal{L}\,$的基$\ B={(\mathbf{b}}_1,\ldots,\mathbf{b}_n)\,$，分块大小$\, \beta\in\left\{2,\ldots,n\right\}\,$，施密特系数矩阵$\, \mu\,$和${\, \left|\mathbf{b}_1^\ast\right|}^2,\ldots,\left|\mathbf{b}_n^\ast\right|^2 \,$
输出：$\,\beta-$BKZ约化基$\, {(\mathbf{b}}_1,\ldots,\mathbf{b}_n)\,$

算法步骤：

原始BKZ算法伪代码

BKZ算法的大致流程如下：

先对输入基进行LLL作为预处理，之后对当前分块进行格枚举求解SVP。若枚举算法得到的最短向量不是当前分块的第一个向量，就将最短向量插入到分块前，重新对整个基进行LLL约化。直到对所有分块都操作完毕。这样得到的输出基通常会优于LLL约化基。分块大致可以视为一种滑动窗口，第一个分块是$(\mathbf{b}_1,\ldots,\mathbf{b}_{\beta})$，第二个分块是$(\mathbf{b}_2,\ldots,\mathbf{b}_{\beta + 1})$…总之每次窗口向右移动一个向量。注意最后的$\,\beta-2\,$个分块长度是小于$\,\beta \,$的。

为什么每次插入后要进行LLL呢？这主要是因为插入的子格最短向量与该子格的基线性相关，因此插入后当前的向量组就不是一组基了。而LLL能够消去线性相关性，同时进行一步约化。

理论效能

Hanrot等人运用动力系统分析出BKZ的约化能力下界为$\, \left|\mathbf{b}_1\right|\le\beta^{\frac{n-1}{2\left(\beta-1\right)}+\frac{3}{2}} \det(B)^\frac{1}{n}\,$。另一方面，当$\, \beta\,$设置为输入格维度$\, n\,$时，由BKZ约化基的定义可知$\, \left|\mathbf{b}_1\right|=\left|\mathbf{b}_1^\ast\right|=\lambda_1\left(\mathcal{L}\right)\,$。此时若BKZ算法能够终止，则其能够成功地求解$\, \mathcal{L}\,$上的SVP问题。
尽管在实践中BKZ算法较为有效，但它至今仍没有被证明是多项式时间的算法。2008年，Gama和Nyugen在文指出当时BKZ时间复杂度的理论上界为$\,O\left(n\beta\right)^n\,$，关于维度$\, n\,$为超指数级（当然这也是悲观上界）。他们对BKZ进行了大量的实验。实验结果表明原始BKZ运行时间关于维度$\, n\,$似乎是指数级而不是多项式级。BKZ 2.0论文中指出，原始BKZ算法中$\,\beta=20\,$较为实用，但$\,\beta\geq25\,$时运行时间会显著增加。输入高维格时，选取分块大小为$\, \beta\geq40\,$会使BKZ运行得非常慢，甚至可能跑不出结果。

总结与启发

前面总结了原始格基规约算法，其中高斯算法在理论上被研究的很透彻，而LLL和BKZ的理论效能分析结论并不实用，只是算法的下限。

目前使用的改进LLL算法与改进BKZ算法已经比原始算法的效能好很多，因此在实战中不使用两种原始算法。但即便如此原始算法仍然是值得回顾的，很容易受到如下启发：

理解各算法的优化方向。对于LLL算法，其改进版的优化主要集中在于大数运算的优化（包括大数算法的改进和浮点数的正确使用），以及使用深插法(deep insertion)提升算法的约化能力；对于BKZ算法，其改进版的优化会集中在SVP oracle（枚举）的调用次数和SVP oracle算法本身的改进，减少运行时间从而能使用更大的$\,\beta\,$。
算法效能很难用理论进行分析。事实上，大多数使用的改进后的算法在理论分析上也很困难，结论也不太理想，并且经典的分析方法不再适用。目前比较有效的理论分析一般是利用启发公式的方法进行启发式估计，设计模拟算法进行实验来得到启发式时间复杂度，许多分析还使用离散动力系统理论作为数学工具。
在大多数场景下BKZ往往比LLL更实用，因为BKZ约化能力更强。回顾时，我们发现原始BKZ在大多数场景更加实用。只有对求解速度有较大要求或需要在高维格中循环调用算法时才会调用LLL，其他情况下BKZ才是更好的选择。

改进格基约化算法

目前，sagemath中的格基规约算法默认采用fpLLL的实现。在fpLLL中默认的LLL算法依照 $\mathrm{L}^2$算法实现，并结合H-LLL；默认的BKZ算法主要依照BKZ 2.0实现。对于LLL和BKZ，下面仅简单总结了$\, \mathrm{L}^2\,$算法和BKZ 2.0算法。

$\mathrm{L}^{2}$算法

该算法为一种浮点型LLL算法，其中采用了浮点数和大数运算算法来优化运行时间，并使用deep insertion来提升算法的约化能力。即便不使用大数运算优化，$\, \mathrm{L}^2$算法的理论时间复杂度也为$\, O\!\left(d^4(d+\log B)\,m \log B\right)\,$，远优于原始LLL。（$\,d\,$是格的维度，$\,B\,$是输入基中最长向量的范数，$\,\mathcal{L} \subset \mathbb{R}^{m}$）

BKZ 2.0

该算法为目前sagemath默认调用的BKZ算法，对原始BKZ算法进行了四个优化：

将极限剪枝枚举算法(extreme pruning)和一种高概率线性剪枝算法(linear pruning)这两种算法搭配起来，作为BKZ 2.0的SVP oracle（论文中称为sound pruning）。这比最早提出的Schnorr-Euchner剪枝枚举算法还要快很多。
一次极限剪枝算法的成功概率虽低，但是速度非常快，以至于我们可以通过多次地调用它（例如一百次…），达到一个与其他算法相同的成功概率，速度却能快很多倍。
以大量实验结果为依据，使用Gaussian Heuristic启发式对剪枝枚举半径的值进行初始化。具体来说，枚举半径的初始值是1.05GH与输入格基的第一个向量范数中最小的那个。
使用早期中止技术，合理设置oracle的调用次数（多项式级别）。
对局部基进行预处理。

BKZ 2.0的这些优化手段旨在降低BKZ的SVP oracle调用次数以及SVP oracle自身的运行时间。这一系列的优化使得BKZ 2.0可以使用较大的 $\, \beta\,$，从而使得其约化能力显著强于LLL。BKZ 2.0论文中指出，设定算法参数为$\,\beta \ge 90\,$，甚至$\,\beta = 110\,$都是可以的。

要想更深入的理解BKZ 2.0，就要学习一下格枚举算法。可以在某英文网站上看一下视频 Lattice-based cryptography II - Enumeration attacks 和 Random Sampling Revisited Lattice Enumeration with Discrete Pruning的前半部分。

BKZ 2.0论文是我的外文翻译，不过感觉这篇论文翻译难度较大，我的翻译还需完善一下。如果有人想看的话，可能会在2022年1月完善后放出。

扩展阅读

2004年高斯算法被Nguyen等人推广至高维，他们指出推广算法在4维格中输出基为欧氏范数为Minkowski约化基（最小基）。同时，在4维格中算法复杂度（就输入基中最长向量范数的比特长度$\,n\,$而言）至少是平方级，若使用快速大数运算方法，算法的时间复杂度有希望提升到$\,O\!\left(n\log{n}\right)\,$级别。论文：Low-Dimensional Lattice Basis Reduction Revisited

下面提及的算法在fpLLL中也有实现。

H-LLL以$\,\mathrm{L}^2$算法为基础，在计算施密特正交化（QR分解）时使用householder算法替换了 Cholesky算法从而加快了运行速度。（具体做法并没这么简单，为了防止精度损失导致结果与原来不同，整个算法被重组）。论文：H-LLL: Using Householder Inside LLL

2008年，Gama和Nyugen提出了slide reduction。算法结构很漂亮，并且它的理论效能强于使用中止技术的BKZ。不过最初的slide reduction算法，其实际表现远不如BKZ 2.0算法。论文：Finding Short Lattice Vectors within Mordell’s Inequality

2016年， Micciancio和Walter获得了很大成果。他们提出一种在对偶格上枚举最短向量的方法，并且这种方法不需要计算对偶基。这使得他们能够在slide reduction使用很大的block size。改进后的slide reduction，其效能与BKZ 2.0几乎差不多。并且更重要的是，在block size的值适中时，其理论效能与实际效能几乎一致。这意味着无需进行实验就可以估计格基约化算法对格密码的冲击。此外，他们还提出一种SDBKZ(self dual BKZ，即自对偶BKZ)，其实际效能与BKZ 2.0相差无几，但其理论效能很容易分析。总之，这篇论文对于想进一步了解格基规约算法的人来说非常值得阅读。论文：Practical, Predictable Lattice Basis Reduction

此外也推荐这些博客，与上面的内容相关：

目前最强的算法是基于G6K的BKZ（全称General Sieve Kernel，读作Jessica），可以在英文网站上查找相关的讲解视频。论文：The General Sieve Kernel and New Records in Lattice Reduction

参考资料

文献

为了保证阅读体验，我没有在正文标注引用。本人只是把这方面内容重新组织和总结了一下，又写了一点自己的理解。根据以下论文的名字不难找到本文内容的出处。

Hoffstein J , Pipher J C , Silverman J H . An Introduction to Mathematical Cryptography. 2008.
Galbraith S D . Mathematics of Public Key Cryptography: Lattices. 2012.
Nguyen P Q , D Stehlé. Low-Dimensional Lattice Basis Reduction Revisited. 2009.
Lenstra A . Factoring polynomial with rational coefficients. 1982.
Bremner M R . Lattice Basis Reduction: An Introduction to the LLL Algorithm and Its Applications. 2011.
Schnorr C P, Euchner M. Lattice basis reduction: improved practical algorithms and solving subset sum problems. 1994.
Gama, Nicolas, et al. “Lattice Enumeration Using Extreme Pruning.” EUROCRYPT’10 Proceedings of the 29th Annual International Conference on Theory and Applications of Cryptographic Techniques, 2010, pp. 257–278.
Chen Y, Nguyen P Q. BKZ 2.0: Better lattice security estimates. 2011.
PQ Nguyen, D Stehlé. Floating-Point LLL Revisited. 2005.
郑永辉,刘永杰,栾鸾.格基约化算法及其在密码分析中的应用综述. 2020.
Regev L O , Kaplan S E . Lattices in Computer Science LLL Algorithm. 2013.
Cohen H . A Course in Computational Algebraic Number Theory. 2013.
Hanrot G, Pujol X, Stehlé. Analyzing blockwise lattice algorithms using dynamical systems. 2011.
Gama N, Nguyen P Q. Predicting lattice reduction. 2008.
Morel I, Stehlé D, Villard G. H-LLL: using householder inside LLL. 2009.

博客

Building Lattice Reduction (LLL) Intuition | kel.bz

Lattice Blog Reduction – Part I: BKZ | Calvin Café: The Simons Institute Blog

Lattice Blog Reduction – Part II: Slide Reduction | Calvin Café: The Simons Institute Blog

Lattice Blog Reduction – Part III: Self-Dual BKZ | Calvin Café: The Simons Institute Blog

还有一些英文视频，因为一些你懂得的原因这里就不贴了。

记一次对家中网络的简单优化

2021-03-04T13:00:05.000Z

最近实在忍不了家里的WiFi了，经常丢包和断线，游戏没法打，网也上着费劲，因此决定对WiFi进行优化。

家里的网络结构是光猫接上路由器的WAN口，平时手机电脑上网时连路由器，路由器连光猫。就是那种很常见的小型家庭网络。

优化光猫

关无线功能

仔细看光猫，发现开启了路由模式（无线工作指示灯亮着），也就是说光猫既要进行光电信号的转换、拨号还要发射无线信号。但是光猫这玩意性能很差，这也是为什么我们要花钱买路由器。因此我们要把光猫的无线关掉。

网上说可以让光猫开启桥接模式，让路由器来拨号。但是联通的光猫设置起来好像比较麻烦，我也没找到设置选项。也有人说就让光猫拨号就行，一般情况下不用搞，而且改桥接还可能被运营商限速。所以这里就只关掉光猫的wifi功能，没调桥接，光猫的DHCP也没关。

首先，我们先查看下光猫的IP地址

这大概就是光猫的ip地址了，我们再用tracert看一下

第一跳肯定是我们的路由器，第二跳肯定是光猫，可见光猫确实是192.168.18.1这个IP地址了。

进入光猫配置页面，关掉Wifi功能。这里光猫的密码通过扫光猫上贴的二维码得到，如果光猫上到处没有写的话就要问下运营商了。

既然关DHCP费劲，调桥接模式更费劲，那光猫就没什么可优化的了。

关闭防火墙

就光猫这性能，防火墙铁定是鸡肋，不会有什么用的。家里的路由器开防火墙就足够了。我们把光猫的防DoS，ipv6spi统统关掉，节省一些光猫的性能。

优化路由器

开启QoS

有时候可能是家里看视频占带宽太大，网很卡。看到路由器CPU和内存负载挺低，那开个QoS吧。下载速度自己应该知道，上传速度，自己测一下就完事了。

总结

想小优化一下，发现其实没太多可优化的。要想优化得细节一些又要花很多时间捣腾，先就这样吧。

随缘的英语听力练习秘籍

2019-09-01T09:30:00.000Z

这是一种可以让英语应试水平和英语能力同步提升的训练方法。经过一个月的训练，我的朋友在之前英语水平一般的情况下，四级听力得到200分，也顺利通过了六级。

考试方法

考试关键点：听到了选项要在纸上随时做标记，记录一些关键词

训练方法：精听

以练习精听为主，临考前可以再做几套听力题。

精听：拿一篇自己听起来有点困难的文章/对话，逐句听写。

具体流程

一句话听数次，把自己听到的部分写在纸上，直到写下完整句子，或者连续听了两次都听不出来一个新词为止。之后纠正错误，补全没听懂的部分。如果这句话有没听懂的地方（尤其是连读），看着原句对照其发音再听，有能力可模仿其发音（连读）。

听力选材建议

用来做精听的文章词汇量不要高于自己词汇量，至少有1000以上词汇量（初中水平）再做精听

高考不及格的水平可以听新概念2前半本；
四级500分及以下 / 高考的水平听新概念英语2后半本、VOA慢速等；
四级550 / 六级500分水平尝试听新概念3的前半本、VOA；
四级580以上 / 六级540以上听新概念3后半本、老托福文章、新托福对话、VOA…

如果有考试听力练习的原文，可以对听力材料做精听。

练习时长及效果

每周听3-4天，每天1次，至少15分钟并且至少80个词。

坚持一个月，四级听力150->190

坚持两个月150->210-220（词汇量不低于3000情况下）

每周天天听，坚持40天 150->210

基本上，听个7-10天就感觉有提升。