지난 포스팅에선 미분연산자가 정확한 반대칭 행렬이 아닐 경우에 도출되는 문제에 대해 설명했다. 그런데 양자장론에서 범함수functional에 대해 공부하던 중, 미분연산자의 비대칭이 국소성locality에 대해서도 문제를 발생시킨다는 사실을 깨달았다. 이번 포스팅에선 그 문제에 대해 설명해보려 한다. 그전에 먼저 범함수와 그것의 미분에 대해 간략히 정리해보자.
아마 많은 물리학도들이 범함수를 정면으로 마주하는 첫 순간은 고전물리에서 라그랑지 역학Lagrangian Mechanics을 배울때 일 것이다. 그 지점은 그토록 기다려왔던 최소작용원리the principle of least action와 처음 만나는 순간이기도 하다. 하지만 돌아보면, 일반적으로 쓰이는 범함수와 최소작용원리에 대한 설명은 뭔가 잘 이해되지가 않았다.
보통 범함수를 ‘함수의 함수’라는 표현으로 설명하는데, 그런 표현 자체를 이해하는건 어렵지 않았지만 왠지 모르게 그런 이해는 시간이 지나도 여전히 추상적힌 무언가처럼 느껴졌다. 최소작용의 원리는 보통 그리스 문자 $\eta$로 표시하는 변분variation을 써서 하는 설명이 주류인데, 그 또한 아무리 반복해서봐도 손에 단단히 잡히는 느낌이 들질 않았다1.
그러다가 범함수와 최소작용을 원리를 이해하는데 큰 전환점을 맞게되었는데, 이는 Susskind의 <The Theoretical Minimum>과 Blundell의 양자장론 교재를 공부하면서 있었던 일이다. 특히나 Blundell 교재에서 범함수의 미분이 함수의 미분과 정확히 같은 형태로 나타내어진다는 사실을 명시적으로 드러낸 부분은 일종의 ‘개안開眼의 순간’과도 같았다 : $$ \begin{aligned} \text{함수의 미분 :} &\quad \frac{df(x)}{dx} = \lim_{\epsilon \to 0} \frac{f(x+\epsilon) – f(x)}{\epsilon} \\[1em] \text{범함수의 미분 :} &\quad \frac{\delta F[f(x)]}{\delta f(x)} = \lim_{\epsilon \to 0} \frac{F[f(x’) + \epsilon \delta(x-x’)] – F[f(x’)]}{\epsilon} \end{aligned} \tag{1} $$
이런 정의에서 보면 최소작용의 원리 또한 정확히 ‘미분해서 $0$’ — 즉 ‘$\nabla f=0$’이라는 전략을 범함수에서 적용한 결과이다. 이에 대한 보다 구체적인 설명은 조만간 다른 포스팅에서 할 생각이다. 이번 포스팅에선 식$(1)$의 첫째줄과 같은 함수 $x$에 대해 좌우비대칭적인 미분이 물리학의 매우 중요한 성질인 -‘국소성locality’ 을 해친다는 사실을 말하려 한다2.
먼저 다음과 같은 Action작용 $S$가 있다 하자 : $$S=\int F[f(x), f'(x)] dx \tag{2}$$
이는 입자의 위치 $x(t)$와 속도 $\dot{x}(t)$에만 의존하고 시간 $t$에 대한 명시적explicit 의존성이 없는 라그랑지안 $L[x(t), \dot{x}(t)]$을 다루는 상황과 비슷하다.
여기서 식$(2)$를 이산화discretization 해보자 : $$S=\sum_{i} F[f(x_i), f'(x_i)] \Delta x\tag{3}$$
이는 그저, 식$(2)$에서 $dx$가 충분히 크게 보일때까지 확대했다는 정도로 이해하면 되겠다. 예를들어 컴퓨터 모니터를 픽셀 하나하나가 보일때까지 확대해서 본다거나 인쇄물을 잉크 한점한점이 보일때까지 확대했다는것과 같은 상황인 것이다.
여기서 $S$의 자유도는 몇개인가? $S$는 $i$로 labeling 된 무한히 많은 $f(x_i)$와 $f'(x_i)$에 대한 함수이므로, 무한개의 자유도를 가진다3. 그리고, 여기서 오직 $x_k$에서의 함수값 $f(x_k)$가 미소량 $\delta f(x_k)$만큼 변했다고 해보자.
이때 우리가 미분의 정의를 식$(1)$과 같이 $x$에 인접한 오른쪽 지점만을 택하는 비대칭적 정의를 사용한다면, 작용 $S$에서 그러한 변분에 영향을 받는 항은 단 두개 뿐이다 : $$ S = \cdots + F \left[ f(x_{k-1}), \frac{f(x_k) – f(x_{k-1})}{\Delta x} \right] \Delta x + F \left[ f(x_k), \frac{f(x_{k+1}) – f(x_k)}{\Delta x} \right] \Delta x + \cdots $$
$f(x_k)$ 이외의 항들은 변하지 않으므로 $\delta S$에 영향을 주지 않는다. 그리고 chain rule을 사용하여 변분 $\delta f(x_k)$에 대한 위 두항의 변화량 — 즉, Action의 변화량 $\delta S$를 계산하면 : $$ \delta S = \frac{\partial F[f(x_{k-1}), f'(x_{k-1})]}{\partial f'(x_{k-1})} \underbrace{\frac{\partial f'(x_{k-1})}{\partial f(x_k)}}_{+\frac{1}{\Delta x}} \delta f(x_k) + \frac{\partial F[f(x_k), f'(x_k)]}{\partial f(x_k)} \delta f(x_k) + \frac{\partial F[f(x_k), f'(x_k)]}{\partial f'(x_k)} \underbrace{\frac{\partial f'(x_k)}{\partial f(x_k)}}_{-\frac{1}{\Delta x}} \delta f(x_k) $$
식을 정리해주면 : $$ \frac{\delta S}{\delta f(x_k)} = \frac{\partial F[f(x_k), f'(x_k)]}{\partial f(x_k)} – \frac{1}{\Delta x} \left\{ \frac{\partial F[f(x_k), f'(x_k)]}{\partial f'(x_k)} – \frac{\partial F[f(x_{k-1}), f'(x_{k-1})]}{\partial f'(x_{k-1})} \right\} $$
여기서 $\frac{\left\{ \cdots \right\}}{\Delta x}$는 식$(1)$에서 한 미분의 정의에 따르면 함수 $\frac{\partial F[f(x), f'(x)]}{\partial f'(x)}$를 $x$에 대해서, 그리고 $x=x_{k-1}$ 지점에서 미분한 결과이다. 따라서 최종적으로 다음과 같은 미분방정식이 도출된다 : $$ \frac{\delta S}{\delta f(x_k)} = \left. \frac{\partial F[f(x), f'(x)]}{\partial f(x)} \right|_{x=x_k} – \left. \frac{d}{dx} \left( \frac{\partial F[f(x), f'(x)]}{\partial f'(x)} \right) \right|_{x=x_{k-1}} \tag{4}$$
이 결과는 국소적이지 않다. 식$(4)$에서 최소작용의 원리 $\delta S =0$를 적용하여 나오는 결과는 고전역학에선 $\frac{d\mathbf{p}}{dt}=-\nabla V(\mathbf{x})$를 뜻한다. 이 뉴튼의 운동방정식 좌변과 우변은 모두 어떤 특정한 시간 $t$, 그리고 그때 공간상의 어떤 특정한 지점 $\mathbf{x}(t)$에 대한 물리량이다. 즉, 어떤 지점 $\mathbf{x}(t)$에서 운동량의 시간변화량은 힘과 같다는 것이 뉴튼역학의 골자인 것이다. 그런데 식$(4)$는 어떤 지점 $x=x_k$에서의 힘이 그것보다 한칸 왼쪽으로 간 지점 $x=x_{k-1}$ 지점에서의 운동량의 변화와 같음을 말해주고 있다4. ..왜 한칸 오른쪽이 아니라 왼쪽인가? 물리법칙에 그렇게 특정 방향에 대한 선호도가 들어갈 이유가 무엇인가?
이 문제는 전적으로 식$(1)$에서 미분연산자를 비대칭적으로 정의했기 때문이다. $x$의 오른쪽과 왼쪽을 모두 포함하도록 다음과 같이 정의하면 식$(4)$의 비국소성은 자동적으로 해결된다 : $$ \frac{df(x)}{dx} = \lim_{\epsilon \to 0} \frac{f(x+\epsilon) – f(x-\epsilon)}{2\epsilon} \tag{5} $$
이런 정의 하에선 식$(3)$에서 $f(x_k)$를 포함하는 항은 3개이다 : $$ S = \cdots + F \left[ f(x_{k-1}), \frac{f(x_k) – f(x_{k-2})}{2\Delta x} \right] \Delta x + F \left[ f(x_k), \frac{f(x_{k+1}) – f(x_{k-1})}{2\Delta x} \right] \Delta x + F \left[ f(x_{k+1}), \frac{f(x_{k+2}) – f(x_k)}{2\Delta x} \right] \Delta x + \cdots $$
이 식은 $f(x_k)$에 대한 변분 $\delta f(x_k)$에 대해 다음과 같이 변한다 : $$ \frac{\delta S}{\delta f(x_k)} = \frac{\partial F[f(x_k), f'(x_k)]}{\partial f(x_k)} + \frac{\partial F[f(x_{k+1}), f'(x_{k+1})]}{\partial f'(x_{k+1})} \underbrace{\frac{\partial f'(x_{k+1})}{\partial f(x_k)}}_{-\frac{1}{2\Delta x}} + \frac{\partial F[f(x_{k-1}), f'(x_{k-1})]}{\partial f'(x_{k-1})} \underbrace{\frac{\partial f'(x_{k-1})}{\partial f(x_k)}}_{+\frac{1}{2\Delta x}} $$
정리해주면 : $$ \frac{\delta S}{\delta f(x_k)} = \frac{\partial F[f(x_k), f'(x_k)]}{\partial f(x_k)} – \frac{1}{2\Delta x} \left\{ \frac{\partial F[f(x_{k+1}), f'(x_{k+1})]}{\partial f'(x_{k+1})} – \frac{\partial F[f(x_{k-1}), f'(x_{k-1})]}{\partial f'(x_{k-1})} \right\} $$
여기서 $\frac{ \left\{ \cdots \right\} }{\Delta x}$ 부분은, 식$(5)$에 따르면 함수 $\frac{\partial F[f(x), f'(x)]}{\partial f'(x)}$를 $x$에 대해서, 그리고 $x=x_{k}$ 지점에서 미분한 결과이다. 따라서 최종적으로 다음과 같은 미분방정식이 도출된다 : $$ \frac{\delta S}{\delta f(x_k)} = \left. \left[ \frac{\partial F[f(x), f'(x)]}{\partial f(x)} – \frac{d}{dx} \left( \frac{\partial F[f(x), f'(x)]}{\partial f'(x)} \right) \right] \right|_{x=x_{k}} \tag{6}$$
즉, 미분을 $x$를 기준으로 어느 한쪽만 택하는 식$(1)$의 정의를 사용하면 운동방정식은 국소적이지 않다. 반면 미분을 $x$를 기준으로 좌우대칭적으로 정의된 식$(5)$를 택하면 운동방정식은 특정 위치에 대한 국소적인 미분방정식이 된다.
나는 이 문제를 많은 사람들이 간과하고 있다는 느낌을 받는다. 식$(1)$은 앞서 언급한 Blundell의 양자장론 교과서에 있는 그대로이다. 그리고 필자는 이런 문제를 Chat GPT와 Gemini에게 물었는데, 둘다 식$(1)$의 미분정의를 사용하여 답했고, 심지어 그 결과 식$(4)$와 같은 국소성 문제가 드러났는데도 이를 인지하지 못했다. 사실 필자 또한 지금껏 이런 문제를 몰랐었는데, 미분연산자가 정확히 반대칭anti-symmetric하지 않을 경우 canonical commutation relation $[\mathbf{x}, \mathbf{p}]=i\hbar$이 성립하지 않는다는 심대한 문제를 몰랐다면 앞으로도 몰랐을 뻔했다.
수학적으로 엄밀히 따졌을때 미분의 비대칭적 정의가 어떤 직접적인 문제를 낳는지는 잘 모르겠다. 하지만 그것이 수학적으로 문제가 없다해도, 물리적으로는 큰 문제인듯 하다.
■
- 최소작용원리에 대한 그런 설명이 널리 퍼지게 된데는 파인만의 공이 클것이다. 필자 또한 <파인만의 물리학 강의>에서 그 설명을 봤는데, 아무리 천재 물리학자의 설명이라 해도 내 속에서 소화가 안되면 소용이 없다.[^]
- 참으로 신기하게도, 식$(1)$에서 함수의 미분과 범함수의 미분은 정확히 동일한 수학적 형태를 보이지만 비대칭성은 전자에게만 있다. 범함수의 미분에서 변분은 오직 $x’=x$에서만 일어나는 국소적 사건이다. 반면 함수 $f(x)$의 미분을 위해선 반드시 $x$에 인접한 지점을 택해야 한다. 즉, 함수의 미분은 $x$에 대해 인접한 오른쪽 지점을 택할지 왼쪽 지점을 택할지 – 아니면 양쪽을 동시에 택하여 분모를 $2\epsilon$으로 해줄지에 따라 대칭/비대칭을 오가지만, 범함수의 미분은 오직 $x’=x$에 대한 변분만을 고려하므로 그런 대칭/비대칭의 문제가 없다. [^]
- 관련개념에 대한 설명은 delta function $\delta (x-x’)$에 대한 지난 포스팅을 참조바란다.[^]
- 보다 엄밀히 말하면 — 뉴튼 운동방정식에선 변수가 $t$이기 때문에, 식$(4)$는 시간 $t_k$에서의 힘이 그 보다 이전 시점인 $t_{k-1}$에서의 운동량 변화와 같음을 말해준다.[^]