비대칭 미분연산자의 문제점

지난 포스팅에선 미분연산자가 정확한 반대칭 행렬이 아닐 경우에 도출되는 문제에 대해 설명했다. 그런데 양자장론에서 범함수functional에 대해 공부하던 중, 미분연산자의 비대칭이 국소성locality에 대해서도 문제를 발생시킨다는 사실을 깨달았다. 이번 포스팅에선 그 문제에 대해 설명해보려 한다. 그전에 먼저 범함수와 그것의 미분에 대해 간략히 정리해보자.

아마 많은 물리학도들이 범함수를 정면으로 마주하는 첫 순간은 고전물리에서 라그랑지 역학Lagrangian Mechanics을 배울때 일 것이다. 그 지점은 그토록 기다려왔던 최소작용원리the principle of least action와 처음 만나는 순간이기도 하다. 하지만 돌아보면, 일반적으로 쓰이는 범함수와 최소작용원리에 대한 설명은 뭔가 잘 이해되지가 않았다.

보통 범함수를 ‘함수의 함수’라는 표현으로 설명하는데, 그런 표현 자체를 이해하는건 어렵지 않았지만 왠지 모르게 그런 이해는 시간이 지나도 여전히 추상적힌 무언가처럼 느껴졌다. 최소작용의 원리는 보통 그리스 문자 $\eta$로 표시하는 변분variation을 써서 하는 설명이 주류인데, 그 또한 아무리 반복해서봐도 손에 단단히 잡히는 느낌이 들질 않았다1.

그러다가 범함수와 최소작용을 원리를 이해하는데 큰 전환점을 맞게되었는데, 이는 Susskind의 <The Theoretical Minimum>과 Blundell의 양자장론 교재를 공부하면서 있었던 일이다. 특히나 Blundell 교재에서 범함수의 미분이 함수의 미분과 정확히 같은 형태로 나타내어진다는 사실을 명시적으로 드러낸 부분은 일종의 ‘개안開眼의 순간’과도 같았다 : $$ \begin{aligned} \text{함수의 미분 :} &\quad \frac{df(x)}{dx} = \lim_{\epsilon \to 0} \frac{f(x+\epsilon) – f(x)}{\epsilon} \\[1em] \text{범함수의 미분 :} &\quad \frac{\delta F[f(x)]}{\delta f(x)} = \lim_{\epsilon \to 0} \frac{F[f(x’) + \epsilon \delta(x-x’)] – F[f(x’)]}{\epsilon} \end{aligned} \tag{1} $$

이런 정의에서 보면 최소작용의 원리 또한 정확히 ‘미분해서 $0$’ — 즉 ‘$\nabla f=0$’이라는 전략을 범함수에서 적용한 결과이다. 이에 대한 보다 구체적인 설명은 조만간 다른 포스팅에서 할 생각이다. 이번 포스팅에선 식$(1)$의 첫째줄과 같은 함수 $x$에 대해 좌우비대칭적인 미분이 물리학의 매우 중요한 성질인 -‘국소성locality’ 을 해친다는 사실을 말하려 한다2.

먼저 다음과 같은 Action작용 $S$가 있다 하자 : $$S=\int F[f(x), f'(x)] dx \tag{2}$$

이는 입자의 위치 $x(t)$와 속도 $\dot{x}(t)$에만 의존하고 시간 $t$에 대한 명시적explicit 의존성이 없는 라그랑지안 $L[x(t), \dot{x}(t)]$을 다루는 상황과 비슷하다.

여기서 식$(2)$를 이산화discretization 해보자 : $$S=\sum_{i} F[f(x_i), f'(x_i)] \Delta x\tag{3}$$

이는 그저, 식$(2)$에서 $dx$가 충분히 크게 보일때까지 확대했다는 정도로 이해하면 되겠다. 예를들어 컴퓨터 모니터를 픽셀 하나하나가 보일때까지 확대해서 본다거나 인쇄물을 잉크 한점한점이 보일때까지 확대했다는것과 같은 상황인 것이다.

여기서 $S$의 자유도는 몇개인가? $S$는 $i$로 labeling 된 무한히 많은 $f(x_i)$와 $f'(x_i)$에 대한 함수이므로, 무한개의 자유도를 가진다3. 그리고, 여기서 오직 $x_k$에서의 함수값 $f(x_k)$가 미소량 $\delta f(x_k)$만큼 변했다고 해보자.

이때 우리가 미분의 정의를 식$(1)$과 같이 $x$에 인접한 오른쪽 지점만을 택하는 비대칭적 정의를 사용한다면, 작용 $S$에서 그러한 변분에 영향을 받는 항은 단 두개 뿐이다 : $$ S = \cdots + F \left[ f(x_{k-1}), \frac{f(x_k) – f(x_{k-1})}{\Delta x} \right] \Delta x + F \left[ f(x_k), \frac{f(x_{k+1}) – f(x_k)}{\Delta x} \right] \Delta x + \cdots $$

$f(x_k)$ 이외의 항들은 변하지 않으므로 $\delta S$에 영향을 주지 않는다. 그리고 chain rule을 사용하여 변분 $\delta f(x_k)$에 대한 위 두항의 변화량 — 즉, Action의 변화량 $\delta S$를 계산하면 : $$ \delta S = \frac{\partial F[f(x_{k-1}), f'(x_{k-1})]}{\partial f'(x_{k-1})} \underbrace{\frac{\partial f'(x_{k-1})}{\partial f(x_k)}}_{+\frac{1}{\Delta x}} \delta f(x_k) + \frac{\partial F[f(x_k), f'(x_k)]}{\partial f(x_k)} \delta f(x_k) + \frac{\partial F[f(x_k), f'(x_k)]}{\partial f'(x_k)} \underbrace{\frac{\partial f'(x_k)}{\partial f(x_k)}}_{-\frac{1}{\Delta x}} \delta f(x_k) $$

식을 정리해주면 : $$ \frac{\delta S}{\delta f(x_k)} = \frac{\partial F[f(x_k), f'(x_k)]}{\partial f(x_k)} – \frac{1}{\Delta x} \left\{ \frac{\partial F[f(x_k), f'(x_k)]}{\partial f'(x_k)} – \frac{\partial F[f(x_{k-1}), f'(x_{k-1})]}{\partial f'(x_{k-1})} \right\} $$

여기서 $\frac{\left\{ \cdots \right\}}{\Delta x}$는 식$(1)$에서 한 미분의 정의에 따르면 함수 $\frac{\partial F[f(x), f'(x)]}{\partial f'(x)}$를 $x$에 대해서, 그리고 $x=x_{k-1}$ 지점에서 미분한 결과이다. 따라서 최종적으로 다음과 같은 미분방정식이 도출된다 : $$ \frac{\delta S}{\delta f(x_k)} = \left. \frac{\partial F[f(x), f'(x)]}{\partial f(x)} \right|_{x=x_k} – \left. \frac{d}{dx} \left( \frac{\partial F[f(x), f'(x)]}{\partial f'(x)} \right) \right|_{x=x_{k-1}} \tag{4}$$

이 결과는 국소적이지 않다. 식$(4)$에서 최소작용의 원리 $\delta S =0$를 적용하여 나오는 결과는 고전역학에선 $\frac{d\mathbf{p}}{dt}=-\nabla V(\mathbf{x})$를 뜻한다. 이 뉴튼의 운동방정식 좌변과 우변은 모두 어떤 특정한 시간 $t$, 그리고 그때 공간상의 어떤 특정한 지점 $\mathbf{x}(t)$에 대한 물리량이다. 즉, 어떤 지점 $\mathbf{x}(t)$에서 운동량의 시간변화량은 힘과 같다는 것이 뉴튼역학의 골자인 것이다. 그런데 식$(4)$는 어떤 지점 $x=x_k$에서의 힘이 그것보다 한칸 왼쪽으로 간 지점 $x=x_{k-1}$ 지점에서의 운동량의 변화와 같음을 말해주고 있다4. ..왜 한칸 오른쪽이 아니라 왼쪽인가? 물리법칙에 그렇게 특정 방향에 대한 선호도가 들어갈 이유가 무엇인가?

이 문제는 전적으로 식$(1)$에서 미분연산자를 비대칭적으로 정의했기 때문이다. $x$의 오른쪽과 왼쪽을 모두 포함하도록 다음과 같이 정의하면 식$(4)$의 비국소성은 자동적으로 해결된다 : $$ \frac{df(x)}{dx} = \lim_{\epsilon \to 0} \frac{f(x+\epsilon) – f(x-\epsilon)}{2\epsilon} \tag{5} $$

이런 정의 하에선 식$(3)$에서 $f(x_k)$를 포함하는 항은 3개이다 : $$ S = \cdots + F \left[ f(x_{k-1}), \frac{f(x_k) – f(x_{k-2})}{2\Delta x} \right] \Delta x + F \left[ f(x_k), \frac{f(x_{k+1}) – f(x_{k-1})}{2\Delta x} \right] \Delta x + F \left[ f(x_{k+1}), \frac{f(x_{k+2}) – f(x_k)}{2\Delta x} \right] \Delta x + \cdots $$

이 식은 $f(x_k)$에 대한 변분 $\delta f(x_k)$에 대해 다음과 같이 변한다 : $$ \frac{\delta S}{\delta f(x_k)} = \frac{\partial F[f(x_k), f'(x_k)]}{\partial f(x_k)} + \frac{\partial F[f(x_{k+1}), f'(x_{k+1})]}{\partial f'(x_{k+1})} \underbrace{\frac{\partial f'(x_{k+1})}{\partial f(x_k)}}_{-\frac{1}{2\Delta x}} + \frac{\partial F[f(x_{k-1}), f'(x_{k-1})]}{\partial f'(x_{k-1})} \underbrace{\frac{\partial f'(x_{k-1})}{\partial f(x_k)}}_{+\frac{1}{2\Delta x}} $$

정리해주면 : $$ \frac{\delta S}{\delta f(x_k)} = \frac{\partial F[f(x_k), f'(x_k)]}{\partial f(x_k)} – \frac{1}{2\Delta x} \left\{ \frac{\partial F[f(x_{k+1}), f'(x_{k+1})]}{\partial f'(x_{k+1})} – \frac{\partial F[f(x_{k-1}), f'(x_{k-1})]}{\partial f'(x_{k-1})} \right\} $$

여기서 $\frac{ \left\{ \cdots \right\} }{\Delta x}$ 부분은, 식$(5)$에 따르면 함수 $\frac{\partial F[f(x), f'(x)]}{\partial f'(x)}$를 $x$에 대해서, 그리고 $x=x_{k}$ 지점에서 미분한 결과이다. 따라서 최종적으로 다음과 같은 미분방정식이 도출된다 : $$ \frac{\delta S}{\delta f(x_k)} = \left. \left[ \frac{\partial F[f(x), f'(x)]}{\partial f(x)}  – \frac{d}{dx} \left( \frac{\partial F[f(x), f'(x)]}{\partial f'(x)} \right) \right] \right|_{x=x_{k}} \tag{6}$$

즉, 미분을 $x$를 기준으로 어느 한쪽만 택하는 식$(1)$의 정의를 사용하면 운동방정식은 국소적이지 않다. 반면 미분을 $x$를 기준으로 좌우대칭적으로 정의된 식$(5)$를 택하면 운동방정식은 특정 위치에 대한 국소적인 미분방정식이 된다.

나는 이 문제를 많은 사람들이 간과하고 있다는 느낌을 받는다. 식$(1)$은 앞서 언급한 Blundell의 양자장론 교과서에 있는 그대로이다. 그리고 필자는 이런 문제를 Chat GPT와 Gemini에게 물었는데, 둘다 식$(1)$의 미분정의를 사용하여 답했고, 심지어 그 결과 식$(4)$와 같은 국소성 문제가 드러났는데도 이를 인지하지 못했다. 사실 필자 또한 지금껏 이런 문제를 몰랐었는데, 미분연산자가 정확히 반대칭anti-symmetric하지 않을 경우 canonical commutation relation $[\mathbf{x}, \mathbf{p}]=i\hbar$이 성립하지 않는다는 심대한 문제를 몰랐다면 앞으로도 몰랐을 뻔했다.

수학적으로 엄밀히 따졌을때 미분의 비대칭적 정의가 어떤 직접적인 문제를 낳는지는 잘 모르겠다. 하지만 그것이 수학적으로 문제가 없다해도, 물리적으로는 큰 문제인듯 하다.

  1. 최소작용원리에 대한 그런 설명이 널리 퍼지게 된데는 파인만의 공이 클것이다. 필자 또한 <파인만의 물리학 강의>에서 그 설명을 봤는데, 아무리 천재 물리학자의 설명이라 해도 내 속에서 소화가 안되면 소용이 없다.[^]
  2. 참으로 신기하게도, 식$(1)$에서 함수의 미분과 범함수의 미분은 정확히 동일한 수학적 형태를 보이지만 비대칭성은 전자에게만 있다. 범함수의 미분에서 변분은 오직 $x’=x$에서만 일어나는 국소적 사건이다. 반면 함수 $f(x)$의 미분을 위해선 반드시 $x$에 인접한 지점을 택해야 한다. 즉, 함수의 미분은 $x$에 대해 인접한 오른쪽 지점을 택할지 왼쪽 지점을 택할지 – 아니면 양쪽을 동시에 택하여 분모를 $2\epsilon$으로 해줄지에 따라 대칭/비대칭을 오가지만, 범함수의 미분은 오직 $x’=x$에 대한 변분만을 고려하므로 그런 대칭/비대칭의 문제가 없다. [^]
  3. 관련개념에 대한 설명은 delta function $\delta (x-x’)$에 대한 지난 포스팅을 참조바란다.[^]
  4. 보다 엄밀히 말하면 — 뉴튼 운동방정식에선 변수가 $t$이기 때문에, 식$(4)$는 시간 $t_k$에서의 힘이 그 보다 이전 시점인 $t_{k-1}$에서의 운동량 변화와 같음을 말해준다.[^]
Subscribe
Notify of
guest
0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments