물리공부를 하다보면 복소함수 \(\psi\)와 그것의 켤레복소수 이하 켤레 \(\psi^*\)를 독립변수로 다루는 경우를 볼 수 있다. 예를들어 양자역학의 다음과 같은 예가 있다 : 정규화 조건 normalization condition \(\int \psi^*(\mathbf{r})\psi(\mathbf{r})d^3r = 1\)을 만족하는 파동함수 \(\psi\)가 있다하면, 해당 시스템의 헤밀토니안 \(H = – \frac{h^2}{2m} \nabla^2 + V(\mathbf{r})\)에 대한 기대값 \(\int \psi^*(\mathbf{r}) H \psi(\mathbf{r}) d^3 r\)을 최소화하는 조건이 바로 슈뢰딩거 방정식 \(- \frac{\hbar^2}{2m} \nabla^2 \psi + V \psi = E \psi\) 이다. 수리물리교재 Arfken 7E, Example 22.4.3에서는 그 유도과정 중 다음과 같은 계산을 수행한다 : $$\frac{\partial g}{\partial \psi^*} – \frac{\partial}{\partial x} \frac{\partial g}{\partial \psi_x^*} – \frac{\partial}{\partial y} \frac{\partial g}{\partial \psi_y^*} – \frac{\partial}{\partial z} \frac{\partial g}{\partial \psi_z^*} = 0$$
개념적으로 보자면 위 과정은 고등학교 미분에서 배우는 극값찾기와 같다. ‘미분하면 0’이라는 조건으로 극값을 찾는것의 고급버젼일 뿐이다. 내가 이번 포스팅에서 설명하고자 하는것은, 위 식에선 파동함수 \(\psi\)와 그것의 켤레 \(\psi^*\)를 독립변수 취급하고 있다는 사실이다. 즉 \(\psi\)에 대한 함수 \(g\)를 다루는데 있어, 그것의 실수부와 허수부가 아니라 \(\psi\)와 \(\psi^*\)를 독립변수 취급 하는 것이다. 이런식의 계산은 물리교과서에서 어렵지 않게 찾아볼 수 있다1.
중고등학교 때 배운 복소수 개념으로 보면 이런 수학적 전개는 받아들일 수 없다. 임의의 복소수 \(z = a + ib\)는 실수부 \(a\)와 허수부 \(b\)가 정해져야 그것은 하나의 고정된 수가 되는것이다. 따라서 복소수는 두개의 독립적인 자유도를 가진다. 만약 그것을 복소평면에서 극좌표 형태로 나타내면 : \(z=re^{i\theta}\) — 이때는 그 두개의 자유도가 복소수의 크기 \(r\)과 편각 \(\theta\)가 된다. 하지만 그 자유도를 어떻게 잡아도 \(z\)와 \(z^*\)가 서로 독립적이진 않다. \(z^*\)는 단순히 \(z\)의 허수부 부호를 바꾼 수이고, 복소평면에서 보자면 \(z\)를 실수축 중심으로 거울대칭 시킨 수이다. 즉 \(z\)가 결정되면 \(z^*\)는 자동적으로 결정되는 것이고, 이 둘은 독립적이지 않다. 그런데 어떻게 위와 같이 복소함수와 그것의 켤레를 독립적으로 취급할 수 있단 말인가?
하지만 어떤 수학적 문맥에서는 그럴 수 있다. 복소함수 \(\psi\)에 의존하는 임의의 함수 \(\mathcal{L}(\psi)\) 가 있다 하자. 복소함수 \(\psi\)는 실수부와 허수부로 나눌 수 있을것이고 : \(\psi = \phi_1 + i \phi_2\) — 따라서 \(\mathcal{L}\)은 독립된 두 변수 \(\phi_1\)과 \(\phi_2\)로 결정되는 함수이다 : \(\mathcal{L} = \mathcal{L}(\phi_1, \phi_2)\).
그런데 여기서 \(\mathcal{L}\)은 두 독립변수의 미소변화량 \(\delta \phi_1\), \(\delta \phi_2\)에 대해 어떻게 변하는가? : $$\delta \mathcal{L} = \frac{\partial \mathcal{L}}{\partial \phi_1} \delta \phi_1 + \frac{\partial \mathcal{L}}{\partial \phi_2} \delta \phi_2 \tag{1}$$
그런데 \((\phi_1, \phi_2)\)와 \((\psi, \psi^*)\)는 다음과 같은 선형적 관계를 가지므로 : $$\left( \begin{array}{l} \psi = \phi_1 + i \phi_2 \\ \psi^* = \phi_1 – i \phi_2 \end{array} \right), \quad \left( \begin{array}{l} \phi_1 = \frac{1}{2}(\psi + \psi^*) \\ \phi_2 = \frac{1}{2i}(\psi – \psi^*) \end{array} \right)$$
수식(1)에 \((\phi_1, \phi_2)\)로 표현된 있는 각 항들은 다음과 같이 \((\psi, \psi^*)\)에 대한 표현으로 다시 쓸 수 있다 : $$\begin{array}{l} \frac{\partial \mathcal{L}}{\partial \phi_1} = \frac{\partial \mathcal{L}}{\partial \psi} \underbrace{\frac{\partial \psi}{\partial \phi_1}}_{=1} + \frac{\partial \mathcal{L}}{\partial \psi^*} \underbrace{\frac{\partial \psi^*}{\partial \phi_1}}_{=1} = \frac{\partial \mathcal{L}}{\partial \psi} + \frac{\partial \mathcal{L}}{\partial \psi^*}, \\ \\ \frac{\partial \mathcal{L}}{\partial \phi_2} = \frac{\partial \mathcal{L}}{\partial \psi} \underbrace{\frac{\partial \psi}{\partial \phi_2}}_{=i} + \frac{\partial \mathcal{L}}{\partial \psi^*} \underbrace{\frac{\partial \psi^*}{\partial \phi_2}}_{=-i} = i \frac{\partial \mathcal{L}}{\partial \psi} – i \frac{\partial \mathcal{L}}{\partial \psi^*} \end{array}$$
따라서 \(\delta \mathcal{L}\)을 \(\psi\)와 \(\psi^*\)만으로 다시 써보면 : $$\begin{aligned} \delta \mathcal{L} &= \frac{\partial \mathcal{L}}{\partial \phi_1} \delta \phi_1 + \frac{\partial \mathcal{L}}{\partial \phi_2} \delta \phi_2 \\ &= \left( \frac{\partial \mathcal{L}}{\partial \psi} + \frac{\partial \mathcal{L}}{\partial \psi^*} \right) \frac{1}{2}(\delta \psi + \delta \psi^*) + \left( i\frac{\partial \mathcal{L}}{\partial \psi} – i\frac{\partial \mathcal{L}}{\partial \psi^*} \right) \frac{1}{2i}(\delta \psi – \delta \psi^*) \\ &= \frac{1}{2} \left( \frac{\partial \mathcal{L}}{\partial \psi} \delta \psi + \cancel{\frac{\partial \mathcal{L}}{\partial \psi} \delta \psi^*} + \bcancel{\frac{\partial \mathcal{L}}{\partial \psi^*} \delta \psi} + \frac{\partial \mathcal{L}}{\partial \psi^*} \delta \psi^* \right) + \frac{1}{2} \left( \frac{\partial \mathcal{L}}{\partial \psi} \delta \psi – \cancel{\frac{\partial \mathcal{L}}{\partial \psi} \delta \psi^*} – \bcancel{\frac{\partial \mathcal{L}}{\partial \psi^*} \delta \psi} + \frac{\partial \mathcal{L}}{\partial \psi^*} \delta \psi^* \right) \\ &= \frac{\partial \mathcal{L}}{\partial \psi} \delta \psi + \frac{\partial \mathcal{L}}{\partial \psi^*} \delta \psi^* \end{aligned} \tag{2}$$
보시다시피, \(\mathcal{L}\)의 변화량을 따지는 상황에선, 놀랍게도 \(\psi\)와 \(\psi^*\)가 함께 들어있는 항들은 마법처럼 서로 상쇄된다. 따라서 \(\delta \mathcal{L}\)은 순수하게 \(\delta \psi\)에 대한 변화량과 \(\delta \psi^*\)에 대한 변화량만으로 표현된다. 즉, \(\mathcal{L}\) 자체가 아니라 그것의 변화량을 따질땐 수학적으로 \(\psi\)과 \(\psi^*\)이 \(\delta \mathcal{L}\)에 대해 독립적으로 기여한다.
그런데 물리학 전반에 적용되는 최소작용의 원리 the principle of least action 를 표현하는 Euler-Lagrange 방정식은 기본적으로 라그랑지안 Lagrangian에 대한 미분형태만을 포함한다. 예를들어, Lagrangian density \(\mathcal{L}\)가 파동함수 \(\psi\)와 그 미분 \(\partial_{\mu} \psi\)에 대한 함수라면 : \(\mathcal{L} = \mathcal{L}(\psi, \partial_{\mu} \psi) \) — 이때 Euler-Langrange 방정식은 다음과 같이 쓰여진다 : $$\partial_{\mu} \left( \frac{\partial \mathcal{L}}{\partial(\partial_\mu \psi)} \right) = \frac{\partial \mathcal{L}}{\partial \psi}$$
맨처음 언급한 에너지를 최소화 하는 조건으로 슈뢰딩거 방정식을 유도하는것 또한 기본적으로 주어진 함수를 미분하여 최솟값을 구하는 과정이다. 그런데 수식(2)에서 확인 할 수 있듯, 변분에 대해서는 수학적 형태가 \(\psi\)와 \(\psi^*\)의 기여가 독립적이다. 따라서 이러한 맥락에서는 \(\psi\)와 \(\psi^*\)를 독립변수로 취급 할 수 있다.
■
- 예를들어 : 신상진 교수님 양자역학교재 2판 10장 2절 식(10.21) 부근, David Tong의 양자장론 강의노트 1.1.2절[^]