파인만은 선생님들을 대상으로했던 한 강연1에서 자신이 어릴적 품었던 질문 하나를 소개했다. 파인만은 어릴적 어떤 책을 보다가 공명회로 resonant circuit 에 대한 식 하나 \(f=\frac{1}{2\pi \sqrt{LC}}\)를 보게 되었는데, 그는 대체 거기에 \(\pi\)가 왜 들어가는지 알 수 없었다. \(\pi\)는 원과 관련이 있다 했는데, 그 전자회로와 원이 무슨관련이었는지 ··· 어린 파인만은 이해 할 수 없었던 것이다. 그런데 객석에 있던 선생님들 중 일부는 그 일화를 듣고 웃었다. 그리고 파인만은 ‘지금 웃으신 분들은 그 식에 \(\pi\)가 왜 들어가는지 아시나요?’라고 반문했다.
아마 웃었던 선생님들은 공명주파수 식에 \(\pi\)가 들어가는것을 그저 ‘당연한 일’로 알고있었을 것이다. 그래서 어린 파인만의 질문을 마치 ‘1+1는 왜 2인가’에 대해 묻는것과 같다 느꼈던것 같다. 하지만 그 어떤것도 당연하지 않다. 특히나 가장 당연하다고 여겼던 것에 대해 질문을 던지고 답해보는 과정은 영양가 높은 공부인 경우가 많다. 이번 포스팅에서는 아마 그렇게 많은 이들이 당연하다 여길 숫자하나 — 푸리에 변환식에서 등장하는 \(2\pi\)의 기원에 대해 이해해보고자 한다 : $$\begin{aligned} f(x) &= \int_{-\infty}^{+\infty} g(\alpha) e^{+i\alpha x} \, d\alpha \\ g(\alpha) &= \frac{1}{2\pi} \int_{-\infty}^{+\infty} f(x) e^{-i\alpha x} \, dx \end{aligned} \tag{1}$$
먼저, 주기가 \(L\)인 함수 \(f(x)\)를 생각해보자 : \(f(x+nL) = f(x) \). 다루고자 하는 대상이 특정한 대칭성을 가질 경우엔 그 대칭성을 가장 잘 반영하는 특정 좌표계를 사용하는것이 기술의 효율성에 있어 큰 도움이 된다. 비슷한 이유로 함수가 주기성을 가질땐 주기성을 가지는 기저basis를 사용하는것이 효율적인데, 가장 기본적인 주기함수는 삼각함수 \(\sin\theta\), \(\cos\theta\) 이다. 그런데 \(\sin\theta\), \(\cos\theta\)로 기술하는것 보다 \(e^{i\theta}\)를 사용하는 것이 더 효율적이다. \(\sin\theta = \frac{e^{i\theta}-e^{-i\theta}}{2i}\), \(\cos\theta = \frac{e^{i\theta}+e^{-i\theta}}{2}\) 이므로, 두개의 함수 \(\sin\theta\)와 \(\cos\theta\)를 쓰는것 보다는 하나의 함수 \(e^{i\theta}\)를 쓰는것이 기술을 더 간편하게 해준다.
그런데 \(e^{i\theta}\) 형태를 기저삼아 \(f(x)\)를 표현하려면, 일단 직선을 그리는 \(x\)를 원을 그리는 \(\theta\)로 변환해줘야 한다. \(x\)가 \(0\)부터 \(L\)까지 변할때 \(\theta\)가 \(0\)부터 \(2n\pi\)까지 변해야 모든 \(e^{i\theta}\)가 \(L\)의 주기성을 만족하게 된다. 따라서 \(x\)와 \(\theta\)는 다음과 같은 선형 관계를 가진다 : \(\theta = 2\pi n \times \frac{x}{L}\). 그리고 \(f(x)\)는 기저 \(e^{i\theta}\) 하에서 다음과 같이 표현된다2 : $$\begin{aligned} &f(x) = \sum_{n=-\infty}^{+\infty} c_n e^{i \frac{2\pi n }{L}x} \\ &c_n=\int^{+L/2}_{-L/2} f(x)e^{-i\frac{2\pi n}{L}x} dx \end{aligned}$$
그런데 여기엔 문제가 하나 있다. 기저 \(e^{i \frac{2\pi n }{L}x}\)의 크기가 1이 아니란 사실 말이다. 직교좌표계 기저 \(\left\{ \hat{\mathbf{x}}, \hat{\mathbf{y}}, \hat{\mathbf{z}} \right\}\)에서 각각의 크기가 1이듯, 기저의 크기는 1로 정규화 normalization 시켜주는것이 좋다. 벡터에 관해 배웠던 거의 모든 공식들은 그렇게 정규화된 기저벡터를 가정한다. 그런데 \(e^{i \frac{2\pi n }{L}x}\)는 \(x\)값에 관계없이 그 자체의 크기가 항상 1이므로 \(e^{-i \frac{2\pi n }{L}x} \times e^{i \frac{2\pi n }{L}x}=1\), 이를 주기 \(L\)에 대해 적분해주면 기저 \(e^{i \frac{2\pi n }{L}x}\)의 크기는 \(L\)이 된다. 따라서 크기가 1인 기저를 만들기 위해선 다음과 같은 정규화가 필요하다 : \(|n \rangle = \frac{1}{\sqrt{L}} \times e^{i \frac{2\pi n }{L}x}\). 그래야 기저 \(|n\rangle\)의 크기가 1이된다 : $$\begin{aligned} \langle n | n \rangle &= \int_{-L/2}^{+L/2} \left( \frac{1}{\sqrt{L}} e^{-i \frac{2\pi n}{L}x} \right) \left( \frac{1}{\sqrt{L}} e^{i \frac{2\pi n}{L}x} \right) dx \\ &= \int_{-L/2}^{+L/2} \frac{1}{L} \, dx = \frac{1}{L} \times L = 1 \end{aligned}$$
따라서 주기 \(L\)을 가지는 \(f(x)\)를 정규화된 기저에 대한 급수로 다시 적어보면 : $$\begin{aligned} &f(x) = \sum_{n=-\infty}^{+\infty} c_n \frac{e^{i \frac{2\pi n }{L}x}}{\sqrt{L}} \\ &c_n=\int^{+L/2}_{-L/2} f(x) \frac{e^{-i\frac{2\pi n}{L}x}}{\sqrt{L}} dx \end{aligned} \tag{2}$$
여기서 지수부분에서 \(i\)와 \(x\) 사이에 있는 factor를 다음과 같이 변수 \(\alpha\)라 해보자 : \(\alpha (n) \equiv \frac{2\pi n}{L}\). \(n\)은 정수이므로 \(\Delta \alpha = \frac{2\pi}{L}\)이고, 따라서 \(\frac{1}{L}\)을 다음과 같이 나타낼 수 있다 : \(\frac{1}{L}=\frac{\Delta \alpha}{2\pi}\).
이때 \(L\)이 무한히 커진다면 어떻게 될까? 우리는 주기가 \(L\)인 함수를 \(x=0\) 기준으로 좌우로 동등하게 나눠 \(x=-\frac{L}{2}\) 부터 \(x=+\frac{L}{2}\) 까지를 한 주기로 보고있다. 따라서 \(L\)이 무한히 커진다는 말은 함수의 한 주기가 무한히 커짐을 뜻하는 것이고, 이는 \(f(x)\)가 \(-\infty\)부터 \(+\infty\)까지 모든 \(x\)에 대해 주기적일 필요가 없음을 뜻한다. 앞서 유한한 주기를 가정했을때 한주기 내의 \(f(x)\)에 대해서는 별제약이 없었단 사실은3, 무한대 주기에 대해선 \(f(x)\)가 모든 \(x\)에 대해 주기 없이 자유로운 형태를 가져도 좋다는 것을 뜻한다. 또한 \(L \rightarrow \infty\)이면 \(\alpha=\frac{2\pi n}{L}\)는 연속변수가 되고 \(\Delta \alpha = \frac{2\pi}{L}\)는 무한소가 된다 : \(\Delta \alpha \rightarrow d\alpha\).
이러한 상황에서 식(2)는 다음과 같이 다시 쓰여질 수 있다 : $$\begin{array}{l} \begin{aligned} f(x) &= \sum_{n=-\infty}^{+\infty} c_n \frac{e^{i \frac{2\pi n x}{L}}}{\sqrt{L}} \\ &= \sum_{n=-\infty}^{+\infty} \left( \int_{-L/2}^{+L/2} f(u) \frac{e^{-i\frac{2\pi n}{L}u}}{\sqrt{L}} \, du \right) \frac{e^{i \frac{2\pi n x}{L}}}{\sqrt{L}} \end{aligned} \\ \\ \qquad \downarrow \quad L \to \infty, \quad \frac{1}{L} = \frac{d\alpha}{2\pi} \\ \\ f(x) = \int_{\alpha=-\infty}^{+\infty} \left( \int_{u=-\infty}^{+\infty} f(u) e^{-i\alpha u} \, du \right) e^{i\alpha x} \frac{d\alpha}{2\pi} \end{array}\tag{3}$$
기저의 크기는 항상 1로 정규화한다는 규칙을 지킨다면, 푸리에 변환관계를 가지는 두 함수 \(f(x)\)와 \(g(\alpha)\)는 다음과 같이 쓰여진다 : $$ \begin{aligned}f(x) &= \int_{\alpha=-\infty}^{+\infty} g(\alpha) \frac{e^{i\alpha x}}{\sqrt{2\pi}} d\alpha \\ g(\alpha) &= \int_{x=-\infty}^{+\infty} f(x) \frac{e^{-i\alpha x}}{\sqrt{2\pi}}dx \end{aligned} \tag{4}$$
필자는 식(1)의 형태가 보다 더 일반적으로 쓰이는걸로 알고있는데, 이는 식(3) 마지막줄 끝부분에 등장하는 \(2\pi\)를 통째로 \(g(\alpha)\)로 밀어넣은 결과이다. 이러한 표현은 \(f(x)\)가 가장 기본적인 주기함수 \(e^{i\theta}\)에 대한 선형결합으로 나타내어지며 특정 주파수에 대한 계수가 \(g(\alpha)\)라고 하는 점을 보다 명확히 보여준다는 면에서 이점이 있다. \(2\pi\)를 모두 \(g(\alpha)\)로 밀어넣었기 때문에, 식(1)에서는 \(f(x)\)의 표현식에 \(2\pi\) 같은 군더더기가 붙지 않는 것이다.
헌데 그런 이점은 ‘형식적’인 것이며, ‘내용적’으로 보면 식(4)의 표현이 더 논리적이다. 기본적로 어떤 함수의 내적은 자기자신과 그 켤레복소수의 곱을 주어진 범위에 대해 적분하는 것으로 정의되는데4, 이 규칙을 \( \int_{-\infty}^{+\infty} e^{i\alpha(x-x_0)} d\alpha = 2\pi \times \delta(x-x_0) \)임5을 그대로 적용해보면 식(1)에서 \(f(x)\) 기저의 크기는 \(\sqrt{2\pi}\) 이고, \(g(\alpha)\) 기저의 크기는 \(\frac{1}{\sqrt{2\pi}}\)이다. 따라서 ‘기저의 크기는 항상 1로 정규화 시킨다’는 규칙을 지키기 위해선 푸리에 변환식은 식(4)의 형태가 되어야 한다.
그렇다면 처음의 질문으로 다시 돌아가 보자 : 식(1)과 식(4)에 등장하는 \(2\pi\)는 어디서 왔는가? — 우리가 해온 논의에서 \(2\pi\)가 등장한 시점은 딱 한군데 뿐이다. 길이 \(x\)를 각도 \(\theta\)로 변환하는 과정 \(\theta = 2\pi n \times \frac{x}{L}\)에서 들어와 그것이 마지막 공식까지 이어져 온것이다. 즉, 푸리에 변환에 등장하는 \(2\pi\)는 직선 \(x\)에 대한 정보인 \(f(x)\)를 원형을 그리며 주기성을 나타내는 \(e^{i\theta}\)를 기저로 삼아 표현하는 과정에서 들어간 factor이다.
■
- What Is Science | The Physics Teacher | AIP Publishing[^]
- 상태와 기저에 대해 논했던 이전 포스팅의 표현방법을 쓰자면, \(f(x) = |\mathbf{n} \rangle \mathbf{c}^n \) 이다. 이러한 표현은 유한한기저든 무한한기저든, 어떤 상태를 특정한 기저에 대한 expansion으로 본다는 그 picture를 잘 담고있다.[^]
- 푸리에 해석이 가능한 함수에 대해서는 조건이 있다. 예를들어 한주기 안에서 함수는 무한대로 발산해선 안되며, 또한 한주기에 대한 함수의 적분값은 유한해야 한다. 그런데 이러한 수학적 조건들을 완전히 이해하는것은 실용적 차원에서 푸리에 급수를 배우는 경우에 대해선 상당히 비효율적이다. 이는 마치 미분에서의 ‘입실론-델타 논법’과 비슷하다. 흔히 학부 1학년 때 미적분 강의를 시작하며 함수극한의 존재성을 증명하는 ‘입실론-델타 논법’이란걸 배운이다. 그런데 그 논리는 대단히 추상적이고 어려워서 학생들이 이해하는데 대단히 애를 먹는다. 사실 많은 경우 이해를 포기하거나 그냥 외우는식으로 넘겨 버린다. 그런데 한가지 중요한 사실은, 그 부분을 이해 못해도 미적분 과목의 다른 내용을 이해하는데는 큰 무리가 없다는 것이다. 물론 그런 수학적 증명이 불필요 하다는건 아니지만, 엄밀성을 강조하다간 학생들의 흥미를 증발시켜버리는 악효과가 생길 수도 있다. 1+1=2를 증명하지 않듯이, 그리고 지수의 곱셈법칙이 성립하는 이유를 자연수에 대해서만 설명하고 다른 수체계에 대해선 증명없이 써도 별문제 없듯이, 때로는 엄밀성은 포기하고 직관적 이해만 주고 넘어가는게 더 좋을 수도 있다. 물론 그 저울질의 결과는 가르침을 받는 사람에 따라, 그리고 가르치는 사람에 따라 달라지겠지만.[^]
- 경우에 따라 weight function \(w(x)\)를 곱해줘야 할때도 있다. 상세한 내용은 특정 2차 미분방정식에 대응되는 함수공간의 구조를 다루는 ‘Sturm-Liouville theory’을 참조바란다.[^]
- 개인적으로는 이 공식을 와 닿게끔 이해하는것이 참 어려웠다. 이와 관련하여 앞으로 별도의 포스팅을 할 기회가 있을것 같은데, 우선 관심있으신 분들은 다음과 같은 예제문제를 풀어보기 바란다 : 높이가 \(h\)이고 너비가 \(1/h\)인 step function을 생각해보라. 즉, \(x=\pm 1/2h\) 바깥영역의 함수값은 0이고, 안쪽영역의 함수값은 \(h\)인 것이다. 우선 이 함수를 푸리에 변환하고, 그 다음 \(h\)의 값을 무한대로 보내보라. 이때 원점에서 무한히 뾰족하지만 그 아래 넚이가 1인 그 step-funtion이 바로 delta function이다. 그런데 그것에 대한 푸리에 변환은 어떤 형태를 가지는가? 만약 delta function의 중심이 \(x=0\)이 아니라 \(x=x_0\)에 있다면?[^]