清水熱力学1章メモ

  • この本では平衡系の熱力学を扱う。

1.1 ミクロ・マクロと陥りやすい幻想

  • 「すべての自然現象はミクロな世界の基本法則に支配されている」は正しそう
  • 「初期条件を与えれば、マクロ系のこともミクロ系の運動方程式を解いて予言することが原理的にできる」は幻想
    • 原理的に解けない(例えば三体問題は、解析的に表される非自明な運動の積分が存在しないので求積法によって解が求められないらしい。)
    • 近似的に解くことも不可能(「原理的に」を否定したいので計算機は関係ないのでは?カオスになるから摂動論でも近似的に解けない、とかなら納得。三体問題が解けないのも、可積分系の摂動系である条件を満たすものは非可積分、という話らしいので繋がってそう。)
    • 初期条件のわずかな差で結果が著しく変わる(初期条件を正確に知るのは原理的には可能と想定すべきでは?「初期条件を与えれば原理的に運動方程式を解ける」に対して「初期条件を与えられない」はむしろ肯定。)

カオス、エルゴード性(混合性はよく知らない)と関連している。あとエルゴード性が「統計力学が現実の系で成立していることの理由」というのは本当ですか?

  • 扱いたいスケールを決めてから有効理論で記述する。

1.2 熱力学の意義

  • 熱力学は少ない変数でマクロ系の「本質」(平衡状態とその間の遷移)を記述したもの。
  • 操作限界(不可逆性)を記述(熱力学第二法則)
  • マクロレベルの堅牢な理論

1.3 熱力学の様々な流儀

大きく分けて2つの流儀がある。

  1. 相加変数(またの名を示量変数。エネルギー、物質量 etc.)を基本変数とする。Gibbs が創始。よさげ。
  2. 一部の変数が狭義示強変数(示量変数の密度などを除いた示強変数。温度、圧力 etc.)になったもの。一次相転移がある場合不完全。相対論的重力の効果があってもだめらしい。

ここでは1.の流儀を採用する。先入観を捨てよう。

1.4 用語や記号に関する注意

言葉の使い方は人それぞれ。 「狭義増加関数」の方が一般的?

付録A

\(o\)(スモールオー)

\(\hspace{0.2em}a\in \R\cup\qty{\pm\infty}\hspace{0.2em}\)について、ある\(\hspace{0.2em}\ve>0\hspace{0.2em}\)が存在して、任意の\(\hspace{0.2em}x\in U(a,\ve)\setminus\qty{a}\hspace{0.2em}\)\(\hspace{0.2em}g(x)\neq 0\hspace{0.2em}\)のとき

\begin{align} \lim_{\substack{x\to a\\ x\neq a}}\dfrac{f(x)}{g(x)}=0\stackrel{\mathrm{def}}{\iff}f(x)=o(g(x))\quad(x\to a) \end{align}

\(O\)(ラージオー)

\(\hspace{0.2em}a\in \R\cup\qty{\pm\infty}\hspace{0.2em}\)について、ある\(\hspace{0.2em}\ve>0\hspace{0.2em}\)が存在して、任意の\(\hspace{0.2em}x\in U(a,\ve)\setminus\qty{a}\hspace{0.2em}\)\(\hspace{0.2em}g(x)\neq 0\hspace{0.2em}\)のとき

\begin{align} {}^\exists c\in\R\setminus\qty{0},\,\lim_{\substack{x\to a\\ x\neq a}}\dfrac{f(x)}{g(x)}=c\stackrel{\mathrm{def}}{\iff}f(x)=\order{g(x)}\quad(x\to a) \end{align}

\(\hspace{0.2em}x\hspace{0.2em}\)がどこへ近づくときの話か、が大事。

1.5 微分と偏微分

左微係数、右微係数はそれぞれ

\begin{align} D_x^-f(x)\coloneqq \lim_{\ve\to+0}\dfrac{f(x)-f(x-\ve)}{\ve}\qc D_x^+f(x)\coloneqq \lim_{\ve\to+0}\dfrac{f(x+\ve)-f(x)}{\ve} \end{align}
と定義される。\(D^-_xf(x)=D^+_xf(x)\hspace{0.2em}\)ならば\(\hspace{0.2em}f(x)\hspace{0.2em}\)\(\hspace{0.2em}x=x\hspace{0.2em}\)において微分可能といい、\(f'(x)=D_x^-f(x)=D_x^+f(x)\hspace{0.2em}\)。微分可能\(\hspace{0.2em}\implies\hspace{0.2em}\)連続だが逆は真ならず。

問題1.1

\(\hspace{0.2em}\R\hspace{0.2em}\)の開区間\(\hspace{0.2em}I\hspace{0.2em}\)で定義された実数値関数\(\hspace{0.2em}f\hspace{0.2em}\)\(\hspace{0.2em}a\in I\hspace{0.2em}\)および\(\hspace{0.2em}c\in \R\hspace{0.2em}\)について以下は同値。

  1. \(f(x)\hspace{0.2em}\)\(\hspace{0.2em}x=a\hspace{0.2em}\)で微分可能で\(\hspace{0.2em}f'(a)=c\hspace{0.2em}\)
  2. \(f(x)=f(a)+c(x-a)+o(x-a)\quad (x\to a)\hspace{0.2em}\)
証明
\begin{align} &\lim_{\ve\to +0}\dfrac{f(x)-f(x-\ve)}{\ve}=\lim_{\ve\to +0}\dfrac{f(x+\ve)-f(x)}{\ve}\\ \iff&\lim_{\ve\to -0}\dfrac{f(x+\ve)-f(x)}{\ve}=\lim_{\ve\to +0}\dfrac{f(x+\ve)-f(x)}{\ve}\\ \iff& {}^\exists c\in\R,\,\lim_{\ve\to 0}\dfrac{f(x+\ve)-f(x)}{\ve}=c \end{align}
に気を付ける。
\begin{align} \lim_{\ve\to 0}\dfrac{f(a+\ve)-f(a)}{\ve}=c\iff f(a+\ve)-f(a)-c\ve=o(\ve)\quad(\ve\to 0) \end{align}
であり、右側の式で\(\hspace{0.2em}\ve=x-a\hspace{0.2em}\)を代入すれば示せた。

偏微分は他の変数を固定した微分。何を固定するかには気をつけねばならない。

問題1.5 回答\(\hspace{0.2em}(x,y)\in\R^2\hspace{0.2em}\)で定義された\(\hspace{0.2em}Z=x^2\e^y\hspace{0.2em}\)について、\(\eta\coloneqq y-x\hspace{0.2em}\)とする。
\(\hspace{0.2em}Z=x^2\e^{x+\eta}\hspace{0.2em}\)に気を付けて
\begin{align} \qty(\pdv{Z}{x})_\eta&=(2x+x^2)\e^{x+\eta}=x(x+2)\e^y\\ \qty(\pdv{Z}{x})_y&=2x\e^y \end{align}
違いますね。
問題1.6 回答\(\hspace{0.2em}Z(x,y)=W(\xi,\eta)\hspace{0.2em}\)と記号を変えれば混乱が少ない。

(i) 合成関数の微分法を適用して
\begin{align} \qty(\pdv{Z}{\xi})_\eta&=\qty(\pdv{Z}{x})_y\qty(\pdv{x}{\xi})_\eta+\qty(\pdv{Z}{y})_x\qty(\pdv{y}{\xi})_\eta \end{align}
と分かる。\(\ds\qty(\pdv{Z}{\eta})_\xi\hspace{0.2em}\)は上の式の\(\hspace{0.2em}\xi,\eta\hspace{0.2em}\)を入れ替えただけ。

(ii) 納得しました。

(iii)
\begin{align} f(x,y)&=(x+1)(x-y+1)\\ g(x,\eta)&=(x+1)(\eta+1) \end{align}
について
\begin{align} \qty(\pdv{g}{x})_\eta&=\eta+1=x+y-1. \end{align}

(iv) \(Z(x_1,\dots,x_n)=W(\xi_1,\dots,\xi_n)\hspace{0.2em}\)と表せる(拘束条件とかがなければ自由度\(\hspace{0.2em}n\hspace{0.2em}\)は一致していないといけない気がする)とき
\begin{align} \qty(\pdv{Z}{\xi_1})_{\xi_2,\dots,\xi_n}&=\sum_{i=1}^n\qty(\pdv{Z}{x_i})_{\qty{x_j}_j\setminus\qty{x_i}}\qty(\pdv{x_i}{\xi_1})_{\xi_2,\dots,\xi_n} \end{align}
となる。
定義(\(\R^m\hspace{0.2em}\)上の関数の微分可能性)

\(\hspace{0.2em}\R^m\hspace{0.2em}\)上の開領域\(\hspace{0.2em}U\hspace{0.2em}\)\(\hspace{0.2em}f(x_1,\dots,x_m)\hspace{0.2em}\)\(\hspace{0.2em}n\hspace{0.2em}\)階までのすべての偏導関数が存在して、それらがすべて連続\(\hspace{0.2em}\stackrel{\mathrm{def}}{\iff} f(x_1,\dots,x_m)\hspace{0.2em}\)\(\hspace{0.2em}U\hspace{0.2em}\)上で\(\hspace{0.2em}C^n\hspace{0.2em}\)級(\(n\hspace{0.2em}\)階連続的微分可能)。

問題1.3 回答
\begin{align} f(x,y)=\left\{\begin{aligned} &xy\dfrac{x^2-y^2}{x^2+y^2}&(x,y)\neq(0,0)\\ &0 & (x,y)=(0,0) \end{aligned}\right. \end{align}
この関数は連続である(極座標表示すれば自明)。とりあえず\(\hspace{0.2em}(x,y)\neq(0,0)\hspace{0.2em}\)において偏微分して
\begin{align} \pdv{f}{x}&=y\dfrac{x^2-y^2}{x^2+y^2}+xy\dfrac{4xy^2}{(x^2+y^2)^2}=\dfrac{y(x^4-y^4)+4x^2y^3}{(x^2+y^2)^2} =y\qty(1+2y^2\dfrac{x^2-y^2}{(x^2+y^2)^2}) \end{align}
となる。一方\(\hspace{0.2em}(x,y)=(0,0)\hspace{0.2em}\)においては\(\hspace{0.2em}\partial_x f(0,0)=\lim_{\ve\to 0}(f(\ve,0)-f(0,0))/\ve=0\hspace{0.2em}\)である(\(y=0\hspace{0.2em}\)で固定すれば常に\(\hspace{0.2em}0\hspace{0.2em}\)なので)。
よって\(\hspace{0.2em}\partial_xf(x,y)\hspace{0.2em}\)\(\hspace{0.2em}\R^2\hspace{0.2em}\)上で連続である(\(-1\hspace{0.2em}\)倍すれば\(\hspace{0.2em}\partial_yf(x,y)\hspace{0.2em}\)も連続なことが分かるので\(\hspace{0.2em}C^1\hspace{0.2em}\)級ではある)。さらに\(\hspace{0.2em}(x,y)\neq(0,0)\hspace{0.2em}\)において偏微分すれば
\begin{align} \pdv{f}{y}{x}&=1+\dfrac{6x^2y^2-10y^4}{(x^2-y^2)^2}-2\dfrac{2y^3(x^2-y^2)}{(x^2+y^2)^2}2y\\ &=1+2\sin^2\theta(3\cos^2\theta-5\sin^2\theta)-8\sin^3\theta(\cos^2\theta-\sin^2\theta)\quad(x,y)\neq (0,0) \end{align}
となる。明らかに原点に近づく方向に極限値が依存しており、原点で不連続となるため\(\hspace{0.2em}C^2\hspace{0.2em}\)級ではない。

もっと穏便に示したければ、後で証明する定理1.2を用いる。原点において
\begin{align} \pdv{f}{y}{x}&=\lim_{\ve\to 0}\dfrac{\partial_x f(0,\ve)-\partial_xf(0,0)}{\ve}=\dfrac{-\ve-0}{\ve}=-1\\ \pdv{f}{x}{y}&=\lim_{\ve\to 0}\dfrac{\partial_y f(\ve, 0)-\partial_yf(0,0)}{\ve}=\dfrac{\ve-0}{\ve}=1 \end{align}
となり、微分が可換ではないため、定理1.2から少なくとも原点を含む任意の開領域では\(\hspace{0.2em}f\hspace{0.2em}\)\(\hspace{0.2em}C^2\hspace{0.2em}\)級ではないことが分かる。
数学の定理1.1

\(\hspace{0.2em}\bm{a}\hspace{0.2em}\)の開近傍\(\hspace{0.2em}U\subset \R^m\hspace{0.2em}\)において実数値関数\(\hspace{0.2em}f\hspace{0.2em}\)が連続的微分可能であるとする。\(\nabla f(\bm{a})\coloneqq \mqty({\partial_{x_1}f(\bm{a})}&\dots&{\partial_{x_m}f(\bm{a})})\hspace{0.2em}\)と定義すると

\begin{align} f(\bm{x})&=f(\bm{a})+\nabla f(\bm{a})\cdot(\bm{x}-\bm{a})+o(\abs{\bm{x}-\bm{a}})\quad(\bm{x}\to\bm{a})\label{eq:thm1-1} \end{align}
が成り立つ。

証明
\(\hspace{0.2em}U\hspace{0.2em}\)が開集合であることから\(\hspace{0.2em}{}^\exists \ve>0,\,U(\bm{a},\ve)\subset U\hspace{0.2em}\)。したがって\(\hspace{0.2em}\abs{\bm{h}}<\ve\implies \bm{a+h}\in U\hspace{0.2em}\)となる(平均値の定理を使うのに大事)。
ここでは
\begin{align} f(\bm{a}+\bm{h})-f(\bm{a})=\nabla f(\bm{a})\cdot\bm{h}+o(\abs{\bm{h}})\quad(\bm{h}\to 0) \end{align}
を示す。
\begin{align} \bm{h}(i)&\coloneqq \mqty(0&\dots&0&h_i&\dots&h_m)^\mathrm{T}=\sum_{k=i}^mh_k\mathbb{e}_k\quad(i=1,\dots,m)\\ \bm{h}(m+1)&\coloneqq 0 \end{align}
と定義すれば、平均値の定理を\(\hspace{0.2em}m\hspace{0.2em}\)回適用することにより
\begin{align} f(\bm{a+h})-f(\bm{a})&=f(\bm{a}+\bm{h}(1))-f(\bm{a}+\bm{h}(m+1))\\ &=\sum_{i=1}^{m}\qty[f(\bm{a+h}(i))-f(\bm{a+h}(i+1))]\\ &=\sum_{i=1}^mh_i{\pdv{f}{x_i}}(\bm{a}+\underbrace{\bm{a}+\theta_ih_i\mathbb{e}_i+\bm{h}(i+1)}_{\ds\eqqcolon\tilde{\bm{h}}(i)}) \end{align}
を満たす\(\hspace{0.2em}\theta_1,\dots,\theta_m\in\ivo{0}{1}\hspace{0.2em}\)が存在することが言える。このとき
\begin{align} &\dfrac{1}{\abs{\bm{h}}}\abs{f(\bm{a+h})-f(\bm{a})-\nabla f(\bm{a})\cdot \bm{h}}\\ &=\dfrac{1}{\abs{\bm{h}}}\abs{\sum_{i=1}^mh_i\qty[{\pdv{f}{x_i}}(\bm{a+\tilde{h}}(i))-\pdv{f}{x_i}(\bm{a})]}\quad\mqty(\text{分子は内積の形をしているので}\\\text{Schwarzの不等式を使える})\\ &\le\qty[\sum_{i=1}^m\qty[{\pdv{f}{x_i}}(\bm{a+\tilde{h}}(i))-\pdv{f}{x_i}(\bm{a})]^2]^{1/2}\to 0\quad(\bm{h}\to 0) \end{align}
となる。実際、\(\bm{h}\to 0\hspace{0.2em}\)\(\hspace{0.2em}\tilde{\bm{h}}\to 0\hspace{0.2em}\)となるし、連続的微分可能の条件から\(\hspace{0.2em}\ds\pdv{f}{x_i}\hspace{0.2em}\)\(\hspace{0.2em}\bm{a}\hspace{0.2em}\)において連続である。

(実は縦ベクトル、横ベクトルに気を遣っている(添字の上下は気を遣っていない)。\(\nabla f\hspace{0.2em}\)は共変ベクトルなので横ベクトルになっており、\(\cdot\hspace{0.2em}\)を打たなくとも行列積として捉えられる。)

\eqref{eq:thm1-1}は問題1.1の2.の条件を一般化した形をしている。熱力学でよく使う形は

\begin{align} \dd{f}&\coloneqq\nabla f(\bm{x})\cdot\dd{\bm{x}}\\ f(\bm{x}+\dd{\bm{x}})-f(\bm{x})&=\dd{f}+o(\abs{\dd{\bm{x}}}) \end{align}
らしい。

数学の定理1.2

開領域\(\hspace{0.2em}U\subset\R^m\hspace{0.2em}\)において\(\hspace{0.2em}f\hspace{0.2em}\)\(\hspace{0.2em}C^n\hspace{0.2em}\)級であれば、\(U\hspace{0.2em}\)における\(\hspace{0.2em}n\hspace{0.2em}\)階までのすべての偏導関数は偏微分の順序に依らない。

証明
\(\hspace{0.2em}n=2\hspace{0.2em}\)について示せば、あとは任意の置換が互換の積で書けることと、\(C^n\hspace{0.2em}\)級なら\(\hspace{0.2em}n-2\hspace{0.2em}\)階偏導関数は\(\hspace{0.2em}C^2\hspace{0.2em}\)級であることから従う。
また、\(n=2\hspace{0.2em}\)で示す場合は他の座標は固定されるので\(\hspace{0.2em}\R^2\hspace{0.2em}\)で考えても同じことである。以下では\(\hspace{0.2em}(a,b)\hspace{0.2em}\)の任意の開近傍\(\hspace{0.2em}V\subset\R^2\hspace{0.2em}\)について、\(V\hspace{0.2em}\)上で\(\hspace{0.2em}f(x,y)\hspace{0.2em}\)\(\hspace{0.2em}C^2\hspace{0.2em}\)級ならば\(\hspace{0.2em}\partial_x\partial_y f(a,b)=\partial_y\partial_x f(a,b)\hspace{0.2em}\)を示す。
\begin{align} \varDelta(h,k)&\coloneqq f(a+h,b+k)-f(a+h,b)-f(a,b+k)+f(a,b)\\ &=\varphi(a+h)-\varphi(a)\quad(\varphi(x)\coloneqq f(x,b+k)-f(x,b))\\ &=h(\partial_x\varphi(a+\theta_xh))\\ &=h(\partial_x f(a+\theta_xh,b+k)-\partial_xf(a+\theta_xh,b))\\ &=hk\partial_y\partial_xf(a+\theta_xh,b+\theta_yk) \end{align}
となる\(\hspace{0.2em}\theta_x,\theta_y\in\ivo{0}{1}\hspace{0.2em}\)が存在することが平均値の定理から言える。\(\partial_y\partial_xf\hspace{0.2em}\)\(\hspace{0.2em}(a,b)\hspace{0.2em}\)において連続なので
\begin{align} \lim_{\substack{(h,k)\to 0\\hk\neq0}}\dfrac{\varDelta(h,k)}{hk}&=\partial_y\partial_xf(a,b) \end{align}
となる。一方、
\begin{align} \varDelta(h,k)&=\psi(b+k)-\psi(b)\quad(\psi(y)\coloneqq f(a+h,y)-f(a,y))\\ &=k(\partial_y\varphi(b+\theta'_yk))\\ &=kh\partial_x\partial_yf(a+\theta'_xh,b+\theta'_yk) \end{align}
より
\begin{align} \lim_{\substack{(h,k)\to 0\\hk\neq0}}\dfrac{\varDelta(h,k)}{hk}&=\partial_x\partial_yf(a,b) \end{align}
となり、偏微分が交換できることが示せた。

熱力学に現れる関数は、相転移領域以外では\(\hspace{0.2em}C^\infty\hspace{0.2em}\)級らしい。

問題1.4 回答\(\hspace{0.2em}(x,y)\in\R^2\hspace{0.2em}\)で定義された\(\hspace{0.2em}f(x,y)=x^2\e^y\hspace{0.2em}\)について
(i)
\begin{align} \dd{f}&=2x\e^y\dd{x}+x^2\e^y\dd{y}\\ &\stackrel{(x,y)=(0,0)}{=}0\\ &\stackrel{(x,y)=(1,1)}{=}2\e\dd{x}+\e\dd{y} \end{align}
(ii),(iii) \(f_{xx}=2\e^y,f_{xy}=f_{yx}=2x\e^y,f_{yy}=x^2\e^y\hspace{0.2em}\)はいずれも\(\hspace{0.2em}\R^2\hspace{0.2em}\)全体で連続なので\(\hspace{0.2em}f\hspace{0.2em}\)\(\hspace{0.2em}\R^2\hspace{0.2em}\)\(\hspace{0.2em}C^2\hspace{0.2em}\)級。

\(\hspace{0.2em}f(x)\hspace{0.2em}\)\(\hspace{0.2em}x=a\hspace{0.2em}\)の近傍で\(\hspace{0.2em}x-a\hspace{0.2em}\)の収束する冪級数で展開できる\(\hspace{0.2em}\stackrel{\mathrm{def}}{\iff}f(x)\hspace{0.2em}\)\(\hspace{0.2em}x=a\hspace{0.2em}\)で解析的。

\begin{align} \left\{\begin{aligned} &\e^{-1/x^2}&(x\neq 0)\\ &0 & (x=0) \end{aligned}\right. \end{align}
\begin{align} \left\{\begin{aligned} &\e^{-1/x}&(x>0)\\ &0 & (x\le0) \end{aligned}\right. \end{align}
\(\hspace{0.2em}C^\infty\hspace{0.2em}\)級だが解析的でない関数の例。

参考文献

  1. 清水 明『熱力学の基礎 第2版 I 熱力学の基本構造』(2021、東京大学出版会)
  2. ハミルトン系の非可積分性の証明(PDF)
  3. 杉浦 光男『解析入門I』(1980、東京大学出版会)
\begin{align} f(\bm{x})&=f(\bm{a})+\nabla f(\bm{a})\cdot(\bm{x}-\bm{a})+o(\abs{\bm{x}-\bm{a}})\quad(\bm{x}\to\bm{a})\tag*{\eqref{eq:thm1-1}} \end{align}

Home

© 2023 @L48610