エントロピーの数学的な性質
5.1 相加性・同次性・密度
5.1.1 相加性
平衡状態においてエントロピーは相加的。したがって均一な平衡状態では示量的。
相加的:全系の物理量が各部分系の物理量の和になっている様。 示量的:均一な系の部分系で物理量が体積に比例する様。
非平衡状態では\(\hspace{0.2em}U\hspace{0.2em}\)などは定義できても、\(S\hspace{0.2em}\)は定義できない。
5.1.2 同次性
この章の残りの節では単純系だけを扱う。
平衡状態にある単純系を\(\hspace{0.2em}p\hspace{0.2em}\)等分する(すべての部分系\(\hspace{0.2em}i=1,\dots,p\hspace{0.2em}\)について\(\hspace{0.2em}X_k^{(i)}=X_k/p\hspace{0.2em}\)となるようにする)と、エントロピーの相加性から
単純系のエントロピーは、その自然な変数の1次同次関数である。
5.1.3 エントロピー密度
\(\hspace{0.2em}V_0\hspace{0.2em}\)をマクロな単位体積として、エントロピーの1次同次性より
エントロピーの自然な変数の数が\(\hspace{0.2em}t+1\hspace{0.2em}\)個であるような単純系の性質は、\(t\hspace{0.2em}\)個の変数を持つ関数であるエントロピー密度\(\hspace{0.2em}s\hspace{0.2em}\)で決まり、基本関係式は次のように表せる:
エントロピー密度も基本関係式を与え(それゆえに完全な熱力学関数の1つ)、エントロピーの自然な変数の密度\(\hspace{0.2em}u,n,\dots,x_t\hspace{0.2em}\)はエントロピー密度の自然な変数であり、実質的に熱力学的状態空間を成す(エントロピーの自然な変数が示量変数であることを用いて次元を1つ落とせるということ?逆に言えば\(\hspace{0.2em}U,V,N,\dots,X_t\hspace{0.2em}\)で張られる空間は冗長性を持っている?単純系の場合は)。
\(\hspace{0.2em}t=0\hspace{0.2em}\)では\(\hspace{0.2em}s\hspace{0.2em}\)が定数となる。\(t=1\hspace{0.2em}\)の系は後で出てくる。
実際には
逆に\eqref{eq:entdens}が成り立てば、
\(\hspace{0.2em}V\hspace{0.2em}\)の代わりに\(\hspace{0.2em}N\hspace{0.2em}\)で割ってもよい。
問題5.2 \(S=K(UVN)^{1/3}\hspace{0.2em}\)のとき
- \(S(\lambda U,\lambda V, \lambda N)=S(\lambda^3 UVN)^{1/3}=\lambda S(U,V,N)\hspace{0.2em}\)より1次同次であることが確認できる。
- 体積についてのエントロピー密度は\(\hspace{0.2em}s^{(V)}=K(un)^{1/3}\hspace{0.2em}\)、物質量についてのエントロピー密度は\(\hspace{0.2em}s^{(N)}=K(uv)^{1/3}\hspace{0.2em}\)となる。
5.1.4 均一でない平衡状態について
定理5.2の証明における仮想的な\(\hspace{0.2em}p\hspace{0.2em}\)等分は、そのような分割が1つ存在していればよいので、たとえば水と水蒸気の比率が全系と同じになるような分割(各部分系が連結である必要はないはずなのでそのような分割はいつでも存在する)をすればよく、定理5.2は均一でない平衡状態についても成り立つ。
定理5.3は定理5.2から導かれるのでやはり均一でない平衡状態についても成り立つ。液体と気体に相分離しているような系では
5.2 凸関数
区間\(\hspace{0.2em}I\subset \R\hspace{0.2em}\)について、関数\(\hspace{0.2em}f\colon I\to \R\hspace{0.2em}\)が、任意の\(\hspace{0.2em}a,b\in I,\,\lambda\in \ivo{0}{1}\hspace{0.2em}\)について
\(\hspace{0.2em}f\hspace{0.2em}\)が\(\hspace{0.2em}I\hspace{0.2em}\)において上に凸\(\hspace{0.2em}\iff \qty{(x,y)\mid x\in I,y\le f(x)}\hspace{0.2em}\)が凸集合。
\(\hspace{0.2em}I\hspace{0.2em}\)上で定義された\(\hspace{0.2em}f\hspace{0.2em}\)および\(\hspace{0.2em}a < b < c\hspace{0.2em}\)なる\(\hspace{0.2em}a,b,c\in I\hspace{0.2em}\)について以下は同値:
証明
\(\hspace{0.2em}f\hspace{0.2em}\)が補題1の条件をみたすことと\(\hspace{0.2em}f\hspace{0.2em}\)が\(\hspace{0.2em}I\hspace{0.2em}\)において上に凸であることは同値。
証明
実数値単調減少関数はその定義域で高々可算個の不連続点を持つ。
証明
----
そもそも\(\hspace{0.2em}\ds\lim_{\ve\to +0}\varphi(s-\ve)\hspace{0.2em}\)などが存在するのかという疑問について。任意の点列\(\hspace{0.2em}\qty{x_n}_n\hspace{0.2em}\)で\(\hspace{0.2em}x_n<x_{n+1}<\dots<s\hspace{0.2em}\)かつ\(\hspace{0.2em}\ds\lim_{n\to\infty}x_n=s\hspace{0.2em}\)なるものについて、\(f(x_n)>f(s)\hspace{0.2em}\)より\(\hspace{0.2em}\qty{f(x_n)}_n\hspace{0.2em}\)は下に有界な単調減少列なので収束することから\(\hspace{0.2em}\ds\lim_{\ve\to +0}\varphi(s-\ve)\hspace{0.2em}\)が存在すると言える(杉浦解析p.54にも書かれている。微妙に行間があるが、定理6.2の証明で\(\hspace{0.2em}\abs{x_n-a}>\abs{x_{n+1}-a}\hspace{0.2em}\)もっと言うと\(\hspace{0.2em}\qty{x_n}_n\hspace{0.2em}\)が単調列になるように取れるのがミソ)。
----
したがって\(\hspace{0.2em}\varphi\hspace{0.2em}\)の不連続点は高々可算個である。
区間\(\hspace{0.2em}I\hspace{0.2em}\)において上に凸な関数\(\hspace{0.2em}f\hspace{0.2em}\)について
- \(I\hspace{0.2em}\)の内点において連続。
- \(I\hspace{0.2em}\)から高々可算個の点を除いた集合\(\hspace{0.2em}I^\ast\hspace{0.2em}\)の上で連続的微分可能。
- \(I\hspace{0.2em}\)の内点において左右の微係数\(\hspace{0.2em}D^\pm_xf(x)\hspace{0.2em}\)が存在し、それ微係数の左右の極限値に等しい。
- \(I\hspace{0.2em}\)の内点\(\hspace{0.2em}x\hspace{0.2em}\)では\(\hspace{0.2em}\ds\lim_{\ve\to +0} f'(x-\ve)\ge \lim_{\ve\to +0}f'(x+\ve)\hspace{0.2em}\)。
- \(I\hspace{0.2em}\)の内点\(\hspace{0.2em}a,b\hspace{0.2em}\)について\(\hspace{0.2em}a<b\implies \ds\lim_{\ve\to +0}f'(a+\ve)\ge \lim_{\ve\to +0}f'(b-\ve)\hspace{0.2em}\)。
証明
また、\(D_x^\pm(x)\hspace{0.2em}\)はともに\(\hspace{0.2em}x\hspace{0.2em}\)についての減少関数であることは以下のように確かめられる。\(x<a<b\hspace{0.2em}\)について\(\hspace{0.2em}\dfrac{f(a)-f(x)}{a-x}\ge \dfrac{f(b)-f(x)}{b-x}\hspace{0.2em}\)が成り立っていることから、\(x\to a-0\hspace{0.2em}\)としたときにも\(\hspace{0.2em}D_x^-f(a)\ge \dfrac{f(b)-f(a)}{b-a}\hspace{0.2em}\)が成り立つ。かつ\(\hspace{0.2em}\dfrac{f(b)-f(a)}{b-a}\ge D_x^-f(b)\hspace{0.2em}\)なので\(\hspace{0.2em}D_x^-f(a)\ge D_x^-f(b)\hspace{0.2em}\)となる。\(D_x^+f(x)\hspace{0.2em}\)も同様。
\(\hspace{0.2em}\ve>0\hspace{0.2em}\)を任意に取る。\(D_x^-f(a)=\ds\lim_{x\to a-0}\dfrac{f(a)-f(x)}{a-x}\hspace{0.2em}\)の定義より、\(\delta_1\hspace{0.2em}\)が存在して\(\hspace{0.2em}\abs{a-x}<\delta_1\implies \ds\abs{\dfrac{f(a)-f(x)}{a-x}-D_x^-f(a)}<\dfrac{\ve}{2}\hspace{0.2em}\)となる。また、\(x<a\hspace{0.2em}\)の範囲では\(\hspace{0.2em}\dfrac{f(a)-f(x)}{a-x}\hspace{0.2em}\)は連続な関数の商なので連続である。よって\(\hspace{0.2em}\delta_2\hspace{0.2em}\)が存在して\(\hspace{0.2em}\abs{a-b}<\delta_2\implies\abs{\dfrac{f(b)-f(x)}{b-x}-\dfrac{f(a)-f(x)}{a-x}}<\dfrac{\ve}{2}\hspace{0.2em}\)となる。このとき\(\hspace{0.2em}\dfrac{f(b)-f(x)}{b-x}\ge D_x^-f(b)\ge D_x^-f(a)\hspace{0.2em}\)となり、\({}^\forall \ve>0,{}^\exists \delta_2>0,\abs{a-b}<\delta_2\implies \abs{D_x^-f(a)-D_x^-f(b)}<\ve\hspace{0.2em}\)すなわち\(\hspace{0.2em}\ds\lim_{b\to a-0}D_x^-f(b)=D_x^-f(a)\hspace{0.2em}\)が示せた。
また\(\hspace{0.2em}D_x^-f(x)\hspace{0.2em}\)が\(\hspace{0.2em}x=a\hspace{0.2em}\)において連続であるとする。このとき、任意の\(\hspace{0.2em}\ve>0\hspace{0.2em}\)について、\(\delta>0\hspace{0.2em}\)が存在して、\(\ds\abs{a-b}<\delta\implies\abs{D_x^-f(a)-D_x(b)}<\ve\hspace{0.2em}\)となる。特に\(\hspace{0.2em}a<b<a+\delta\hspace{0.2em}\)のとき\(\hspace{0.2em}D_x^-f(a)\ge\dfrac{f(b)-f(a)}{b-a}\ge D_x^-f(b)\hspace{0.2em}\)なので、\(\ds\abs{a-b} < \delta\implies\abs{D_x^-f(a)-\dfrac{f(b)-f(a)}{b-a}} < \ve\hspace{0.2em}\)が成り立つ。これは\(\hspace{0.2em}D_x^-f(a)=D_x^+f(a)\hspace{0.2em}\)を意味している。つまり\(\hspace{0.2em}x=a\hspace{0.2em}\)において\(\hspace{0.2em}D_x^-f(x)\hspace{0.2em}\)が連続なら微分可能で\(\hspace{0.2em}D_x^-f(a)=f'(a) = D_x^+f(a)\hspace{0.2em}\)が成り立つ。
\(\hspace{0.2em}D_x^-f(x)\hspace{0.2em}\)は減少関数なので補題3より不連続点は高々可算個しかない。したがって、\(I\hspace{0.2em}\)から\(\hspace{0.2em}D_x^-f(x)\hspace{0.2em}\)の不連続点を除いた\(\hspace{0.2em}I^\ast\hspace{0.2em}\)は連続濃度を持ち、\(I^\ast\hspace{0.2em}\)で\(\hspace{0.2em}D_x^-f(x)\hspace{0.2em}\)は連続である。\(I^\ast\hspace{0.2em}\)上での極限を考えると\(\hspace{0.2em}D_x^\pm f(x)=\ds\lim_{\substack{x\pm\ve\in I^\ast\\\ve\to +0}}D_x^\pm f(x\pm \ve)=\ds\lim_{\substack{x\pm\ve\in I^\ast\\\ve\to +0}}f'(x\pm\ve)\hspace{0.2em}\)と表せる。
ここまで左側微分について議論してきたが右側微分についても同様のことが言え、
5.についても、\eqref{eq:lem1_2}を\(\hspace{0.2em}a<x<b\hspace{0.2em}\)に適用して
区間\(\hspace{0.2em}I\hspace{0.2em}\)において\(\hspace{0.2em}f\hspace{0.2em}\)が連続かつ高々可算個の点を除いた集合\(\hspace{0.2em}I^\ast\hspace{0.2em}\)が存在してその上で微分可能でさらに\(\hspace{0.2em}f'(x)\hspace{0.2em}\)が\(\hspace{0.2em}I^\ast\hspace{0.2em}\)の上で減少関数であれば\(\hspace{0.2em}f\hspace{0.2em}\)は\(\hspace{0.2em}I\hspace{0.2em}\)において上に凸である。
\(\hspace{0.2em}I\hspace{0.2em}\)において\(\hspace{0.2em}f\hspace{0.2em}\)が2階微分可能であれば「\(\hspace{0.2em}f''(x)\le 0\iff f\hspace{0.2em}\)が上に凸」に帰着する。
問題5.5
- \(f(x)=-x^2\hspace{0.2em}\)について\(\hspace{0.2em}f''(x)=-2\hspace{0.2em}\)で上に凸。
- \(f(x)=\ln x\hspace{0.2em}\)について\(\hspace{0.2em}f''(x)=-x^{-2}\hspace{0.2em}\)で上に凸。
- \(f(x)=\sqrt{-x}\hspace{0.2em}\)について\(\hspace{0.2em}f''(x)=-x^{-3/2}/4\hspace{0.2em}\)で上に凸。
区間\(\hspace{0.2em}I\hspace{0.2em}\)で上に凸な\(\hspace{0.2em}f\hspace{0.2em}\)について
- \(I\hspace{0.2em}\)の内点\(\hspace{0.2em}x_\ast\hspace{0.2em}\)について\(\hspace{0.2em}f'(x_\ast+0)\le f'(x_\ast -0)\implies f(x_\ast)\ge f(x)\ ({}^\forall x\in I)\hspace{0.2em}\)。つまり\(\hspace{0.2em}x_\ast\hspace{0.2em}\)において\(\hspace{0.2em}f(x)\hspace{0.2em}\)は最大値を取る。
- \(x_\ast\hspace{0.2em}\)において微分可能なら、\(f'(x_\ast)=0\implies x_\ast\hspace{0.2em}\)において\(\hspace{0.2em}f(x)\hspace{0.2em}\)は最大値を取る。
\(\hspace{0.2em}f,g\hspace{0.2em}\)を区間\(\hspace{0.2em}I\hspace{0.2em}\)において上に凸な関数とすると以下の\(\hspace{0.2em}h(x)\hspace{0.2em}\)も括弧内の区間において上に凸。
- \(c>0\hspace{0.2em}\)について\(\hspace{0.2em}h(x)=cf(x)\ (x\in I)\hspace{0.2em}\)1. \(h(x)=f(X-x)\ (X-x\in I)\hspace{0.2em}\)1. \(h(x)=f(x)+g(x)\ (x\in I)\hspace{0.2em}\)1. \(h(x)=f(x)+g(X-x)\ (x,X-x\in I)\hspace{0.2em}\)1. \(h(x)=\operatorname{min}\qty{f(x),g(x)}\ (x\in I)\hspace{0.2em}\)
証明
1. ただの変数変換。
1. \(f(\lambda a+(1-\lambda)b)\ge \lambda f(a)+(1-\lambda)f(b)\hspace{0.2em}\)と\(\hspace{0.2em}g\hspace{0.2em}\)についての不等式を辺々足せばよい。
1. 3.の変数変換(2.で変数変換した場合の不等式が成り立ち、それと\(\hspace{0.2em}f\hspace{0.2em}\)についての不等式を足せばよい)。
1. 例えば、\(f(\lambda a+(1-\lambda)b)\ge \lambda f(a)+(1-\lambda)f(b)\hspace{0.2em}\)の不等式で右辺をより小さい\(\hspace{0.2em}g(a)\hspace{0.2em}\)で置き換えても不等号は成り立つ。
5.2.2 多変数の凸関数
凸集合\(\hspace{0.2em}D\subset \R^n\)(\(a,b\in D\implies \lambda a+(1-\lambda)b\in D\))について関数\(\hspace{0.2em}f\colon D\to \R\hspace{0.2em}\)が、任意の\(\hspace{0.2em}a,b\in D,\,\lambda\in \ivo{0}{1}\hspace{0.2em}\)について
上に凸な\(\hspace{0.2em}n\hspace{0.2em}\)変数関数について、\(k\hspace{0.2em}\)個の変数を固定すれば、上に凸な\(\hspace{0.2em}n-k\hspace{0.2em}\)変数関数が得られる。
上に凸な多変数関数\(\hspace{0.2em}f\hspace{0.2em}\)は、各々の変数についても上に凸。
数学の定理5.4の多変数版。証明も同じ。
問題5.8 アドリブ
5.3 エントロピーの凸性
\(\hspace{0.2em}(\lambda U_a,\lambda V_a),((1-\lambda)U_b,(1-\lambda)V_b)\hspace{0.2em}\)の2つの部分系から成る複合系について、要請IIより
単純系のエントロピーは、その事前な変数について上に凸な関数である。
単純系のエントロピーは、その自然な変数の各々について上に凸な関数である。
対偶を取れば、エントロピーが凸関数でなければ要請IIは満たされない。
エントロピーの同次性から、エントロピー密度も示量変数の密度について上に凸であることが分かる。
単純系のエントロピー密度は上に凸な関数である。
数学の定理5.1(高々可算個の点を除いて連続的微分可能で、\eqref{eq:nya}より左右それぞれの偏微係数は減少する)と\(\hspace{0.2em}S\hspace{0.2em}\)が連続的微分可能であるという要請から
単純系のエントロピーの、その自然な変数についての偏微分係数は連続な減少関数である。エントロピー密度も示量変数の密度についての偏微係数は連続な減少関数である。
参考文献
- 清水 明『熱力学の基礎 第2版 I 熱力学の基本構造』(2021、東京大学出版会)
- 凸関数の理論(PDF)
- 凸関数
- 累次極限