单层 TMD 材料的三能带紧束缚模型构建

本文将从对称性与轨道选择出发，逐步构建单层 TMD 的三能带紧束缚模型，并说明它为何足以描述 K/K′ 点附近的带边性质。

引言

单层过渡金属二硫化物（TMD，如 MoS₂、WS₂、MoSe₂ 等）是近年来非常受关注的一类二维半导体材料。它们在单层极限下表现为直接带隙体系，并且具有明显的自旋-轨道耦合效应和能谷（valley）自由度，这使得许多新奇的物理都集中在 K/K' 点附近。在这个能量区间内，价带顶与导带底几乎完全由过渡金属原子的 \(d\) 轨道组成，它们分别是 \(d_{z^2}\) 、 \(d_{xy}\) 与 \(d_{x^2-y^2}\) 。基于这一事实，我们可以构建一个仅包含这三个轨道的紧束缚模型，也就是常常提到的三能带模型。尽管这个模型的基组很小，但已经足够描述 K/K' 点附近的带边性质。

不妨在这里简要介绍一下紧束缚模型。所谓紧束缚模型，是指利用局域的原子轨道来描述晶体电子结构的办法：它假设电子主要局域在各个原子附近，即波函数由一组正交的原子轨道线性组合而成，并允许电子通过有限距离的跳跃 (hopping) 在晶格中传播。它的 Hamiltonian 通常由原位 (on-site) 能级和近邻/远近邻跳跃项组成，它的参数可以由对称性约束得到简化，并通过拟合 DFT 能带得到。紧束缚模型因其形式直观、计算高效，特别适合分析带边、能谷以及自旋-轨道耦合等物理性质。

本文将从对称性出发，依次介绍三能带紧束缚模型基组的选择与 Hamiltonian 的构建，并利用该模型复现 DFT 能带的结果。

TMD 的晶体结构与对称性分析

在构建紧束缚模型之前，我们首先要弄明白研究对象的晶体结构，这包含了材料的晶胞形状以及对称性信息。而紧束缚模型中跳跃矩阵的各项参数并非完全独立，受材料对称性的约束，这些参数之间有存在相应的关联，这些关联操作可以大大减少跳跃矩阵中独立参数的数量，使问题简单化。因此，我们有必要弄明白 TMD 材料的对称性信息。

注：为了避免误会，接下来我们所提到的 TMD 材料均为单层材料。而 TMD 的单层材料中有两个常见的相，分别是 1T 相和 2H 相，其中 1T 相为金属， 2H 相为半导体（或绝缘体）。我们下面所讨论的相均为 2H 相。

TMD 的实空间结构与布里渊区

单层 TMD 材料的化学式为 MX₂ ，其中 M 为过渡金属元素（如Mo、W和V等），X为硫族元素（如S、Se以及Te等）。其结构如图1 所示（图片引自文献¹），图中灰色原子为过渡金属原子，黄色原子为硫族原子，它们组成了一种类似 “三明治”的结构，金属原子形成了二维的六角晶格，硫族原子分别位于金属原子的上下两侧，形成了三棱柱形的配位环境，形状如图1 (b)所示。

<span class="figure-number">Figure 1: </span>TMD 材料的晶体结构以及布里渊区示意图，灰色球为 M 原子，黄色球为 X 原子，(c) 为布里渊区示意图，图片引自文献。 — Figure 1: TMD 材料的晶体结构以及布里渊区示意图，灰色球为 M 原子，黄色球为 X 原子，(c) 为布里渊区示意图，图片引自文献。

而由于 MX₂ 的原胞为六角晶型，它的布里渊区同样为六角形，如图1 (c)所示。在这个布里渊区中，除了原点 \(\Gamma\) 和边中心 \(M\) 以外，我们对位于六边形顶点的 \(+K\) 与 \(-K\) 点比较感兴趣，它们决定着能谷（valley）中存在许多有趣的物理性质。

TMD 的对称性

单层 TMD 的点群为 \(D_{3h}\) ，它主要包括以下几种对称性：

三重旋转对称性：绕 \(z\) 轴旋转 120° 后系统保持不变，即

\begin{equation} \label{eq:symmetry-C3-xy} C_3: \begin{bmatrix} x \\ y \end{bmatrix} \to \begin{bmatrix} \cos(\theta) & -\sin(\theta) \\
\sin(\theta) & \cos(\theta) \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix}, \;\; \theta = \frac{2\pi}{3} \end{equation}
水平镜面反射：关于 \(xy\) 平面反射后系统不变，即

\begin{equation} \sigma_h: (x, y, z) \to (x, y, -z) \end{equation}
竖直的镜面对称：分别沿 M‒X 键做反映（以1 中沿\(yz\)反映面为例）

\begin{equation} \sigma_v: (x, y, z) \to (-x, y, z) \end{equation}

以上三种对称操作可以相互组合，并形成更多的对称操作，下面将部分操作总结在表1 中

Table 1: TMD 材料的部分对称性操作

对称操作	符号	表达式
旋转 \(\frac{2\pi}{3}\)	\(C_3\)	\(C_3\)
旋转 \(\frac{4\pi}{3}\)	\(C_3^2\)	\(C_3 \cdot C_3\)
沿 \(yz\) 面反映	\(\sigma_v\)	\(\sigma_v\)
沿 \(yz\) 面反映后旋转 \(\frac{2\pi}{3}\)	\(\sigma_v'\)	\(C_3 \cdot \sigma_v\)
沿 \(yz\) 面反映后旋转 \(\frac{4\pi}{3}\)	\(\sigma_v''\)	\(C_3 \cdot C_3 \cdot \sigma_v \)

基组的确定及对称性算符

在构建紧束缚 Hamiltonian 之前，我们需要明确系统的基组。众所周知，“紧束缚模型”也称为“原子轨道线性组合法”（LCAO, linear combination of atomic orbitals），它使用原子轨道作为基组表示系统的波函数，因此我们需要明确具体使用哪些原子轨道。

以 MoS₂ 为例，G. B. Liu¹等使用 DFT 软件计算得到它的原子轨道投影能带，如图2 所示（图片引自文献¹）。不难看出 MoS₂ 的价带最高（VBM）与导带最低（CBM）均主要由原子的 \(d\) 轨道贡献，而 \(p\) 轨道占比相比之下就小很多，\(s\) 轨道则更是几乎没有。由于我们通常只关心 VBM 与 CBM 的带隙与色散，因此只使用 M 原子的这三个 \(d\) 轨道来构成紧束缚模型的基组是可行的。为此我们认为 X 原子的所有轨道以及 M 原子的 \(sp\) 轨道都可以忽略不计，它们不参与紧束缚模型的构建。

<span class="figure-number">Figure 2: </span>使用 VASP 计算得到的 MoS<sub>2</sub> 能带及原子轨道投影，图片引自文献。 — Figure 2: 使用 VASP 计算得到的 MoS₂ 能带及原子轨道投影，图片引自文献。

在此，我们的紧束缚模型基组确定为 M 原子的三条 \(d\) 轨道：

\begin{equation} \qty{ \ket{d_{z^2}}, \ket{d_{xy}}, \ket{d_{x^2-y^2}} } \end{equation}

从轨道的基函数表达式不难判断，它们对应了几种对称性：

\(\ket{d_{z^2}}\) 的基函数为 \(z^2\) ，与 xy 无关，因此它对于 \(xy\) 平面内的操作不变，即 \(C_3\) 操作与 \(\sigma_v\) 操作对它不起作用：

\begin{equation} C_3: \ket{d_{z^2}} \to \ket{d_{z^2}}; \;\; \sigma_v: \ket{d_{z^2}} \to \ket{d_{z^2}} \end{equation}
\(\ket{d_{xy}}\) 的基函数为 \(xy\) ，它对于沿 \(yz\) 平面的反映产生符号改变：

\begin{equation} \sigma_v: \ket{d_{xy}} \to - \ket{d_{xy}} \end{equation}
\(\ket{d_{xy}}\) 与 \(\ket{d_{x^2-y^2}}\) 组合起来时，它对三重旋转操作有以下关系

\begin{equation} C_3: \begin{bmatrix} \ket{d_{xy}} \\ \ket{d_{x^2-y^2}} \end{bmatrix} \to \begin{bmatrix} \cos(2\frac{2\pi}{3}) & -\sin(2\frac{2\pi}{3}) \\
\sin(2\frac{2\pi}{3}) & \cos(2\frac{2\pi}{3}) \end{bmatrix} \begin{bmatrix} \ket{d_{xy}} \\ \ket{d_{x^2-y^2}} \end{bmatrix} \end{equation}

这个式子的意思是，当一个波函数可以用 \(\ket{d_{xy}}\) 与 \(\ket{d_{x^2-y^2}}\) 这两种轨道的线性组合表示时，它经过三重旋转后的结果仍可以使用这两个轨道表示，旋转操作只改变了两种轨道的组合系数²。需要指出的是，尽管这个式子看起来与公式\eqref{eq:symmetry-C3-xy} 很像，但它们是完全不同的概念。当前对称操作作用的基底是原子轨道³，而 \eqref{eq:symmetry-C3-xy} 作用的基底则是位置坐标 \(xy\) 。

那么，在 \(\qty{ \ket{d_{z^2}}, \ket{d_{xy}}, \ket{d_{x^2-y^2}} }\) 基组中，上面两种对称操作可以用下面的算符表示：

\begin{equation} \label{eq:Dnmatrix} D(C_3) = \begin{bmatrix} 1 & 0 & 0 \\
0 & \cos(2\frac{2\pi}{3}) & -\sin(2\frac{2\pi}{3}) \\
0 & \sin(2\frac{2\pi}{3}) & \cos(2\frac{2\pi}{3}) \end{bmatrix}; \;\; D(\sigma_v) = \begin{bmatrix} 1 & 0 & 0 \\
0 & -1 & 0 \\
0 & 0 & 1 \end{bmatrix} \end{equation}

有了以上两种对称操作后，表1 中对称操作对应的矩阵形式就都可以得到了。

由于 X 原子不参与到模型中，系统只由 M 原子组成，并且所有 M 原子都在同一平面内，\(z\) 方向上的对称操作对这个系统的基函数也不起作用，因此 \(D_{3h}\) 点群中其它与 \(z\) 方向相关的操作，如 \(xy\) 平面反映 \(\sigma_h\) 与绕 \(x\) 轴的二次旋转 \(C_2\) 等均不需要考虑⁴。

紧束缚 Hamiltonian 的构建

坐标系与近邻原子

在此我们不妨明确一下系统的坐标系，如图3 所示。

<span class="figure-number">Figure 3: </span>本文所使用的坐标系，以及 M 原子的最近邻（nearest neighbor, NN）、次近邻（next-nearest neighbor, NNN）和第三近邻（third-nearest neighbor, TNN） M 原子位置示意图 — Figure 3: 本文所使用的坐标系，以及 M 原子的最近邻（nearest neighbor, NN）、次近邻（next-nearest neighbor, NNN）和第三近邻（third-nearest neighbor, TNN） M 原子位置示意图

图中 \(ab\) 表示两个晶格矢量，它们分别是

\begin{equation} \vec{a} = (l, 0);\;\; \vec{b} = (\frac{l}{2}, \frac{\sqrt{3}}{2}l) \end{equation}

\(l\) 是相邻两个 M 原子的距离，在本文中它也表示晶格常数。最近邻原子、次近邻原子与第三近邻原子的位置分别用 \(R_n\) 、 \(\tilde{R}_n\) 以及 \(2R_n\) (\(n = 1, 2, …, 6\)) 表示，它们对应的分数坐标为

\begin{gathered} R_1 = (1, 0);\; R_2 = (0, 1);\; R_3 = (-1, 1);\\
R_4(-1, 0);\; R_5 = (0, -1);\; R_6 = (1, -1) \\
\\
\tilde{R}_1 = (1, 1);\; \tilde{R}_2 = (-1, 2);\; \tilde{R}_3 = (-2, 1);\\
\tilde{R}_4(-1, -1);\; \tilde{R}_5 = (1, -2);\; \tilde{R}_6 = (2, -1) \\
\\
2R_1 = (2, 0);\; 2R_2 = (0, 2);\; 2R_3 = (-2, 2);\\
2R_4(-2, 0);\; 2R_5 = (0, -2);\; 2R_6 = (2, -2) \\
\end{gathered}

紧束缚模型 Hamiltonian

由于我们研究的晶胞内只包含一个 M 原子，每个原子有三个 \(d\) 轨道，因此三能带模型的紧束缚 Hamiltonian 在动量空间中表示为一个 3x3 的矩阵

\begin{equation} \label{eq:tb-hamiltonian} H(\vb{k}) = \begin{bmatrix} H_{11}(\vb{k}) & H_{12}(\vb{k}) & H_{13}(\vb{k}) \\
H_{21}(\vb{k}) & H_{22}(\vb{k}) & H_{23}(\vb{k}) \\
H_{31}(\vb{k}) & H_{32}(\vb{k}) & H_{33}(\vb{k}) \end{bmatrix} \end{equation}

为了方便起见，我们不妨定义以下记号

\begin{equation} \ket{\phi_1} = d_{z^2}\, , \; \ket{\phi_2} = d_{xy}\, , \; \ket{\phi_3} = d_{x^2-y^2} \end{equation}

公式 \eqref{eq:tb-hamiltonian} 中每一项对应的表达式为

\begin{equation} \label{eq:tb-hamiltonian-Hijk} H_{ij}(\vb{k}) = \sum_{\vb{R}} e^{i\vb{k}\vdot\vb{R}} E_{ij}(\vb{R}) \end{equation}

其中 \(E_{ij}(\vb{R})\) 即为轨道间的跳跃项，

\begin{equation} \label{eq:on-site} E_{ij}(\vb{R}) = \mel{\phi_i(\vb{r})}{\hat{H}}{\phi_j(\vb{r} - \vb{R})} \end{equation}

它表示位于原点的 \(i\) 轨道跳跃到位于 \(\vb{R}\) 的 \(j\) 轨道的能量积分，这里 \(\vb{R}\) 表示近邻的原子。这个积分有一个十分重要的性质 \(E_{ij}( R) = E_{ji}(-R)^*\) ，证明如下

\begin{equation} \label{eq:tb-hopping-transpose} \begin{aligned} E_{ij}(\vb{R}) &={} \mel{\phi_i(\vb{r})}{\hat{H}}{\phi_j(\vb{r} - \vb{R})} \\
&={} \mel{\phi_j(\vb{r} - R)}{\hat{H}}{\phi_i(\vb{r})}^* \\
&={} \mel{\phi_j(\vb{r})}{\hat{H}}{\phi_i(\vb{r} + \vb{R})}^* \quad (\text{变量替换} \vb{r} \to \vb{r} + \vb{R}) \\
&={} E_{ji}(-\vb{R})^* \\
\end{aligned} \end{equation}

此外，当有了其中一个近邻原子轨道的 \(E_{ij}(\vb{R})\) 后，我们可以通过对称性操作推导出其它近邻原子轨道对应的跳跃积分 \(E_{ij}(\vb{R'})\)，它们可以通过下面的式子推得

\begin{equation} \label{eq:tb-hopping-symmetry} E(\hat{g}_n \vb{R}) = D(\hat{g}_n) E(\vb{R}) \bqty{D(\hat{g}_n)}^{\dagger} \end{equation}

\(E( R)\) 表示由 \(E_{ij}(\vb{R})\) 组成的矩阵， \(\hat{g}_n\) 是具体的对称操作， \(D(\hat{g}_n)\) 是 \(\hat{g}_n\) 对应的矩阵形式，它们已在公式\eqref{eq:Dnmatrix} 中给出⁵。

在 TMD 中，根据考虑近邻原子的多少不同，跳跃项分最近邻项、次近邻项和第三近邻项，下面将以最近邻模型和第三近邻模型为例分别阐述它们的具体形式。

参数	文献符号	数值 (eV)	参数	文献符号	数值 (eV)
\(\epsilon_1\)	\(\epsilon_1\)	1.046	\(t_{13}\)	\(t_2\)	0.507
\(\epsilon_2\)	\(\epsilon_2\)	2.104	\(t_{22}\)	\(t_{11}\)	0.218
\(t_{11}\)	\(t_0\)	-0.184	\(t_{23}\)	\(t_{12}\)	0.338
\(t_{12}\)	\(t_1\)	0.401	\(t_{33}\)	\(t_{22}\)	0.057

仔细观察，不难看出，对于 \(\tilde{R}_1\) ，我们可以先做 \(C_3\) 转动变换为 \(\tilde{R}_3\) ，再经过 \(yz\) 面反映变换回 \(\tilde{R}_1\) 。即

\begin{gathered} \tilde{R}_1 \xrightarrow{C_3} \tilde{R}_3 \xrightarrow{\sigma_v} \tilde{R}_1 \\
\Downarrow \\
E(\tilde{R}_1) = D(\sigma_v \cdot C_3) E(\tilde{R}_1) D(\sigma_v \cdot C_3)^{\dagger} \end{gathered}

同样，使用下面的 SymPy 脚本，可以解出 \(E(\tilde{R}_1)\) 中部分参数之间的关系

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23


r11, r12, r13 = sym.symbols("r11, r12, r13", real=True)
r21, r22, r23 = sym.symbols("r21, r22, r23", real=True)
r31, r32, r33 = sym.symbols("r31, r32, r33", real=True)

DC3 = sym.Matrix([[1,          0,         0],
                  [0,    -S(1)/2, sqrt(3)/2],
                  [0, -sqrt(3)/2,   -S(1)/2]])

DSigmaV = sym.Matrix([[1,  0, 0],
                      [0, -1, 0],
                      [0,  0, 1]])

r = sym.Matrix([[r11, r12, r13],
                [r21, r22, r23],
                [r31, r32, r33]])

equation_matrix = (DSigmaV * DC3) * r * (DSigmaV * DC3).T - r
equations = list(equation_matrix)
solutions = sym.solve(equations, (r11, r12, r13, r21, r22, r23, r31, r32, r33))
print(solutions)

# Output:
# {r12: -sqrt(3)*r13, r21: -sqrt(3)*r31, r22: -2*sqrt(3)*r32/3 + r33, r23: r32}

因此可得简化后的跳跃矩阵

\begin{equation} E(\tilde{R}_1) = \begin{bmatrix} r_{11} & r_{12} & -\frac{1}{\sqrt{3}} r_{12}\\
r_{21} & r_{22} & r_{23} \\
-\frac{1}{\sqrt{3}} r_{21} & r_{23} & r_{22} + \frac{2}{\sqrt{3}} r_{23} \end{bmatrix} \end{equation}

有了 \(\tilde{R}_1\) 后，我们可以通过对称性陆续得到其它的次近邻跳跃项 \(\tilde{R}_2 \cdots \tilde{R}_6\)

为方便理解，我们先从 \(\tilde{R}_4\) 开始，刚好有 \(\tilde{R}_4 = -\tilde{R}_1\) ，因此有

\begin{equation} E(\tilde{R}_4) = E(\tilde{R}_1)^{\dagger} \end{equation}
\(\tilde{R}_2\) 可以使用 \(\tilde{R}_4\) 经过两次 \(C_3\) 转动得到

\begin{equation} E(\tilde{R}_2) = D(C_3 \cdot C_3) E(\tilde{R}_1)^{\dagger} D(C_3 \cdot C_3)^{\dagger} \end{equation}
\(\tilde{R}_3\) 可以使用 \(\tilde{R}_1\) 经过一次 \(C_3\) 转动得到

\begin{equation} E(\tilde{R}_3) = D(C_3) E(\tilde{R}_1) D(C_3)^{\dagger} \end{equation}
\(\tilde{R}_5\) 可以使用 \(\tilde{R}_1\) 经过两次 \(C_3\) 转动得到

\begin{equation} E(\tilde{R}_5) = D(C_3 \cdot C_3) E(\tilde{R}_1) D(C_3 \cdot C_3)^{\dagger} \end{equation}
\(\tilde{R}_6\) 可以使用 \(\tilde{R}_4\) 经过一次 \(C_3\) 转动得到

\begin{equation} E(\tilde{R}_6) = D(C_3) E(\tilde{R}_1)^{\dagger} D(C_3)^{\dagger} \end{equation}

此时次近邻跳跃的 Hamiltonian 形式如下：

\begin{aligned} H^{\text{NNN}} &={} e^{i\vb{k}\cdot \vb{\tilde{R}_1}} E(\tilde{R}_1) + e^{i\vb{k}\cdot \vb{\tilde{R}_2}} E(\tilde{R}_2) + e^{i\vb{k}\cdot \vb{\tilde{R}_3}} E(\tilde{R}_3) \\
&\phantom{{}={}} + e^{i\vb{k}\cdot \vb{\tilde{R}_4}} E(\tilde{R}_4) + e^{i\vb{k}\cdot \vb{\tilde{R}_5}} E(\tilde{R}_5) + e^{i\vb{k}\cdot \vb{\tilde{R}_6}} E(\tilde{R}_6) \end{aligned}

将参数代入 \(H^{\text{NNN}}\) 和 \(H^{\text{TNN}}\) 中，即可得到第三近邻模型下的能带结构。需要注意的是，在使用第三近邻模型时， \(H^{\text{on-site}}\) 与 \(H^{\text{NN}}\) 的参数也需要更新。

能带求解

这里同样使用刘贵斌教授给出的数值：

参数	文献符号	数值 (eV)	参数	文献符号	数值 (eV)
\(\epsilon_1\)	\(\epsilon_1\)	0.683	\(t_{13}\)	\(t_2\)	0.506
\(\epsilon_2\)	\(\epsilon_2\)	1.707	\(t_{22}\)	\(t_{11}\)	0.085
\(t_{11}\)	\(t_0\)	-0.146	\(t_{23}\)	\(t_{12}\)	0.162
\(t_{12}\)	\(t_1\)	0.114	\(t_{33}\)	\(t_{22}\)	0.073

\(r_{11}\)	\(r_0\)	0.060	\(r_{22}\)	\(r_{11}\)	0.016
\(r_{12}\)	\(r_1\)	-0.236	\(r_{23}\)	\(r_{12}\)	0.087
\(r_{21}\)	\(r_2\)	0.067

\(u_{11}\)	\(u_0\)	-0.038	\(u_{22}\)	\(u_{11}\)	0.266
\(u_{12}\)	\(u_1\)	0.046	\(u_{23}\)	\(u_{12}\)	-0.176
\(u_{13}\)	\(u_2\)	0.001	\(u_{33}\)	\(u_{22}\)	-0.150

可得能带图如下：

显然，这次模型所得能带与 DFT 符合的很好，这说明考虑次近邻跳跃与第三近邻跳跃后的三能带模型已经可以很好地满足带边的描述需求。

自旋-轨道耦合的引入

在前面的讨论中，我们构建了一个仅包含轨道自由度的紧束缚模型。然而，对于单层 TMD 材料而言，自旋轨道耦合 (spin-orbit coupling, SOC) 不仅仅是一种微小的能量修正，它是决定能带精细结构以及谷激子性质的关键因素，因此我们有必要研究如何将 SOC 引入紧束缚模型。

原子内 SOC 的基本形式

所谓自旋轨道耦合，就是电子的自旋角动量与轨道角动量相互作用的一种狭义相对论效应。当电子在原子核产生的电场中高速运动时，相对论效应会使其感应出有效磁场，这种磁场与电子自身的自旋磁矩产生相互作用，从而导致能级分裂和谱线精细结构的产生。⁶

SOC 的通用形式为

\begin{equation} H^{\text{SOC}} = \frac{\hbar}{4mc^2} \sigma \vdot \vb{p} \cp \grad{v}(\vb{r}) \end{equation}

其中:

\(\sigma\) 是泡利矩阵；
\(\vb{p}\) 是电子的动量；
\(v(\vb{r})\) 是电子感受到的静电势；

在真实体系中，这个表达中的 \(\grad{v(\vb{r})}\) 并不容易得到，因此我们将它与前面的系数合并为 \(\lambda\) 作为一个经验参数给出此时 SOC 可以写成

\begin{equation} H_{\text{atom}}^{\text{SOC}} = \lambda \vb{L} \vdot \vb{S} \end{equation}

其中：

\(\lambda = \frac{\grad{v(\vb{r})}}{2mc^2}\) 表示 SOC 作用的强度，它决定了 SOC 对能级劈裂的贡献；
\(\vb{L}\) 是电子的轨道角动量；
\(\vb{S} = \frac{\hbar}{2} \sigma\) 是电子的自旋角动量。

我们将用这个式子对紧束缚模型中的 SOC 作用进行建模。需要指出的是，一般认为 SOC 仅作用于 on-site 项，即它只作用于同一个原胞内的同一个原子，不涉及跳跃项。

三能带模型中的 SOC 作用

在三能带模型中，我们选取的轨道基组为

\begin{equation} \qty{ \ket{d_{z^2}},\; \ket{d_{xy}},\; \ket{d_{x^2-y^2}} } \end{equation}

当 \(\vb{L}\) 算符作用到它们时， \(L_x\) 与 \(L_y\) 分量所得结果可能会得到 \(\ket{d_{yz}}\) 、 \(\ket{d_{xz}}\) 分量，而这些分量并不在三能带模型的基组内；相反，当使用 \(\ket{L_z}\) 算符作用时，所得结果仍可用现有的基组表达。因此在三能带近似下，可以将 \(m_z\) 视为一个好量子数， SOC 被简化为⁷

\begin{equation} H^{\text{SOC}} = \lambda L_z S_z \end{equation}

下面我们来讨论三能带基组下 SOC 的矩阵元。

\(L_z\) 算符

对于各个实轨道，它们都可以写成复球谐函数的线性组合：

\(\ket{d_{z^2}} = Y_{2,0}\)
\(\ket{d_{xy}} = \frac{i}{\sqrt{2}} (Y_{2,-2} - Y_{2,2})\)
\(\ket{d_{x^2-y^2}} = \frac{1}{\sqrt{2}} (Y_{2,-2} + Y_{2,2})\)

对每个球谐函数，有⁸

\begin{equation} L_z Y_{lm} = m Y_{lm} \end{equation}

将 \(L_z\) 作用于实轨道时，有

\(\hat{L}_z \ket{d_{z^2}} = 0\)
\(\hat{L}_z \ket{d_{xy}} = \frac{i}{\sqrt{2}} (-2 Y_{2,-2} - 2 Y_{2,2}) = -2i \frac{1}{\sqrt{2}} (Y_{2,-2} + Y_{2,2}) = -2i \ket{d_{x^2-y^2}}\)
\(\hat{L}_z \ket{d_{x^2-y^2}} = \frac{1}{\sqrt{2}} (-2 Y_{2,-2} + 2 Y_{2,2}) = 2i \frac{-i}{\sqrt{2}} (Y_{2,-2} + Y_{2,2}) = 2i \ket{d_{xy}}\)

因此， \(\hat{L}_z\) 的矩阵元 \(\mel{i}{\hat{L}_z}{j}\) 中有以下关系

\(\mel{d_{z^2}}{\hat{L}_z}{j} = 0\)
\(\mel{d_{xy}}{\hat{L}_z}{d_{x^2-y^2}} = \mel{d_{x^2-y^2}}{\hat{L}_z}{d_{xy}}^* = -2i\)
\(\mel{d_{xy}}{\hat{L}_z}{d_{xy}} = \mel{d_{x^2-y^2}}{\hat{L}_z}{d_{x^2-y^2}} = 0\)

把上面的关系写成矩阵形式有

\begin{equation} L_z = \begin{bmatrix} 0 & 0 & 0 \\
0 & 0 & -2i \\
0 & 2i & 0 \end{bmatrix} \end{equation}

\(S_z\) 算符

由于我们忽略了 \(L_x\) 与 \(L_y\) 的贡献，因此电子自旋也只需考虑 \(S_z\) 的贡献

\begin{equation} S_z = \frac{1}{2} \sigma_z = \begin{bmatrix} \frac{1}{2} & 0 \\
0 & -\frac{1}{2} \end{bmatrix} \end{equation}

此时我们可以得到完整的 SOC 矩阵

\begin{aligned} H^{\text{SOC}} &={} \lambda S_z \otimes L_z \\
&={} \begin{bmatrix} \frac{\lambda}{2} L_z & 0 \\
0 & -\frac{\lambda}{2} L_z \end{bmatrix} \end{aligned}

这里我们相当于引入了新的自由度，即自旋，因此需要使用克罗内克积(Kronecker Product, 也称“直积”) 符号 \(\otimes\) ⁹。

考虑自旋轨道耦合后的能带

前面我们已经得到了紧束缚模型的 Hamiltonian \(H^0\) 和完整的 SOC 矩阵 \(H^{\text{SOC}}\) ，现在可以将它们组合起来

\begin{aligned} H^{\text{TB+SOC}}(\vb{k}) &={} I_2 \otimes H^0(\vb{k}) + H^{\text{SOC}} \\
&={} \begin{bmatrix} H_0 + \frac{\lambda}{2} L_z & 0 \\
0 & H_0 - \frac{\lambda}{2} L_z \end{bmatrix} \end{aligned}

这里 \(I_2 = \bmqty{1 & 0 \\ 0 & 1}\) 表示单位矩阵。

借用刘贵斌教授 Phys. Rev. B 给出的数值， MoS₂ 中 \(\lambda = 0.073\) ，代入 \(H^{\text{TB+SOC}}\) 中，可得能带如图5 所示

<span class="figure-number">Figure 5: </span>包含 SOC 后 DFT 能带图与第三邻模型的对比。 — Figure 5: 包含 SOC 后 DFT 能带图与第三邻模型的对比。

不难看出，在包含 SOC 后，三能带模型与 DFT 计算结果仍然符合地不错。比如 K 谷里 VBM 较大的劈裂和 CBM 微小的劈裂都被良好地复现出来，而 \(\Gamma\) 谷 VBM 存在简并的特性也一样得到保留。这说明在只取 \(L_z\) 近似下的 SOC 就可以描述出较为合理的自旋轨道劈裂。

参数的拟合

到目前为止，我们的模型在建立好之后一直依赖查文献来获取模型的参数，这对于 MoS₂ 这样已经十分熟悉的体系而言是没什么问题的，但对于一个文献鲜有报道的体系，我们就不得不自己来拟合这些参数。

我们来简化一下这个问题，它等同于：

有一个函数 \(f\) ，它接受一个参数集 \(\{p\}\) 并输出结果 \(E\) ，现在求一个 \(\{p\}\) 使得 \(E\) 尽可能接近目标值 \(E_0\) ，即

\begin{equation} \min_{p} \sum \bqty{ f(\{p\}) - E_0 }^2 \end{equation}

其中 \(f\) 即为紧束缚模型；

\(\qty{p} = \qty{\epsilon_1, \epsilon_1, t_11, …}\) ；

E_0 为目标能带的具体数值。

这是一个典型的最优化问题，直接交给程序去完成即可。

目标能带

这里我们以 MoS₂ 为例演示如何通过拟合 HSE 能带（不带 SOC）得到三能带紧束缚模型的参数值。图 6 中突出显示的即为目标能带。

构造损失函数

损失函数的构造其实相当简单，只需

\begin{equation} f_{\text{loss}}\bqty{p} = \sum_{n,\vb{k}} \abs{ E\bqty{p}(n, \vb{k}) - E_0(n, \vb{k}) }^2 \end{equation}

其中 \(E\bqty{p}(n, \vb{k})\) 是在当前参数空间 \(p\) 中计算所得能带值。这个损失函数其实就表示当前能带“距离目标能带有多远”，式中 \(||^2\) 就表示求两个量的欧氏距离。

程序设计和计算结果

这里我们使用 Julia 的 Optim.jl 包，大概流程如下

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34


# Evaluate bands, pvec is the vector of TB params
function forward_bands(pvec, kpath, model, ...)
    # Const and diagonalize the Hamiltonian
    Hk = ...
    E = eigvals!(Hk)
    return E
end

# Loss function
function make_loss(Etarget, kpath, model, cache)
    function loss(pvec)
        Etb = forward_bands(pvec, kpath, model, cache)
        s = 0.0
        @inbounds for b in 1:3, i in 1:size(Etb,2)
            d = Etb[b,i] - Etarget[b,i]
            s += w * d*d
        end
        return s
    end
    return loss
end

# main function
loss = make_loss(Etarget, kpath, model, cache; mask=mask, p0=p0, reg=reg, nsegs=nsegs)

# 1) Coarse: Nelder-Mead (robust, no gradients)
res1 = optimize(loss, p0, NelderMead())
p1 = Optim.minimizer(res1)
@info "After NelderMead: loss = $(Optim.minimum(res1))"

# 2) Refine: BFGS (fast local)
res2 = optimize(loss, p1, BFGS(), Optim.Options(show_trace=true))
p_opt = Optim.minimizer(res2)
@info "After BFGS: loss = $(Optim.minimum(res2))"

在上面的代码中，我们先用 NelderMead 方法进行快速地粗优化，然后在此基础上使用 BFGS 算法进行更精细地优化，拟合所得参数如下

参数	文献符号	数值 (eV)	参数	文献符号	数值 (eV)
\(\epsilon_1\)	\(\epsilon_1\)	1.126	\(t_{13}\)	\(t_2\)	0.653
\(\epsilon_2\)	\(\epsilon_2\)	2.211	\(t_{22}\)	\(t_{11}\)	0.205
\(t_{11}\)	\(t_0\)	-0.208	\(t_{23}\)	\(t_{12}\)	0.231
\(t_{12}\)	\(t_1\)	-0.203	\(t_{33}\)	\(t_{22}\)	0.065

\(r_{11}\)	\(r_0\)	0.055	\(r_{22}\)	\(r_{11}\)	0.023
\(r_{12}\)	\(r_1\)	-0.271	\(r_{23}\)	\(r_{12}\)	0.107
\(r_{21}\)	\(r_2\)	0.040

\(u_{11}\)	\(u_0\)	-0.015	\(u_{22}\)	\(u_{11}\)	0.267
\(u_{12}\)	\(u_1\)	0.064	\(u_{23}\)	\(u_{12}\)	0.184
\(u_{13}\)	\(u_2\)	0.026	\(u_{33}\)	\(u_{22}\)	0.179

其对应的能带结果如下

<span class="figure-number">Figure 7: </span>MoS<sub>2</sub> 中 HSE06 能带与 TNN 模型能带对比 — Figure 7: MoS₂ 中 HSE06 能带与 TNN 模型能带对比

不难看出，用拟合参数计算得到的能带与 HSE 能带在 Γ 谷和 K 谷符合地非常好，但在 M 与 M' 谷及附近还存在 ~15meV 左右的差距，尽管如此，笔者依然认为这是一个相当好的结果，至少证明了我们的程序是可用的。

模型的局限性

至此，我们已经给出了单层 TMD 体系中三能带紧束缚模型的完整构建过程，并证明该模型能够较好地再现 K/K' 谷附近的低能电子结构。然而，在模型构建过程中我们不可避免地引入了一系列假设与近似，这也意味着该模型的适用性存在明确的边界。本节将系统总结三能带模型的适用范围，并讨论其主要局限性。

三能带模型仅保留了过渡金属（M）原子的 \(\ket{d_{z^2}},\; \ket{d_{xy}},\; 和 \ket{d_{x^2-y2}}\) 三个轨道。在这一近似下，该模型能够较为准确地描述 K/K' 谷附近、费米能级上下若干电子伏特范围内的能带性质，包括带隙大小、有效质量以及价带的自旋-轨道耦合劈裂等关键物理量。

然而，在以下情形中，三能带模型的局限性会逐渐显现：

在 Γ 点附近，导带底（CBM）往往不再由所选取的三条金属 d 轨道主导。若希望正确描述 Γ 谷附近的能带结构，必须在基组中引入更多轨道自由度，例如硫（或硒）原子的 p 轨道或金属原子的其它 d 轨道；
当 \(\vb{k}\) 远离 K/K′ 点（例如靠近 M/M' 谷）时，三能带模型对能带色散关系的描述精度明显下降；
对于远离费米能级的高能能带，该模型本身并不具备描述能力，此时应考虑采用多能带模型，甚至使用 Wannier 轨道基；
在当前模型中，自旋–轨道耦合仅以 on-site 项的形式引入，并忽略了 \(L_x\) 和 \(L_y\) 分量以及可能存在的 inter-site SOC，这一近似在研究精细自旋结构或强外场效应时可能不再充分；
模型的结构高度依赖于单层 TMD 材料所具有的 \(D_{3h}\) 点群对称性。一旦体系的对称性被破坏，例如施加垂直电场或磁场、引入单轴应变、构造异质结或莫尔超结构，原有的对称性约束将不再成立，此时整个模型需要重新审视甚至重新构建。换言之，该模型在不同体系之间的泛用性是有限的。

以上讨论总结了三能带紧束缚模型的主要局限性。在实际研究中，只要所关注的物理问题处于其适用范围之内，这一模型依然是一个结构简洁、物理清晰且行之有效的理论工具。

总结

本文以单层 TMD 材料的三能带紧束缚模型为核心，系统介绍了该模型的构建思路与实现过程。我们从晶体结构与对称性分析出发，依次讨论了轨道基组的选择、紧束缚哈密顿量的构建方法以及自旋-轨道耦合的引入方式，展示了如何在最小基组的框架下刻画 TMD 体系中最受关注的带边电子结构。

三能带模型之所以具有代表性，主要体现在以下几个方面：

单层 TMD 的导带底与价带顶主要由金属原子的三条 \(d\) 轨道贡献，其它原子及轨道的影响可以在低能近似下被有效吸收，从而保留了带隙起源及带边态的本征轨道性质；
尽管模型中未显式包含硫（或硒）原子的轨道自由度，但金属原子之间的有效跃迁参数已经隐式地包含了 M–X–M 路径的贡献；
在模型构建的全过程中，对称性始终作为首要约束条件，这显著减少了自由参数数量，并保证了模型结构与物理结果的一致性。

凭借其简洁而不失物理内涵的特点，三能带紧束缚模型不仅是研究单层 TMD 能谷物理的重要工具，也非常适合作为紧束缚建模方法的入门示例。通过这一模型，人们可以清晰地看到如何在复杂材料体系中提炼出最关键的自由度，并在可控近似下建立具有明确物理解释力的有效理论。

待续

既然已经提到了紧束缚模型，那只用它算个能带未免有点太浪费了，后面可能会考虑做以下几个实验（也可能没时间做）

贝里联络、贝里曲率的计算；
引入二体相互作用（主要是电子电子、电子空穴的库仑直接项与交换项）；
实现一个半导体布洛赫方程；
对 TMD 中的高次谐波等非线性光学性质进行模拟；

代码下载

文中所有代码已经打包到 code.zip 其中包括：

计算能带脚本： tmd-tb-main.jl
画图脚本： tmd-plot.py
TMD 紧束缚模型的参数: tmd-params.toml ¹⁰
拟合 HSE 能带的脚本： tmd-fit-params.jl
MoS₂ 使用 DFT 计算得到的能带信息，这里不一一列举。

其中大部分代码是在我已经写好的基础上使用 ChatGPT 优化所得，因此需要给到 ChatGPT 部分 credit ，在此表示感谢。

致谢

刘贵斌教授：本文基本属于他那篇 Phys. Rev. B 的复现；
nguyn21012003：他是正在越南一所高校就读的研一大佬，他的仓库对本文帮助很大；
长岛冰茶109：茶佬帮助解决了困扰我很久的跳跃矩阵对称性约束问题；

Liu, G.-B.; Shan, W.-Y.; Yao, Y.; Yao, W.; Xiao, D. Three-Band Tight-Binding Model for Monolayers of Group-VIB Transition Metal Dichalcogenides. Phys. Rev. B 2013, 88 (8), 085433. https://doi.org/10.1103/PhysRevB.88.085433 . ↩︎
这是因为 \(\ket{d_{xy}}\) 与 \(\ket{d_{x^2-y^2}}\) 构成了 \(C_3\) 群中 \(E\) 不可约表象的完备基函数。原谅我因为不会群论，不得不这样绕一下来讲 \(C_3\) 转动群的不可约表示。 ↩︎
这个对称操作矩阵其实可以从 Wigner D 矩阵得到。 https://en.wikipedia.org/wiki/Wigner_D-matrix ↩︎
确切地说，受 LCAO 的三条原则（对称性匹配原则、最大重叠原则和能量相近原则）中对称性匹配原则的约束， \(\ket{d_{z^2}}\) 与 \(\ket{d_{xy}}\) 以及 \(\ket{d_{x^2-y^2}}\) 对于 \(xy\) 平面的反映 \(\sigma_h\) 都是偶对称性，而其它的 \(d\) 轨道，即 \(\ket{d_{xz}}\) 和 \(\ket{d_{yz}}\) 轨道对于 \(\sigma_h\) 则是奇对称性，两者对称性不匹配，所以文中选取的 \(d\) 轨道与其它 \(d\) 轨道的耦合严格为 0 ；因此在选择该基组后已经约束了所有轨道都是 \(\sigma_h\) 偶对称，也就是不需要考虑 \(\sigma_h\) 操作。其它与 \(z\) 相关的对称操作也是如此。 ↩︎
这里如果将不同不可约表示的对称算符分开写会更符合群论"原理"，但考虑到本人不熟悉群论，以及这个系统本身轨道数不多，就不那样处理了。 ↩︎
这段话来自 Wiki https://en.wikipedia.org/wiki/Spin%E2%80%93orbit_interaction 。 ↩︎
等价于我们限制了自旋的取向为 \(\pm z\) ，因此这其实可以看成一种伊辛模型 (Ising model) 近似。 ↩︎
这里取 \(\hbar = 1\) ，因此量纲没表现出来。 ↩︎
https://en.wikipedia.org/wiki/Kronecker_product ↩︎
这份参数表源自刘贵斌老师的 Phys. Rev. B ，由于 GitHub 用户 @nguyn21012003 整理，详见这个仓库。 ↩︎

单层 TMD 材料的三能带紧束缚模型构建

文章目录

引言

TMD 的晶体结构与对称性分析

TMD 的实空间结构与布里渊区

TMD 的对称性

基组的确定及对称性算符

紧束缚 Hamiltonian 的构建

坐标系与近邻原子

紧束缚模型 Hamiltonian

最近邻模型

原位项

最近邻项

能带求解

第三近邻模型

第三近邻项

次近邻项

能带求解

自旋-轨道耦合的引入

原子内 SOC 的基本形式

三能带模型中的 SOC 作用

\(L_z\) 算符

\(S_z\) 算符

考虑自旋轨道耦合后的能带

参数的拟合

目标能带

构造损失函数

程序设计和计算结果

模型的局限性

总结

待续

代码下载

致谢