指示变量法

2025-03-26

0. 引入

指示变量法 可以利用期望线性性，快速计算期望，本文将介绍几个经典的例子。我们知道那么，就可以通过找到而计算，一般地，有三个条件：

能够找到这样的分解
计算比直接计算容易
计算出后，对求和容易，即计算容易，特别地，若，则

指示变量法指导我们如何寻找满足条件 2 的分解，然而不能保证满足条件 3。在快速排序一节中，可以看到可能没有封闭表达式，但能够渐进分析。

对于事件，定义其指示变量

立刻有

如果能找到一系列事件，满足，则，那么将简记作，条件 2 自然满足。如果是同质的，那么是常数，条件 3 也将满足。

这就是指示变量法，你早已在伯努利实验的期望中使用了它。

1. 逆序数

问题

数列是集合的等概随机排列，表示在数列中的位置，是到的双射，实际上

逆序对是满足且的数对，逆序数是逆序对的总数，求逆序数的期望值。

用指示变量法解逆序数问题有两种方式，一种是元素视角，另一种是位置视角。

元素视角

我们考虑每对元素是否形成了逆序对，例如的位置是否在的位置之后。令

表 示

则由对称性，

逆序对总数：

所以：

位置视角

我们考虑每对位置上是否形成了逆序对，例如位置的元素是否比位置的元素大。令

表 示

则

逆序对总数：

所以：

总结

对于数列相关的问题，元素视角和位置视角都值得尝试，常常有某一种更好。由于逆序数问题中，元素和位置有良好的对偶性，因此两个视角均可行，且形式完全相同。

2. 快速排序 1

问题

这里研究随机化的快速排序：对于每一个子问题，等概随机地选择主元。我们希望研究这个随机算法所选主元总数的期望。

快速回顾一下快速排序算法，可以知道每个元素最多被选为主元一次。如果某个元素从未被选为主元，那么大小上相邻的两个元素一定被选为了主元。因此，一共至少个主元，最多可能需要个主元，那么期望一定介于和之间。

简化模型，设被排序的数列是集合的等概随机排列，沿用逆序对问题的记号。

设随机变量为主元总数，事件为 “ 是主元”，是的指示变量，那么

我们把那些不是主元的元素看作 广义主元，它们在成为递归树的叶子节点时被 “广义选择” 为 “主元”，那么每个元素恰好被广义选取一次。

现在设在大小上与相邻，则 “ 不是主元” 等价于 “ 是中最后被广义选择的。

由于主元的选择是等概随机的，经过思考，可以知道：

我们假设，对于最小元素和最大元素 n，它们只有一个相邻元素，故对应的，而不是

故

3. 快速排序 2

注：本节内容改编自杨宽老师的 SJTU CS1212 slides

问题

现在研究快速排序的时间复杂度。

快速排序的时间复杂度主要来源于比较元素，因此可以用比较的总次数衡量一次快速排序算法运行的时间。类似逆序对，总次数可以分解为每对元素的比较次数，即

基本事实

下面给出几个事实：

不妨设，则某个轮次中与产生比较，等价于或是当轮的主元，且任意满足的都尚未被选为主元，否则和已经被分开
不妨设，由于与终要分开，要么被其他主元分开，要么两者直接比较，最终等价于任意满足的都未被选为主元，直到或成为主元，也就等价于，或是中最先成为主元的。

可以发现，定义是 位置视角 相应地，元素视角的定义是

元素视角下，第三个事实是：

等价于或是中最先成为主元的

把“ 或是中最先成为主元的”作为事件，这就是说是的指示变量。

明显，元素视角对于这个问题更好，因为它提供了已知序关系，让的表述更简单，也让计算更具确定性，所以采用元素视角。

计算

由于主元的选择是等概随机的，故：

当然，采用位置视角也是可以的：

得到上式的第二个相等关系实际上需要隐式地采用元素视角。因此，在快速排序的问题上，元素视角和位置视角没有本质不同，两者给出的答案本质相同。

对于这个结果，可以作渐进分析，得到快速排序时间复杂度的经典结论：

4. 最小元素

问题

从集合中，等概随机地选择大小为的子集，求子集最小元素的期望

直接计算

记子集最小元素为随机变量

这个式子的进一步处理有较强技巧性，下面展示指示变量法如何巧妙解决问题。

我们把看作个位置，对于被选入子集的位置，将在该位置上放置，反之放置，形成数列。

容易证明原问题与下面的问题等价：

序列的前 k 个元素是，后个元素是，是的等概随机排列，映射函数是，设中的最小位置为随机变量，形式化地，

例如，当时，

求

接下来的处理方法分为位置视角和元素视角，有较大区别。

位置视角

令事件表示，指示变量为那么，

换元，令

实际上，若采用位置视角，则不必转化问题，直接在原问题上将设为事件中元素均未被选入子集即可。但元素视角必须转化问题，因为原问题没有”元素“的概念。为了对照，这里提前转化了问题。

元素视角

令事件表示，指示变量为那么，

若，，因为的含义是，是像集的最小值

若，，因为的含义是，比个在中都更靠前，即是像集的最小值

故

总结

最终，我们解决了问题，并且获得了一个组合恒等式：

在这个问题中，位置视角与元素视角大相径庭，后者非常巧妙，得到结果也更直接，无需对组合式求和。

指示变量法

0. 引入

1. 逆序数

问题

元素视角

位置视角

总结

2. 快速排序 1

问题

3. 快速排序 2

问题

基本事实

计算

4. 最小元素

问题

直接计算

位置视角

元素视角

总结

评论区

最新评论