正方形内随机两点的期望距离

问题描述:在一个单位正方形内按均匀分布随机选择两个独立的点,试问它们之间的期望距离是多少?

一个很有迷惑性的问题!我看到这个题的第一感觉是它很容易,而且答案应该是\(\frac{1}{2}\)或\(\frac{\sqrt{2}}{2}\)这种数字,毕竟这个题目本身可以把正方形改为单位线段或单位立方体,我们更希望有一个系统的解答。

结果我发现我并不会做(躺),但是我发现我会做单位线段的情形,而从单位线段到单位正方形或单位立方体可以巧妙地建立起桥梁,最终通过还算简洁的计算得到了答案,下面我就一步步展示我的解法。

问题答案:\(\frac{2+\sqrt{2}+5\ln(1+\sqrt{2})}{15}\)

Step1:单位线段上随机两点距离平方的分布

先解释一下为什么要计算距离平方的分布而非距离的分布,根据\(n\)维空间中两点间距离公式:$$d(X,Y)=\sqrt{(x_1-y_1)^2+(x_2-y_2)^2+\cdots+(x_n-y_n)^2}$$

按照题意,我们当然可以把\(n\)维空间中的一个随机点看成\(n\)个数轴上的独立随机点,这样我们就可以尝试用单位线段的情形来推算单位正方形或更高维的情形了。如果直接考虑距离,需要先平方、再相加、然后开根,对随机变量来说这实在是太复杂了,但如果我们考虑距离的平方:$$d^2(X,Y)=
(x_1-y_1)^2+(x_2-y_2)^2+\cdots+(x_n-y_n)^2 $$

如果我们获得了单位线段上随机两点距离平方的分布函数或密度函数,高维的情形就对应满足上述分布的若干独立随机变量相加的情况,这是容易处理的。

考虑分布函数$$F(t)=\iint_{(x-y)^2<t\\(x,y)\in[0,1]\times[0,1]}p(x)p(y)dxdy=
\iint_{-\sqrt{t}<|x-y|<\sqrt{t}\\(x,y)\in[0,1]\times[0,1]}dxdy $$

即需要计算单位正方形被直线\(x-y=-\sqrt{t}\)和直线\(x-y=\sqrt{t}\)包围的面积,容易发现这等价于用单位正方形减去两个直角边长为\(1-\sqrt{t}\)的等腰直角三角形剩余部分的面积,所以有分布函数和密度函数:$$F(t)=1-(1-\sqrt{t})^2\qquad f(t)=1-\frac{1}{\sqrt{t}}$$

Step2:单位正方形内随机两点距离平方的概率密度

根据题设,我们现在需要计算两个密度函数为\(f(t)\)的随机变量的和的密度函数,直接由卷积公式得:$$g(t)=\int f(u)f(t-u)du$$

注意到\(f(t)\)只在\([0,1]\)上取非零值,所以\(g(t)\)需要分段计算:$$g(t)=\left\{\begin{matrix}\int_0^tf(u)f(t-u)du&0\leq t<1\\\int_{t-1}^1f(u)f(t-u)du&1\leq t\leq 2\end{matrix}\right.$$

计算得:$$g(t)=\left\{\begin{matrix}t-4\sqrt{t}+\pi&0\leq t<1\\-t+4\sqrt{t-1}+\pi-2-4tan^{-1}(\sqrt{t-1})&1\leq t\leq 2\end{matrix}\right.$$

Step3:单位正方形内随机两点距离的期望

假设单位正方形内随机两点距离的概率密度为\(h(l)\),则\(h(l)=f(l^2)\frac{dt}{dl}\),代入两点距离平方的概率密度得:$$h(l)=\left\{\begin{matrix}2l^3-8l^2+2\pi l&0\leq l<1\\-2l^3+8l\sqrt{l^2-1}+(2\pi-4)l-8ltan^{-1}(\sqrt{l^2-1})&1\leq l\leq\sqrt{2}\end{matrix}\right.$$

最后一步就是计算积分\(\int_0^{\sqrt{2}}lh(l)dl\)了,利用\(2ldl=dl^2\),上式中所有需要积分的都是初等函数,最后不难得到答案为\(\frac{2+\sqrt{2}+5\ln(1+\sqrt{2})}{15}\)。

这个做法并不是唯一的,我之前看到YouTube上一个视频给出了一个解法,直接按定义对四重积分下手,利用积分变换的各种技巧最终得出答案。我觉得相比之下,本文提出的做法不仅计算量大幅减小,而且也容易向高维的情形推广,是一种更加优美的做法。

发表评论

电子邮件地址不会被公开。 必填项已用*标注