“生日悖论”:为人中可能有两人同一天生日?
在一个只人的房间里,至少有两个人同一天生日的概率%。

这听起来像个悖论,对吧?
为什么说这是悖论呢?我们知道,一个人和另一个人生日相同的概率只/365。而我们大多数人可能认识的朋友远远超人,却很少遇到生日相同的情况。这不禁让人质疑:这个说法怎么会成立呢?
其实,这种逻辑存在一些问题。首先,这里并不是问“有没有人和你同一天生日”,而是“是否有任意两个人生日相同”。这种可能性比你想象的要大得多。
为了更好地理解这一点,我们可以通过计算机模拟来验证“生日悖论”的真实性。
模拟就是用计算机或模型去重现现实情况的一种方法,既高效又经济。比如,用风洞测试飞机模型的气流表现就是一种模拟。
在这里,我们通过Python编程语言模拟“生日悖论”。模拟的核心是:随机选择人并记录他们的生日,直到有两个人的生日相同为止,然后统计需要多少人才能发生这种情况。
以下是模拟实验的具体步骤:
随机选择一个人的生日。 检查之前是否有人有相同的生日。 如果没有重复,则继续选择下一人,重复步,直到找到生日重复的人。 统计询问人数,并将其记为结果。以下是模拟该实验的单个实例的代码:
def collect_until_repeat(dist = np.ones(365)/365):# dist is the distribution of birthdays. If it is not known# it is assumed uniform# We'll use this variable as the stopping conditionrepeat = False# We'll store the birthdays in this vectoroutcomes = np.zeros(dist.shape[0])# n will count the number of people we meet. Each loop is# a new person.n = 0while not repeat:# addone to the countern += 1# simulate meeting a person with a random birthdayoutcomes += np.random.multinomial(1,dist)# check if we got a repeatif np.any(outcomes > 1):repeat = Truereturn n
重复以上步骤多次,我们可以得到一个关于“多少人需要满足生日重复”这一问题的概率分布。
通过一百万次实验的结果,我们得到了如下统计分布图:

实验结果显示,当房间里个人时,至少两人生日相同的概率确实达到%。这个结果验证了“生日悖论”的真实性。
有人可能会问:现实生活中,生日并非完全均匀分布。比如,12日日的出生人数明显偏低。如果我们用真实的生日分布数据来做实验,结果会有所不同吗?
答案是:不会!
我们通过实际的美年间的出生数据进行模拟后发现,无论是否考虑真实分布,“生日悖论”都成立。
如果你对“近似生日”(比如前后相天)也感兴趣,那么所需人数会更少。比如,当允天的容差时,只需要大人就几乎可以保证找到一对“接近生日”的人。