用算法可以买房,找女朋友,还能找幼儿园
2019-03-13 17:14

用算法可以买房,找女朋友,还能找幼儿园

本文来自微信公众号:伊甸园的桃子(ID:PeachAtEden),作者:fujiaa,头图来源:UNsplash


本文为《Algorithms to live by》读书笔记。


两年多前,我在加州湾区买了个房子。湾区的房市虽然不能跟国内大城市相比,但码农们抢房毕竟也是凶狠的。每套房子在市场上平均时间也就大概4~5天,可以收到20几个竞价,一般价高者得。作为一个平日小气的人,要做出一个投入一大笔积蓄的巨大决定,我总是忧心忡忡患得患失。每看到一个房子都会不停思考:会不会有其他更好一点的?会不会有多一个卫生间的?会不会有离地铁站更近的?会不会有更便宜的?还没和马克商量完,房子就已经没了。


加州大学伯克利分校心理与认知科学教授Tom Griffths与畅销书作家Brian Christian写作的《Algorithms to live by》一书里,将这种情况归结为数学界著名的脑筋急转弯题目“秘书问题”:想象你在招聘一个秘书,你希望能在应聘者中找到最好的人,但你对应聘者一无所知,并不知道会有怎样的人前来应聘,所以你只能轮流给每一个人面试。虽然你可以随时给任何应聘者录取,但你如果在面试后没有马上给对方答复,他就从此消失,去其他地方工作了。你怎么才能保证:你正在面试的这个应聘者是最好的选择呢?


万能的算法给出答案:37%。你需要给自己设定一个招聘总时间,前37%的时间里只面试,收集数据不做决定,之后只要碰到一个比之前所有应聘者都优秀的人,马上下录取通知,你能得到最好应聘者的机率是37%。这是你能获得的最好效果。


乍听起来,37%成功率是一个很低的数字。但这个算法可适用于任何大数据。如果你有100个应聘者,你能获得最好雇员的机率其实只有1%;而如果你有100万应聘者,你的机率只剩百万分之一。在这种情况,37%成功率已经是一个非常好的数字了。当然,为了达到这个成功率,你也需要为搜集之前37%的数据而付出相应的时间精力。


书读到这里,我马上打电话给正在太浩湖开心滑雪的马克,让他迅速回家看房子。我们只有6个月时间买房,假设市场上的房子数量均匀每周放出(虽然并不完全如此但也差不太多),37%的时间是两个月多一点。当时已经过去一个月了,拖延症患者马克还乐天派地说“我们还有时间”。但被太太吼了一通,又科普了一下“37%算法”之后,他还是回家乖乖看房了。


▲就是这个房子啦


接下来的事情是这样的:我们建了个数据库,其中有我们两个多月里看过的30几个房子,大到户型地址,小到我喜不喜欢附带的洗衣机牌子,事无巨细都整理了出来。一个多月后,我们进入了37%阶段,迅速开始做决定。只过了三周,我们就竞价得到了一个心仪的房子。这还要感谢“秘书算法”!


如果“秘书算法”可以用来应聘员工和找房子,是不是可以用来解决一些人生更大的问题,比如,找对象?


本书作者Brian Christian曾经在初恋里无比困惑。在上大学时,他还保持着和高中小女友的异地恋,但他无法避免自己的心灵拷问:这段初恋感情究竟质量怎样?他没有前女友可以做对比,也没有足够证据判断自己的初恋质量。Brian困惑地去找辅导员讨论。见惯不惯的辅导员告诉他:你要先搜集数据。只有你有了足够的恋爱经验,见过各种各样的人,你才能决定这段感情是否是最好的。


但究竟要谈过多少恋爱,才能确定你找到最好的人?过尽千帆也可能皆不是,蓦然回首也可能发现最好的人已经消失在人海。无数痴男怨女唱着后来我总算学会了如何去爱,有些人一旦错过就不再。在人工智能无所不能的今天,算法能不能用来拯救一下在痛苦爱情中挣扎的人类?37%是不是一个寻找对象的黄金数字?


卡内基梅隆大学的计算机教授Michael Trick在读研究生时就考虑了这个问题。作为一个聪明优秀又希望找到女朋友的年轻数学博士生,他发现这个恋爱问题其实就是一个“秘书问题”。他的计算是这样的:假设从18岁到40岁都是找对象时间,37%时间点是26.1岁,而他正好在这个年龄点!他于是找到一位无论各方面他都觉得超出以往对象的姑娘,毫不犹豫地向她求婚。然而,他被拒绝了。


▲图片来源:Pixabay


在为爱悲伤之后,Trick重新研究“秘书算法”。他发现,找女朋友比买房子复杂多了。原“秘书算法”有一个巨大假设:你发出的聘书肯定会被对方接受。即使在我们加州湾区,买房一般也是价高者得,还有中介帮忙估价,只要志在必得,总能做出让对方接受的选择,模型差别并不大。但是女孩子啊,君心深似海,你永远不知道她想要的是什么,特别对于钢铁直男数学博士码农群体而言。


Trick于是修正了算法,他发现如果修正下前提,把对方接受概率改为50%,那么你只有25%时间收集数据,而成功率也从37%降为25%。然而最不幸的是:他发现他自己已经太晚了,25%数据收集时间点已经是他的历史了。


且让我们看看著名天文学家开普勒如何处理这个找对象问题。1611年,开普勒妻子去世,他开始认真寻找再婚对象。在热心红娘们的帮助下,他最终确立了11个姑娘,逐一开始约会。但他约会到第四位姑娘时,他感觉找对人了,“我其实可以停止寻找了。”然而开普勒是一个骑驴找马的渣男。他并没有停止寻找,而是吊着四姑娘,继续按顺序与剩下7个姑娘逐一约会。他最终发现第五个姑娘更好,“我喜欢她的爱、忠诚、家世、勤劳,和她给继子们的爱。”他抛弃其他姑娘,向五姑娘求婚,余生婚姻幸福美满。


开普勒在“秘书问题”中,超越了算法限制,顶着渣男的名声,采用了“不抛弃不放弃”的策略。在姑娘们依然愿意等待的算法前提下,阅尽千帆了解了所有数据再做选择,这当然是一种最佳策略。但请问数学男博士们,你们能做到让姑娘一直等着你吗?(女生们请擦亮双眼认清渣男!)


但如果在选择时必须勇往直前立刻放弃,等到千红过后再次回头,而对象有50%机率不计前嫌重修旧好,应该什么时候开始做选择呢?万能的算法告诉我们:你可以花61%的时间搜集数据,然后在前61%的最佳选择与之后每次碰到的最佳选择中选最优选,你得到最佳伴侣的机率——也是61%。


(注意:此算法同样适用于女生。大龄姑娘不要放弃寻找真爱!)


我们的数学博士Trick最后也觅得真爱。在求婚被拒后,他继续不停寻找,直到8年后他找到了一位德国姑娘接受了求婚。《Algorithms to live by》一书忠实地记录了他的恋爱故事,推荐给各位单身狗朋友阅读。


以上文章写于2016年。现在我家娃桃子都已经1岁半了,我的闺蜜群里从讨论爱情到讨论买房,现在又进入讨论抢幼儿园的状态中。当我的女博士闺蜜们抱怨天天参观幼儿园又不知如何选择时,我突然又想到了秘书算法。


湾区幼儿园也是极为抢手的。基本所有妈妈们都要经历这么一个心路历程:面对众多纷繁特色的幼儿园无从下手,看着心仪的幼儿园就觉得非君不可;再发现好幼儿园一早已经爆满,孩子面临无学可上需要在家缠妈妈的噩运,一下进入恐慌状态,祈祷只要孩子有学上就可以了;但再看到那些无人问津的幼儿园,实在下不了手,母爱爆棚宁可在家辞职带娃。怎样才能保证找到一个好幼儿园?是37%,25%,还是61%?



比起找房子和找对象,找幼儿园有一个根本的区别。房子和对象都是一对一的选择,在某一个时间点,这个对象和房子只能有你这么一个唯一的顾客。但幼儿园不一样,每一个幼儿园都有几十上百个孩子。在互联网时代,这些孩子的家长们在点评网、社交媒体、微信群上不停评价幼儿园。你可能很难去找男朋友的前女友了解他的恋爱表现,但你可以轻易从家长群里了解幼儿园的质量。


《Algorithms to live by》一书里解释,这在“秘书算法”里表示对选择对象有了解信息。就好比你给所有应聘者举行考试,并得到全体应聘者的平均分,而你只在平均分数线以上的应聘者中选择秘书。这显然大大增加了你得到最好秘书的成功率。算法表明,你的成功率可以直接从37%变成58%:你有58%的机率获得最好的秘书。


事实上这也许也可以用于找对象。爱情不可量化,但金钱总是可以的。如果你的目标是找到一个收入在平均工资以上的对象,在打听对方收入时做好尽职调查工作(这大概比找前女友质问要容易一些),那你获得最好对象的概率就从37%增加到58%了!真爱难得,金钱易觅,人世间最痛苦的事情莫过于此。


当我给女博士闺蜜科普完58%算法之后,她恍然大悟地逛遍了所有本地幼儿园,列了个极其详尽的数据库,简直比她的博士论文还要叹为观止。她的宝宝最后进入了一个非常好的幼儿园,快乐地开始了新生活。



至于我怎么给桃子找幼儿园的?当然是直接把女博士闺蜜的数据库拿过来用啦!书中自有黄金屋,书中自有颜如玉,书中还有幼儿园。祝大家愉快地在生活中使用算法,都过上幸福的人生。


本文来自微信公众号:伊甸园的桃子(ID:PeachAtEden),作者:fujiaa,牛津大学博士,科技创业者,科学松鼠会会员,科普作者。家有一女小桃子。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP