预测,算命,心理学和大数据

abloz 2013-04-27
2013-04-27

周海汉/文

说到计划经济,给共产主义国家的人民留下了非常严重阴影。因为政府的大手实际上无法真正预测掌控一切。

计划委员会的官员也不过是人,不是神。一旦所计划的事情庞杂到一个国家,基本上很多情况下只能瞎扯蛋了。即使一个人对自己的规划,其实也是很难做到的。何况还要规划别人的事情。

但是人类对未来预测能力的确比以前强了很多,因为人类现在有了计算机,有了网络,对数据的分析掌控能力今非昔比。现在为什么大家对大数据如此关注,因为大数据里有大价值。人类建立在网络和大数据分析的基础上的预测,是完全可能的。

最近在学习统计学,心理学,顺便学习玄学。我们来玩个游戏。

我摆个八卦,你心里默想你的出生日期,属相星座,以及你是什么人,然后我可以预测出来你是什么样的,比你想的还准确。

下面是我预测你的性格的话(选中显示):

你很需要别人喜欢并尊重你。你有自我批判的倾向。你有许多可以成为你优势的能力没有发挥出来,同时你也有一些缺点,不过你一般可以克服它们。你与异性交往有些困难,尽管外表上显得很从容,其实你内心焦虑不安。你有时怀疑自己所做的决定或所做的事是否正确。你喜欢生活有些变化,厌恶被人限制。你以自己能独立思考而自豪,别人的建议假如没有充分的证据你不会接受。你认为在别人眼前过于坦率地表露自己是不明智的。你有时外向、亲切、好交际,而有时则内向、谨慎、缄默沉静。你的有些抱负往往很不现实。

很准吧?

这在心理学上叫巴纳姆效应(  Barnum effect )。

虽然对于彩票摸奖的预测比较扯谈,但基于统计的预测在很多地方都有应用。比如语音识别,机器翻译,人工智能。

以前人们对于语音识别,机器学习,认为计算机必须理解语义才能识别、翻译和学习。但实践发现,其实基于统计的模型能更准确完成任务。比如你说“中”的时候,后面可能是“国”,也可能是“间”等。那如果统计发现“中国”概率更高,则在此基础上去做分析,准确度大增。这就像你一张嘴,机器已经知道你下一句要说什么一样。你可以不遵循语法语义来说话,但你必须遵循统计概率来说话,否则即使是活人也无法理解你说什么。

而心理学研究发现,对一个人进行心理人格测试的结果,与大多数人测试结果共同点汇总比较,这个人可能会将大多数人的性格特点更像自己。这也是算命有时感觉很准的原因之一。

预言家的确很神奇。但基于统计总结出来的规律是可以预言很多事情的。比如用数据挖掘分类技术,是可以预测一个人的行为的;用线性回归或非线性回归拟合的曲线,也是完全能预估遵循该规律的事件发生的可能性的。

这也是中国移动,银行,民航等大公司需要花大价钱请IBM,Teradata,EMC,SAS等有大数据挖掘处理能力的咨询公司进行数据分析,以便准确做出决策的原因。

现在开源的Apache Hadoop生态系统,让有技术能力的公司都可以拥有大数据的分析处理能力,让大数据分析处理不再被少数公司垄断,而进入中等企业中。“旧时王谢堂前燕,飞入寻常百姓家”,正是这一现状的写照。

那么大数据处理能否有能力分析整个世界的数据呢?

美国在2001年遭受911恐怖袭击后,布什政府曾提出一项计划叫TIA(Total Information Awareness),就是挖掘所有能获得的数据,包括信用卡记录,旅馆住宿记录,旅行记录等,以发现跟踪恐怖活动。但该计划被国会毙了。除了对于个人隐私的担忧,还有技术上是否可行的问题。将所有人当成嫌犯的后果,会遭遇邦弗朗尼原理(Bonferroni’s Principle),导致过大的结果集,所以和没有挖掘差不多。

如果预言和算命能够准的话,其立论点是不一样的。命能算是因为相信命由天注定。不过,如果采用统计技术,基于大数据,那么对一个成年人算命是不是比生辰八字属相星座会更准确呢?


如非注明转载, 均为原创. 本站遵循知识共享CC协议,转载请注明来源