Image by Medium
举个例子,为了研究一个群体的某种特征,我们往往需要抽样,然后研究抽样样本的数据,反过来再猜想某种群体是否有相似的关联或特征。但是,由样本数据得出的结论可能会出现两种情况:
样本数据中显示出了某种关联性,群体之中确实有这种关联性
样本数据中显示出了某种关联性,群体之中 并没有这种关联性
样本数据中显示出了某种关联性,群体之中确实有这种关联性
样本数据中显示出了某种关联性,群体之中 并没有这种关联性
如果出现了第二种情况,我们一般认为是“样本偏差”(Sampling Error)导致的。零假设检验就是来帮助研究者辨别到底样本数据反应的关联性能否应用在实际对象身上——判断上面情形1出现了,还是2出现了。
零假设代表的是出现了第二类情形,也就是在群体之中并没有关联,但是在样本中出现了某种数据关联。通俗点说,就是调查选取的对象出现的某种相关性是“偶然的”。
Image by ThoughtCo
拿疑似作弊棋手的行为举例:
如果这个棋手的各种数据和行为呈现出了和引擎选择的某种关联是偶然的,也就意味着他没作弊——属于零假设的情况。
另外一种情况,就是这个棋手确实作弊了,那么我们叫做“替代假设”(Alternative hypothesis)——他个人在某局中出现的和引擎一致的行为是“必然的”。
有了这两个假设之后,我们就可以通过“零假设检验”判断这个棋手到底有没有作弊了。
检验逻辑如下:
假设零假设情况成立(某位棋手没作弊)
判断样本的数据关联程度(类比于看棋手和引擎的相似度)
如果样本呈现出了极低的相关性,则推翻零假设——即该棋手作弊了
如果样本没有呈现出极低的相关性,则保留零假设——即该棋手没作弊
假设零假设情况成立(某位棋手没作弊)
判断样本的数据关联程度(类比于看棋手和引擎的相似度)
如果样本呈现出了极低的相关性,则推翻零假设——即该棋手作弊了
如果样本没有呈现出极低的相关性,则保留零假设——即该棋手没作弊
在这个检验逻辑之中最重要的就是计算在零假设条件成立的情况下,判断样本棋手的数据相关性发生的概率,也就是Idog作者提出的P值。
在零假设检验之中,如果P值低于5%,那么零假设被推翻——棋手作弊;如果P值高于5%,则“不能推翻零假设”——不能判定棋手作弊。
Image by data-flair
Idog给出的P值计算方法是参考棋手可用的引擎数X,棋手在K步棋内选择的最优解步数D以及在K步棋内棋手可选的总步数N。
公式如下:
(d_1)/(n_1) * (d_2)/(n_2) * (d_3)/(n_3) *...* (d_k)/(n_k)
p* = minimum p over all chess engine X, all subsequences y.
当然,运用零假设检验的方法需要样本容量足够丰富,同时还要考虑到数据关联的强弱程度问题。
*关联程度强弱和样本容量的关系
table by opentextbc.ca
此外,这位作者的检验方法也有待确认,比如是否涉及的变量足够丰富、优选步数和总步数的比值是否有参考性等等。但不管怎么说,用科学的方法解决生活中出现难题的态度绝对是值得肯定的,也许在不久的将来,国象网赛的作弊高手就被这样一种检验方法彻底击溃了。
完
喜欢就点“在看“吧返回搜狐,查看更多
