库里吧 关注:413,223贴子:5,162,064
  • 4回复贴,共1

关于库里的三分。。随便玩弄些数据

取消只看楼主收藏回复

数据来源是2012-2013赛季的78场库里上场的常规赛。
图一:每场三分命中数与PER值的相关性

PER值,就是霍林格的那个计算球员每场表现的数值。这张表里关键数据是B18里面的3.083729,即两数据的相关性,其他基本上可以忽略。数据显示没有任何蹊跷的地方,每多命中一个三分,PER增加3.083729,差不多就是3,符合计算方式。
说明什么呢?说明库里三分命中数和他其他方面的表现没有很明显的影响。如果当库里三分中的多的时候,他的其他表现被明显拖累,比如助攻少篮板少失误多,那么这个值会明显小于3;如果当库里三分中的多的时候,助攻篮板罚球等数据也容易爆发,那么这个值将会明显大于3。
库里三分球命中数与他的其他方面表现没有明显影响,这个结论对后续具体的数据分析有用,是个适合后续分析的前提。


1楼2013-07-09 18:02回复
    图二:每场三分命中数与胜负结果的相关性

    同样,相关性数据见B18,为-0.01068。也就是库里每命中一个三分,球队这场比赛获胜的可能性下降百分之1.068。
    进三分了,反而胜率下降了?数据结果不符合预期。这里数据结果不符合预期的原因可能有以下两种:1. 事实的确如此(囧。。) 2. 数据过于简单粗暴。
    没错,数据过于简单粗暴。就像我的观点经常简单粗暴一样,居然选取了胜或负这样武断的虚拟变量,胜利为1,失败为0。虚拟变量在数据统计中的最大缺点就是过于武断,准确性不够,如果有很多变量的话,其中混入虚拟变量,那效果还是不错的,而完全依赖虚拟变量,结果的准确性就非常不靠谱了。


    7楼2013-07-09 18:13
    回复
      刚才那位删自己回复的吧友。。没事的。。插楼可以的。。我就随便说说。。


      8楼2013-07-09 18:13
      收起回复
        图三:每场三分命中数与胜负分的相关性

        既然胜负结果这种1或0的东西太过于简单粗暴,那就换个靠谱点的:胜负分。当105-98获胜的时候,胜负分为7;当86-88失利的时候,胜负分为-2,以此类推。
        同上面一样,B18为相关性:1.587915,也就是说,库里每投进一个三分,这场比赛最终的胜负分正增加1.587915。Bingo,这个结果就看上去合理多了。
        足够精确吗,否,虽然比上面用直接用胜负的虚拟数据要好,还有很多不妥的地方。最大的应该是:其余变量未统一。比如,X变量太少,即使寻求的数据只是库里的三分命中数,其他变量也是需要统一的。如何统一?即增加X变量,比如库里的其他数据,比如队友的PER等等,工作量比较大,以后有兴致的时候再弄。


        9楼2013-07-09 18:22
        回复
          OK。。数据玩弄完毕
          THE END


          10楼2013-07-09 18:22
          回复