当贝叶斯遇上NBA:用数学重新定义球员价值——《一种基于贝叶斯分层模型的新型NBA球员指标》深度解读前置概念科普:读懂这篇论文,你需要知道这些词
在进入正文前,我们先给“篮球迷”和“数学小白”们补补课。这篇论文里藏了不少专业术语,但别怕,我们用“说人话”的方式一一拆解:
术语
通俗解释
论文中的作用
贝叶斯统计
一种“根据新信息不断更新判断”的统计方法。比如你猜硬币正面概率,先假设50%,扔了10次有8次正面,就会调整为更接近80%
用于构建模型,结合数据不断优化对球员/球队投篮特征的判断
分层模型
把问题分成“多层”的模型。比如分析球员时,先分团队层(球队整体风格),再分球员层(个人习惯),层层关联
同时考虑球队和球员的投篮特征,避免单一层次分析的片面性
PER(球员效率值)
传统球员评估指标,综合得分、篮板、助攻等数据,按分钟计算
论文中作为对比对象,因“难以解释”被指出局限
BPM(真实正负值)
另一种传统指标,衡量球员每100回合比平均球员多贡献的分数
论文中作为对比对象,因依赖“模糊的球员位置定义”被质疑
预期得分(EP)
基于投篮选择和命中率,预测球队在固定投篮次数下的得分
团队层面的新指标,用于跨球队/赛季公平比较
平均水平以上预期得分(EPAA)
衡量球员比“平均球员”多贡献的预期得分
球员层面的核心新指标,体现个人独特价值
后验预测分布
用模型算出来的“未来可能结果的概率范围”。比如预测某队得分,不是一个确定值,而是“有95%概率在100-110分之间”
用于计算EP和EPAA,体现结果的不确定性
Gibbs抽样
一种从复杂概率分布中“抽样本”的算法。就像从装满彩色球的黑箱里,一次次抽球来推测箱内球的颜色比例
用于求解贝叶斯模型的参数,得到后验分布
术语
通俗解释
论文中的作用
一、引言:为什么我们需要给NBA球员“重新打分”?体育分析的三大终极目标
论文一开篇就点明:体育分析研究有三个核心目标——评估个人影响、提高胜率、量化比赛组件。这三者相辅相成:比如搞清楚“谁是最有价值的球员”(评估个人影响),就能帮球队调整战术(提高胜率),而这个过程又能让我们更懂“篮球赢球的关键是什么”(量化比赛组件)。
传统指标的“坑”:得分多≠价值高
过去,人们总觉得“得分高的球员就是最好的”,但这显然不对。比如一个球员得分多,可能是因为队友太强(给他创造了很多机会),而不是他自己厉害。后来人们改用“投篮命中率”(命中数/投篮数),但这又掉进了“小样本陷阱”——比如某球员只投了2个球全中,命中率100%,但显然不能说他比投100个中50个的球员强。
再看两个主流指标:
PER(球员效率值):虽然综合了得分、篮板、助攻等数据,还按分钟计算(避免“上场时间少”的干扰),但最大问题是“看不懂”——你说一个球员PER是25,这到底意味着什么?没人能说清。
BPM(真实正负值):比PER好懂,单位是“分”,代表球员每100回合比平均球员多拿多少分。但它依赖“球员位置”(比如中锋和后卫的标准不同),而现在NBA流行“无位置篮球”,位置定义越来越模糊,这指标就不准了。
PER(球员效率值):虽然综合了得分、篮板、助攻等数据,还按分钟计算(避免“上场时间少”的干扰),但最大问题是“看不懂”——你说一个球员PER是25,这到底意味着什么?没人能说清。
BPM(真实正负值):比PER好懂,单位是“分”,代表球员每100回合比平均球员多拿多少分。但它依赖“球员位置”(比如中锋和后卫的标准不同),而现在NBA流行“无位置篮球”,位置定义越来越模糊,这指标就不准了。
论文作者们盯上了棒球的“平均以上得分(Runs Above Average)”指标——衡量球员比平均水平多贡献多少分。他们把这个思路搬到篮球,提出了两个新指标:
团队层面:预期得分(EP):预测一支球队在固定投篮次数下能得多少分,排除“投篮总数不同”的干扰,公平比较不同球队。
球员层面:平均水平以上预期得分(EPAA):如果把一个球员放到“平均水平的球队”里,他比“平均水平的球员”能多拿多少分?这直接体现了球员的独特价值。
团队层面:预期得分(EP):预测一支球队在固定投篮次数下能得多少分,排除“投篮总数不同”的干扰,公平比较不同球队。
球员层面:平均水平以上预期得分(EPAA):如果把一个球员放到“平均水平的球队”里,他比“平均水平的球员”能多拿多少分?这直接体现了球员的独特价值。
而支撑这两个指标的“黑科技”,就是贝叶斯分层模型。简单说,就是先把球队和球员按“投篮习惯”(比如爱投三分还是中距离)和“命中率”分组,再通过数学模型计算他们的“预期表现”。
二、数据:260万次投篮背后的故事
要做分析,先得有数据。论文用了一个叫nbastatR的R语言工具包(可以理解为“NBA数据挖掘机”),扒了2008-2009到2020-21赛季的所有常规赛数据,足足260多万次投篮!
这些数据里藏着什么?
每次投篮的位置:既有(x,y)坐标,也有“区域标签”(比如“禁区”“左底角三分”);
结果:进了还是没进;
谁投的、哪个队的。
每次投篮的位置:既有(x,y)坐标,也有“区域标签”(比如“禁区”“左底角三分”);
结果:进了还是没进;
谁投的、哪个队的。
为了分析投篮特征,作者把篮球场的进攻半场划成了7个区域(图2),每个区域的得分值不同:
三分区:弧顶三分(ATB)、左底角三分(LC3)、右底角三分(RC3)——每个进球得3分;
两分区:禁区(ITP)、中距离(MID)、限制区(RA)——每个进球得2分;
罚球线(FT)——每个进球得1分。
三分区:弧顶三分(ATB)、左底角三分(LC3)、右底角三分(RC3)——每个进球得3分;
两分区:禁区(ITP)、中距离(MID)、限制区(RA)——每个进球得2分;
罚球线(FT)——每个进球得1分。
(图2解读:论文里的图2用不同颜色标出了这7个区域,红色是弧顶三分,绿色是左底角三分,黄色是右底角三分,蓝色是禁区,紫色是中距离,橙色是限制区,罚球线是分隔禁区和中距离的横线。记住这个分区很重要,后面所有分析都基于它!)
13年数据揭示的NBA大趋势
作者统计了这13年里,全联盟在7个区域的投篮次数和命中率(图3),发现了两个很有意思的变化:
中距离投篮(MID)越来越少:2012-13赛季后,球队开始疯狂减少中距离投篮,转而投更多弧顶三分(ATB)。这和我们看球的感受一致——现在NBA球队恨不得每个球都扔三分!
限制区(RA)命中率悄悄上涨:虽然三分投得多了,但禁区附近的命中率反而慢慢提高,说明球队在“冲筐”和“三分”之间找到了平衡。
中距离投篮(MID)越来越少:2012-13赛季后,球队开始疯狂减少中距离投篮,转而投更多弧顶三分(ATB)。这和我们看球的感受一致——现在NBA球队恨不得每个球都扔三分!
限制区(RA)命中率悄悄上涨:虽然三分投得多了,但禁区附近的命中率反而慢慢提高,说明球队在“冲筐”和“三分”之间找到了平衡。
(图3解读:图3上半部分是各区域投篮次数随赛季的变化,中距离(紫色线)一路下降,弧顶三分(红色线)一路上升;下半部分是命中率变化,限制区(橙色线)有轻微上升,其他区域相对稳定。另外,2011-12赛季投篮次数骤降,因为那年NBA停摆,赛季只打了66场;2019-20和2020-21赛季也因疫情缩短了。)
三、核心模型:贝叶斯分层模型是怎么“给球员贴标签”的?
这部分是论文的“硬核”,但我们可以用“给学生分班”来类比:假设你是老师,想按“学习习惯”(比如爱做难题还是简单题)和“正确率”给学生分班,贝叶斯分层模型就像一个智能分班系统——先猜几个班(比如“学霸班”“中等班”),再根据学生的答题数据,不断调整每个班的“特征”(比如学霸班做难题的比例高、正确率高),最后确定每个学生属于哪个班。
模型的“两层结构”:先分球队,再分球员
论文的模型分“团队层”和“球员层”,逻辑差不多,我们先以团队为例讲:
给球队分“投篮选择班”和“命中率班”
每个球队有两个“隐藏标签”:w_i(投篮选择 cluster)和z_i(命中率 cluster)。w_i决定“这个球队爱在哪些区域投篮”,z_i决定“这个球队在每个区域的命中率有多高”。
比如“投篮选择班1”可能是“三分大队”(投三分的概率高),“命中率班A”可能是“禁区杀手”(禁区命中率高)。
用概率分布描述“班级特征”
对于“投篮选择班”:用Multinomial分布(多项分布)描述“在7个区域投多少球”。比如“三分大队”在弧顶三分(ATB)的投篮概率p_w^k会很高。
对于“命中率班”:用Binomial分布(二项分布)描述“每个区域投中的概率”。比如“禁区杀手”在限制区(RA)的命中率q_z^k会很高。
贝叶斯的“先猜后调”
一开始,模型会对“班级特征”做个初始猜测(叫“先验分布”)。比如假设每个区域的投篮概率差不多(用Dirichlet先验),命中率在0-1之间均匀分布(用Beta(1,1)先验)。
然后用Gibbs抽样(一种算法),根据真实投篮数据不断调整猜测:比如发现某球队投了很多三分且命中率高,就把它分到“三分准班”,同时更新这个班的“三分概率”和“命中率”。
给球队分“投篮选择班”和“命中率班”
每个球队有两个“隐藏标签”:w_i(投篮选择 cluster)和z_i(命中率 cluster)。w_i决定“这个球队爱在哪些区域投篮”,z_i决定“这个球队在每个区域的命中率有多高”。
比如“投篮选择班1”可能是“三分大队”(投三分的概率高),“命中率班A”可能是“禁区杀手”(禁区命中率高)。
每个球队有两个“隐藏标签”:w_i(投篮选择 cluster)和z_i(命中率 cluster)。w_i决定“这个球队爱在哪些区域投篮”,z_i决定“这个球队在每个区域的命中率有多高”。
比如“投篮选择班1”可能是“三分大队”(投三分的概率高),“命中率班A”可能是“禁区杀手”(禁区命中率高)。
用概率分布描述“班级特征”
对于“投篮选择班”:用Multinomial分布(多项分布)描述“在7个区域投多少球”。比如“三分大队”在弧顶三分(ATB)的投篮概率p_w^k会很高。
对于“命中率班”:用Binomial分布(二项分布)描述“每个区域投中的概率”。比如“禁区杀手”在限制区(RA)的命中率q_z^k会很高。
对于“投篮选择班”:用Multinomial分布(多项分布)描述“在7个区域投多少球”。比如“三分大队”在弧顶三分(ATB)的投篮概率p_w^k会很高。
对于“命中率班”:用Binomial分布(二项分布)描述“每个区域投中的概率”。比如“禁区杀手”在限制区(RA)的命中率q_z^k会很高。
贝叶斯的“先猜后调”
一开始,模型会对“班级特征”做个初始猜测(叫“先验分布”)。比如假设每个区域的投篮概率差不多(用Dirichlet先验),命中率在0-1之间均匀分布(用Beta(1,1)先验)。
然后用Gibbs抽样(一种算法),根据真实投篮数据不断调整猜测:比如发现某球队投了很多三分且命中率高,就把它分到“三分准班”,同时更新这个班的“三分概率”和“命中率”。
一开始,模型会对“班级特征”做个初始猜测(叫“先验分布”)。比如假设每个区域的投篮概率差不多(用Dirichlet先验),命中率在0-1之间均匀分布(用Beta(1,1)先验)。
然后用Gibbs抽样(一种算法),根据真实投篮数据不断调整猜测:比如发现某球队投了很多三分且命中率高,就把它分到“三分准班”,同时更新这个班的“三分概率”和“命中率”。
(球员层面的模型和团队类似,只是分析对象从“球队”变成了“球员”,同样分“投篮选择班”和“命中率班”。)
从“分班”到“算分”:预期得分(EP)和EPAA怎么来的?
模型分好班后,就能计算核心指标了:
团队预期得分(EP):假设一支球队投N个球(论文里固定为8000个,接近2020-21赛季平均水平),根据它的“投篮选择班”和“命中率班”特征,预测它能得多少分。比如“三分大队+高命中率班”的EP肯定更高。
球员EPAA:想象一个“平均球队”(所有球队的平均水平),先算它投N个球的预期得分;再把球员X放到这个球队里,算新的预期得分;两者的差就是EPAA——正数越大,说明球员X比“平均球员”强越多。
团队预期得分(EP):假设一支球队投N个球(论文里固定为8000个,接近2020-21赛季平均水平),根据它的“投篮选择班”和“命中率班”特征,预测它能得多少分。比如“三分大队+高命中率班”的EP肯定更高。
球员EPAA:想象一个“平均球队”(所有球队的平均水平),先算它投N个球的预期得分;再把球员X放到这个球队里,算新的预期得分;两者的差就是EPAA——正数越大,说明球员X比“平均球员”强越多。
(图1解读:图1是整个计算流程的可视化。上半部分是球员分析:先聚类球员(左),得到每个球员的投篮特征(中),再和“平均球队”对比,算出EPAA(右)。下半部分是团队分析:先聚类球队(左),得到每个球队的预期得分(中),再平均得到“平均球队”的预期得分(右)。红色曲线就是球员X的预期得分分布,和平均球队(蓝色)的差就是EPAA。)
四、核心发现:新指标下,哪些球员和球队“封神”了?团队篇:2020-21赛季的“预期得分王”是谁?
作者用模型计算了2020-21赛季所有球队的预期得分(EP),前提是每支球队都投8000个球(联盟平均水平)。结果显示:
篮网队稳居第一:预期得分高达120分/场。这不难理解,当时篮网有杜兰特、哈登、欧文“三巨头”,都是得分机器,他们的投篮选择(比如大量三分和禁区冲击)和命中率都处于顶级水平。
快船、太阳、掘金紧随其后:这三支球队要么有伦纳德、乔治(快船),要么有布克、保罗(太阳),要么有约基奇(掘金),都是进攻体系完善的球队。
垫底的是尼克斯、雷霆等队:这些球队要么年轻球员多(如雷霆),要么战术体系偏向防守(如尼克斯),投篮效率自然偏低。
篮网队稳居第一:预期得分高达120分/场。这不难理解,当时篮网有杜兰特、哈登、欧文“三巨头”,都是得分机器,他们的投篮选择(比如大量三分和禁区冲击)和命中率都处于顶级水平。
快船、太阳、掘金紧随其后:这三支球队要么有伦纳德、乔治(快船),要么有布克、保罗(太阳),要么有约基奇(掘金),都是进攻体系完善的球队。
垫底的是尼克斯、雷霆等队:这些球队要么年轻球员多(如雷霆),要么战术体系偏向防守(如尼克斯),投篮效率自然偏低。
(图4解读:图4是各球队预期得分的 posterior 预测分布,横轴是“预期得分/场”,纵轴是球队名称。每个球队对应的“阴影区间”代表“有95%的概率得分在这个范围内”。篮网的区间整体最靠右,说明他们的进攻效率确实独一档;而魔术、骑士等队的区间偏左,进攻乏力。)
球员篇:EPAA告诉你谁是“被低估的王者”
作者重点分析了2020-21赛季“投篮次数前100名”的球员(高出手球员才有足够数据支撑分析),算出他们的EPAA,结果颠覆了不少人的认知:
库里登顶,约基奇紧随其后
斯蒂芬·库里的EPAA排名第一,这符合他“历史第一射手”的身份——他在三分线外的投篮选择(大量弧顶三分)和命中率都远超平均水平,能给“平均球队”带来巨大提升。而2021年的MVP约基奇排名第二,作为中锋,他不仅能在禁区高效得分,还能拉到外线投三分,这种“全能性”让他的EPAA极高。
“全明星遗珠”浮出水面
托拜厄斯·哈里斯(第4)、迈克尔·波特 Jr.(第5)、 Khris Middleton(第6)这三位球员,EPAA排名远超他们的知名度——他们没入选当年的全明星,但数据证明他们的进攻效率比很多全明星还高。这说明EPAA能帮我们发现那些“默默输出”的实力派。
(这一年,也是作者Max最喜欢的球星夺得总冠军的那年!)
库里登顶,约基奇紧随其后
斯蒂芬·库里的EPAA排名第一,这符合他“历史第一射手”的身份——他在三分线外的投篮选择(大量弧顶三分)和命中率都远超平均水平,能给“平均球队”带来巨大提升。而2021年的MVP约基奇排名第二,作为中锋,他不仅能在禁区高效得分,还能拉到外线投三分,这种“全能性”让他的EPAA极高。
“全明星遗珠”浮出水面
托拜厄斯·哈里斯(第4)、迈克尔·波特 Jr.(第5)、 Khris Middleton(第6)这三位球员,EPAA排名远超他们的知名度——他们没入选当年的全明星,但数据证明他们的进攻效率比很多全明星还高。这说明EPAA能帮我们发现那些“默默输出”的实力派。
(这一年,也是作者Max最喜欢的球星夺得总冠军的那年!)
(图5解读:图5是19名球员的EPAA posterior 分布,横轴是球员名字,纵轴是EPAA值。黑线是中位数(最可能的EPAA值),盒子是80%可信区间(有80%概率在这个范围), whiskers 是95%可信区间。库里的中位数最高,约基奇次之;标红的球员是未入选全明星的“遗珠”,他们的区间和全明星球员重叠甚至更高,说明被低估了。)
EPAA与“出手多少”无关
有人可能会说:“得分高是因为出手多啊!”但数据显示,EPAA和“球员占球队总出手的比例”几乎没关系(图6)。比如乔·哈里斯、邓肯·罗宾逊,他们出手不算多,但EPAA很高,说明他们“每一次出手都很值钱”——效率极高。
EPAA与“出手多少”无关
有人可能会说:“得分高是因为出手多啊!”但数据显示,EPAA和“球员占球队总出手的比例”几乎没关系(图6)。比如乔·哈里斯、邓肯·罗宾逊,他们出手不算多,但EPAA很高,说明他们“每一次出手都很值钱”——效率极高。
(图6解读:图6横轴是“球员占球队出手的比例”,纵轴是EPAA均值。点的大小代表EPAA的标准差(越大说明不确定性越高)。整体看,点分布很散,没有明显的上升或下降趋势,证明两者无关。左上角的点(如乔·哈里斯)就是“低出手、高贡献”的代表。)
跨赛季观察:10年顶级球员的“EPAA轨迹”
作者还分析了2010年代10位顶级球员(剔除了科比,因为他只打了3个完整赛季)的EPAA排名变化(图7),发现了很多故事:
库里和杜兰特“统治时代”:从2013年开始,两人的EPAA排名基本稳居前20,尤其库里,在2015年后多次进入前5,印证了“勇士王朝”的进攻威力。
诺维茨基“老而弥坚”:虽然2010年代他已过巅峰,但EPAA排名仍常年在前20,说明他的“金鸡独立”跳投在任何时代都高效。
威斯布鲁克“盛极而衰”:巅峰期(2016-18)EPAA排名很高,但后期明显下滑,这和他“效率下降”的观感一致。
库里和杜兰特“统治时代”:从2013年开始,两人的EPAA排名基本稳居前20,尤其库里,在2015年后多次进入前5,印证了“勇士王朝”的进攻威力。
诺维茨基“老而弥坚”:虽然2010年代他已过巅峰,但EPAA排名仍常年在前20,说明他的“金鸡独立”跳投在任何时代都高效。
威斯布鲁克“盛极而衰”:巅峰期(2016-18)EPAA排名很高,但后期明显下滑,这和他“效率下降”的观感一致。
(图7解读:图7横轴是赛季,纵轴是EPAA排名(1是最高)。每条线代表一个球员,库里和杜兰特的线整体靠下(排名高),诺维茨基的线波动小,威斯布鲁克的线先低后高(排名下降)。这张图像一部“球员效率史”,直观展现了他们的巅峰与低谷。)
与传统指标的“大比拼”:EPAA到底新在哪里?
论文把EPAA和PER、BPM做了对比(图8),发现:
EPAA与PER的相关系数只有0.246,与BPM也只有0.238——几乎没什么关系!
而PER和BPM的相关系数高达0.915,说明它们本质上在衡量“差不多的东西”。
EPAA与PER的相关系数只有0.246,与BPM也只有0.238——几乎没什么关系!
而PER和BPM的相关系数高达0.915,说明它们本质上在衡量“差不多的东西”。
这意味着EPAA捕捉到了传统指标没发现的“隐藏价值”。比如有些球员PER不高,但EPAA很高,可能是因为他们擅长“在关键时刻投高效球”,而这种能力被传统指标忽略了。
(图8解读:左图是EPAA vs BPM,右图是EPAA vs PER。每个点代表一个球员,点的分布很散,没有明显的直线趋势,说明相关性低。而如果把PER和BPM画在一起,点会紧密围绕一条直线,证明它们高度相关。)
五、实用工具:Shiny应用——让你也能当“NBA分析师”
为了让普通球迷和球队管理层都能用这个新指标,作者开发了一个免费的Shiny网页应用(类似“NBA数据可视化工具”),地址是:https://ryan-elmore.shinyapps.io/NBA-EPAA/ 。
这个应用能做什么?
对比球员EPAA:选4个球员和1个赛季,就能看到他们的EPAA分布(像图5那样),直观看出谁更强。
查看球员排名表:所有计算过EPAA的球员都按得分排序,还能下载原始数据。
球队投篮趋势分析:看某支球队在7个区域的投篮次数和命中率随赛季的变化(类似图3)。
球员EPAA时间线:选4个球员,看他们多年来的EPAA变化(类似图7)。
对比球员EPAA:选4个球员和1个赛季,就能看到他们的EPAA分布(像图5那样),直观看出谁更强。
查看球员排名表:所有计算过EPAA的球员都按得分排序,还能下载原始数据。
球队投篮趋势分析:看某支球队在7个区域的投篮次数和命中率随赛季的变化(类似图3)。
球员EPAA时间线:选4个球员,看他们多年来的EPAA变化(类似图7)。
(图9解读:图9是应用的截图,展示了2020-21赛季詹姆斯、字母哥、库里、威斯布鲁克的EPAA密度图。库里的曲线最靠右,说明他的EPAA最高;威斯布鲁克的曲线偏左,且比较“胖”(标准差大),说明他的效率波动大。)
六、结论与展望:这个新指标能改变NBA吗?研究贡献:三大目标全达标
论文的新指标EP和EPAA完美契合了体育分析的三大目标:
评估个人影响:EPAA直接告诉我们“这个球员比平均水平强多少”;
提高胜率:球队可以用它找到“性价比高”的球员,优化阵容;
量化比赛组件:通过分析投篮区域和效率,搞懂“赢球的关键是三分还是禁区”。
评估个人影响:EPAA直接告诉我们“这个球员比平均水平强多少”;
提高胜率:球队可以用它找到“性价比高”的球员,优化阵容;
量化比赛组件:通过分析投篮区域和效率,搞懂“赢球的关键是三分还是禁区”。
忽略“团队协作”:篮球是5个人的运动,一个球员的表现可能受队友影响(比如库里的三分准,可能因为队友吸引了防守),但EPAA没考虑这一点。
“平均球队”是虚构的:现实中没有“平均球队”,所以EPAA的结果是“理论值”,和实际比赛可能有偏差。
聚类数量固定:模型里的“投篮选择班”和“命中率班”数量(各20个)是人为设定的,可能不是最优解。
忽略“团队协作”:篮球是5个人的运动,一个球员的表现可能受队友影响(比如库里的三分准,可能因为队友吸引了防守),但EPAA没考虑这一点。
“平均球队”是虚构的:现实中没有“平均球队”,所以EPAA的结果是“理论值”,和实际比赛可能有偏差。
聚类数量固定:模型里的“投篮选择班”和“命中率班”数量(各20个)是人为设定的,可能不是最优解。
作者认为这个方法可以扩展到其他体育:
NFL(美式足球):给四分卫算“平均以上传球码数”;
足球:分析球队的“射门区域效率”;
冰球:评估球员的“射门得分贡献”。
NFL(美式足球):给四分卫算“平均以上传球码数”;
足球:分析球队的“射门区域效率”;
冰球:评估球员的“射门得分贡献”。
甚至可以用更 advanced 的模型(比如“稀疏有限混合模型”)自动确定“最佳聚类数量”,让结果更精准。
七、预期得分(EP)与平均水平以上预期得分(EPAA)的深层逻辑
在理解了模型的基本框架后,我们需要进一步拆解两个核心指标——预期得分(EP)和平均水平以上预期得分(EPAA)的计算逻辑。这两个指标并非简单的“数据汇总”,而是基于贝叶斯后验预测分布的“概率性评估”,这也是它们与传统指标最本质的区别。
预期得分(EP):如何“公平比较”不同球队?
传统上比较球队得分时,我们会直接看“场均得分”,但这忽略了一个关键因素:不同球队的投篮总数不同。一支场均投100次篮的球队,得分自然可能比投80次的球队高,但这未必说明前者更高效。
EP的解决思路是:固定投篮总数,预测球队能得多少分。论文中选择了8000次投篮(约为2020-21赛季各队的平均投篮总数)作为基准,通过模型计算每支球队在这一固定次数下的“预期得分分布”(不是一个确定值,而是一系列可能的得分及概率)。
具体计算步骤如下:
从球队的后验分布中抽样,得到其“投篮选择cluster”和“命中率cluster”的概率;
根据cluster特征,用Multinomial分布模拟8000次投篮在7个区域的分配(比如三分区占40%,禁区占30%等);
对每个区域,用Binomial分布模拟“命中次数”(比如三分区命中率35%,则2000次投篮命中700次);
按区域得分值(3分、2分、1分)计算总得分,重复多次得到“预期得分分布”。
从球队的后验分布中抽样,得到其“投篮选择cluster”和“命中率cluster”的概率;
根据cluster特征,用Multinomial分布模拟8000次投篮在7个区域的分配(比如三分区占40%,禁区占30%等);
对每个区域,用Binomial分布模拟“命中次数”(比如三分区命中率35%,则2000次投篮命中700次);
按区域得分值(3分、2分、1分)计算总得分,重复多次得到“预期得分分布”。
这种方法的优势在于:差异只来自投篮效率(选择+命中率),与投篮总数无关。比如2020-21赛季篮网队的EP高达120分/场,不是因为他们投得多,而是因为他们在“投哪里”和“投得准”这两方面都优于联盟平均水平。
平均水平以上预期得分(EPAA):如何衡量球员的“独特价值”?
EPAA的核心思想是:如果把球员X放到一支“平均水平的球队”里,他能比“平均球员”多拿多少分?计算过程分三步:
构建“平均球队”:不是简单取所有球队的平均值,而是通过团队模型的后验分布,随机抽样生成一支具有“联盟平均投篮特征”的球队(比如三分占比、各区域命中率都是联盟中间值);
模拟球员X在平均球队的得分:假设球员X出手N次(论文中用其实际赛季出手数),根据他的“投篮选择cluster”和“命中率cluster”,模拟他在平均球队中的得分分布;
计算差值:用球员X的得分分布减去“平均球员”(平均球队中随机球员)的得分分布,取两者的均值差,即为EPAA。
构建“平均球队”:不是简单取所有球队的平均值,而是通过团队模型的后验分布,随机抽样生成一支具有“联盟平均投篮特征”的球队(比如三分占比、各区域命中率都是联盟中间值);
模拟球员X在平均球队的得分:假设球员X出手N次(论文中用其实际赛季出手数),根据他的“投篮选择cluster”和“命中率cluster”,模拟他在平均球队中的得分分布;
计算差值:用球员X的得分分布减去“平均球员”(平均球队中随机球员)的得分分布,取两者的均值差,即为EPAA。
举个例子:库里的EPAA高,是因为当他在“平均球队”中投同样多的球时,他的三分选择(多投弧顶三分)和命中率(远超平均)会让球队比用“平均球员”多得更多分。这种“增量价值”正是EPAA想要捕捉的。
这里有个关键细节:EPAA不依赖球员所在的真实球队。哪怕一个球员在弱队,只要他的投篮效率高,EPAA也会很高,这避免了“队友强则数据好”的偏差。比如2020-21赛季的迈克尔·波特Jr.,所在的掘金队并非顶级进攻强队,但他的EPAA排名第5,说明他的个人投篮能力本身就很突出。
八、模型参数与稳健性:为什么选择20个cluster?
论文中设定了一些关键参数,比如将“投篮选择cluster”(L)和“命中率cluster”(J)的数量都定为20,还设置了先验参数α=β=γ=5。这些参数不是拍脑袋定的,而是经过“敏感性分析”验证的,目的是确保模型结果的稳健性。
为什么是20个cluster?
cluster数量太少,会导致“分类太粗”(比如把风格迥异的球队归为一类);数量太多,又会“过拟合”(每个cluster只有几支球队,失去代表性)。作者测试了10、20、30三个数量,发现:
当L和J超过20后,EP和EPAA的结果变化很小(预期得分波动在1分以内,EPAA波动在0.5分以内);
20个cluster既能区分不同风格(比如“三分大队”和“禁区大队”),又不会让每个cluster的样本量太小。
当L和J超过20后,EP和EPAA的结果变化很小(预期得分波动在1分以内,EPAA波动在0.5分以内);
20个cluster既能区分不同风格(比如“三分大队”和“禁区大队”),又不会让每个cluster的样本量太小。
这就像给衣服分类:分“上衣、裤子”(2类)太粗,分“红色T恤、蓝色牛仔裤”(100类)太细,20类左右刚好能平衡“区分度”和“代表性”。
先验参数的作用
模型中的先验分布(如Dirichlet(α,α)、Beta(1,1))是为了“引导”模型的初始猜测。作者测试了不同的α、β、γ值(比如1、5、10),发现结果差异很小,说明模型对这些参数“不敏感”——即使初始猜测略有不同,最终也会收敛到相似的结果。
这种“稳健性”很重要,它说明模型的结论不是“靠参数调出来的”,而是基于数据本身的规律。
九、与其他研究的对话:这篇论文的“学术定位”
任何新研究都不是孤立的,这篇论文也回应了此前体育分析领域的争议和空白:
弥补传统指标的“语境缺失”
此前Deshpande和Jensen(2016)指出,PER、BPM等指标忽略了“比赛语境”(如比分胶着时的表现)。EPAA虽然没直接纳入“高杠杆时刻”,但通过“平均球队”假设,间接控制了“队友水平”“对手强度”等语境因素,比传统指标更公平。
超越“坐标级分析”,聚焦“区域价值”
有些研究(如Jiao等2021)用精确的(x,y)坐标分析投篮,但忽略了“区域得分差异”(比如同样是2米外的投篮,三分线外得3分,线内得2分)。本文的7区域划分,更贴合篮球规则的“得分逻辑”。
从“聚类结果”到“价值量化”
此前的聚类研究(如Hu等2021)主要关注“哪些球员风格相似”,而本文用聚类结果进一步计算“球员比平均水平强多少”,把“描述性分析”推进到“预测性评估”。
弥补传统指标的“语境缺失”
此前Deshpande和Jensen(2016)指出,PER、BPM等指标忽略了“比赛语境”(如比分胶着时的表现)。EPAA虽然没直接纳入“高杠杆时刻”,但通过“平均球队”假设,间接控制了“队友水平”“对手强度”等语境因素,比传统指标更公平。
超越“坐标级分析”,聚焦“区域价值”
有些研究(如Jiao等2021)用精确的(x,y)坐标分析投篮,但忽略了“区域得分差异”(比如同样是2米外的投篮,三分线外得3分,线内得2分)。本文的7区域划分,更贴合篮球规则的“得分逻辑”。
从“聚类结果”到“价值量化”
此前的聚类研究(如Hu等2021)主要关注“哪些球员风格相似”,而本文用聚类结果进一步计算“球员比平均水平强多少”,把“描述性分析”推进到“预测性评估”。
这种“站在巨人肩膀上”的创新,让EPAA不仅是一个新指标,更成为连接“统计模型”和“实战应用”的桥梁。
十、对NBA实战的启示:哪些场景能用上EPAA?
对于球队管理层、教练和球迷,EPAA能带来哪些实际价值?
球员签约:避免“数据陷阱”
有些球员在强队中得分高(比如依赖明星队友吸引防守),但EPAA可能不高,说明他的“真实效率”有限;反之,有些球员在弱队数据一般,但EPAA高,可能是“被低估的宝藏”。比如2020-21赛季的乔·哈里斯,场均得分不算顶级,但EPAA很高,说明他的三分效率是“真强”,值得高薪续约。
战术调整:优化投篮分布
教练可以通过EP分析球队的“投篮盲区”——比如某球队在左底角三分(LC3)的EP特别低,可能需要减少该区域投篮,或针对性训练。而对手的EP分布则能提示“防守重点”(比如对篮网队要重点防弧顶三分)。
全明星/ MVP评选:提供客观依据
过去评选常受“名气”“球队战绩”影响,EPAA可以作为补充证据。比如2020-21年的托拜厄斯·哈里斯,EPAA排名第4却没进全明星,用数据证明他“配得上”。
球迷观球:看懂“低效数据”
当你看到某球员“场均15分但命中率40%”时,不用急着否定——查一下他的EPAA,如果很高,说明他投的都是“高价值球”(比如关键时刻的三分),效率其实不低。
球员签约:避免“数据陷阱”
有些球员在强队中得分高(比如依赖明星队友吸引防守),但EPAA可能不高,说明他的“真实效率”有限;反之,有些球员在弱队数据一般,但EPAA高,可能是“被低估的宝藏”。比如2020-21赛季的乔·哈里斯,场均得分不算顶级,但EPAA很高,说明他的三分效率是“真强”,值得高薪续约。
战术调整:优化投篮分布
教练可以通过EP分析球队的“投篮盲区”——比如某球队在左底角三分(LC3)的EP特别低,可能需要减少该区域投篮,或针对性训练。而对手的EP分布则能提示“防守重点”(比如对篮网队要重点防弧顶三分)。
全明星/ MVP评选:提供客观依据
过去评选常受“名气”“球队战绩”影响,EPAA可以作为补充证据。比如2020-21年的托拜厄斯·哈里斯,EPAA排名第4却没进全明星,用数据证明他“配得上”。
球迷观球:看懂“低效数据”
当你看到某球员“场均15分但命中率40%”时,不用急着否定——查一下他的EPAA,如果很高,说明他投的都是“高价值球”(比如关键时刻的三分),效率其实不低。
这篇论文最打动人心的,不是复杂的数学公式,而是它对“篮球本质”的追问:什么是“好球员”?是得分最多的?还是效率最高的?EPAA告诉我们:是“能给球队带来更多‘额外价值’”的。
从“看得分多少”到“看得分效率”,从“看个人数据”到“看团队贡献”,体育分析的进步正在让篮球变得更透明、更公平。而贝叶斯分层模型这种“数学工具”,则像一副“透视镜”,帮我们拨开表面数据的迷雾,看到球员真正的价值。
也许未来某天,当NBA总裁宣布MVP时,会说:“他的EPAA排名联盟第一”——那时候,我们就可以说:数据真的改变了篮球。
欢迎各位阅读转发!返回搜狐,查看更多