当前位置:
首页 > 
篮球新闻 > 
:棒球运动中的体育分析例子-

:棒球运动中的体育分析例子-

  • 时间:2024-03-21 12:52:56|
  • 来源:网络转载

让我们首先简要解释一下篮球和棒球之间的区别。 当然,这是从体育分析的角度来说的。 大概:

篮球是非常有战术性的。 进攻中,有各种复杂的跑动战术,包括无球拦网、带球挡拆等。 防守上有盯人防守和联防。 这比棒球战术复杂得多。 所以我们需要仔细分析篮球的战术。 在分析篮球战术的过程中,数据量会比较大:单赛季大约有20万次进攻,而且都是非常干净的数据,噪音很少。 如果是具体的跑位和防线的话那就更多了。 因此,此时可以应用一些适合更大规模数据场景的模型进行分析,比如深度学习。 同时,这对于时间序列对象(跑动和防守线)的分析非常典型。 因此,我们有时会使用时间序列分析模型来做到这一点。 在篮球比赛中,不同球员的进攻/投篮有很大不同。 在棒球比赛中,进攻方的每个人轮流击球。 无论你的实力有多强或多弱,你击中的机会都不会相差太大。 在篮球运动中,一些明星球员在场上的投篮次数可以占全队近40%。 这很大程度上决定了篮球不是棒球式的“1+1=2”运动。 类似于棒球分析中的进攻线性模型(wOBA),应用于篮球时并不可靠,转会后球员的价值也不可靠。 它不可能是简单的线性加法。 同样的非线性问题也发生在篮板和防守上。

在这篇文章中,我们介绍了篮球分析中一个非常重要且基本的任务:进攻战术的分类和识别。

所谓进攻战术可以理解为跑位、掩护(有球挡拆和无球掩护)、传球的结合。 在我们的文章中,战术的识别将只考虑运动部分,而忽略后两者。 本文的介绍主要参考了这两篇论文。

笔者认为,这项任务在篮球分析中的重要性无需强调。 作为一项非常注重战术的体育运动,无论是分析各个战术的有效性和相互关系,还是分析每个球员的能力和适应性,都必须先明确战术,然后才能进行其他工作。

打篮球的进攻战术_篮球战术进攻战术基础配合_5打5篮球进攻战术

如上图所示。 我们先看左边的战术。 我们可以看到,红队(勇士队)持球者和博古特持球打挡拆后突破内线,而其他三名球员则在三分线外伸展。 持球者最终传给博古特,博古特内切,后者最终将球传给队友空位三分。 右图中红队的战术与之类似。 虽然是不同人打的,但也通过突破在弱侧底角创造了空位三分机会。

打篮球的进攻战术_篮球战术进攻战术基础配合_5打5篮球进攻战术

再看看上面的图片。 虽然和刚才的勇士组一样,最后在右侧底角形成了三分机会,但是本组红队(火箭队)的战术显然完全不同。 在这两种战术中,红队持球者琼斯和琼斯都将球持在原地,利用无球掩护进行底线无球跑动,也就是所谓的底线滑行,最终创造了一个机会。

我们的任务是对战术进行分类并识别出这种明显不同(尤其是“概念上”不同)的战术。

由于我们将战术视为“动作的组合”,因此整个模型应该分为两部分。 第一部分,我们首先识别各种跑步位置,并对跑步路线进行分类。 第二部分是根据这次攻击中所有人的移动路线来确定总体战术。 我们先来说第一部分,如何对跑步路线进行识别和分类。

打篮球的进攻战术_篮球战术进攻战术基础配合_5打5篮球进攻战术

如上图所示,“跑步路线”简单来说就是一条带有时间信息的轨迹。 因此我们可以使用任何可以对此类轨迹进行分类的模型。

例如,我们可以使用这个模型来查找玩家在攻击过程中的轨迹。 他跑过的地方看成1,没跑过的地方看成0,最后就形成了一张图(其实就是上图中的图片)。 然后使用带有一定量人工注释的卷积神经网络 (CNN) 对图像进行分类。 这个模型与我们通常在计算机视觉(CV)中看到的模型非常相似,尤其是与经典的手写数字识别问题(MNIST)非常相似的模型。

该模型的缺点是需要手动注释。 没有足够的篮球知识,很难做标注,工作量也比较大。 因此,论文(参见参考文献2)提出了一种总体思路类似但无需标注的方法。 这也是计算机视觉中非常常见的方法。 这种方法是使用卷积自动解码器(auto-)首先从图像中提取连续特征,然后对连续特征进行聚类,例如使用k-means聚类。 聚类算法不需要标签,可以达到接近的结果。

5打5篮球进攻战术_打篮球的进攻战术_篮球战术进攻战术基础配合

上图是聚类结果,每张图代表一个分类。 可以看出像15、16这样的都是底线无球跑动(滑底线),而2、3则是典型的突破,13、14则是底角的三分位置等等。

本段提到的CNN和自动模型都是非常常见的通用模型。 有现成的工具可以用作黑匣子。 使用现有的深度学习编程语言(例如keras)很容易实现一种。 的。

本段提到的k-means是一个聚类模型。 所谓聚类模型,就是将待训练的数据聚类成若干类别(数量通常是预先指定的),而不进行标记。 k-means 的输入是空间中的一组点5打5篮球进攻战术,它将靠近的点聚集在一起。 因此,该模型可以自动识别“相似分类”。 意味着它的功能和分类大致相同,但不需要标注,在很多场景下都很实用。

思考:

上述模型丢失了时间序列信息。 这可能会导致一些奇怪的结果。 例如,如果滑动基线,从左到右和从右到左将被识别为一条路线。 对我们后续的战术识别和分类需求影响大吗? 如果很大的话,这个问题怎么解决呢? 该模型还会丢失有关球存在和不存在的信息。 带球突破和空手切入显然是有区别的。 这个问题影响大吗? 怎么解决呢? 请注意5打5篮球进攻战术,球员可能只有部分时间拥有球权。 NBA的平均投篮时间只有10秒多一点。 但根据规则,一次进攻允许进行24秒,这足以运行两种或多种战术。 即使采用相同的战术,玩家也可能需要依次跑几条路线(根据实际情况而定),因为规划的路线可能不是最优的,或者可能被对手阻挡等。如果是这种情况,应该我们将运行路线分开并分别对每个部分进行分类/聚类? 这个怎么做? (本文后半部分提供了方法)

现在我们有了跑动路线的类别,接下来就可以进入第二阶段,根据跑动路线的组合来分类识别整体战术。

打篮球的进攻战术_篮球战术进攻战术基础配合_5打5篮球进攻战术

如上所述,在一次(长时间)进攻中通常会进行多次进攻。 在一个战术中,玩家也可能因为各种原因需要跑几条路线,比如因为原来的路线被堵住了等等。所以当我们看上图的时候,我们会发现每个玩家()都有几条路线()过来时间。 我们现在需要做的是将这个路线组合分类或聚类为特征。

需要注意的是,如果我们使用上面提到的路线识别模型,是不可能识别出一个跑多条路线的玩家的。 论文中为了解决这个问题,采取的办法是按照规则进行路由切割。 切割的标准是基于玩家的跑步速度:如果玩家的速度下降到很低甚至停止,则认为当前路线已经停止,接下来跑一条新路线。

这里我们使用LDA主题模型(LDA主题模型,参见参考文献1)来完成这个任务。 这是自然语言处理(NLP)中非常常用的模型。 它是一个聚类模型,属于我们之前介绍过的贝叶斯层次模型(模型)。 具体假设是:

(1)每次攻击都有几种策略(或几种主题/话题)。 具体是:本次攻击中这些策略出现的概率满足一定的分布,并具有相应的共轭先验分布。

(2) 每次攻击中任何一对路由(或一个词/词)的出现概率取决于该对路由属于哪种策略(概率由(1)中的分布决定),并且在此情况下的对战术。 路径出现的概率。

这里有几点需要注意:首先,对于一次攻击来说,每种战术出现的概率是均匀的,与路线无关。 因此,不同的路线可以属于不同的战术,但会有一个统一的概率来限制; 另外,这是针对一对路线(即两个玩家的路线组合)进行的。 从篮球知识来看,我们可以猜测,这会比单一路线更有效,因为大多数篮球战术确实主要由两个人(持球者和跑垒者/掩护者)协调。

篮球战术进攻战术基础配合_打篮球的进攻战术_5打5篮球进攻战术

以上是部分训练结果。 具体来说,它们是某些战术(主题)下最常见(最常出现)的跑步路线。 比如策略0,大致就是一个人在三分线附近跑动,另一个人替他掩护。 筛选者在这里会从不同的位置开始,但总体“概念”是相同的。 和战术3一样,其中3条路线都有一个人向篮筐走去(应该是突破),还有一个人在三分线外拉扯。 战术5包括滑入底角等基本“概念”。

使用该模型,已经可以识别与每次攻击相对应的策略。 正如上面模型描述中提到的,每次攻击可能对应多种策略。 经过实际训练,你会发现单次进攻的实际战术数量通常不会超过8个,这与我们的篮球知识是一致的。 此外,本文还简要讨论了一些具体策略。 比如本文开头给出的两组底角三分球(一组是突破,一组是空切)可以区分等等,由于篇幅限制,这里不再赘述。

本段提到的LDA,如前所述,是自然语言处理中常见的聚类模型。 很难解决。 请参考教材(参考文献3)或相关资料来解决。

思考:

上面提到的时间序列信息和有球/无球信息仍然没有被这个模型利用:从上面的描述来看,LDA模型根本不关心单词之间的顺序; 至于有球/无球,这不是一个特点。 里面。 我们如何利用这两条信息呢? 有球挡拆和无球掩护是篮球的关键。 这个模型可以部分识别它们5打5篮球进攻战术,但是有没有办法专门处理它们以保证更高的识别精度?

基于上面的动作识别模型和战术识别(基于LDA)模型,我们现在可以识别攻击中使用的战术。 并且您还可以获得额外信息:每种策略对应哪些常见跑步路线。 因此,这两个模型完成了本文提出的任务,即篮球战术的识别和分类。

下一篇我们将继续介绍篮球分析中的另一个核心问题。

参考:NBA,C. 和 Luke Bornn,层,Akhil 和 John。 关于LDA的详细内容,也可以参见教材27.3节:A.这里的模型除了“路由对”之外,和普通的LDA没有什么区别。

热门直播

热门录像