Her şey Gol Beklentisi istatistiğinin çıkmasıyla başladı. Futbol Analitik camiasının rönesansı olan bu olay hepimize umut olmuştu. Belki de dedi, veri analisti, belki de rakamlarla futbolu açıklamak mümkündür. İçindeki sönmeye yüz tutan ışık yeniden parlaklığını arttırmıştı.

Gol Beklentisi’nden sonra olaylar hızla gelişti; yeni modeller, makine öğrenmesi, markov zinciri, beklenen asist, beklenen tehlike, beklenen o, beklenen şu vs. derken beklediğimize bir türlü erişemedik. Çok açık ki artık istatistiklerle oyunu açıklama epey miktarda yol katetti; ancak hala önünde upuzun bir yol daha var. 

Başlangıçtaki küçük kartopu, artık dikkate almamız gereken bir kartopuna dönüştü. İlgisiz kalan takımlar, bu tutumlarından vazgeçmezse çığ altında kalmaları kuvvetle muhtemel. 

Hedeflenen noktaya gitmek için FAS veri analiz ekibi olarak, bizim de bir katkımız olsun diye çalışmalarımızı sürdürüyoruz. Bugün basketbol hakkında yazılmış bir içerikten ilham alarak yaptığımız bir çalışmadan bahsetmek istiyorum. İlgili yazıya buradan ulaşabilirsiniz.

Eşsizlik İndeksi

Dribbleanalytics.blog’da yayımlanan çalışma, basketbol oyuncularını mevkisine göre 0’dan 1’e kadar eşsizliğini sorgulamaya dayalı. “Unicorn index” adını verdikleri puanı bulmak için bir sürü farklı istatistiği kullanıyorlar.

1’e en yakın notu alan oyuncu en eşsiz olanken, 0’a yakın olan, mevkisinin ortalamasına yakın.

Biz bu çalışmayı daha dar anlamda uygulamak istedik. Eşsiz forveti, orta sahayı ya da defansı bulmaktan ziyade, eşsiz bitiriciyi bulmak, gol beklentisinin ortalığı kasıp kavurduğu bir zamanda yapılacak en güzel çalışmalardan birisi olur diye düşündük.

“Beni teknik detaya boğma, sonucu göster.” diyen futbol severlerimizi “Sonuç” kısmına alabiliriz.

Veri Toplamak

EPL, Bundesliga, La liga, Serie A ve Ligue 1’e ait 2017-2018 ve 2018-2019 sezonlarında çekilen tüm şut verilerini understat.com’dan toplayarak işe başladık. Çekilen şutların kaleye olan mesafesini baz alarak En Yakın – Yakın – Orta – Uzak – En Uzak diye kategorilere ayırdık. Aşağıdaki grafikte mesafelerin nasıl ayrıldığını görebilirsiniz.

Golleri ve golle sonuçlanmayan şutları ayrı olacak şekilde böldükten sonra her bir mesafede atılan şutların xG ortalamalarını da veri setimize ekleyerek toplam 20 tane değişkenimizin olduğu veri setimizin son halini elde etmiş olduk.

Kısaca özet geçmek gerekirse, atılan gollerin xG’si, sayısı, atılan şutların xG’si ve sayısını yukarıda bahsettiğim mesafelere göre gruplandırarak bir araya getirdik.

Eşsiz bitiriciyi bulmak istediğimiz için 10 ve 10’dan fazla gol atan oyuncular kalacak şekilde filtre uyguladıktan sonra elimizde iki sezona ait 184 tane gözlem kaldı. Bu 184 tane oyuncu takımına skor anlamında katkı sağlamış ve çift haneli gol sayısına ulaşmış isimler. (Penaltılar hariç.)

Yavaş yavaş asıl işleme geçebiliriz.

Temel Bileşen Analizi

Verileri 0 ve 1 arasında standartlaştırdıktan sonra bir sürü farklı sayının karmakarışık görüntüsünü ortadan kaldırmak ve veri setini birazcık bilgi kaybıyla, daha az değişkenle açıklamak için Temel Bileşen Analizini uyguluyoruz. Böylece birbiriyle yakın ilişki içinde bulunan değişkenlerimizin boyutunu düşürüyoruz.

10 bileşen veri setinin %90’ını açıklıyor

Yukarıdaki grafikten anlayacağınız gibi 20 sütunlu veri setinin %90’nını 10 bileşen ile açıklayabiliyoruz. 

%90 oranını seçmemizin belirli bir sebebi yok. İlham aldığımız yazıda da aynı oran seçilmiş.

Birinci bileşen, verinin yaklaşık çeyreğini açıklıyor ve bu bileşenin ayırt edici faktörleri arasında en önemlileri, en yakından çekilen şut sayısı, en yakından atılan gol sayısı, en yakından çekilen şutların ve gollerin ortalama xG’si gibi değişkenler. 

Zirvedeki futbolcuları diğerlerinden ayıran en önemli özelliğin yüksek xG’li pozisyonlara daha sık girebilmesi tezini doğrulayan bir sonuca varabiliriz. 

Temel Bileşen Analizini uygulayarak 10 olarak belirlediğimiz bileşenleri veri setine uygulayıp, ortalamasını aldıktan sonra elimizde “ortalama” bir bitiricinin değerleri oluyor. 

Ortalamadan Ne Kadar Uzakta?

4 ayrı mesafe ölçüm metodu uygulayarak 184 futbolcunun ortalama bitirici değerleri ile arasındaki mesafeyi ölçüyoruz ve çıkan sonuçları yine 0 ve 1 arasında standartlaştırıyoruz.

Kullandığımız metotlar: “euclidean”, “maximum”, “manhattan” ve “minkowski”

Her bir metottan elle ettiğimiz puanların ortalamasını alarak “Eşsizlik” adını verdiğimiz puanı elde ediyoruz.

Sonuç

2017-2018 sezonunun en eşsiz 20 bitiricisi

2018-2019 sezonunun en eşsiz 20 bitiricisi

Değerlendirmeye aldığımız 2 sezon için de zirvede Messi’nin bulması bizleri şaşırttı mı? Hayır.

Uzatmalar

Eşsizlik puanı ile xG ya da Gol sayısı arasında güçlü bir pozitif korelasyon yok. (Orta şiddetli bir pozitif korelasyon var.) Yani çok gol atmak demek eşsiz bitirici anlamına gelmiyor. 2017-18 sezonunda 17 gol atan Aguero’nun eşsizlik puanı 0.27. Aynı sezon 25 kez fileleri sarsan Edinson Cavani’nin ise 0.36.

Tam tersi açıdan bakacak olursak Bordeaux forması giydiği son sezonda 10 kez skor yapan Malcom’un eşsizlik puanı 0.73. 

Rakamlar farklı bir hikaye anlatırken, bu anlatılan hikayenin görsel analiz ile desteklenmesinden yana olduğumuz için eşsizlik puanımızı siz futbol severlerin yorumuna açıyoruz. Sonuçlardan ilginç bulduğunuz olduysa veya “Aslında bu adam çok atmıyor ama hakikaten attığı zaman da güzel atıyor.” diyorsanız, fikirler havada uçuşsun.

Veriyle kalın…

Henüz yorum yok

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Football Analytics & Scouting 2019 © Tüm Hakları Saklıdır.