Business Game 2016
Telephone Business game Organizzato assieme all'Università di Padova
Competizione + selezione per colloqui ...
2020
01/05
 
  Partecipanti 56 Sottomissioni 324  
 

Business game Organizzato assieme all’Università di Padova

Competizione + selezione per colloqui con le aziende

Link alla pagina dell’evento

Classifica finale del Business Game (19/04/2916, ore 13.00).

Abbiamo deciso di RIAPRIRE la competizione a solo scopo di approfondimento. Su “Learning” (vedi linguetta a destra) abbiamo attivato un punto di discussione sulla competizione.
_______________________________________________________________________________

Lo scenario proposto è quello di una compagnia che opera nel settore delle telecomunicazioni.

La Direzione intende promuovere una campagna volta a incrementare l’upsell, l’acquisto di prodotti di maggior valore rispetto a quelli inizialmente acquistati dai suoi clienti.

L’estensione della garanzia, l’acquisto di un prodotto di gamma superiore o la sostituzione del prodotto con uno dal margine più alto, sono tutti esempi positivi di upsell.

Nella fase di pianificazione della campagna promozionale viene chiesto al data scientist di identificare il target di clienti verso cui rivolgersi.

Il business problem proposto è tipico di un sistema Customer Relationship Management (CRM). Una strategia per gestire e personalizzare il rapporto con il cliente è quella di produrre degli scores che ne caratterizzano il profilo. Sulla base di questi scores la compagnia può quindi decidere quali siano le iniziative più opportune da intraprendere.

• Non c’è un limite al numero di submission che ogni partecipante può fare.
• Al termine della competizione, solo l’ultima submission sarà considerata per il calcolo del punteggio finale (sottomettete quindi per ultima quella che reputate migliore!).
• Il punteggio finale è calcolato usando solo le predizioni che NON sono state usate nel calcolo del punteggio parziale.

Utilizzando il vostro modello stimato sul dataset ctrainset.csv, dovrete prevedere la propensione all’upsell redemption (punteggi bassi per propensione bassa, punteggi alti per propensione positiva) per ciascuno dei 20000 nuovi clienti del daset cscoreset.csv. La bontà della vostra classificazione verrà valutata secondo la vostra capacità di massimizzare l’AUC (Area Under the ROC):

https://en.wikipedia.org/wiki/Receiver_operating_characteristic

Durante il game avrete anche la possibilità di valutare la performance del vostro modello attraverso un Punteggio Parziale: si tratta dell’errore di previsione precedentemente descritto, calcolato solo su una parte – a voi non nota – delle 6000 righe del dataset di predizione. Ad ogni nuova submission otterrete un nuovo punteggio parziale (calcolato sullo stesso dataset parziale). Non c’è limite al numero submissions che potete effettuare.

Dopo la chiusura della competizione, il sistema calcolerà il Punteggio Finale sulla base dell’ultimo vettore di previsione sottomesso da ogni squadra. Questo errore è calcolato usando tutte e sole le osservazioni che non hanno partecipato al calcolo del punteggio parziale e le vostre corrispondenti previsioni.

Per il calcolo il sistema usa la funzione auc() della library(pROC) in R.

Calcolare l’AUC, esempi

- in R
http://stackoverflow.com/questions/4903092/calculate-auc-in-r

- in MATLAB
http://it.mathworks.com/help/stats/perfcurve.html

- in Python
http://stackoverflow.com/questions/31159157/different-result-with-roc-auc-score-and-auc

- in XLS
http://www.statisticshowto.com/how-to-find-the-area-under-a-curve-in-microsoft-excel/

Training set
• Profilo di 30.000 clienti (osservazioni, righe del dataset)
• 367 variabili (features, colonne del dataset)
Il significato di queste variabili è stato criptato, identificandole con un codice fittizio Var1,…,Var367
• Sono presenti solo valori quantitativi
• dati mancanti (~ 65%).
• Ogni cliente è classificato rispetto alla variabile target, che indica se questi ha acquistato o meno un prodotto di maggior valore (upsell redemption).

Score set
• 20.000 clienti
• le stesse 367 variabili del training set.
• non viene fornita la variabile target, questa è la soluzione che dovrete fornire.




Presentazione Business Game presentazione_BusinessGame.pdf
600 KB
ctrainset.zip (csv) ctrainset.csv.zip
3 MB
ctrainset.zip (csv) cscoreset.csv.zip
2 MB
Per partecipare bisogna prima autenticarsi
# Nome Punteggio Prove Ultima prova
1 Pugi Jacopo PARZIALE 87.83% 9 01.05.2016
19:55
2 mattiaU PARZIALE 87.71% 9 01.05.2016
16:07
3 AVON VALENTINO PARZIALE 87.43% 110 01.05.2016
22:14
4 GRIPPALDI ALBERTO PARZIALE 87.07% 21 01.05.2016
12:01
5 alessandro.aere PARZIALE 86.91% 7 23.04.2016
10:06
6 Andrea Sottosanti PARZIALE 86.81% 9 27.04.2016
10:10
7 POLI FEDERICO PARZIALE 86.33% 23 19.04.2016
11:49
8 Spiderman PARZIALE 85.25% 12 22.04.2016
10:04
9 Edoardo Michielon PARZIALE 81.01% 5 19.04.2016
11:47
10 Davide Boschetto PARZIALE 80.94% 13 19.04.2016
11:55
11 TREVISIOL DAVIDE PARZIALE 80.30% 5 19.04.2016
11:22
12 MARTINO LUCA PARZIALE 79.09% 8 19.04.2016
11:36
13 Annalisa Balata PARZIALE 75.01% 6 19.04.2016
11:33
14 riccardo.gobbo.1 PARZIALE 74.34% 7 19.04.2016
11:47
15 deepblusky26 PARZIALE 74.33% 5 19.04.2016
11:50
16 BOSSOLI DAVIDE PARZIALE 72.13% 9 27.04.2016
17:46
17 SCHIAVON LORENZO PARZIALE 68.97% 18 19.04.2016
11:48
18 alessandro.casa PARZIALE 63.43% 24 19.04.2016
12:01
19 Annapaola Mavilla PARZIALE 61.56% 3 19.04.2016
11:26
20 RESIDORI DANIELE PARZIALE 61.53% 8 23.04.2016
00:05
21 federicoferraccioli PARZIALE 61.08% 2 19.04.2016
11:44
22 BEE ROSANGELA PARZIALE 52.95% 1 19.04.2016
12:00
23 DUAN XIAOBIN PARZIALE 50.28% 3 19.04.2016
11:39
24 alberto gennaro PARZIALE 50.00% 2 03.04.2019
17:46
25 BIANCHI ALBERTO PARZIALE 49.78% 3 19.04.2016
09:53