Business Game 2018
Logojpeg Business game organizzato dall’Università di Padova in collaborazione con Bee Viva.
Proviamo a pr...
2028
06/04
 
  Partecipanti 80 Sottomissioni 760  
 

Business game organizzato dall’Università di Padova in collaborazione con Bee Viva.

Proviamo a prevedere il prezzo di una bottiglia di vino sulla base di una collezione di oltre cento mila review di somelier e di altre caratteristiche del prodotto.

Career Service, Università di Padova

beeviva_career_2018

L’accuratezza delle vostre previsioni verrà valutata utilizzando il Root Mean Squared Error (RMSE).

Un esempio di codice per il calcolo:

RMSE=sqrt(mean((predicted-true)^2))

• Non c’è un limite al numero di submission che ogni partecipante può effettuare, ma solo l’ultima submission verrà considerata valida per il Punteggio Finale.
• Nel corso della competizione è possibile misurare la validità dei modelli che state sviluppando consultano il punteggio parziale determinato da una parte del validation set (20000 osservazioni).
• Il punteggio finale è calcolato usando unicamente le predizioni che non vengono impiegate per il calcolo del punteggio parziale.
• In caso di parità di punteggio finale prevale l’utente che

Il file da sottomettere deve riportare una previsione per ogni riga; quindi il file avrà una sola colonna ed un numero di righe pari al numero di osservazioni del Validation Set (71564).

File:

Training Set (4832 Kb)
Validation Set (5206 Kb)
Esempio submission.csv

I file training_set.zip e validation_set.zip sono protetti da password che vi verrà comunicata al momento della apertura della competizione.

I dati sintetizzano 147459 recensioni di vini:

• 75895 costituiscono il training set, i dati su cui addestrare i vostri modelli;
• le restanti 71564 osservazioni costituiscono il validation set (o score set), ovvero i dati su cui dovete fare la stima per la submission.
Il validation set a vostra disposizione non contiene ovviamente la variabile price, prezzo della bottiglia di vino che l’obiettivo della vostra previsione.

Le variabili presenti sono:


  • country (String) The country that the wine is from

  • province (String) The province or state that the wine is from

  • region_1 (String) The wine growing area in a province or state (ie Napa)

  • region_2 (String) Sometimes there are more specific regions specified within a wine growing area (ie Rutherford inside the Napa Valley), but this value can sometimes be blank

  • winery (String) The winery that made the wine

  • variety (String) The type of grapes used to make the wine (ie Pinot Noir)

  • designation (String) The vineyard within the winery where the grapes that made the wine are from

  • review (String) A few sentences from a sommelier describing the wine’s taste, smell, look, feel, etc.

  • review_score (Numeric) The number of points WineEnthusiast rated the wine on a scale of 1-100 (though they say they only post reviews for wines that score >=80)

  • TARGET: price (Numeric) The cost for a bottle of the wine



Per partecipare bisogna prima autenticarsi
# Nome Punteggio Prove Ultima prova
1 RAGANA ANDREA PARZIALE 13.45 24 26.03.2019
15:56
2 marco.dallaba PARZIALE 20.80 36 08.04.2019
19:33
3 Michele De Vita PARZIALE 23.58 30 06.04.2018
11:58
4 ZANATTA ALBERTO PARZIALE 23.59 9 06.04.2018
10:44
5 Giovanni Barbarani PARZIALE 23.63 10 06.04.2018
11:19
6 Lorenzo Palloni PARZIALE 24.46 19 06.04.2018
11:48
7 alaeddine.ayadi PARZIALE 25.29 18 06.04.2018
11:47
8 BELLONI PIETRO PARZIALE 26.15 12 06.04.2018
11:20
9 Giuliana Lo Presti PARZIALE 27.81 9 06.04.2018
11:38
10 alberto gennaro PARZIALE 27.96 50 08.04.2019
15:29
11 fabio94.licini PARZIALE 27.96 15 08.04.2019
15:03
12 Vittorio Giatti PARZIALE 28.25 103 08.04.2019
22:01
13 emanueledepaoli1 PARZIALE 28.25 55 08.04.2019
22:17
14 aaa PARZIALE 28.25 51 08.04.2019
22:41
15 ZANETTI MARCO PARZIALE 28.25 34 08.04.2019
22:30
16 mattia.cenedese PARZIALE 29.61 5 06.04.2018
11:57
17 elisateresabianco PARZIALE 29.93 26 06.04.2018
11:53
18 davide.comerlati PARZIALE 30.08 16 06.04.2018
11:56
19 BIANCO NICOLAS PARZIALE 30.26 11 06.04.2018
11:56
20 D.Padoan PARZIALE 30.57 8 06.04.2018
11:57
21 mattia.stival PARZIALE 31.42 4 06.04.2018
10:52
22 valeria.zuccoli PARZIALE 32.65 9 06.04.2018
12:00
23 s.dalessio PARZIALE 32.73 20 06.04.2018
11:48
24 VANZETTO MATTIA PARZIALE 33.10 17 06.04.2018
12:00
25 DESIRÒ GIANLUCA PARZIALE 33.52 8 06.04.2018
11:39
26 Yuri PARZIALE 33.69 11 08.04.2019
23:45
27 davide.divincenzo10 PARZIALE 33.69 7 06.04.2018
12:02
28 santo.picci PARZIALE 34.33 5 08.04.2019
21:37
29 gandolfo PARZIALE 34.33 1 09.04.2019
07:55
30 leonardo.padovan.1 PARZIALE 34.47 2 06.04.2018
11:45
31 Alberto.Toffoli PARZIALE 34.53 18 06.04.2018
12:02
32 TOMASELLO GIUSEPPA PARZIALE 35.51 2 08.04.2019
13:56
33 ainhoaelena.leger PARZIALE 37.76 1 04.04.2019
10:54
34 Filips PARZIALE 37.76 4 06.04.2018
10:01
35 lucia.rapisarda.pd PARZIALE 37.76 2 04.04.2019
10:56
36 luca.attanasio PARZIALE 37.84 6 08.04.2019
23:00
37 LOAT FRANCESCO PARZIALE 40.28 2 06.04.2018
11:59
38 OHABUCHE AUGUSTINE NNADOZIE PARZIALE 41.01 6 06.04.2018
12:01
39 BOSCOLO MENGOLIN ELISA PARZIALE 43.55 18 06.04.2018
11:55
40 Lorenzo Schiavon PARZIALE 44.24 7 06.04.2018
11:50
41 luca.gherardini PARZIALE 45.35 2 26.03.2019
20:02
42 Alexander Faehnle PARZIALE 46.15 38 08.04.2019
21:29
43 Marco Petretta PARZIALE 48.56 2 06.04.2018
11:21
44 benchmark PARZIALE 54.84 2 05.04.2018
21:51
45 REDO MARCO PARZIALE 64.21 5 06.04.2018
11:58
46 carlo PARZIALE 79.00 13 06.04.2019
15:49

I modelli usati dai partecipanti:

Michele De Vita (Punteggio Finale: 33.24)

Leonardo Padovan (Punteggio Finale: 33.57)

Elisa Teresa Bianco (Punteggio Finale: 34.20)

• Davide Comerlati (Punteggio Finale: 34.26):
[…] Ho fatto un semplice albero di regressione, sono stato pigro :) […]

• Marco Zanetti (Punteggio Finale: 37.54):
[…] non ho fatto nulla di speciale, solo un lm(price~review_score+I(review_score^2)+country-1,data=data.train)