Prezentacja z XX Zlotu Forum
: sob sty 23, 2016 8:24 pm
Z opóźnieniem, ale zgodnie z obietnicą publikuję internetową wersję mojej prezentacji z XX Zlotu Forum LP3, a prezentacja owa dotyczy rozkładu statystycznego głosów na Liście Przebojów. Krótko mówiąc starałem się odpowiedzieć na pytanie: ile głosów dostają piosenki na poszczególnych miejscach Listy? Swoją analizę rozpocząłem od zebrania danych, z których do obliczeń wykorzystałem następujące:
1. W maju 2007 roku Marek Niedźwiecki ujawnił na czacie internetowym, że piosenka potrzebuje od 120 do 150 głosów, aby wejść do poczekalni (czyli na miejsce 50).
2. W sierpniu 2010 roku Marek Niedźwiecki powiedział na antenie, że aby wejść do pierwszej dwudziestki, trzeba zdobyć 1000 głosów, a piosenka na miejscu drugim ma około 2000 głosów.
3. W marcu 2014 roku podczas spotkania z forowiczami Marek Niedźwiecki ujawnił, że aby wejść do poczekalni (czyli na miejsce 50) potrzeba już 300 głosów, natomiast aby wejść do "szczęśliwej trzynastki" potrzeba 200 głosów.
4. W kwietniu 2015 roku Marek Niedźwiecki powiedział na antenie, że na Listę głosuje około 8000 osób.
Jak widać informacje pochodzą z różnych lat i na ich przestrzeni na pewno zmieniała się całkowita liczba głosów na LP3. To pewien problem, ale założyłem, że proporcje liczby głosów pomiędzy poszczególnymi miejscami są takie same (czyli że każde miejsce dostawało w przybliżeniu ten sam procent głosów w dowolnym roku, a zmieniła się tylko całkowita liczba głosujących). Można zatem przeliczyć dane zawarte w punktach 1-3 na dowolny rok. Wybrałem 2014, ze względu na stosunkową łatwość w obliczeniach i na to, że zapewne interesują Was obecne wyniki, a przynajmniej zbliżone do obecnych. Mój tok rozumowania był taki:
Jeśli piosenka z miejsca 50 dostawała w 2007 roku około 135 głosów, a w 2014 roku około 300, to mogę obliczyć, ile głosów dostawała w 2010 roku - wyszło mi, że około 206 (przy założeniu, że liczba głosów rosła liniowo, jak to widać na poniższym wykresie). Jeśli już wiem, jak zmieniła się liczba głosów na miejsce 50 od roku 2010 do roku 2014, to mogę na tej podstawie obliczyć, jak zmieniła się w tym czasie liczba głosów na miejsce 20 i na miejsce 2. W tym celu wystarczy skorzystać z prostej proporcji i w 2014 roku dla miejsca 20 wychodzi 1460+/-260 głosów, a dla miejsca 2 wychodzi 2920+/-530 głosów.
(Nie pytajcie mnie, jak obliczyłem niepewności, bo odpowiem, że z metody różniczki zupełnej dla rozkładów gaussopodobnych.)
Sytuację tę ilustruje poniższy rysunek, na którym na osi poziomej jest data (z dokładnością do 1 roku), a na osi pionowej jest liczba głosów. Zmiany liczby głosów na poszczególne miejsca pokazują linie w różnych kolorach. Kropkami zaznaczone są dane z punktów 1-3, zaś krzyżykami oznaczyłem wartości obliczone przeze mnie. Pionowe linie przy krzyżykach przedstawiają zakres niepewności dla danej wartości.
Znane (obliczone lub uzyskane od Marka Niedźwieckiego) wartości liczby głosów na poszczególne miejsca można teraz nanieść na wykres, na którym na osi poziomiej jest miejsce (od 1 do 151, bo średnio tyle jest piosenek w zestawie do głosowania), a na osi pionowej liczba głosów. Uzyskuje się coś takiego:
A teraz należy zastanowić się, jaki rodzaj linii można przeprowadzić między tymi punktami?
1. W maju 2007 roku Marek Niedźwiecki ujawnił na czacie internetowym, że piosenka potrzebuje od 120 do 150 głosów, aby wejść do poczekalni (czyli na miejsce 50).
2. W sierpniu 2010 roku Marek Niedźwiecki powiedział na antenie, że aby wejść do pierwszej dwudziestki, trzeba zdobyć 1000 głosów, a piosenka na miejscu drugim ma około 2000 głosów.
3. W marcu 2014 roku podczas spotkania z forowiczami Marek Niedźwiecki ujawnił, że aby wejść do poczekalni (czyli na miejsce 50) potrzeba już 300 głosów, natomiast aby wejść do "szczęśliwej trzynastki" potrzeba 200 głosów.
4. W kwietniu 2015 roku Marek Niedźwiecki powiedział na antenie, że na Listę głosuje około 8000 osób.
Jak widać informacje pochodzą z różnych lat i na ich przestrzeni na pewno zmieniała się całkowita liczba głosów na LP3. To pewien problem, ale założyłem, że proporcje liczby głosów pomiędzy poszczególnymi miejscami są takie same (czyli że każde miejsce dostawało w przybliżeniu ten sam procent głosów w dowolnym roku, a zmieniła się tylko całkowita liczba głosujących). Można zatem przeliczyć dane zawarte w punktach 1-3 na dowolny rok. Wybrałem 2014, ze względu na stosunkową łatwość w obliczeniach i na to, że zapewne interesują Was obecne wyniki, a przynajmniej zbliżone do obecnych. Mój tok rozumowania był taki:
Jeśli piosenka z miejsca 50 dostawała w 2007 roku około 135 głosów, a w 2014 roku około 300, to mogę obliczyć, ile głosów dostawała w 2010 roku - wyszło mi, że około 206 (przy założeniu, że liczba głosów rosła liniowo, jak to widać na poniższym wykresie). Jeśli już wiem, jak zmieniła się liczba głosów na miejsce 50 od roku 2010 do roku 2014, to mogę na tej podstawie obliczyć, jak zmieniła się w tym czasie liczba głosów na miejsce 20 i na miejsce 2. W tym celu wystarczy skorzystać z prostej proporcji i w 2014 roku dla miejsca 20 wychodzi 1460+/-260 głosów, a dla miejsca 2 wychodzi 2920+/-530 głosów.
(Nie pytajcie mnie, jak obliczyłem niepewności, bo odpowiem, że z metody różniczki zupełnej dla rozkładów gaussopodobnych.)
Sytuację tę ilustruje poniższy rysunek, na którym na osi poziomej jest data (z dokładnością do 1 roku), a na osi pionowej jest liczba głosów. Zmiany liczby głosów na poszczególne miejsca pokazują linie w różnych kolorach. Kropkami zaznaczone są dane z punktów 1-3, zaś krzyżykami oznaczyłem wartości obliczone przeze mnie. Pionowe linie przy krzyżykach przedstawiają zakres niepewności dla danej wartości.
Znane (obliczone lub uzyskane od Marka Niedźwieckiego) wartości liczby głosów na poszczególne miejsca można teraz nanieść na wykres, na którym na osi poziomiej jest miejsce (od 1 do 151, bo średnio tyle jest piosenek w zestawie do głosowania), a na osi pionowej liczba głosów. Uzyskuje się coś takiego:
A teraz należy zastanowić się, jaki rodzaj linii można przeprowadzić między tymi punktami?