Zawartość
- Wyjaśniło prawo Zipfa
- Podstawowy eksperyment
- Prawo Zipfa na rynkach Steam
- Czego możemy się dowiedzieć o Steam?
- Wnioski
Niedawno mój przyjaciel zasugerował, żebym obejrzał wideo Vsaucesa na temat prawa Zipfa, zasady Pareto i ich tajemniczych występów wokół nas. Oto mały zwiastun, który przyciągnie twoją uwagę - 80% wszystkich ludzi mieszka w 20% najpopularniejszych miast; 80% wszystkich gruntów należy do 20% najbogatszych właścicieli; 80% wszystkich śmieci znajduje się na najlepszych 20% najbardziej koszmarnych ulicach - jak przewiduje prawo Zipfa i zasada Paretosa.
Niewystarczająco? Cóż, jak odkryłem wczoraj, królika nie kończy się na tym ... Pełen sceptycyzmu, postanowiłem przyjrzeć się, ile czasu ludzie spędzają na grach Steam ... Cóż. 80% czasu ludzi spędza grając w 20% najpopularniejszych gier ... Interesujące? Cóż, czytaj dalej, ta historia ma coś więcej.
Zbliżając się do ponad 20 minut, Vsauces dąży do niesamowitych rezultatów i wyjaśnia wiele dużych rzeczy o Zipfie, jednak jest bardzo nieśmiały, pokazując nam główny mechanizm, który jak się powszechnie uważa, przyczynia się do tego, jak działa Zipf. Zanim przejdziemy dalej, chciałbym to krótko wyjaśnić.
Wyjaśniło prawo Zipfa
Istnieje kilka koncepcyjnych sposobów wyjaśnienia intuicji stojącej za zasadą 20/80. Moim zdaniem najlepszym przykładem jest kratery Księżyca.
Podstawowy eksperyment
Wyobraź sobie więc, że istnieje nietknięty Księżyc - idealnie gładka powierzchnia. Teraz powiedzmy, że są jakieś przypadkowe wielkości asteroid, które uderzają w Księżyc chcąc nie chcąc. Gdy pierwsza asteroida wyląduje, opuszcza krater. Teraz kolejny trafia, pozostawiając krater gdzie indziej. Każdy krater jest częścią całkowitej powierzchni, dlatego istnieje szansa, że następna losowa asteroida uderzy w pobliżu istniejącego krateru i dołączy do niego, tworząc grupę. Szansa na uderzenie nowej asteroidy w dany krater jest wtedy proporcjonalna do istniejących rozmiarów kraterów i asteroid. Oznacza to, że kolejna losowa asteroida jest bardziej prawdopodobna do przyłączenia się do największej istniejącej grupy, co czyni ją jeszcze większą. Rodzaj kumulatywnego procesu, który następnie tworzy bogato wzbogacony mechanizm biednego pobierania.
Pamiętaj o tym, ponieważ uważa się, że jest to ogólne wyjaśnienie „dlaczego” prawo Zipfsa działa z tak tajemniczą uniwersalnością. Przykład asteroidu jest dość prosty, jednak pojawia się pytanie, co stanie się z wieloma powtórzeniami
Trochę oszołomiony?
Cóż, zrobiłem gif, aby prowadzić ten początkowy punkt do domu. Uwaga! wykres zostanie omówiony później, po prostu spróbuj zobrazować eksperyment.
Jeśli obserwujemy rzeczywisty Księżyc, okazuje się, że wraz ze wzrostem ilości asteroid do dużych ilości obserwowane średnice kraterów rosną tak, że 20% największych kraterów zbliża się do 80% całej powierzchni.
Tak więc, gdy przechodzimy do większej liczby asteroid, dystrybucja najpopularniejszych do najmniej popularnych grup zbliża się do pewnego rodzaju „idealnej dystrybucji” z tą właściwością 20/80 - rozkładem Pareto. Jeśli wykonasz matematykę, okaże się, że (ogólnie), jeśli największa grupa ma rozmiar N, druga co do wielkości grupa to rozmiar N / 2, trzecia N / 3 i tak dalej i tak dalej. Nazywa się to prawem Zipfa. Dziwną rzeczą jest prawo Zipfa i dystrybucja Pareto dla oszałamiającej ilości elementów (asteroid) i grup (skupisk kraterów). Oczywiście są skośne i przypadkowe zakłócenia, ale ogólny trend jest niezaprzeczalny.
Mam nadzieję, że można zobaczyć, jak asteroidy częściej uderzają w duże kratery na Księżycu, łącząc się z miastami, które są bardziej atrakcyjne, jeśli żyje w nich więcej ludzi. Jednak trzeba sobie uświadomić, że miasta są dalekie od jedynych „grup”, które zachowują się zgodnie z Zipfem.
Oto kilka przykładów z badań Marka Newmana na temat dystrybucji Pareto. Uwaga! Wykresy są w skali log-log, która wygładza hiperboliczną formę krzywych, prezentując relację prawie liniową.
Początkowy y = aX ^ (- b)
Dzienniki obu stron => log y = log a - b log X
Co ciekawe, ten sam trend przejawia się również w kultach religijnych ... Wspólną własnością większości z tych zjawisk jest po prostu ta „duża grupa-większa-tendencja”. Prawo Zipfa jest więc trwałe w mechanizmach, gdzie preferencje elementów są pozytywnie powiązane z rozmiarem grup (co oznacza, że im większa grupa, tym większe prawdopodobieństwo jej wzrostu). Dlatego lubię myśleć o grupach jako klastrach i elementach jako klastrach.
Prawo Zipfa na rynkach Steam
Podejrzliwy wobec tego ostatniego? Oto ilość czasu, jaką ludzie spędzają na najpopularniejszych grach na Steam .. Dane z SteamSpy.
Jeśli wykonasz matematykę, okaże się, że 20% najpopularniejszych gier Steam stanowi 80% całkowitej ilości gier, więc tajemnica Pareto 20/80 działa tutaj jak urok ... Trzeba jednak zauważyć, że dla Zipf to prawda, CS: GO musi odpowiadać za 37,5% / 2 = 18,8% całkowitego czasu zamiast o 30%. Ale poza tym poza tym (ZATRZYMAJ GRA CS: GO), dystrybucja podobna do Zipfa jest wyraźnie widoczna.
Oto ilość sprzedanych kopii najpopularniejszych gier.
Wygląda o wiele ładniej, prawda? Sprzedane kopie nie mają dużych wartości odstających, więc pasują bardzo dobrze, co jest godną uwagi różnicą. Jest jednak coś bardziej interesującego do wyciągnięcia z różnic w dwóch ostatnich wykresach.
Czy zauważysz, jak „ogon” idący w prawo to rodzaj tłuszczu na drugim wykresie? Mówiąc prosto, mówi nam to, że gry „stosunkowo niepopularne” są w rzeczywistości znacznie bardziej popularne niż na poprzedniej fabule.
W rzeczywistości okazuje się, że 20% najpopularniejszych gier stanowi tylko 60% sprzedaży, w porównaniu z 80% gier. Ciekawy? Założę się, że to ty.
Czego możemy się dowiedzieć o Steam?
Cóż, fakt, że popularność gry podąża za dystrybucją Pareto, mówi nam, że rzeczywiście istnieje jakiś pozytywny efekt sieci, który sprawia, że gracze wybierają gry, w które już gra więcej osób. Różnica w otyłości ogonów mówi nam, że użytkownicy Steam są o wiele bardziej „ślepi na grupy”, gdy kupują gry, niż gdy grają.
Pomyśl o tym - im więcej ludzi kupuje gry bez względu na „aktualną popularną opinię”, tym bardziej spłaszczona jest dystrybucja Pareto, ponieważ jest mniejsze prawdopodobieństwo dalszego rozwoju dużych gier. Gdyby nikt nie dał szczurowi tyłka o tym, ile osób już gra, a dostępność wszystkich gier była taka sama, to oczekiwalibyśmy, że 20% najpopularniejszych gier odpowiada za około 50% sprzedaży i czasu gry (np. Przy założeniu, że indywidualne preferencje są normalnie rozproszony).
Wnioski
Istnieją zatem dwa czynniki, które przyczyniają się do dystrybucji Pareto na rynkach Steam - jak innowacyjni są twórcy (ile powstaje nowych kraterów Księżyca) i jak bardzo gracze (asteroidy) doceniają aktualny rozmiar grupy, wybierając grupę do przyłączenia . Jak się okazuje, gracze są niewidomi w grupie, gdy kupują gry, ale wręcz przeciwnie, gdy grają w gry. Fajne hę?
Jeśli chcesz dowiedzieć się więcej na temat dystrybucji prawa i prawa Zipfa, oto miły wykład. Ponadto spójrz na papier Newmana!
Jeśli chcesz przeczytać więcej tego typu rzeczy, niedługo postaram się połączyć tę obserwację z modelem, który pokazuje, że bardziej popularne gry wieloosobowe mają wyższe ceny (które łączą się z preferencjami graczy do łączenia się w grupy o większych rozmiarach). Zobacz artykuł tutaj. Artykuł Piece De Resistance spróbuje połączyć te teorie razem wyjaśniając, w jaki sposób gry wieloosobowe, sieci społecznościowe i miasta są w rzeczywistości wszystkimi towarami anty-rywalizującymi z efektami sieciowymi (im więcej ludzi konsumuje dobro, tym więcej korzyści dla każdego z nich przynosi) zatytułowałem ich tą Zipfianską mgłą tajemnicy ...
Do tego czasu - ciesz się!
P.S. Pop w komentarzu z zabawnym pomysłem na relację 20/80, która Twoim zdaniem może być prawdziwa.
Moje są:
80% nostalgii narodów jest spowodowanych przez 20% ich najszczęśliwszych wspomnień (w rzeczywistości udowodniono, że ludzie zapominają o nich)
80% masy koncentruje się w 20% największych obiektów kosmicznych (w rzeczywistości udowodniono, że rozkład siły grawitacyjnej)
I oczywiście
80% bałaganu w twojej toalecie pochodzi z 20% tego, co jesz (o czym nie mówi się w badaniach naukowych)