Benford's Law Covid-19 in Romania
Cod Embed Grafic:
Legea lui Benford
Legea lui Benford sugereaza ca distributia primei cifre din numerele unui set de date urmeaza o anumita curba. Cifra 1 va fi cea mai prezenta ca prima cifra cu o probabilitate de 30.1%, cifra 2 va avea probabilitatea de aparitie de 17.6% pana la cifra 9 cu cea mai mica probabilitate de aparitie, de 4.6%.
d | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|
P (d) | 30.1% | 17.6% | 12.5% | 9.7% | 7.9% | 6.7% | 5.8% | 5.1% | 4.6% |
Deviatia
Deviatia (d*) reprezinta distanta Euclidiana intre seria de date (cazuri, teste, etc.) si distributia Benford. Aceasta poata sa fie intre 0 si 1. Daca distributia primei cifre intr-un set de date este exact ca distribuita Benford, d* va fi 0. Cu cat datele se abat mai mult de la aceasta distributie, d* se va apropia de 1. Se sugereaza ca un posibil indicator al faptului ca seria de date este corupta e un d* > 0.25 [1].
Referinte
1. William Goodman (2016), "The promises and pitfalls of Benford's law" Royal Statistical Society: https://rss.onlinelibrary.wiley.com/doi/full/10.1111/j.1740-9713.2016.00919.x
2. Anran Wei, Andre E. Vellwock (2020), "Is COVID-19 data reliable? A statistical analysis with Benford's Law": https://www.researchgate.net/publication/344164702_Is_COVID-19_data_reliable_A_statistical_analysis_with_Benford%27s_Law
3. Benford's law Wikipedia: https://en.wikipedia.org/wiki/Benford%27s_law
d* pentru seriile de date din grafic
- Cazuri noi - d*: 0.05
- Cazuri totale - d*: 0.14
- Teste noi - d*: 0.15
- Vindecari noi - d*: 0.03
- Decese noi - d*: 0.05