Hukum Benford Ditinjau Kembali | ThatsMaths

Hey, Selamat datang di wikitanic.com.

{Probabilitas untuk angka desimal pertama D_1 angka untuk mengambil nilai dari 1 sampai 9.

Beberapa peneliti telah mengamati bahwa, dalam berbagai kumpulan data numerik, digit desimal terdepan — atau paling signifikan — tidak terdistribusi secara seragam, tetapi sesuai dengan distribusi logaritmik. Dari sembilan nilai yang mungkin, D_1=1 terjadi lebih dari 30\% dari waktu sementara D_1=9 ditemukan kurang dari 5\% kasus (lihat Gambar di atas). Secara khusus, distribusi probabilitas adalah

\displaystyle \mathsfP(D_1 = d) = \log_10 \left( 1 + \frac1d \right) \,, \quad \mbox for\  d = 1, 2 , \titik , 9 \,.  \ \ \ \ \ (1)

Bentuk hukum yang lebih lengkap memberikan probabilitas untuk digit kedua dan selanjutnya. Pembahasan lengkap tentang Hukum Benford diberikan dalam Berger dan Hill (2015).

Kami mendefinisikan set Benford B_k untuk k=1, 2, \titik , 9 sebagai

\displaystyle B_k = \n \in\mathbbN : D_1(n) = k \ \,.

Kepadatan relatif dari B_k dalam jangkauan [1,n] dapat ditulis

\displaystyle \rho = \frac\mboxcard(B_1 \cap \mathrmN_n)n \,,

Di mana \mathrmN_n = \1, 2, \dots , n \. Ini berosilasi antara \frac19 Dan \frac59 sebagai N meningkat, dan tidak mendekati batas. Secara khusus, himpunan B_1 tidak memiliki kerapatan alami. Namun, kami dapat menetapkan probabilitas nomor arbitrer masuk B_1 mengikuti ide-ide yang diuraikan dalam Diaconis dan Skyrmes (2018) dan, secara lebih rinci, dalam Tenenbaum (1995) [Earlier post: How many numbers begin with a 1?]

Metode Rata-Rata

Urutan yang berbeda berperilaku berbeda. Angka Fibonacci sesuai dengan Hukum Benford: frekuensi relatif dari digit terdepan D_1=d konvergen ke \log_10(1+d^-1). Kepadatan himpunan bilangan Fibonacci yang dimulai dengan 1 adalah \log_102 \kira-kira 0,3010. Urutan bilangan prima tidak bukan mengikuti Hukum Benford. Untuk deret bilangan asli, densitas relatif berosilasi, dengan \liminf = \frac19 Dan \limsup = \frac59.

Untuk satu set C\subset\mathbbNkepadatan dapat didefinisikan sebagai

\displaystyle \rho_C = \lim_N\rightarrow\infty \frac1N \sum_n=1^N \chi_C(n)

Ini adalah contoh dari rata-rata Cesaro, yang menetapkan bobot 1/T ke masing-masing yang pertama N ketentuan.

Ada beberapa cara alternatif untuk menentukan kerapatan. Kepadatan harmonik menggantikan bobot seragam 1/T dengan urutan menurun

\displaystyle w_n = \kiri[\frac1H_N\right]\frac1n \,,\quad\mboxdi mana\quad H_N = \sum_n=1^N \frac1n \,.  \ \ \ \ \ (2)

Angka-angka H_n dikenal sebagai bilangan harmonik. Seperti diketahui, deret harmonik menyimpang, jadi \lim_n\rightarrow\infty H_n = \infty. Diaconis dan Skyrmes (2018) menjelaskan generalisasi dari (2):

\displaystyle w_n = \kiri[\frac1\zeta_s(N)\right]\frac1n^s \,,\quad\mboxdimana\quad \zeta_s(N) = \sum_n=1^N \frac1n^s \,.

Untuk s>1″ class=”latex” />fungsi <img decoding= konvergen dengan fungsi Riemann zeta \zeta(s).

Pada Gambar di atas, kami menunjukkan frekuensi relatif untuk digit pertama dari sebuah angka D_1=1 (kurva biru) dan H_1 = 9 (kurva merah) untuk N bervariasi dari 1 ke 5\kali 10^4. Hal ini menggambarkan bahwa, untuk D_1=1frekuensi berosilasi antara batas kira-kira \frac19 Dan \frac59.

Jika Kalian ingin mencari jawaban lainya, Baca Juga :  Segitiga Pascal dan Teorema Binomial

Pada Gambar di bawah ini, kami menunjukkan frekuensi relatif untuk digit pertama dari suatu bilangan D_1=1, di mana rata-rata logaritmik (2) digunakan. Indikasinya adalah frekuensi berosilasi dengan pengurangan amplitudo dan cenderung ke batas sekitar 0,3, sesuai dengan Hukum Benford.

{Kepadatan probabilitas untuk D_1=1 dengan probabilitas berbobot harmonis (2).

Distribusi Logaritmik

Kami melihat bahwa frekuensi terjadinya D sebagai digit terdepan mengikuti hukum logaritmik. Tapi dari mana ini berasal? Jika kita menganggap bahwa semua nomor N dalam jangkauan 1 \le n \le N mungkin terjadi dengan probabilitas yang sama, maka distribusi seragam

\displaystyle \mathsfP(n) = \frac1N

tepat. Ini mengarah pada kesimpulan bahwa semua angka desimal harus terjadi dengan probabilitas yang sama 1/9 (karena nol tidak bisa menjadi digit terdepan). Namun, kami dapat berargumen bahwa angka yang lebih kecil lebih mungkin daripada yang lebih besar dan menetapkan distribusi lain, seperti distribusi logaritmik. Kita ingat bahwa bilangan harmonik asimtotik terhadap fungsi logaritmik H_n \sim\log n. Jadi, untuk perkiraan yang baik, probabilitas bahwa angka yang dipilih secara acak berada dalam kisaran R \le n \le S adalah \log S - \log R = \log S/R.

Sekarang pertimbangkan `dekade’ angka 10^k \le n \le 10^k+1. Probabilitas bahwa pilihan acak dalam interval ini adalah \log 10^k+1-\log 10^k = \log 10sedangkan angka dengan digit terdepan 1 (dalam selang waktu 10^k \le n \le 2\kali 10^k) terjadi dengan probabilitas \log 2\kali 10^k-\log 10^k = \log 2. Dengan demikian, frekuensi relatif bilangan dengan digit terdepan 1 adalah

\displaystyle \frac\log 2\log 10 = \log_10 2 \kira-kira 0,3010 \,,

atau sekitar 30\%. Ini adalah kasus khusus Hukum Benford untuk d=1. Kasus yang tersisa dapat ditunjukkan dengan cara yang sama.

Sumber

\peluru Berger, Arno dan Theodore P. Hill, 2015: Pengantar Hukum Benford. Universitas Princeton. Tekan, 248pp. ISBN: 978-0-691-16306-2.

\peluru Deacon, Persi dan Brian Skyrms, 2018: Sepuluh Ide Hebat Tentang Peluang. Universitas Princeton. Tekan, 255 halaman [See Chapter 5].

\peluru Tenenbaum, Gerald, 1995: Pengantar Teori Bilangan Analitik dan Probabilistik. Pers Universitas Cambridge. ISBN 0-521-41261-7.

\peluru Thatsmaths: Berapa banyak angka yang dimulai dengan 1?

Author: admin

Leave a Reply

Your email address will not be published. Required fields are marked *