Membuat Gambar Suara untuk Mengidentifikasi Lagu Burung

Hey, Selamat datang di wikitanic.com.

Atas: Sinyal audio dengan tiga kicauan. Bawah: Spektogram sinyal Waktu-Frekuensi.

Seorang musisi terlatih dapat melihat skor musik dan membayangkan suara seluruh orkestra. Skor adalah representasi visual dari suara. Dengan cara yang analog, kita dapat merepresentasikan kicau burung dengan sebuah gambar, dan analisis dari gambar tersebut dapat memberi tahu kita spesies kicauan burung. Inilah yang terjadi dengan ID Burung Merlin. Dalam episode terbaru dari Mooney Menjadi Liar, Niall Hatch dari Birdwatch Ireland mewawancarai Drew Weber dari Cornell Lab of Ornithology, pengembang Merlin Bird ID. Aplikasi telepon ini memungkinkan sejumlah besar burung untuk diidentifikasi [TM237 or search for “thatsmaths” at irishtimes.com].

Fitur yang sangat menarik adalah Sound ID: berdiri saja di taman, di tepi laut atau di perbukitan dan tekan “rekam”. Sound ID akan membandingkan kicauan burung dengan bank data suara rekaman yang besar dan dengan cepat mengidentifikasi spesiesnya. Sound ID adalah kemajuan besar dalam identifikasi suara dan pembelajaran mesin. Saat ini, ia dapat mengidentifikasi sekitar 250 spesies burung Eropa dan lebih banyak spesies eksotis lainnya.

Bagaimana cara kerja ID Suara?

Rekaman nyanyian burung pada dasarnya adalah grafik tekanan udara terhadap waktu, penuh dengan informasi tetapi sulit untuk ditafsirkan. Ide Sound ID adalah menggunakan model visi komputer untuk mengidentifikasi vokalisasi burung. Untuk Sound ID, algoritma yang disebut Short-time Fourier transform (STFT) mengubah sinyal audio menjadi gambar yang disebut spektogram.

Spektogram adalah diagram dengan waktu pada sumbu horizontal dan frekuensi pada sumbu vertikal. Ini sangat mirip dengan skor musik, yang memiliki waktu pada satu sumbu dan nada pada sumbu lainnya. Catatan yang berbunyi pada saat yang sama muncul sebagai tumpukan vertikal, akord.

Setelah audio diubah menjadi spektogram, audio dapat dimasukkan ke dalam model visi komputer standar, yang dilatih untuk mengidentifikasi vokalisasi burung berdasarkan tanda visualnya dalam spektogram. Analisis gambar komputer sangat canggih, dan dapat digunakan untuk memecah gambar menjadi bagian-bagian yang dapat diatur. Setiap bagian kemudian dapat dibandingkan dengan database kicau burung.

Jika Kalian ingin mencari jawaban lainya, Baca Juga :  Wanita di STEM Bagian 2: Membongkar Stereotip Gender

Gambar spektogram diproses oleh model yang disebut deep convolutional neural network (CNN). Jaringan ini disetel dengan memeriksa sejumlah besar kicau burung. Hal ini juga mampu mengenali suara latar belakang asing seperti lalu lintas dan ucapan manusia, dan untuk menghilangkannya.

Pelatihan

Alat ID Suara Merlin dilatih menggunakan data audio saat setiap burung bersuara. Ahli ornitologi memilih momen yang tepat saat burung berkicau, dan menandai suara tersebut dengan spesies burung yang sesuai. Jaringan saraf menggunakan sejumlah besar parameter, yang disebut bobot, agar sesuai dengan data. Metode yang disebut algoritme penurunan gradien mengetahui cara menyesuaikan bobot untuk memastikan bahwa prediksi model cocok dengan prediksi pakar ID Suara.

Beberapa pilihan diperlukan saat membuat spektogram: panjang klip audio, panjang jendela STFT optimal, penskalaan vertikal, dan dimensi spasial spektogram. Setelah pengujian ekstensif, ID Suara ditetapkan untuk menggunakan panjang jendela 512 sampel, dengan 128 sampel untuk STFT dan ukuran gambar 128 x 512 piksel. Ini mencapai keseimbangan yang baik antara kecepatan dan akurasi model.

Ada banyak informasi dan detail teknis di situs web Cornell. Merlin Bird ID tersedia gratis. Setelah diinstal di ponsel Anda, ini berjalan offline, tanpa memerlukan koneksi jaringan, dan memungkinkan Anda merekam dan mengidentifikasi burung di sekitar Anda.

Aplikasi tersedia di: ID Burung Merlin.

Kursus UCD tentang matematika rekreasi, AweSums: The Wonder, Utility and Fun of Mathematics, akan dipresentasikan pada musim gugur ini oleh Prof Peter Lynch — pendaftaran dibuka di www.ucd.ie/lifelonglearning

\star \qquad \star \qquad \star

Koleksi Baru Artikel ThatsMaths

HARGA SANGAT KURANG DARI Tekan Logika.

Sekarang tersedia juga dalam bentuk hardback

Leave a Reply

Your email address will not be published. Required fields are marked *

Previous Article

Segitiga Pascal dan Teorema Binomial

Next Article

Luas Permukaan Silinder

Related Posts