Audiodan musiqa janrlarini tanib olishni o'rganish Challenjga umumiy nuqtai
Download 18.33 Kb.
|
Audiodan musiqa janrlarini tanib olishni kurs ishi O\'rozbekov Jamshidbek
Audiodan musiqa janrlarini tanib olishni o'rganish Challenjga umumiy nuqtai Maykl Deferrard EPFL, Lozanna, Shveytsariya michael.deferrard@epfl.ch Sharada P. Mohanty EPFL, Lozanna, Shveytsariya sharada.mohanty@epfl.ch Shon F. Kerroll EPFL, Lozanna, Shveytsariya sean.carroll@epfl.ch Marsel Salad EPFL, Lozanna, Shveytsariya marcel.salathe@epfl.ch ANTRACT Biz bu erda ochiqlik bilan shug'ullanish tajribamizni umumlashtiramiz musiqa janrini aniqlash uchun ma'lumot. Ushbu eslatmalar vazifani rag'batlantiradi va tanlov dizayni, taqdimotlar haqida ba'zi statistik ma'lumotlarni ko'rsating va natijalarni taqdim eting. Kalit SO‘ZLAR Musiqa ma'lumotlarini qidirish (MIR); ML Challenge; Ochiq ma'lumotlar ACM mos yozuvlar formati: Maykl Deferrard, Sharada P. Mohanty, Sean F. Carroll va Marsel Salathé. 2018. Audiodan musiqa janrini aniqlashni o'rganish: qiyinchilikni ko'rib chiqish. WWW '18 Companion-da: 2018-yilgi veb-konferentsiya hamkori, 23–27 aprel, 2018 yil, Lion, Fransiya. ACM, Nyu-York, NY, AQSh, 2 sahifa. https://doi.org/10. 1145/3184558.3192310 1.KIRISH Hech qachon bo'lmaganidek, Internet ijodiy g'oyalar almashish joyiga aylandi ish - musiqa kabi - san'atkorlar global hamjamiyatida va san'at ixlosmandlari. Garchi musiqa va musiqa to'plamlari Internetdan oldin paydo bo'lgan bo'lsa-da, veb ancha katta to'plamlarni ishga tushirdi. Lekin odamlar Ilgari ularda bir nechta vinil plastinalar yoki kompakt disklar bo‘lgan, bugun ham bor Internetda chop etilgan barcha musiqa kontentiga tezkor kirish Spotify, iTunes, Youtube, FMA, Jamendo, Bandcamp va boshqalar kabi platformalar. Musiqiy to'plamlar hajmining bunday keskin o'sishi ikkita qiyinchilik tug'dirdi: (i) avtomatik ravishda tashkil etish zarurati a to'plam (chunki foydalanuvchilar va noshirlar ularni qo'lda boshqara olmaydi hozir) va (ii) yangi qo'shiqlarni avtomatik ravishda tavsiya etish zarurati tinglash odatlarini biladigan foydalanuvchiga. Ikkalasida ham asosiy vazifa bu qiyinchiliklar qo'shiqlarni semantik toifalarga guruhlash imkoniyatiga ega. Musiqa janrlari kompleks orqali yaratilgan kategoriyalardir xarakterlash uchun madaniyatlar, rassomlar va bozor kuchlarining o'zaro ta'siri kompozitsiyalar va musiqa to'plamlarini tashkil etish o'rtasidagi o'xshashliklar. Biroq, janrlar orasidagi chegaralar hali ham aniq emas Musiqa janrini aniqlash muammosi (MGR) noaniq vazifadir [5]. Uning foydaliligi muhokama qilingan bo'lsa-da, asosan uning noaniqligi tufayli va musiqa toifalarini muhokama qilishni foydali deb bilgan foydalanuvchilar tomonidan keng qo'llaniladigan va tushuniladigan madaniy ta'rif [3]. Ushbu maqola Creative Commons Attribution 4.0 International ostida chop etilgan (CC BY 4.0) litsenziyasi. Mualliflar o'z asarlarini tarqatish huquqini o'zida saqlab qoladi tegishli atributga ega shaxsiy va korporativ veb-saytlar. WWW '18 Companion, 23-27 aprel, 2018 yil, Lion, Frantsiya © 2018 IW3C2 (Xalqaro Butunjahon Internet konferentsiyasi qo'mitasi), tomonidan nashr etilgan Creative Commons CC BY 4.0 bo'yicha litsenziyalangan. ACM ISBN 978-1-4503-5640-4/18/04. https://doi.org/10.1145/3184558.3192310 Ushbu muammoning vazifasi, to'rtta veb-konferentsiyadan biri muammolar, musiqa asarining musiqiy janrini tan olish edi ulardan faqat yozuv mavjud. Janrlar keng, masalan. pop yoki rok va har bir qo'shiq faqat bitta maqsadli janrga ega. Boshqa metamaʼlumotlar, masalan. qo'shiq nomi yoki qo'shiqchi nomi bashorat qilish uchun ishlatilmasligi kerak edi. Ushbu tanlov uchun ma'lumotlar yaqinda nashr etilgan FMA ma'lumotlar to'plami [1], Bepul musiqa arxivi (FMA).1 The maʼlumotlar toʻplami 917 GiB va 343 kunlik Creative Commonslicensed audio toʻplamidan iborat boʻlib, 16.341 ijrochi va 14.854 ta trekdan 106 574 ta trekdan iborat. 161 janrning ierarxik taksonomiyasi bo'yicha tuzilgan albomlar. U to'liq uzunlikdagi va yuqori sifatli audio, oldindan hisoblangan xususiyatlarni taqdim etadi, trek va foydalanuvchi darajasidagi metama'lumotlar, teglar va erkin shakl bilan birga tarjimai hollar kabi matnlar. 2 CHALENGE Haddan tashqari moslashish va aldashning oldini olish uchun biz tanlovni tashkil qildik ikki tur. Yakuniy reyting ikkinchidan olingan natijalar asosida tuzilgan dumaloq. Ikkala tur uchun o'quv ma'lumotlari FMA dan iborat edi 30 soniyalik 25 000 ta klipdan tashkil topgan o'rta to'plam, 16 janrga bo'lingan. Kategoriyalash 21 bilan muvozanatsiz har bir janrga 7103 ta klip. Ma'lumotlar ochiq bo'lgani uchun biz yangi test to'pladik test to'plamiga kirishni oldini olish uchun ikkinchi tur uchun ma'lumotlar. Birinchi bosqichda ishtirokchilarga 30 000 test to‘plami taqdim etildi Har biri 30 soniyali kliplar va ular uchun bashorat qilingan janrni yuklash kerak edi ushbu kliplarning har biri. Platforma ushbu bashoratlarni osongina baholadi va har bir taqdimot bo'yicha ishtirokchilarni tartibladi. Bularning kichik to'plami kliplar FMA katta ma'lumotlar to'plamidan namunalar olindi, shu bilan birga buni ta'minlash hech biri o'quv to'plamida taqdim etilgan klip bilan bir-biriga mos kelmaydi. Boshqa kichik to'plam FMA to'liq ma'lumotlar to'plamidagi qo'shiqlardan namuna olingan o'rta kichik to'plamda mavjud emas. Ikkinchi bosqichda ishtirokchilar o'z modellarini git repozitori sifatida taqdim etishlari kerak edi, unda bashorat kodi va o'qitilgan model va ularning yondashuvining qisqacha mazmuni. Docker konteynerlari o'sha omborlardan qurilgan.2 Biz keyin ularni namuna olingan yangi ko'rinmas test to'plamiga qarshi ishlatdi Bepul musiqa arxiviga yangi hissalar. Ikkala turda ham bir xil baholash ko'rsatkichidan foydalanilgan. Asosiy ball o'rtacha log yo'qotish va ikkilamchi ball o'rtacha F1 edi Xol. O'rtacha log yo'qotish bilan belgilanadi L = -1NÕN n=1ÕC c=1 ync ln(pnc), (1) 1 https://freemusicarchive.org 2 https://github.com/jupyter/repo2docker WWW '18 Companion, 2018 yil 23–27 aprel, Lion, Frantsiya Maykl Defferrard, Sharada P. Mohanty, Shon F. Carroll va Marsel Salathé 0,0 0,2 0,4 0,6 0,8 F1 - ball 1 2 3 4 5 Log yo'qotish 1-rasm: F1 balli va jurnalning yo'qolishining birgalikda taqsimlanishi barcha taqdimotlar soni.6 Qizil nuqta asosiy chiziqni bildiradi tashkilotchilar tomonidan tayyorlangan. Bu erda N = 35000 - test to'plamidagi misollar soni, C = 16 janrlar soni, ync ikkilik qiymat bo'lib, n-chi bo'lsa misol c-chi yorlig'iga tegishli, pnc - bu ehtimol n-nasl c-chi yorlig'iga tegishli bo'lgan taqdimotga va ln - natural logarifm. O'rtacha F1 ball tomonidan berilgan F1 =2 C Õ C c=1 p c r c p c + r c p c = tpc tpc + f kompyuter r c =tpc tpc + f nc (2) qaerda p can rc classc va tpc uchun aniqlik va eslab qolishdir f kompyuter, f nc haqiqiy ijobiy, noto'g'ri ijobiy va noto'g'ri soniga ishora qiladi salbiy. Chalg‘i ochiq uchun ochiq platforma bo‘lgan crowdAI da bo‘lib o‘tdi qiyinchiliklar. Qanday ishtirok etish bo'yicha ko'rsatmalar, treningga kirish va test maʼlumotlari, baholangan topshiriqlar va yetakchilar roʻyxati mavjud edi sinov sahifasi.3 Bundan tashqari, biz kodli boshlang'ich to'plamni ishlab chiqdik ma'lumotlar bilan ishlash va taqdim etish.4 Unda ba'zilari ham bor edi misollar va asos. Nihoyat, ishtirokchilar rag'batlantirildi sifatida ma'lumotlarning batafsil tavsifi uchun FMA qog'ozini [1] ko'rib chiqing shuningdek, qanday qilib ko'rsatadigan Jupyter noutbuklari uchun GitHub ombori ma'lumotlardan foydalanish, ularni o'rganish va asosiy modellarni o'rgatish.5 3 NATIJA Birinchi bosqich oxirida biz taqdim etgan, ma'lumotlar to'plamini yuklab olgan yoki jami 246 ishtirokchini jalb qildik. forumlarga hissa qo'shgan. O'sha 246 ishtirokchidan 38 tasi eng yaxshi ishtirokchilarning ba'zilari sifatida kamida bitta taqdim etish 110 ta taqdimnoma. Jami 671 ta murojaat kelib tushgan birinchi tur. Ulardan 77 tasi yaroqsiz, 576 tasi muvaffaqiyatli yakunlandi baholangan. Ushbu 576 ta taqdimnomadan 364 tasi yuqori ball to'plagan tashkilotchilar tomonidan taqdim etilgan asosiy. 1-rasmda taqsimot ko'rsatilgan F1 ballari va log yo'qotishlar. Hozirgi eng yaxshi yechim F1 balliga ega 0,909 va log yo'qotish 0,330. 2-rasmda ishtirokchilar qanday qilib ko'rsatilgan birinchi davradan o'tib ketdi. Bundan tashqari, biz ikkita hujjatni ko'rib chiqdik va qabul qildik. [4] da, mualliflar quyidagi yondashuvlarni solishtirdilar: (i) spektrogrammalarda ConvNet va (ii) chuqur neyron tarmoq, (iii) ExtraTrees va (iv) XGBoost Essentia tomonidan chiqarilgan yuqori darajadagi xususiyatlarda. Ular buni topdilar 3https://www.crowdai.org/challenges/www-2018-challenge-learning-to-recognize-musical-genre 4https://github.com/crowdAI/crowdai-musical-genre-recognition-starter-kit 5Kod va ma'lumotlar https://github.com/mdeff/fma manzilida mavjud.. Rc1 versiyasi ishlatilgan. 2-rasm: Barcha ishtirokchilarning reyting bo'yicha reytingi tanlovning birinchi bosqichi. Har bir qator faolni bildiradi ishtirokchi. Nuqta chiziq asosiy chiziqni ifodalaydi. ansambl usullari XGBoost bilan neyron tarmoqlardan ustun keldi eng yaxshi ishlash. [2] da mualliflar janrlar sub'ektiv va shovqinli teglar, rassomlar esa ko'proq ob'ektiv teglar ekanligini ta'kidladilar. Sifatida rassom odatda janrlarning bir qismidir va bu rassomlar to'plami janrlar uchun namuna sifatida ko'rish mumkin, ular musiqiy deb faraz qildilar Rassomni belgilaydigan xususiyatlar ham asosiy xususiyatlar bo'lishi mumkin muayyan janrlar. Shunday qilib, ular ko'p vazifali neyronni o'qitishni taklif qilishdi Rassom guruhi va janrini birgalikda bashorat qilish uchun tarmoq. Natijalar ko'rsatildi Rassomni tanib olish uchun o'rganilgan xususiyatlar haqiqatan ham foydali bo'lgan MGR. Shunday qilib, ular saqlab qolish bilan birga, transfer o'rganishga erishdilar bir nechta kichik vazifalardan biri sifatida asosiy MGR vazifasi juda muhim edi. 4 XULOSA Tanlovning natijalari ko'p edi. Birinchidan, qabul qilingan maqolalar yangi istiqbollarni taqdim etdi va yangi usullarni kiritdi. Keyin ikkinchi bosqichning barcha ishtirokchilari o'zlarining fikrlarini baham ko'rishlari kerak edi ochiq kodli kod sifatida. Umid qilamizki, bu amaliyotlar amalga oshadi jamiyat uchun foydali, masalan, asos bo‘lib xizmat qilish, bo‘lish sinchiklab tekshiriladi yoki takomillashtiriladi. Nihoyat, muammo ishtirokchilarni yangi FMA ma'lumotlar to'plami bilan tanishtirdi va bu imkoniyat bo'ldi ular bilan tanishishlari uchun. Bu muammo musiqa maʼlumotlarini mashinaviy oʻrganishda ochiq baholashni targʻib qilish boʻyicha kengroq saʼy-harakatlarning bir qismi boʻlib, shundan ochiq FMA ma'lumotlar to'plami birinchi qadam edi [1]. Ushbu tashabbusning maqsadi ochiq ma'lumotlarga asoslangan mos yozuvlar benchmarkini yaratishdir. MIR Tadqiqot tarixan tijorat manfaatlaridan kelib chiqadigan ommaviy ma'lumotlar to'plamining etishmasligidan aziyat chekdi. musiqada rekord yorliqlar tomonidan yaratilgan va shuning uchun qattiq mualliflik huquqi o'rnatilgan. FMA ning yechimi litsenziyaga ruxsat beruvchi treklarni qidirish edi qayta taqsimlash. Loyiha davomida ishlab chiqarilgan barcha ma'lumotlar va kodlar va Chalg'itish CC BY 4.0 va MIT litsenziyalari ostida chiqariladi. ADABIYOTLAR [1] Maykl Defferrard, Kirell Benzi, Per Vandergeynst va Xaver Bresson. 2017 yil. FMA: Musiqa tahlili uchun ma'lumotlar to'plami. ISMIRda. [2] Jaehun Kim, Minz Won, Xavier Serra va Cynthia C. S. Liem. 2018. Transfer Musiqiy janr tasnifiga san'atkorlar guruhi omillarini o'rganish. WWW da. [3] C Makkay va men Fujinaga. 2006. Musiqiy janrlar tasnifi: izlashga arziydimi? va uni qanday yaxshilash mumkin? ISMIRda. [4] Benjamin Murauer va Gyunter Spekt. 2018. Musiqa janridan foydalanib aniqlash Ekstremal gradient oshirish. WWW da. [5] N Scaringella, G Zoia va D Mlynek. 2006. Avtomatik janr tasnifi musiqa mazmuni: so'rovnoma. IEEE Signal Processing jurnali (2006) Download 18.33 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2025
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling