Audiodan musiqa janrlarini tanib olishni o'rganish Challenjga umumiy nuqtai


Download 18.33 Kb.
Sana17.06.2023
Hajmi18.33 Kb.
#1531192
Bog'liq
Audiodan musiqa janrlarini tanib olishni kurs ishi O\'rozbekov Jamshidbek


Audiodan musiqa janrlarini tanib olishni o'rganish
Challenjga umumiy nuqtai
Maykl Deferrard
EPFL, Lozanna, Shveytsariya
michael.deferrard@epfl.ch
Sharada P. Mohanty
EPFL, Lozanna, Shveytsariya
sharada.mohanty@epfl.ch
Shon F. Kerroll
EPFL, Lozanna, Shveytsariya
sean.carroll@epfl.ch
Marsel Salad
EPFL, Lozanna, Shveytsariya
marcel.salathe@epfl.ch
ANTRACT
Biz bu erda ochiqlik bilan shug'ullanish tajribamizni umumlashtiramiz
musiqa janrini aniqlash uchun ma'lumot. Ushbu eslatmalar vazifani rag'batlantiradi
va tanlov dizayni, taqdimotlar haqida ba'zi statistik ma'lumotlarni ko'rsating va natijalarni taqdim eting.
Kalit SO‘ZLAR
Musiqa ma'lumotlarini qidirish (MIR); ML Challenge; Ochiq ma'lumotlar
ACM mos yozuvlar formati:
Maykl Deferrard, Sharada P. Mohanty, Sean F. Carroll va Marsel Salathé.
2018. Audiodan musiqa janrini aniqlashni o'rganish: qiyinchilikni ko'rib chiqish.
WWW '18 Companion-da: 2018-yilgi veb-konferentsiya hamkori, 23–27 aprel,
2018 yil, Lion, Fransiya. ACM, Nyu-York, NY, AQSh, 2 sahifa. https://doi.org/10.
1145/3184558.3192310
1.KIRISH
Hech qachon bo'lmaganidek, Internet ijodiy g'oyalar almashish joyiga aylandi
ish - musiqa kabi - san'atkorlar global hamjamiyatida va
san'at ixlosmandlari. Garchi musiqa va musiqa to'plamlari Internetdan oldin paydo bo'lgan bo'lsa-da,
veb ancha katta to'plamlarni ishga tushirdi. Lekin odamlar
Ilgari ularda bir nechta vinil plastinalar yoki kompakt disklar bo‘lgan, bugun ham bor
Internetda chop etilgan barcha musiqa kontentiga tezkor kirish
Spotify, iTunes, Youtube, FMA, Jamendo, Bandcamp va boshqalar kabi platformalar. Musiqiy to'plamlar hajmining bunday keskin o'sishi
ikkita qiyinchilik tug'dirdi: (i) avtomatik ravishda tashkil etish zarurati a
to'plam (chunki foydalanuvchilar va noshirlar ularni qo'lda boshqara olmaydi
hozir) va (ii) yangi qo'shiqlarni avtomatik ravishda tavsiya etish zarurati
tinglash odatlarini biladigan foydalanuvchiga. Ikkalasida ham asosiy vazifa
bu qiyinchiliklar qo'shiqlarni semantik toifalarga guruhlash imkoniyatiga ega.
Musiqa janrlari kompleks orqali yaratilgan kategoriyalardir
xarakterlash uchun madaniyatlar, rassomlar va bozor kuchlarining o'zaro ta'siri
kompozitsiyalar va musiqa to'plamlarini tashkil etish o'rtasidagi o'xshashliklar.
Biroq, janrlar orasidagi chegaralar hali ham aniq emas
Musiqa janrini aniqlash muammosi (MGR) noaniq vazifadir [5].
Uning foydaliligi muhokama qilingan bo'lsa-da, asosan uning noaniqligi tufayli
va musiqa toifalarini muhokama qilishni foydali deb bilgan foydalanuvchilar tomonidan keng qo'llaniladigan va tushuniladigan madaniy ta'rif [3].
Ushbu maqola Creative Commons Attribution 4.0 International ostida chop etilgan
(CC BY 4.0) litsenziyasi. Mualliflar o'z asarlarini tarqatish huquqini o'zida saqlab qoladi
tegishli atributga ega shaxsiy va korporativ veb-saytlar.
WWW '18 Companion, 23-27 aprel, 2018 yil, Lion, Frantsiya
© 2018 IW3C2 (Xalqaro Butunjahon Internet konferentsiyasi qo'mitasi), tomonidan nashr etilgan
Creative Commons CC BY 4.0 bo'yicha litsenziyalangan.
ACM ISBN 978-1-4503-5640-4/18/04.
https://doi.org/10.1145/3184558.3192310
Ushbu muammoning vazifasi, to'rtta veb-konferentsiyadan biri
muammolar, musiqa asarining musiqiy janrini tan olish edi
ulardan faqat yozuv mavjud. Janrlar keng, masalan. pop yoki
rok va har bir qo'shiq faqat bitta maqsadli janrga ega. Boshqa metamaʼlumotlar, masalan.
qo'shiq nomi yoki qo'shiqchi nomi bashorat qilish uchun ishlatilmasligi kerak edi.
Ushbu tanlov uchun ma'lumotlar yaqinda nashr etilgan
FMA ma'lumotlar to'plami [1], Bepul musiqa arxivi (FMA).1 The
maʼlumotlar toʻplami 917 GiB va 343 kunlik Creative Commonslicensed audio toʻplamidan iborat boʻlib, 16.341 ijrochi va 14.854 ta trekdan 106 574 ta trekdan iborat.
161 janrning ierarxik taksonomiyasi bo'yicha tuzilgan albomlar. U to'liq uzunlikdagi va yuqori sifatli audio, oldindan hisoblangan xususiyatlarni taqdim etadi,
trek va foydalanuvchi darajasidagi metama'lumotlar, teglar va erkin shakl bilan birga
tarjimai hollar kabi matnlar.
2 CHALENGE
Haddan tashqari moslashish va aldashning oldini olish uchun biz tanlovni tashkil qildik
ikki tur. Yakuniy reyting ikkinchidan olingan natijalar asosida tuzilgan
dumaloq. Ikkala tur uchun o'quv ma'lumotlari FMA dan iborat edi
30 soniyalik 25 000 ta klipdan tashkil topgan o'rta to'plam,
16 janrga bo'lingan. Kategoriyalash 21 bilan muvozanatsiz
har bir janrga 7103 ta klip. Ma'lumotlar ochiq bo'lgani uchun biz yangi test to'pladik
test to'plamiga kirishni oldini olish uchun ikkinchi tur uchun ma'lumotlar.
Birinchi bosqichda ishtirokchilarga 30 000 test to‘plami taqdim etildi
Har biri 30 soniyali kliplar va ular uchun bashorat qilingan janrni yuklash kerak edi
ushbu kliplarning har biri. Platforma ushbu bashoratlarni osongina baholadi
va har bir taqdimot bo'yicha ishtirokchilarni tartibladi. Bularning kichik to'plami
kliplar FMA katta ma'lumotlar to'plamidan namunalar olindi, shu bilan birga buni ta'minlash
hech biri o'quv to'plamida taqdim etilgan klip bilan bir-biriga mos kelmaydi. Boshqa
kichik to'plam FMA to'liq ma'lumotlar to'plamidagi qo'shiqlardan namuna olingan
o'rta kichik to'plamda mavjud emas.
Ikkinchi bosqichda ishtirokchilar o'z modellarini git repozitori sifatida taqdim etishlari kerak edi, unda bashorat kodi va
o'qitilgan model va ularning yondashuvining qisqacha mazmuni.
Docker konteynerlari o'sha omborlardan qurilgan.2 Biz keyin
ularni namuna olingan yangi ko'rinmas test to'plamiga qarshi ishlatdi
Bepul musiqa arxiviga yangi hissalar.
Ikkala turda ham bir xil baholash ko'rsatkichidan foydalanilgan. Asosiy ball
o'rtacha log yo'qotish va ikkilamchi ball o'rtacha F1 edi
Xol. O'rtacha log yo'qotish bilan belgilanadi
L = -1NÕN
n=1ÕC
c=1
ync ln(pnc), (1)
1 https://freemusicarchive.org
2 https://github.com/jupyter/repo2docker
WWW '18 Companion, 2018 yil 23–27 aprel, Lion, Frantsiya Maykl Defferrard, Sharada P. Mohanty, Shon F. Carroll va Marsel Salathé
0,0 0,2 0,4 0,6 0,8
F1 - ball
1
2
3
4
5
Log yo'qotish
1-rasm: F1 balli va jurnalning yo'qolishining birgalikda taqsimlanishi
barcha taqdimotlar soni.6 Qizil nuqta asosiy chiziqni bildiradi
tashkilotchilar tomonidan tayyorlangan.
Bu erda N = 35000 - test to'plamidagi misollar soni, C = 16
janrlar soni, ync ikkilik qiymat bo'lib, n-chi bo'lsa
misol c-chi yorlig'iga tegishli, pnc - bu ehtimol
n-nasl c-chi yorlig'iga tegishli bo'lgan taqdimotga va
ln - natural logarifm. O'rtacha F1 ball tomonidan berilgan
F1 =2
C
Õ
C
c=1
p
c
r
c
p
c + r
c p
c =
tpc
tpc + f kompyuter r
c =tpc
tpc + f nc (2)
qaerda p
can rc
classc va tpc uchun aniqlik va eslab qolishdir
f kompyuter,
f nc
haqiqiy ijobiy, noto'g'ri ijobiy va noto'g'ri soniga ishora qiladi
salbiy.
Chalg‘i ochiq uchun ochiq platforma bo‘lgan crowdAI da bo‘lib o‘tdi
qiyinchiliklar. Qanday ishtirok etish bo'yicha ko'rsatmalar, treningga kirish va
test maʼlumotlari, baholangan topshiriqlar va yetakchilar roʻyxati mavjud edi
sinov sahifasi.3 Bundan tashqari, biz kodli boshlang'ich to'plamni ishlab chiqdik
ma'lumotlar bilan ishlash va taqdim etish.4
Unda ba'zilari ham bor edi
misollar va asos. Nihoyat, ishtirokchilar rag'batlantirildi
sifatida ma'lumotlarning batafsil tavsifi uchun FMA qog'ozini [1] ko'rib chiqing
shuningdek, qanday qilib ko'rsatadigan Jupyter noutbuklari uchun GitHub ombori
ma'lumotlardan foydalanish, ularni o'rganish va asosiy modellarni o'rgatish.5
3 NATIJA
Birinchi bosqich oxirida biz taqdim etgan, ma'lumotlar to'plamini yuklab olgan yoki jami 246 ishtirokchini jalb qildik.
forumlarga hissa qo'shgan. O'sha 246 ishtirokchidan 38 tasi
eng yaxshi ishtirokchilarning ba'zilari sifatida kamida bitta taqdim etish
110 ta taqdimnoma. Jami 671 ta murojaat kelib tushgan
birinchi tur. Ulardan 77 tasi yaroqsiz, 576 tasi muvaffaqiyatli yakunlandi
baholangan. Ushbu 576 ta taqdimnomadan 364 tasi yuqori ball to'plagan
tashkilotchilar tomonidan taqdim etilgan asosiy. 1-rasmda taqsimot ko'rsatilgan
F1 ballari va log yo'qotishlar. Hozirgi eng yaxshi yechim F1 balliga ega
0,909 va log yo'qotish 0,330. 2-rasmda ishtirokchilar qanday qilib ko'rsatilgan
birinchi davradan o'tib ketdi.
Bundan tashqari, biz ikkita hujjatni ko'rib chiqdik va qabul qildik. [4] da,
mualliflar quyidagi yondashuvlarni solishtirdilar: (i) spektrogrammalarda ConvNet va (ii) chuqur neyron tarmoq, (iii) ExtraTrees va (iv) XGBoost
Essentia tomonidan chiqarilgan yuqori darajadagi xususiyatlarda. Ular buni topdilar
3https://www.crowdai.org/challenges/www-2018-challenge-learning-to-recognize-musical-genre
4https://github.com/crowdAI/crowdai-musical-genre-recognition-starter-kit
5Kod va ma'lumotlar https://github.com/mdeff/fma manzilida mavjud.. Rc1 versiyasi ishlatilgan.
2-rasm: Barcha ishtirokchilarning reyting bo'yicha reytingi
tanlovning birinchi bosqichi. Har bir qator faolni bildiradi
ishtirokchi. Nuqta chiziq asosiy chiziqni ifodalaydi.
ansambl usullari XGBoost bilan neyron tarmoqlardan ustun keldi
eng yaxshi ishlash. [2] da mualliflar janrlar sub'ektiv va shovqinli teglar, rassomlar esa ko'proq ob'ektiv teglar ekanligini ta'kidladilar. Sifatida
rassom odatda janrlarning bir qismidir va bu rassomlar to'plami
janrlar uchun namuna sifatida ko'rish mumkin, ular musiqiy deb faraz qildilar
Rassomni belgilaydigan xususiyatlar ham asosiy xususiyatlar bo'lishi mumkin
muayyan janrlar. Shunday qilib, ular ko'p vazifali neyronni o'qitishni taklif qilishdi
Rassom guruhi va janrini birgalikda bashorat qilish uchun tarmoq. Natijalar ko'rsatildi
Rassomni tanib olish uchun o'rganilgan xususiyatlar haqiqatan ham foydali bo'lgan
MGR. Shunday qilib, ular saqlab qolish bilan birga, transfer o'rganishga erishdilar
bir nechta kichik vazifalardan biri sifatida asosiy MGR vazifasi juda muhim edi.
4 XULOSA
Tanlovning natijalari ko'p edi. Birinchidan, qabul qilingan
maqolalar yangi istiqbollarni taqdim etdi va yangi usullarni kiritdi.
Keyin ikkinchi bosqichning barcha ishtirokchilari o'zlarining fikrlarini baham ko'rishlari kerak edi
ochiq kodli kod sifatida. Umid qilamizki, bu amaliyotlar amalga oshadi
jamiyat uchun foydali, masalan, asos bo‘lib xizmat qilish, bo‘lish
sinchiklab tekshiriladi yoki takomillashtiriladi. Nihoyat, muammo ishtirokchilarni yangi FMA ma'lumotlar to'plami bilan tanishtirdi va bu imkoniyat bo'ldi
ular bilan tanishishlari uchun.
Bu muammo musiqa maʼlumotlarini mashinaviy oʻrganishda ochiq baholashni targʻib qilish boʻyicha kengroq saʼy-harakatlarning bir qismi boʻlib, shundan
ochiq FMA ma'lumotlar to'plami birinchi qadam edi [1]. Ushbu tashabbusning maqsadi ochiq ma'lumotlarga asoslangan mos yozuvlar benchmarkini yaratishdir. MIR
Tadqiqot tarixan tijorat manfaatlaridan kelib chiqadigan ommaviy ma'lumotlar to'plamining etishmasligidan aziyat chekdi.
musiqada rekord yorliqlar tomonidan yaratilgan va shuning uchun qattiq mualliflik huquqi o'rnatilgan.
FMA ning yechimi litsenziyaga ruxsat beruvchi treklarni qidirish edi
qayta taqsimlash. Loyiha davomida ishlab chiqarilgan barcha ma'lumotlar va kodlar va
Chalg'itish CC BY 4.0 va MIT litsenziyalari ostida chiqariladi.
ADABIYOTLAR
[1] Maykl Defferrard, Kirell Benzi, Per Vandergeynst va Xaver Bresson. 2017 yil.
FMA: Musiqa tahlili uchun ma'lumotlar to'plami. ISMIRda.
[2] Jaehun Kim, Minz Won, Xavier Serra va Cynthia C. S. Liem. 2018. Transfer
Musiqiy janr tasnifiga san'atkorlar guruhi omillarini o'rganish. WWW da.
[3] C Makkay va men Fujinaga. 2006. Musiqiy janrlar tasnifi: izlashga arziydimi?
va uni qanday yaxshilash mumkin? ISMIRda.
[4] Benjamin Murauer va Gyunter Spekt. 2018. Musiqa janridan foydalanib aniqlash
Ekstremal gradient oshirish. WWW da.
[5] N Scaringella, G Zoia va D Mlynek. 2006. Avtomatik janr tasnifi
musiqa mazmuni: so'rovnoma. IEEE Signal Processing jurnali (2006)
Download 18.33 Kb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling