Misol. Yuzni tanib olish.
7-rasm.
Shunday qilib, kirish tasvirini turli o'lchamdagi filtrlar va ular tanib olgan elementlarning turli murakkabligi deb atash mumkin bo'lgan qatlamlar tarmog'iga kiradi. Ushbu filtrlar sizning indeksingizni yoki bir qator xususiyatlarni tashkil qiladi, bu keyinchalik sinflashga tushadi. Odatda sinflash uchun SVM yoki MLP - ko'p qatlamli perceptron qulay hisoblanadi.
17.8-rasm.
Agar yuzni tanib olish misolini ko'rib chiqsak, birinchi qatlamning retseptiv maydoni kichik bo'ladi, keyin bir oz ko'proq, ko'proq va shunga o'xshash, nihoyat, biz butun yuzni taniy olamiz.
9-rasm.
Filtrlar ichidagi narsalar nuqtai nazaridan, birinchi navbatda moyil tayoqchalar va bir oz rang, keyin yuzning qismlari bo'ladi va keyin butun yuz qatlamning har bir xujayrasi tanib olinadi.
Shuni yodda tutish kerakki, neyron tarmoq uchun dastlabki ma'lumotlar aniq va izchil bo'lishi kerak.
Umuman olganda, tasvirni tanib olish uchun neyron tarmoqni yaratish quyidagilarni o'z ichiga oladi:
- ma'lumotlarni to'plash va tayyorlash ;
- topologiyani tanlash;
- xususiyatlari tanlash;
- o’qitish parametrlarini tanlash ;
- o’qitish;
- o’qitish sifatini tekshirish;
- tuzatish;
Adabiyotlar ro’yxati
- Ронжин А.Л. Речевой и многомодальный интерфейсы / А.Л. Ронжин, А.А. Карпов, И.В. Ли; - М.: Наука, 2006 - (Информатика: неограниченные возможности и возможные ограничения), 173 с.
- Chesta C. Connected Digit Recognition Using Short and Long Duration Models / C. Chesta, P. Laface, F. Ravera // Proceedings of ICASSP’99 Conference, Phoenix, USA, 1999.
- Kosarev Yu. Robust Speech Understanding for a Voice Control System. // Proceedings of SPECOM’2002, St. Petersburg, 2002, pp. 13-18.
- Потапова Р.К. Речевое управление роботом.// М.:КомКнига, 2005, 328 с.
- Станкевич Л.А. Интеллектуальные роботы и системы управления. // Нейрокомпьютеры: разработка и применение, № 8-9, 2005.
- Timofeev A.V. Development of man-machine interfaces and virtual reality means for integrated medical systems / A.V. Timofeev, et al. // Proceedings of SPECOM'2006, St. Petersburg: “Anatolya”, 2006, pp. 175-178.
- Ли И.В. Проектирование систем речевого диалога / И.В. Ли, А.Л. Ронжин // Труды СПИИРАН. Вып. 3, т. 1. — СПб.: Наука, 2006, С. 320-338.
- Turunen M. Evaluation of a Spoken Dialogue System with Usability Tests and Long-term Pilot Studies: Similarities and Differences / M. Turunen, J. Hakulinen, A. Kainulainen // Proceedings of Interspeech’2006, Pittsburgh, USA, 2006, pp. 1057-1060.
- Марковников Н.М., Кипяткова И. С., Аналитический обзор интегральных систем распознавания речи, Тр. СПИИРАН, 2018, выпуск 58, 77–110. DOI: https://doi.org/10.15622/sp.58.4.
- Potryasaev S. Quality and Quantity Estimation and Analysis of Multimodal Systems for Human-Computer Interaction / S. Potryasaev, B. Sokolov, R. Yusupov // Proceedings of SPECOM’2006, St. Petersburg: “Anatoliya”, 2006, pp. 158-167.
- Polat H., Oyucu S. Building a Speech and Text Corpus of Turkish: Large Corpus Collection with Initial Speech Recognition Results. Symmetry 2020, 12, 290.
- Arul Valiyavalappil Haridasa, Ramalatha Marimuthub, Vaazi Gangadharan Sivakumarc.International Journal of Knowledge-based and Intelligent Engineering Systems 22 (2018) 39–57. DOI 10.3233/KES-180374.
- Muhammadjon Musaev, Ilyos Khujayorov, Mannon Ochilov. Image Approach to Speech Recognition on CNN. ISCSIC 2019: Proceedings of the 2019 3rd International Symposium on Computer Science and Intelligent Control. September 2019 Article No.: 57 Pages 1–6. https://doi.org/10.1145/3386164.3389100.
- Zouhir Y and Ouni K. "Parameterization of speech signals for robust voice recognition," 2014 International Conference on Electrical Sciences and Technologies in Maghreb (CISTEM), Tunis, 2014, pp. 1-4, doi: 10.1109/CISTEM.2014.7076915.
- Мусаев М.М., Хужаяров И.Ш., Очилов М.М. Машинали ўқитиш алгоритмлари асосида ўзбек тили фонемaларини таниб олиш // Журнал Проблемы информатики и энергетики. №6, 2019. -Б. 66-77.
- Бекмуратов Т. Ф., Дорошенко О. Н., Мусаев М. М. Цифроаналоговый преобразователь функций двух переменных. Институт автоматики и электрометрии. Москва, 1976, № 2. стр. 114-116.
- Камилов М.М, Нишанов А.Х. Итерационный метод формирования информативных наборов признаков в задаче распознавания образов. Проблемы информатики и энергетики. №3, 1992. -Б. 5-6.
- Musaev M., Khujayorov I and Ochilov M. "The Use of Neural Networks to Improve the Recognition Accuracy of Explosive and Unvoiced Phonemes in Uzbek Language," 2020 Information Communication Technologies Conference (ICTC), Nanjing, China, 2020, pp. 231-234, doi: 10.1109/ICTC49638.2020.9123309.
- Adrian Rosebrock. Deep Learning for Computer Vision with Python Starter Bundle. 1st Edition (1.2.2). PyImageSearch.com. 2017.
E’TIBORINGIZ UCHUN RAHMAT! E’TIBORINGIZ UCHUN RAHMAT!
Do'stlaringiz bilan baham: |