AUDIO RECOGNITION PROBLEMS
DOI:
https://doi.org/10.30890/2709-2313.2022-08-02-025Keywords:
audio recognition problemsAbstract
audio recognition problemsMetrics
References
Ai for social good. Applying AI to some of the world’s biggest challenges. – URL: https://ai.google/social-good/ (дата обращения: 02.01.2022).
Bringing the world closer together by advancing AI. Meta AI Research. – URL: https://ai.facebook.com/research (дата обращения: 02.01.2022).
Netflix Research. Research Areas: Machine Learning. Learning How to Entertain the World. – URL: https://research.netflix.com/research-area/machine-learning (дата обращения: 02.01.2022).
Google Research. Research Areas: Speech Processing. – URL: https://research.google/research-areas/speech-processing/ (дата обращения: 02.01.2022).
Mirco Ravanelli, Yoshua Bengio. Speaker Recognition from Raw Waveform with SincNet. Electrical Engineering and Systems Science / Mirco Ravanelli, Yoshua Bengio, 2019.
Нейросетевой анализ и сопоставление частотно-временных векторов на основе краткосрочного спектрального представления и адаптивного преобразования Эрмита. / Жирков A.О., Корчагин Д.Н., Лукин А.С., Крылов А.С., Баяковский Ю.М. – ИПМ им. М.В. Келдыша РАН. Москва, 2001.
Harris, Fred. On the Use of Windows for Harmonic Analysis With the Discrete Fourier Transform. / Harris, Fred. – Proceedings of the IEEE. 66. 51-83, 1978.
Дворкович В.П., Дворкович А.В. Оконные функции для гармонического анализа сигналов / Дворкович В.П., Дворкович А.В. - М.: Техносфера, 2014. – 112 c.
Г. Нуссбаумер. Быстрое преобразование Фурье и алгоритмы вычисления сверток. / Г. Нуссбаумер. Перевод с английского Ю. Ф. Касимова и И. П. Пчелинцева; под редакцией чл.-кор. АН КазССР В. М. Амербаева и Т. Э. Кренкеля - Издательство «Радио и связь», 1985.
Распознавание речи на основе сверточных нейронных сетей. / Белоруцкий Р.Ю., Житник С.В. // Вопросы радиоэлектроники. 2019;(4):47-52.
Automatic Speech Recognition of Spoken Digits / Davies, K.H., Biddulph, R. and Balashek, S. // The Journal of the Acoustical Society of America; 24 (6): 637—642, 1952.
Automatic Speech Recognition. / Levis, John & Suvorov, Ruslan, 2012.
IBM Archives. IBM Special Products: IBM Shoebox – URL: https://www.ibm.com/ibm/history/exhibits/specialprod1/specialprod1_7.html (дата обращения: 12.11.2021).
Approach to Computer Speech Recognition by Direct Analysis of the Speech Wave / Reddy, D.R. // The Journal of the Acoustical Society of America 40, 1273-1273, 1966.
Fiber Optic Device Recognizes Signals. / Klass, Philip J. // Aviation Week & Space Technology. — N.Y.: McGraw-Hill, 1962. — Vol. 77 — No. 20 — P. 94-101.
Memory Cells. // Military Review. — April 1963. — Vol. 43 — No. 4 — P. 99.
Armagnac, Alden P. “Tell It to Sceptron!” // Popular Science. — April 1963. — Vol. 182 — No. 4 — P. 120.
Voice-operated Computer Tested. // Air Defense Artillery. - Spring 1983. - No. 2 - P. 54.
WAV Audio File Format Specifications – URL: http://www-mmsp.ece.mcgill.ca/Documents/AudioFormats/WAVE/WAVE.html (дата обращения: 17.09.2021).
Александр Петрович Загуменнов. Компьютерная обработка звука / А.П. Загуменнов, 2000. – 260 с.
Ashby, Michael, & John Maidment. Introducing Phonetic Science. Cambridge: CUP, 2005.
Дворкович В.П., Дворкович А.В. Оконные функции для гармонического анализа сигналов / Дворкович В.П., Дворкович А.В. - М.: Техносфера, 2014. – 112 c.
Современные тренды радиорелейной связи. / Слюсар В.И. // Технологии и средства связи. – 2014. №4, 32-36.
The voice in the machine. Building computers that understand speech. / Pieraccini R., Cambridge, Massachusetts: MIT Press, 2012. 360 p.
Stanford Vision Lab. ImageNet Large Scale Visual Recognition Challenge (ILSVRC 2017) – URL: https://www.researchgate.net/publication/265295439_ImageNet_Large_Scale_Visual_Recognition_Challenge (дата обращения: 01.12.2021)
Хуршудов А.А. Разработка ситемы распознавания визуальных образов в потоке данных / Хуршудов А.А., Кубанский Государственный Технологический университет, 2015.
Simple convolutional neural network on image classification. / Guo T., Dong J., Li H., Gao Y. // IEEE 2nd International Conference on Big Data Analysis (ICBDA). Beijing, 2017. P. 721–724.
Understanding of a convolutional neural network / Albawi S., Mohammed T. A., Al Zawi S. // International Conference on Engineering and Technology (ICET). Antalya, 2017. P. 1–6.
Self-Normalizing Neural Networks / Günter Klambauer, Thomas Unterthiner, Andreas Mayr, Sepp Hochreiter // Advances in Neural Information Processing Systems. — 2017. — Июнь (т. 30, вып. 2017).
Метод автоматического определения ключевых точек объекта на изображении. / Зубов И.Г. // Известия высших учебных заведений России. Радиоэлектроника, 23 (6), 6-16., 2020.
Компьютерное зрение. / Горячкин Б.С., Китов М.А. // E-Scio, (9 (48)), 317-345, 2020.
Dropout: A Simple Way to Prevent Neural Networks from Overfitting / Nitish Srivastava, Geoffrey Hinton, Alex Krizhevsky, Ilya Sutskever, Ruslan Salakhutdinov // Journal of Machine Learning Research. — 2014. — Т. 15.
An empirical analysis of dropout in piecewise linear networks / Warde-Farley, David; Goodfellow, Ian J.; Courville, Aaron & Bengio, Yoshua, arΧiv:1312.6197, 2013.
Программные среды для изучения основ нейронных сетей / П.Ю. Богданов, Е.В. Краева, С.А. Веревкин, Е.Д. Пойманова, & Т.М. Татарникова // Программные продукты и системы, 34 (1), 145-150, 2021.
Исследование архитектуры сверточных нейронных сетей для задачи распознавания образов / Землевский Андрей Дмитриевич // Вестник науки и образования, 2 (6 (30)), 36-43, 2017.
Обзор методов обучения глубоких нейронных сетей / Созыкин Андрей Владимирович // Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика, 6 (3), 28-59, 2017.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2022 Authors
This work is licensed under a Creative Commons Attribution 4.0 International License.