AUDIO RECOGNITION PROBLEMS

Authors

DOI:

https://doi.org/10.30890/2709-2313.2022-08-02-025

Keywords:

audio recognition problems

Abstract

audio recognition problems

Metrics

Metrics Loading ...

References

Ai for social good. Applying AI to some of the world’s biggest challenges. – URL: https://ai.google/social-good/ (дата обращения: 02.01.2022).

Bringing the world closer together by advancing AI. Meta AI Research. – URL: https://ai.facebook.com/research (дата обращения: 02.01.2022).

Netflix Research. Research Areas: Machine Learning. Learning How to Entertain the World. – URL: https://research.netflix.com/research-area/machine-learning (дата обращения: 02.01.2022).

Google Research. Research Areas: Speech Processing. – URL: https://research.google/research-areas/speech-processing/ (дата обращения: 02.01.2022).

Mirco Ravanelli, Yoshua Bengio. Speaker Recognition from Raw Waveform with SincNet. Electrical Engineering and Systems Science / Mirco Ravanelli, Yoshua Bengio, 2019.

Нейросетевой анализ и сопоставление частотно-временных векторов на основе краткосрочного спектрального представления и адаптивного преобразования Эрмита. / Жирков A.О., Корчагин Д.Н., Лукин А.С., Крылов А.С., Баяковский Ю.М. – ИПМ им. М.В. Келдыша РАН. Москва, 2001.

Harris, Fred. On the Use of Windows for Harmonic Analysis With the Discrete Fourier Transform. / Harris, Fred. – Proceedings of the IEEE. 66. 51-83, 1978.

Дворкович В.П., Дворкович А.В. Оконные функции для гармонического анализа сигналов / Дворкович В.П., Дворкович А.В. - М.: Техносфера, 2014. – 112 c.

Г. Нуссбаумер. Быстрое преобразование Фурье и алгоритмы вычисления сверток. / Г. Нуссбаумер. Перевод с английского Ю. Ф. Касимова и И. П. Пчелинцева; под редакцией чл.-кор. АН КазССР В. М. Амербаева и Т. Э. Кренкеля - Издательство «Радио и связь», 1985.

Распознавание речи на основе сверточных нейронных сетей. / Белоруцкий Р.Ю., Житник С.В. // Вопросы радиоэлектроники. 2019;(4):47-52.

Automatic Speech Recognition of Spoken Digits / Davies, K.H., Biddulph, R. and Balashek, S. // The Journal of the Acoustical Society of America; 24 (6): 637—642, 1952.

Automatic Speech Recognition. / Levis, John & Suvorov, Ruslan, 2012.

IBM Archives. IBM Special Products: IBM Shoebox – URL: https://www.ibm.com/ibm/history/exhibits/specialprod1/specialprod1_7.html (дата обращения: 12.11.2021).

Approach to Computer Speech Recognition by Direct Analysis of the Speech Wave / Reddy, D.R. // The Journal of the Acoustical Society of America 40, 1273-1273, 1966.

Fiber Optic Device Recognizes Signals. / Klass, Philip J. // Aviation Week & Space Technology. — N.Y.: McGraw-Hill, 1962. — Vol. 77 — No. 20 — P. 94-101.

Memory Cells. // Military Review. — April 1963. — Vol. 43 — No. 4 — P. 99.

Armagnac, Alden P. “Tell It to Sceptron!” // Popular Science. — April 1963. — Vol. 182 — No. 4 — P. 120.

Voice-operated Computer Tested. // Air Defense Artillery. - Spring 1983. - No. 2 - P. 54.

WAV Audio File Format Specifications – URL: http://www-mmsp.ece.mcgill.ca/Documents/AudioFormats/WAVE/WAVE.html (дата обращения: 17.09.2021).

Александр Петрович Загуменнов. Компьютерная обработка звука / А.П. Загуменнов, 2000. – 260 с.

Ashby, Michael, & John Maidment. Introducing Phonetic Science. Cambridge: CUP, 2005.

Дворкович В.П., Дворкович А.В. Оконные функции для гармонического анализа сигналов / Дворкович В.П., Дворкович А.В. - М.: Техносфера, 2014. – 112 c.

Современные тренды радиорелейной связи. / Слюсар В.И. // Технологии и средства связи. – 2014. №4, 32-36.

The voice in the machine. Building computers that understand speech. / Pieraccini R., Cambridge, Massachusetts: MIT Press, 2012. 360 p.

Stanford Vision Lab. ImageNet Large Scale Visual Recognition Challenge (ILSVRC 2017) – URL: https://www.researchgate.net/publication/265295439_ImageNet_Large_Scale_Visual_Recognition_Challenge (дата обращения: 01.12.2021)

Хуршудов А.А. Разработка ситемы распознавания визуальных образов в потоке данных / Хуршудов А.А., Кубанский Государственный Технологический университет, 2015.

Simple convolutional neural network on image classification. / Guo T., Dong J., Li H., Gao Y. // IEEE 2nd International Conference on Big Data Analysis (ICBDA). Beijing, 2017. P. 721–724.

Understanding of a convolutional neural network / Albawi S., Mohammed T. A., Al Zawi S. // International Conference on Engineering and Technology (ICET). Antalya, 2017. P. 1–6.

Self-Normalizing Neural Networks / Günter Klambauer, Thomas Unterthiner, Andreas Mayr, Sepp Hochreiter // Advances in Neural Information Processing Systems. — 2017. — Июнь (т. 30, вып. 2017).

Метод автоматического определения ключевых точек объекта на изображении. / Зубов И.Г. // Известия высших учебных заведений России. Радиоэлектроника, 23 (6), 6-16., 2020.

Компьютерное зрение. / Горячкин Б.С., Китов М.А. // E-Scio, (9 (48)), 317-345, 2020.

Dropout: A Simple Way to Prevent Neural Networks from Overfitting / Nitish Srivastava, Geoffrey Hinton, Alex Krizhevsky, Ilya Sutskever, Ruslan Salakhutdinov // Journal of Machine Learning Research. — 2014. — Т. 15.

An empirical analysis of dropout in piecewise linear networks / Warde-Farley, David; Goodfellow, Ian J.; Courville, Aaron & Bengio, Yoshua, arΧiv:1312.6197, 2013.

Программные среды для изучения основ нейронных сетей / П.Ю. Богданов, Е.В. Краева, С.А. Веревкин, Е.Д. Пойманова, & Т.М. Татарникова // Программные продукты и системы, 34 (1), 145-150, 2021.

Исследование архитектуры сверточных нейронных сетей для задачи распознавания образов / Землевский Андрей Дмитриевич // Вестник науки и образования, 2 (6 (30)), 36-43, 2017.

Обзор методов обучения глубоких нейронных сетей / Созыкин Андрей Владимирович // Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика, 6 (3), 28-59, 2017.

Published

2022-01-30

How to Cite

Preobrazhenskiy, Y., Preobrazhenskiy, A., Lvovich, Y., & Lvovich, I. (2022). AUDIO RECOGNITION PROBLEMS. European Science, 2(sge08-02), 39–59. https://doi.org/10.30890/2709-2313.2022-08-02-025

Most read articles by the same author(s)