You are on page 1of 12

UNA RECONSTRUCCIÓN DINÁMICA BASADA EN LA RED NEURAL

FILTRO PARA SEÑALES DE AUDIO DIGITAL

Abstracto

El objetivo de cualquier sistema de audio digital es

Muestra y reconstruye un audio analógico.

si @, sin cambios notables en el

señal original Actualmente, dos tipos principales de

Filtros de reconstrucción, muro de ladrillo y

Filtros monotónicos, se utilizan para alisar un

señal de audio analógica muestreada durante su

reconstrucción. Los filtros Brickwall funcionan mejor en

reconstrucción de señales suaves y la

Los filtros monotónicos son los mejores para la reconstrucción de

Señales transitorias. Dado que el audio se compone de

Señales transitorias y suaves mixtas, tanto de

Estos filtros introducirán indeseables.

artefactos a la señal durante su

reconstrucción. Este artículo presenta una nueva

Reconstrucción dinámica basada en redes neuronales

Filtro que puede cambiar su comportamiento al mejor.

coincide con el tipo de señal que se está filtrando

intro

El objetivo de cualquier sistema de audio digital es

Muestra y reconstruye un audio analógico.

señal, sin cambios notables en el

señal original Si, por ejemplo, el audio

La señal se muestrea en un estudio de grabación y la

Las muestras digitales se almacenan en un CD, luego

El reproductor de CD debe recuperar las muestras digitales.

y reconstruir la forma de onda del audio.


señal lo más cerca posible de la forma de onda

de la señal analógica original.


En general, la arquitectura que se muestra en la Figura 1 se utiliza para procesar
digitalmente o almacenar / recuperar una señal analógica
. Teóricamente, cualquier análogo

la señal puede ser muestreada y reconstruida,

siempre que la tasa de muestreo sea al menos

El doble del ancho de banda de la señal analógica.

(Teorema de Nyqyst). Sin embargo, en la práctica, este

no es factible y la tasa de muestreo es

gobernado por la propiedad de los medim que

Almacena y / o transmite la señal. Una muestra

frecuencia más baja que la frecuencia de Nyquist

vendrá aliasing. El alias es causado por

componentes de alta frecuencia para ser erróneamente

Representadas como bajas frecuencias en lo digital.

señal. Con el fin de evitar el aliasing, a la

entrada al convertidor analógico-digital (AD),

Se usa un filtro limitador de banda para eliminar

Frecuencias de audio por encima de la mitad del Nyquist

frecuencia. Un sobre-muestreo de paso bajo similar

El filtro se utiliza para reconstruir y suavizar el

Señal digital ante digital a analógico (D / A)

conversión.

En la actualidad, dos tipos principales de reconstrucción

Filtros, brickwall y filtros monotónicos, son

utilizado para suavizar una señal de audio analógica muestreada

Durante su reconstrucción. El filtro de pared de ladrillo.

tiene una banda de paso relativamente plana (tiene pequeñas

ondas de amplitud en la banda de paso), y una

banda de transición empinada (ver Figura 2a).

Aunque, el filtro brickwall tiene una buena


rechazo de imagen correctamente (ver Figura 4), debido a

su banda de transición empinada, cuando es conducida por un

Señal transitoria que genera indeseable.

Sobrepasar, ondular y ringmg que se conoce.

como fenómeno de Gibbs [Antoniou 791 (ver

Figura 3). Además, su banda de paso ondula,

aunque es relativamente pequeño, causa una

eco en la respuesta al impulso que es uno de

Los contribuyentes al Digital Time Bsplacement.

Error lpapoulis 621. El filtro monotónico (ver

La figura Zb), por otra parte, se caracteriza.

por su amplia banda de transición (es decir, generalmente una caída

fuera de 6 dB a la mitad de la tasa de muestreo) y su

lpapoulis 621 de banda de paso suave y sin ondulaciones. Su

banda de paso sin ondulaciones suave elimina la

eco y su amplia banda de transición proporciona para

una mejor respuesta al impulso haciéndolo mejor

Filtro para la reconstrucción de señales transitorias (ver

Figura 3). Sin embargo, el filtro monotónico tiene

un problema de energia de imagen figura 4

Un filtro de reconstrucción ideal tendría plano.

respuesta sobre el banhdth de interés, alto

atenuación por encima de esa frecuencia, y no

timbre cuando se presenta con una señal transitoria

como un paso o un impulso Faker 951.

Aunque tal filtro no es teóricamente

Posible, aquí os presentamos una nueva neuronal.

enfoque basado en la red que haría que tales

Un diseño de filtro una posibilidad práctica. UN

red neuronal de alimentación de múltiples capas que

utiliza el algoritmo de backpropagation [werbos


74; Rumelhart 86; Vogl 88; Jacobs 88;

Tollenaere 90; Rigler 90; Nguyen 90; Hagan

941 está entrenado para generar una membresía difusa

Valor que indicaría hasta qué grado.

El comportamiento transitorio está presente en la muestra.

Señal que se presenta en su entrada. los

La salida de la red entrenada se usa para

cambiar dinámicamente los parámetros de la

Filtro de reconstrucción para adaptarse mejor a la propiedad.

De la señal que se encuentra en reconstrucción.

2. Entrenamiento de red neuronal

La idea básica detrás del método propuesto.

Aquí es para encontrar una función de membresía difusa

[Zadeh 65; Mitra 921 para el set difuso.

transitorio. Este conjunto difuso representa el conjunto de

Todas las señales que muestran un comportamiento transitorio a

algún grado y la función de membresía

Define el grado de pertenencia. Un

ejemplo de tal función de pertenencia f (X)

se muestra en la Figura 5. Aquí X representa la

vector de señal, y f (X) representan el grado de

Comportamiento transitorio en la señal. los

la función de pertenencia f (X) debe ser una cuando

la señal es una señal transitoria pura (como

un impulso) y cero cuando es un puro no transitorio

señal (como un seno).

Una red de avance de tres capas fue

entrenado para aprender esta función de membresía

La red (constaba de dieciséis unidades de entrada,

Cinco unidades ocultas, y una sola unidad de salida.

La red fue entrenada usando el


Algoritmo de propagación hacia atrás. El tamaño de la

La red fue elegida utilizando la poda estándar

metodos El conjunto de entrenamiento consistió en conjuntos de

Señales transitorias puras y no transitorias tales

Como impulsos, rampas, ondas cuadradas, barridos.

frecuencias, frecuencias de un solo tono, blanco

ruido, etc. Para cada tipo de señales, el

Frecuencia, fase, amplitud y velocidad de barrido.

Fue variado y para cada combinación de estos.

parámetros se generó un vector de 32 muestras

y preprocesado de la siguiente manera:

Transformada rápida de Fourier @ET)

Se casó para generar un 32-

muestra del espectro de Fourier de la

Vector de señal de 32 muestras.

0 La muestra inferior de 16

se extrajo la señal resultante

(es decir, la imagen FFT inferior).

0 La señal resultante fue

NormaIlze por la muestra más grande.

valor.

El valor objetivo de cada señal transitoria era

puesto a uno y el de cada no transitorio

las señales se pusieron a cero. Además de estos

Señales transitorias puras transitorias, complejas

Se formaron señales y se añadieron a la formación.

conjunto. Las señales complejas fueron creadas por

Sumando y / o multiplicando las señales puras.

juntos. El valor objetivo de la

señales complejas se establecieron en uno si había

Cualquier comportamiento transitorio en las señales. Utilizando


este conjunto de entrenamiento, la red fue entrenada para

Reconocer señales transitorias de forma no transitoria.

señales

3. Arquitectura del filtro dinámico.

Dos versiones diferentes del filtro dinámico.

Fueron creados de la siguiente manera. En el

Primera versión, además de la red entrenada.

Un filtro de pared de ladrillo y un monotónico.

Se utilizaron filtros spline cúbicos. La salida de

La red neuronal se limitó a una velocidad suave

rápido transitorio a no transitorio

transiciones La velocidad de salida de la red limitada

entonces fue utilizado de la siguiente manera para

Combina la salida de los dos filtros:

Aquí, fd es la salida del filtro dinámico,

fm es la salida del filtro monotónico, fb es

La salida del filtro brickwall, y a es la

Velocidad de salida limitada de la red neuronal.

Cuando la señal es transitoria pura, la

el nuestro de la red será uno, y la salida de

El filtro dinámico sería el mismo que

del filtro monotónico. Por otro lado, si

La salida de la red es cero, la señal es

clasificado como no transitorio y la salida de

El filtro dinámico sería el mismo que el

Salida del filtro Brickwall. Para cualquier otro valor.

de CL la salida de las redes sería un lineal

Combinación de la salida de los dos filtros.

Señales de entrada más suaves (es decir, menos transitorias


señales) generaría valores de salida de red

Más cerca de uno que fuerza la salida de la dinámica.

Filtro para estar más cerca de la monotónica.

filtrar. Por otro lado, para los más transitorios.

señales, la salida de newtork estará más cerca de

cero y la salida del filtro dinámico sería

más cerca del filtro brickwall. los

Arquitecto general de esta versión de la

El sistema se da en la figura 6.

La segunda versión del filtro dinámico es

Más eficiente en términos de costo computacional.

En esta versión, solo una sola reconstrucción.

Se utiliza filtro. Sin embargo, los coeficientes de la

filtro dynarmc se cambian dinanicamente

De acuerdo con la siguiente fórmula:

Aquí, Od es el vector de coeficiente de

filtro dinámico, om es el vector de coeficiente de

El filtro monotónico, Ob es el coeficiente.

vector del filtro brickwall, y a es la tasa

Salida limitada de la red neuronal. Esta

El filtro es más eficiente, ya que la señal pasa.

a través de un único filtro que dinámicamente

Cambia su comportamiento. La arquitectura en general

de esta versión del sistema se da en la figura

7.

4. Resultados de la simulación

Se midió el rendimiento del sistema.

en dos pasos Primero probamos el

Capacidad de generalización de la neuronal.


red (es decir, qué tan bien se desempeña en las señales

no se ha visto antes) utilizando un conjunto de prueba. los

conjunto de prueba estaba compuesto del mismo tipo de

Señales que estaban en el set de entrenamiento, pero con

Merent conjunto de parámetros. Por ejemplo, sine

Las ondas en el set de prueba tenían amplitud Werent,

Frecuencia y fase. Para cada señal en el

Conjunto de pruebas, la salida generada por la red.

se comparó con el valor objetivo real de

la señal y si la salida de la red era

dentro del rango del 10% del valor objetivo esperado,

La señal se consideró correcta.

clasificado. Por ejemplo, ya que el valor objetivo

de una señal transitoria pura debe ser uno, si el

Salida de red para un impulso fue mayor

igual o igual a 0.9, entonces la señal era

Considerado correctamente clasificado.

La precisión de la clasificación general (es decir, la

Porcentaje de las señales que estaban correctamente.

clasificada) para las señales puras fue de 96.6% y

La de las señales complejas fue del 81,3%.

Después de probar la capacidad de generalización de

La red, un software de simulación del

El filtro d y ”c fue desarrollado utilizando los

Software Simulink. La figura 8 muestra la

respuesta de impulso de los tres filtros del

Respuesta de los filtros a una onda sinusoidal de 20 kHz.

Tenga en cuenta que el filtro d y ”c supera a ambos

El muro de ladrillo y el filtro monotónico en

cualquier tipo de señales. Para señales transitorias

(por ejemplo, el impulso y el paso), el d y ”c


El filtro no genera timbre y para no transitorio.

Señales suaves que tiene buena imagen.

rechazo.

Conclusiones y trabajo futuro

Un nuevo filtro de reconstrucción dinámica que puede

Cambia su comportamiento en función del tipo de señal.

Que se está filtrando se presentó. Una alimentación hacia adelante

red de propagación hacia atrás fue utilizada

Para la clasificación de señales. Resultados de la simulación

Mostrar que debido a su comportamiento dinámico, esto

filtro supera los dos tipos principales de

filtros de reconstrucción (es decir, brickwall y

monotónica) en el mercado.

Actualmente el filtro se está implementando en

hardware. Los datos preliminares indican buena

rendimiento de sistema.

La misma idea también puede aplicarse a Digital.

Procesamiento de imágenes para reducción de imagen.

artefactos Este concepto está actualmente bajo

investigación

You might also like