Procesamiento digital parte 2 - aplicaciones

Ao 2008 Tcnicas Digitales III

Basado en una publicacin de Rony Ferzli - Digital Signal Processing - Lab

Qu es procesamiento de seal?
Seal de Entrada (Analgica o Digital) Operacin, Transformacin Procesamiento Seal de salida (Analgica o Digital)

Ejemplo de seales:
Analgicas: Voz, msica, fotos, Video, radar, sonar, En el dominio Discreto/Digital:
Voz digitalizada, msica, imgenes, video, radar , ...

Qu es el procesamiento Digital de la Seal?

Entrada digital Procesamiento digital Salida digital

Operaciones, Transformaciones sobre seales digitales (usando una computadora o algn otro dispositivo Especializado en manejo de seales digitales)

Y las seales...
Seal Analgica A/D Procesamiento Digital D/A

Porqu Digital??

Aplicacin Tpica

Paso 1: Un sensor analgico capta la seal (ej: microfono) Paso 2: Conversin A/D Paso 3: DSP procesa la informacin digital (ej., compresin, supresin de ruido) Paso 4: D/A para recuperar la seal analgica original

Qu es procesamiento digital en tiempo real?

Entrada Digital Procesamiento en tiempo real Salida Digital

Requiere un tratamiento, o transformacin de la seal Lo ms rapidamente posible para mantener una cierta Sincronizacin con los eventos de entrada.

Procesador a120 MHz, puede realizar 120MIPS
Frec . De Muestreo = 48KHz (Digital Audio Tape - DAT) numero de inst. por muestra = (120 x 106)/(48 x 103) = 2500. fs = 8KHz (Banda de voz, telefona) nmero de instrucciones por muestra= 15000. fs = 75MHz (CIF 360x288 Video a 30 cuadros por segundo) nmero de instrucciones por muestra= 1.6.
Procesamiento de seal en tiempo real:

Las aplicacions DSP quedan limitadas a casos donde la frecuencia de muestreo es suficientemente menor a la velocidad de ejecucin de instrucciones.

Cdigo; Compacto para ser ejecutado en tiempo real. Buena cantidad de instrucciones entre muestras.

Qu es DSP?
DSP = Proc. Digital de seales O DSP = Procesador Digital de seales DSP es usado para ambos
El significado se deduce del contexto en el cual la palabra DSP es usada.

Y Procesador digital de seal (DSP) es

Un micro especialmente diseado para realizar operaciones de procesamiento digital rpidamente (ej., FFT, productos, multiplicacin y acumulacin)

Porqu pasar al dominio digital?

Un hardware puede realizar varias tareas. Fcil de mejorar o cambiar.

Misma performance de una unidad a otra. No cambia su performance por cambios de temperatura o envejecimiento.

Ofrece alta performance : por ejemplo CDplayers vs tocadiscos.

Aplicaciones del procesamiento Digital

Procesamiento de voz
Compresin Reconocimiento Verificacin, adecuacin de voz Sintesis de voz Amplificacin, Cancelacin de eco

Procesamiento de audio
Compresion Reproduccin 3-D

Procesamiento de Imgenes
Compresin Reconocimiento de Patrones Cancelacin de fantasmas (Ghost cancellation) Reduccin de ruido Seguimiento de objetos Fusin de imgenes

Aplicacion DSP a las comunicaciones

Correlacion (filtros de igualcin) Canceladores de eco ecualizadores

Telefona Celular
Compresin de voz

Software de Radio

DSP : Pager
Controlado por la unidad de manejo de la potencia (Power Management Unit) RF RF Receiver Receiver Microcontroller Microcontroller Chip Chip Pager Pager Peripherals Peripherals


Pager Pager Protocol Protocol Decoder Decoder

DSP DSP Chip Chip

-Decodificacin del espectro - Compresin -Procesamiento de voz


FLEX is a popular pager protocol created by Motorola

DSP : Pager

FLEX is a Pager protocol using TDMA concept

DSP : Telfonos Celulares

Controlled by Power Management Unit RF RF Receiver Receiver Microprocessor Microprocessor Chip Chip Cell Cell Peripherals Peripherals

RF RF Codec Codec

DSP DSP Chip Chip

-Codificador de voz -Reconocimiento de voz - Ecualizadores - Cancelacin de ruido de antena

Voice Voice Codec Codec

DSP : Telfono celular

DSP: Voz sobre IP

Micro Micro processor processor

DSP DSP Chip Chip

Memory Memory (Card (Cardor or Chip) Chip)


Voice Voice Codec Codec

Audio Coders -MP3 -AC3 -AAC

DSP: Voz sobre IP

Mercado DSP Por Compaa

Y en el 2002
participacin en el mercado en el 2001

24% 40% Texas Instruments Motorola Agere 8% Analog Devices Other 16% 12%

43% 9%

14% 14%

Mercado DSP Por aplicacin

Ao 2003

11% 68%


Mercado DSP Aumento de uso en productos portables

Personnel Digital Assistant (PDA)
Creci 14 M unid./ao en el 2002 Creci el 32% de 1999 al 2002

PCs portables
26 M unid./ao en 2002 Creci 14% de 1999 al 2002

Trep a 500 M unid./ao en el 2002

En aplicaciones portables es necesario procesadores de alta performance

Ultra Low power Alta performance

P e r f o r m a n c e

P o w e r

Costo efectivo

Ao: 2003

Baja potencia Mediana Performance Costo efectivo

Ao: 1999
Que tienen de especial las aplicaciones de procesamiento digital?

Gran cantidad de muestras en la entradas del procesor. Operaciones Repetitivas:

La misma operacin ser aplicada a diferentes set de muestras Procesamiento paralelo

Operaciones con Vectores y Matrices Operaciones en tiempo real

Ejemplo: Filtrado digital

Los dos filtros digitales mas comunes son: Respuesta finita al impulso (FIR) Respuesta Infinita al Impulso (IIR) La frmula bsica de FIR es: y[ n] donde h[k] es un array de constantes
y[n]=0; For (n=0; n<N;n++) { For (k = 0;k<N;k++) //inner loop y[n] = y[n] + h[k]*x[n-k];}

h[k ].x[n k ]
Solo multiplicar Y acumular (MAC)

En lenguaje C

MAC usando PPG (procesador de propsito general)


11 12 3

11 24 9
Clr Clr Loop Mov Mov Mpy Add Inc Inc Dec Tst Jnz Mov A B *R0, Y0 *R1,X0 X0,Y0,A A,B R0 R1 N N Loop B,*R2 ;Clear Accumulator A ; Clear Accumulator B




1 2 3

; Move data from memory location 1 to register Y0 ; Move data from memory location 2 to register X0 ;X0*Y0 ->A ;A + B -> B ;R0 + 1 -> R0 ;R1 + 1 -> R1 ;Dec N (initially equals to 3) ;Test for the value ;Different than zero loop again ;Move result to memory

MAC usando un DSP

La arquitectura Harvard permite multiples lecturas a memoria
11 12 3

11 24 9
Clr Rep MAC A N *(R0)+, *(R1)+, A ;Clear Accumulator A ; Rep N times the next instruction



1 2 3

; Fetch the two memory locations pointed by R0 and R1, multiply them together and add the result to A, the final result is stored back in A ; Move result to memory


A, *R2

Desventajas de un PPG

Mas instrucciones/tareas Memoria comn para datos y programa

Limitado ancho de banda de bus/memoria

Solucin: Arquitectura DSP

PPG Slo el camino de los datos

Memory Data Bus


Register 1

Register 2


Misma memoria para datos y programa

Tcnicas Digitales III


DSPs Slo camino de los datos

Program Memory Data Bus Data Memory Data Bus Program Memory Un chip DSP es un microprocesor especialmente diseado para aplicaciones DSP. Arquitectura optimizada para proveer procesamiento veloz de seales discretas en el tiempo, ej: Multiplicar y Acumular (MAC) en un solo ciclo Data Memory Multiplexer Multiplexer



Estructura de Memoria

Tcnicas Digitales III


RISC Emphasis on software Single-clock, reduced instruction only Includes multi-clock complex instructions large code size Spends more transistors on memory registers Transistors used for storing complex instructions


Emphasis on hardware

Small code sizes

Arquitectura de memoria
Arquitectura de memoria Harvard vs. Von Neuman
Transferencias de datos concurrentes

diferente manejo de la cache Memoria on-chip

Multiply ACcumulate instruction

Instrucciones de multiplicar y acumular

Multiple unidades en paralelo
Multiplicar y acumular (posiblemente varias unidades) Clculos de direcciones en paralelo para procesar Registo circular ALU especial para calculo de direcciones Bit reversed addressing Direccionamiento circular Software looping: escrito en cdigo assembly para mejorar los saltos Hardware looping: hardware dedicado usando lazos con registros contadores

Accesos a memoria

Loops automticos (lazo)

Hardware para manejo de cmputo aritmtico(en PPG es necesario multiples ciclos)

Desplazamientos (Shifters) Guard bits Previenen Saturation Overflow!

DSP versus PPG

El ncleo del DSP incluye: Buses de direcciones Buses de datos Unidad de aritmtico lgica (Data arithmetic logic unit,ALU) Unidad de generacin de direcciones (Address generation unit,AGU) Program controller Perifricos integrados Bit-manipulation unit Enhanced debugging module Perifricos incluidos en el chip Timer serial port Links de comunicacin DSP a DSP Ethernet ATM host ports input/output pins Adaptacin para FFT bit reverse addressing Instrucciones especiales Soporta movimientos paralelos (Parallel move support) Instrucciones de lazo Instrucciones especiales de Hardware (ej: FIR) Tcnicas Digitales III

Memoria de datos

DM Core PM

Memoria de programa

Mejora de la arquitectura DSP

Mayor paralelismo
Incrementando el nmero de operaciones que se puede realizar en cada instruccin
Adicionando ms unidades de ejecucin(ej: Multiplicadores)

Incrementando el nmero de instrucciones que pueden ser emitidas y ejecutadas en cada ciclo.

Hardware del ncleo altamente especializado. Co-procesadores

Por qu considerar un DSP como alternativa de diseo? Los sistemas Wireless requieren una muy alta performance y elevado ancho de banda.

3G 2.5G 2G
~100MIPS 8-13 Kbps ~100,000MIPS 384-2000 Kbps ~10,000MIPS 64-384 Kbps

La performance de un DSP podra no ser uficiente para futuras aplicaciones

Bit Rate

Tcnicas Digitales III


Operaciones aritmticolgicas Multiplicacin y suma permite una rpida ejecucin de operaciones iterativas

Diagrama de bloques de la arquitectura del PIC-12C5XX

Clculos sobre registros auxiliares para direccionamientos indirectos tanto a memoria de datos como de programa.

Tcnicas Digitales IIIde Diagrama

36 bloques del DSP TMS320F241

Cules son las alternativas?

Alto rendimiento de un PPG con mejoras en DSP.
Eliminara la necesidad de un DSP y un PPG para muchos productos, por lo tanto reduccin de costos. Ejemplo: Pentium 4
Single Instruction Multiple Data (SIMD), las instrucciones permiten identicas operaciones de multiples datos en paralelo. 144 nuevas instrucciones especiales que proveen capacidades avanzadas para aplicaciones como grficos 3D , codificacin y decodificacin de video, y reconocimiento de voz. Varios tipos de datos (flotante/entero)

Aplicacin de circuitos integrados especficos (ASIC) Field Programmable Gate Array (FPGA)
ASIC - Ventajas
Velocidad Consumo de potencia bajo costo/performance Flexibilidad para diseo

Tcnicas Digitales III


ASIC- Desventajas

Alto costo de desarrollo Lentos ciclos de desarrolo Inflexible

Otra solucin


Tcnicas Digitales III


Qu es un FPGA?
Es una red de hardware configurable con interconexiones reconfigurables controladas por el switcheo de una matriz de control. Histricamente se usaron para prototipos Recientemente incluyen caractersticas de DSP
La mayor Compania de DSP + FPGA: ALTERA(ej: Stratex) & XILINX (ej: Virtex II)
Tcnicas Digitales III 40

FPGA - Ventajas
Mayor flexibilidad que un ASIC Alta Performance en algunas aplicaciones Reusabillidad de Hardware para diferentes aplicaciones

Tcnicas Digitales III


FPGA - Desventajas
Largo ciclo de desarrollo Caro comparado con un DSP Mayor consumo de potencia comparado con un DSP

Tcnicas Digitales III


Por qu se usan mas los DSP?

Algunas aplicaciones no son adecuadas para ser implementadas en un FPGA
Paralelismo es limitado Velocidad no es siempre el factor ms importante a considerar

FPGA es aun demasiado caro para productos finales(ej: telfonos celulares)

Tipos de DSP
Low End Fixed Point

High End Fixed Point

TMS320C55XX, DSP16XXX, ADSP215XX, DSP56800 MSC8101 - StarPro2000 (using SC140 from Starcore)

Floating Point
TMS320C3X, C67XX, ADSP210XX, DSP96000, DSP32XX

Punto fijo Vs punto flotante

Fixed Point/Floating Point
Procesadores de punto fijo son :
barato pequeo Menos consumo Difcil de programar
Bsqueda de errores: truncado, rebosamiento, redondeo

Rango dinmico limitado Usado en un 95% de productos de consumo

Procesadores de punto flotante son:

Tiene buena precisin Son mucho ms fciles de programar Pueden acceder a memorias ms grandes

Es ms complejo crear un cdigo eficiente en C en uno de punto fijo que en uno de punto flotante

Punto fijo Vs punto flotante

Punto Flotante Aplicaciones
Modems Digital Subscriber Line (DSL) Estaciones Wireless Centrales telefnicas Imgen digital Grficos 3D Speech Recognition Voice over IP

Punto Fijo Aplicaciones

Productos portables 2G, 2.5G y 3G tel. Celulares Digital Audio Players Digital Cameras Electronic Books Reconocimiento de voz Receptores GPS Biomediciones Reconocimiento de huellas digitales

rbol de la familia Motorola

Motorola DSP Family Tree [2003] Floating Point DSP Chips Discontinued!! TI Tree

DSP56F801 DSP56F802 DSP56F803 DSP56F805 DSP56F807 DSP56F826 DSP56F827

DSP56852 DSP56853 DSP56854 DSP56855 DSP56857

DSP56301 DSP56303 XC56309 XC56L307 DSP56311 DSP56321 DSPB56362 DSPB56364 DSPB56366 DSPA56367 DSPA56371

MSC8101 MSC8103

MC56F8322 MC56F8323 MC56F8345 MC56F8346 MC56F8356 MC56F8357

56800 DSP Family, 16-bit Fixed Point

Processing capability of up to 35 million instructions per second (MIPS) Running at 70 MHz Requires only 2.73.6 V of power

Single-instruction cycle 16-bit x 16-bit parallel multiply-accumulator Two 36-bit accumulators including extension bits Single-instruction 16-bit barrel shifter Parallel instruction set with unique DSP addressing modes Low-power wait and stop modes Operating frequency down to DC 16-bit Timer Module Synchronous serial interface module (SSI) Serial peripheral interface (SPI) Programmable general-purpose I/O

Motion Control Smart appliances Environmental controls Instrumentation Industrial Uninterruptable power supplies Noise cancellation/suppression Temperature control HVAC Inverters and AC-to-DC conversion Lighting Automation Transportation Instrumentation

Tcnicas Digitales III


56800E DSP Family, 16-bit Fixed Point

Processing capability of up to 120 million instructions per second (MIPS) Running at 120 MHz Requires only 2.73.6 V of power

40K x 16-bit Program SRAM 24K x 16-bit Data SRAM 1K x 16-bit Boot ROM Access up to 2M words of program memory or 8M data memory Six (6) independent channels of DMA

Telephony Telco interface Codecs LCD and Keypad support Client-side IP phone Internet Audio Internet Audio decoding Internet Audio standalone player Voice Processing

Includes Also the MC56F300 Series which contains on chip Flash memory

Two (2) Enhanced Synchronous Serial Interfaces (ESSI) Two (2) Serial Communication Interfaces (SCI) Serial Port Interface (SPI) 8-bit Parallel Host Interface General Purpose 16-bit Quad Timer JTAG/Enhanced On-Chip Emulation (OnCE) for unobtrusive, real-time debugging Computer Operating Properly (COP)/Watchdog Timer Time-of-Day (TOD) Up to 47 GPIO

56300 DSP Family, 24-bit Fixed Point

Processing capability of up to 480 million instructions per second (MIPS) Running at 240 MHz Requires only 1.63.3 V of power

Object code compatible with the DSP56000 core with highly parallel instruction set Data Arithmetic Logic Unit (Data ALU) with fully pipelined 24 x 24-bit parallel Multiplier-Accumulator (MAC) Direct Memory Access (DMA) with six DMA channels supporting internal and external accesses Digital Phase Lock Loop (DPLL) allows change of low-power Divide Factor (DF) without loss of lock Hardware debugging support including On-Chip Emulation (OnCETM) module, Joint Test Action Group (JTAG) Test Access Port (TAP) Two Enhanced Synchronous Serial Interfaces (ESSI0 and ESSI1 Serial Communications Interface (SCI) Triple timer module Up to 34 GPIO

Multimedia Telecommunciation Video conferencing Base transceiver stations Packet telephony

MSC8100 Family, 16-bit Fixed Point

Processing capability of up to 4400 million instructions per second (MIPS) Running at 300 MHz Requires only 1.63.3 V of power

Four 250/275 MHz StarCore SC140 DSP extended cores 16 ALUs on a chip deliver up to 4000/4400 MMACS Performance equivalent to a 1.0/1.1 GHz SC140 Core Industry's largest on-chip SRAM memory

2.5G Wireless System 3G Wireless System IP Telephony Compression G.7xx speech coders

Optimized for networking infrastructure applications

1436 KB of internal memory Efficient multi-level memory hierarchy Dual external industry-standard 60xcompatible buses 9.6 Gbps peak bus throughput Four independent Time-Division Multiplex (TDM) Interfaces 400 Mbps peak serial data throughput Accesses various external memories, including SDRAMs, SRAMs, SSRAMs, EPROMs, and Flash

rbol de la familia TI
Ref: TI DSP Selection Guide /ssdv004m.pdf

TI DSP Family Tree [2003]

Motorola Tree C5000 C6000



F2407, F2406 F2403, F2402 F2401, C2406 C2404, C2402 C2401, F243 F241, C242 F240

F2810 F2812

C33 C32 C31 C30

C54x C54x + RISC

C5416 C5410 C5409 C5407 C5404 C5402 C5401 C549 C54CST, C54V90 C5470 C5471

C5509 C5502 C5501

C55x + RISC C62x

OMAP5910 C6211 C6205 C6204 C6203 C6202 C6201

C6416 C6415 C6414 C6412 C6411 DM640 DM641 DM642

C6713 C6712 C6711 C6701

TMS320C24x DSP Generation, 16-bit Fixed Point - Control Optimized DSP

Up to 40-MIPS operation Three power-down modes 3.3-V and 5-V designs

375-ns (minimum conversion time) analog-to-digital (A/D) converter Dual 10-bit A/D converters Up to four 16-bit general-purpose timers Watchdog timer module Up to 16 PWM channels Up to 41 GPIO pins Five external interrupts Up to 32K words on-chip sectored Flash I/O Modules Controller Area Network (CAN) interface module Serial communications inter-face(SCI) Serial peripheral interface (SPI) Boot ROM (LF240x and LF240xA devices)

Appliances Compressors Industrial automation Uninterruptible power (UPS) systems Automotive braking steering systems Electric metering Printers and copiers Hand-held power tools Electronic cooling Intelligent sensors Tunable lasers Consumer goods Fuel pumps Industrial frequency Remote monitoring ID tag readers

Tcnicas Digitales III


TMS320C28x DSP Generation, 16-bit Fixed Point Control Optimized DSP

32-bit fixed-point C28x DSP core 150-MIPS operation 1.8-volt core and 3.3-volt peripherals

Ultra-fast 2040 ns service time to any interrupts 32-/64-bit saturation, single-cycle read-modify-write instructions, and 64/32 and 32/32 modulus division High-performance ADC 32 32 single-cycle fixed-point MAC Dual 16 16 single-cycle fixed-point MACs On Chip flash memory I/O modules: SPI, SCI, CAN

Lighting Optical networking (ONET) Power supplies Industrial automation Consumer goods

TMS320C3x DSP Generation, 32 bit Floating Point First Generation

Performance up to 150 MFLOPS 32 bit Floating point Highly-efficient C language engine Large address space: 16 Mwords Fast memory management with onchip DMA

Parallel multiply and arithmetic/logical operations on integer or floating-point numbers in a single cycle Eight extended-precision registers

Digital audio Laser printers, copiers, scanners Bar-code scanners Videoconferencing Industrial automation and robotics Voice/facsimile Servo and motor control

TMS320C54x DSP Generation, 16-bit Fixed Point Power Efficient DSP

16-bit fixed-point DSPs Power dissipation as low as 60 mW for 100 MIPS Single- and multi-core products delivering 30532 MIPS performance 1.2-, 1.8-, 2.5-, 3.3- and 5-V versions available 6-channel DMA controller per core

Integrated Viterbi accelerator 40-bit adder and two 40-bit accumulators to support parallel instructions 40-bit ALU with a dual 16-bit configuration capability for dual onecycle operations 17 17 multiplier allowing 16-bit signed or unsigned Multiplication Four internal buses and dual address generators enable multiple program and data fetches and reduce memory bottleneck Single-cycle normalization and exponential encoding Eight auxiliary registers and a software stack enable advanced fixed-point DSP C compiler Power-down modes for battery powered applications

Digital cellular communications Personal communications systems (PCS) Pagers Personal digital assistants Digital cordless communications Wireless data communications Networking Computer telephony Voice over packet Portable Internet audio Modems

TMS320C54x DSP + RISC, 16-bit Fixed Point System Level DSP

Dual CPU processor integrating a TMS320C54x DSP core and an ARM7TDMI RISC 1.8-volt core and 3.3-volt peripherals

TMS320C54x DSP core subsystem 100-MIPS operation 72 kwords RAM Two multi-channel buffered serial ports (McBSPs) Direct memory access (DMA) controller Phase-locked loop External memory interface ARM port interface (API) ARM7TDMI RISC core subsystem 47.5-MHz operation 16 KByte zero-wait-state SRAM Memory interface (SDRAM, SRAM, ROM, Flash) Single-port 10/100 Base-T Ethernet Interface (C5471 DSP only) 36 general-purpose I/O (ARMI/O) Two UARTs (one IrDA) Serial peripheral interface (SPI) I 2 C interface

wireless data Smart pen pads Text-to-speech Voice recognition Vommand control Access point controller Networked security Industrial control and emergency radio

TMS320C55x DSP Generation, 16-bit Fixed Point Most Power Efficient DSP
C55x DSP core delivers 300 MHz for up to 600-MIPS performance 1.6-volt core and 3.3-volt peripherals

Advanced automatic power management Configurable idle domains to extend your battery life Shortened debug for faster time-tomarket 144-MHz/200-MHz clock rate 256-KB RAM, 64-KB ROM Three McBSPs, I 2 C, watchdog timer, general-purpose timers USB 2.0 full-speed (12 Mbps) 10-bit ADC real-time clock (RTC)

Feature-rich, miniaturized personal and portable products 2G, 2.5G and 3G cell phones and basestations Digital audio players Digital still cameras Electronic books Voice recognition GPS receivers Fingerprint/Pattern recognition Wireless modems Headsets Biometrics

TMS320C55x DSP + RISC, 16-bit Fixed Point OMAP Processor

Dual CPU processor integrating a TMS320C55x DSP core and an ARM925TDMI RISC @150 MHz 1.8-volt core and 1.8-volt peripherals

150-MHz TI-enhanced ARM925 16 KB instruction cache and 8 KB data cache Data and instruction MMUs 32-bit and 16-bit instruction sets 150-MHz TMS320C55x DSP 12 KW (24 KB) instruction cache 80 KW (160 KB) SRAM 16 KW (32 KB) ROM Two 16-bit memory interfaces for SDRAM and flash Nine-channel system DMA controller LCD controller USB 1.1 host and client MMC/SD card interface Seven serial ports plus three UARTs, Nine timers, Keyboard interface Less than 250 mW at 1.6 V

Internet appliances Applications processing Enhanced gaming Webpad Point-of-sale Medical devices Industry-specific PDAs Telematics Digital media processing Military and government cellular

TMS320C62x DSP Generation, 16-bit Fixed Point High Performance DSP

16-bit fixed-point DSPs Up to 2400 MIPS Running at 300 Mhz

C6000 DSP Platform VelociTI advanced architecture Up to eight 32-bit instructions executed each cycle Eight independent, multi-purpose functional units thirty-two 32-bit registers Industrys most advanced C compiler and Assembly Optimizer maximize efficiency and performance

Pooled modems Digital Subscriber Line (xDSL) Wireless basestations Central office switches Private Branch Exchange (PBX) Digital imaging Call processing 3D graphics Speech recognition Voice over packet

TMS320C67x DSP Generation, 32-bit Floating Point High Performance DSP

32-bit loating point DSPs Up to 1350 MFLOPS Running at 225 Mhz

C6000 DSP Platform VelociTI advanced architecture Up to eight 32-bit instructions executed each cycle Eight independent, multi-purpose functional units thirty-two 32-bit registers Industrys most advanced C compiler and Assembly Optimizer maximize efficiency and performance IEEE floating-point format Up to 1350 MFLOPS at 225 Two new multi-channel serial ports (McASP) (C6713 DSP) can support up to stereo channels of I2S (Inter IC Sound) and compatible with S/PDIF transmit protocol. Note I2S is a protocol for transmitting 2 channels of digital audio over a single serial connection

Pooled modems Digital Subscriber Line (xDSL) Wireless basestations Central office switches Private Branch Exchange (PBX) Digital imaging Call processing 3D graphics Speech recognition Voice over packet

TMS320C64x DSP Generation, 16-bit Fixed Point High Performance DSP

16-bit fixed point processor TMS320C64x DSP high performance core provides scalable performance of up to 1.1 GHz The industrys fastest DSPs with up to 600 MHz (4800 MIPS) performance C64x DSPs are software compatible with TIs C62x DSPs

C6000 DSP Platform VelociTI advanced architecture Up to eight 32-bit instructions executed each cycle Eight independent, multi-purpose functional units thirty-two 32-bit registers Industrys most advanced C compiler and Assembly Optimizer maximize efficiency and performance

DSL and pooled modems Basestation transceivers Wireless LAN Enterprise PBX Multimedia gateway Broadband video transcoders Streaming video servers and clients Highspeed raster image processing (RIP)

TI Families Summary
C24x and C28x families: low performance 16-bit fixed point used for control purpose C54x family: mid-range performance 16-bit fixed point C55x family: mid-range performance 16-bit fixed point with reduced power consumption and increased parallelism C5000 + RISC microprocessor: used for embedded applications such as cell phone and PDAs C62x: high-range performance 16-bit fixed point supporting VLIW architecture C64x: very high performance 16-bit fixed point with extension capabilities of C62x with higher clock frequency (>2500 MIPS) C3x: first generation low performance 32-bit floating point C67xx family: very high performance 32-bit floating point

Qu chip selecciono?
Motorola DSP56858
Family: DSP56800E Kit: DSP56858EVM Software: Metrowerks CodeWarrior
Metrowerks is a Motorola company in charge of developing the software

Telephony Client side IP phone Internet Audio Voice Processing

TI TMS320C5510
Family: TMS320C55xx Kit: TMS320C5510DSK Software: TI Code Composer Studio v2.1 Applications

Escribir cdigo en C Compilar para crear cdigo en asembler Ensamblar el cdigo para crear el cdigo objeto y linkear Usar el simulador para testeo de la velocidad del cdigo Si el cdigo no es lo suficientemente rpido reescribir el cdigo en C y volverlo a testear. Si an no es lo suficientemente rpido , escribirlo en lenguaje Assembly.

Por qu usar assembly?

Muchos compiladores de C producen cdigo que no utiliza todas las capacidades del DSP
Bsqueda de datos en paralelo para ejecucin Ejecucin en paralelo

El cdigo en C puede ser 3 a 30 veces ms lento que el mejor cdigo en ensamblador posible. Especialmente en la parte de procesamiento de seal del cdigo. El problema es an mayor para DSPs de punto fijo.
Pero si no se quiere usar assembly...

Si otro programa en assemby por ti
usa librerias

Reescribe el cdigo en C para producir mejor cdigo assembly Probar el cdigo para saber cul parte del software requiere mayor tiempo de CPU. Limita el cdigo ensamblador a subrutinas:
Que el programa gaste la mayor cantidad de tiempo en ellas De esta forma nos beneficiamos de las funciones especiales del DSP como MACs y ejecucin paralela.

Cmo escribo mejor cdigo C?

Usar lazos simples Evitar llamados a subrutinas en lazos Usar subrutinas inline
El compilador inserta la funcin directamente en donde se encuentra el llamado (conceptualmente igual a lo que sucede al utilizar macros)
Evitar el llamado a subrutinas salvando demasiadas variables voltiles. Incrementar el tamao del cdigo

Evitar divisiones o modularizacionmes de las operaciones Usar (&) y shift cuando sea posible
Usar la regla de 5%/80%
Programando en ensamblador el 5% de las lineas de cdigo de un proyecto deben ocupar el 80% de la carga de la CPU. Trata de cambiar el cdigo para que encajen en routinas en assembly existentes.

DSP56858EVM Kit
DSP56858 chip USB interface 1 Mbit EEPROM/Data Flash FSRAM (256K) Parallel interface On board 6 debugging LED Boot Mode Selector RS232 Interface Audio in/out (stereo)

Qu chip selecciono?
DSP56800E Family General Purpose 16-bit fixed point (six members). DSP56800E Introduced in 2000 as improved version of DSP568500 family
Lower Power Consumption Enhanced peripherals Higher MIPS

Many Peripherals:
SCI to communicate with devices using RS232 SPI to communicate with CODEC or EEPROM (needs a clock). DMA to communicate between memory and external device

Aplicaciones del DSP56858E

Telefona Lado cliente en telefonia sobre IP Internet Audio Procesamiento de voz

Modos de direccionamiento
LD #31, A ; carga acumulador A con 31

LD *(X), A; carga A con el nmero almacenadoen la direccin X

Parte de la direccin es dada opcode(cdigo de operacin), la otra por un registro interno.

Modos de direccionamiento
Direccionamiento indirecto
Usado para acceder a una secuencia de nmeros almacenados en una zona consecutiva de la memoria de datos.
X=8000H STM LD ADD ADD STL #X, R1 ; carga R1 con la direccin X *R1+, A ; carga acumulador A con 31 *R1+, A ; suma -14 to A ->A *R1+,A ; 6 + A ->A A, *R1 ; almacena la salida
31 -14 6 out

Buffer circular
Es un buffer normal exceptuando cuando alcanza el final del lazo, entonces vueve al punto de partida.
Definir el punto de partida Define el tamao del buffer

Aplicacin del Buffer Circular

x[n] {0.5,2,-3} h[n]

y[ n] x[ n] h[n]

y[ n]

x[k ]h[n k ]

Pseudo cdigo de una convolucin

Refleje: x(k) en k = 0 para obtener x[-k] Corrimiento: Corra x[-k] en n0 muestras a la derecha para obtener x[n0-k] Multiplicacin: Multiplique h[k] por x[n0-k] para obtener los productos h[k]*x[n0-k] para todo k Suma: Sume todos los productos para obtener la salida y[n0] al tiempo n0
Shiftin g 0 1 2 3 4 5 0 0 0.2 -3 2 0.5 -3 2 -3 0.2 5 0.5 2 -3 0.2 5 0.5 2 -3 0.5 2 -3 0.5 2 0.5 0.2 5 0 0

Tcnicas Digitales III


Buffer circular
A cada valor de y[n0] el puntero para los coeficientes x[-k] debe apuntar a la ltima entrada (ej: x{-2} = -3)
Tcnicas Digitales III

buffer Circular = 3

h[0] h[1] h[2] h[3]

0 0 0.25 0.25 0.25 0.25 0 0


Cdigo ensamblador
.text _main: STM #Inputs,AR5 STM #Coeff, AR2 STM #Output, AR3 STM #3, BK STM #5, AR4
STM #1, AR0

; Pone el cdigo en la seccin text localizada en memoria ; Comienzo de la subr. Ppal. ; Apunta al array de Entradas ; Apunta al array Coeff ; Apunta a la salida (Output) ; Define el buffer circular ; Define variable contadora
; Incremento para el buffer circular

Cdigo ensamblador
loop RPTZ A, #2 ; Borra Acumulador A y repite la sig. instruccion 3 veces MAC *AR5+0%, *AR2+ ; Multiplica input*coeff + A ->A Incrementa puntero AR2 en uno e incrementa AR5 por AR0 usando el buffer circular STL A, *AR3+ ; Almacena resultado en memoria MAR *AR2MAR *AR2- ; Decrementa 2 veces AR2 BANZ loop, *AR4- ; Para que el lazo compute cada salida, saltando seis veces

