Welcome to Scribd!

Assignment Submission Speech Recognition System Architectural Design

Uploaded by

0% found this document useful (0 votes)

18 views5 pages

The document describes the architectural design of a speech recognition system, noting that it uses hidden Markov models which output sequences of vectors representing cepstral coefficients to determine the likelihood of observed speech mapping to words or phonemes, and hidden Markov models allow determining the most likely sequence of states corresponding to a sequence of observations. It provides details on the working of hidden Markov models and lists references and tools used.

Original Description:

Original Title

SpeechRecognitionSystemArchitecturalDesign.pdf

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

18 views5 pages

Assignment Submission Speech Recognition System Architectural Design

Uploaded by

abhibatsa

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 5

Search inside document

Assignment Submission

Speech Recognition System Architectural Design

Course No. : Software Architecture
Course Title : SS ZG653

Definition:
Speech Recognition System is a system that enables recognition and translation of spoken languages into
text by electronic devices like computers, mobile devices etc. It is also known as "automatic speech
recognition" (ASR), "computer speech recognition", or just "speech to text" (STT). It incorporates
knowledge and research in the linguistics, computer science, and electrical engineering fields.

Architectural Details:
Both acoustic modeling and language modeling are important parts of modern statistically-based speech
recognition algorithms. I have used Hidden Markov Model which is basically used by most of the modern
Speech Recognition System.

a. Reason to use Hidden Markov Model (HMMs):

1. Markov model can be used for stochastic purposes i.e. for speech which can be approximated as a
stationary process.
2. HMMs can be trained automatically and are simple yet computationally feasible to use.

b. Working of Hidden Markov Model:

1. HMM outputs a sequence of n-dimensional real-valued vectors per 10 seconds.

2. Vectors consist of cepstral coefficients which are obtained by taking a Fourier Transform of a
short time window of speech and de-correlating the spectrum using a cosine transform by taking
the first coefficients.
3. HMM will have in each state a statistical distribution which will give a likelihood for each
observed vector.
4. HMM for a sequence of words or phonemes is made by concatenating the individual trained
hidden Markov models for the separate words and phonemes.

Hidden Markov Model:

A hidden Markov model is a Markov chain for which the state is only partially observable. In
other words, observations are related to the state of the system, but they are typically insufficient
to precisely determine the state. Several well-known algorithms for hidden Markov models exist.
For example, given a sequence of observations, the Viterbi algorithm will compute the most-
likely corresponding sequence of states, the forward algorithm will compute the probability of the
sequence of observations, and the BaumWelch algorithm will estimate the starting probabilities,
the transition function, and the observation function of a hidden Markov model.
One common use is for speech recognition, where the observed data is the speech
audio waveform and the hidden state is the spoken text. In this example, the Viterbi algorithm
finds the most likely sequence of spoken words given the speech audio.

Mind Map:
Use Case Diagram:
Sequence Diagram:

Activity Diagram:
References and Tools:
Creately.com
"Speaker Independent Connected Speech Recognition- Fifth Generation Computer Corporation". Fifthgen.com.
Retrieved 15 June 2013.
https://en.wikipedia.org/wiki/Hidden_Markov_model

Visual Word: Unlocking the Power of Image Understanding
From Everand
Visual Word: Unlocking the Power of Image Understanding
Fouad Sabry
No ratings yet
Automatic Target Recognition: Fundamentals and Applications
From Everand
Automatic Target Recognition: Fundamentals and Applications
Fouad Sabry
No ratings yet
Speech Recognition: From Wikipedia, The Free Encyclopedia
Document16 pages
Speech Recognition: From Wikipedia, The Free Encyclopedia
Justin Cook
0% (1)
A Literature Survey of Speech Recognition and Hidden Markov Models
Document6 pages
A Literature Survey of Speech Recognition and Hidden Markov Models
amardeepsinghseera
No ratings yet
Editor in Chief,+recurrent Neural Networks in Automatic Speech Recognition
Document8 pages
Editor in Chief,+recurrent Neural Networks in Automatic Speech Recognition
vothaianh18081997
No ratings yet
Thesis Chapter I - ACM Format
Document1 page
Thesis Chapter I - ACM Format
Ryan Podiotan Adlao Sapitanan
100% (1)
Data-Parallel Large Vocabulary Continuous Speech Recognition On Graphics Processors
Document13 pages
Data-Parallel Large Vocabulary Continuous Speech Recognition On Graphics Processors
jikechong
No ratings yet
CS5241 Report
Document9 pages
CS5241 Report
iwatobes
No ratings yet
Realtime Gesture Following and Recognition
Document12 pages
Realtime Gesture Following and Recognition
姚熙
No ratings yet
Where: P (S0) Specifies Initial Conditions P (St+1 - ST) Specifies The Dynamics P (Ot - ST) Specifies The Sensor Model
Document2 pages
Where: P (S0) Specifies Initial Conditions P (St+1 - ST) Specifies The Dynamics P (Ot - ST) Specifies The Sensor Model
darebusi1
No ratings yet
Discrete Math Project
Document12 pages
Discrete Math Project
Prateek Bhatnagar
No ratings yet
The Development Process and Current State of The Speech Recognition Technology
Document8 pages
The Development Process and Current State of The Speech Recognition Technology
Isha
No ratings yet
Corso Muryanto PURE SP09
Document10 pages
Corso Muryanto PURE SP09
Keshu Keshvala
No ratings yet
Methodology For Speaker Identification and Recognition System
Document13 pages
Methodology For Speaker Identification and Recognition System
Ade-Bello Abdul-Jelili
100% (1)
Speech Recognition System Using Matlab
Document13 pages
Speech Recognition System Using Matlab
Charitha Reddy
No ratings yet
Speech Recognition Using HMM ANN Hybrid Model
Document4 pages
Speech Recognition Using HMM ANN Hybrid Model
Editor IJRITCC
No ratings yet
Speaker Recognition
Document29 pages
Speaker Recognition
shanmukhasai
No ratings yet
Segmentation of Connected Arabic Characters Using Hidden Markov Models
Document5 pages
Segmentation of Connected Arabic Characters Using Hidden Markov Models
api-3754855
No ratings yet
Hidden Markov Models For Modeling and Recognizing Gesture Under Variation
Document36 pages
Hidden Markov Models For Modeling and Recognizing Gesture Under Variation
jesus1843
No ratings yet
Ann LA2 Project
Document23 pages
Ann LA2 Project
Dimitri Molotov
No ratings yet
SOPC-Based Word Recognition System: Abstract
Document3 pages
SOPC-Based Word Recognition System: Abstract
Veera Karthi
No ratings yet
Hidden Markov Model (HMM) Tutorial: Home Ciphers Cryptanalysis Hashes Resources
Document5 pages
Hidden Markov Model (HMM) Tutorial: Home Ciphers Cryptanalysis Hashes Resources
Masud Sarker
No ratings yet
Hidden Markov Models Theory and Applications
Document326 pages
Hidden Markov Models Theory and Applications
Tarun Krishna
100% (1)
End-to-End Automatic Speech Recognition
Document19 pages
End-to-End Automatic Speech Recognition
Shubham
No ratings yet
Isolated Digit Recognition System
Document3 pages
Isolated Digit Recognition System
Junaid Ashfaq
100% (1)
A Tutorial On Hidden Markov Models and Selected Applications in Speech Recognition
Document30 pages
A Tutorial On Hidden Markov Models and Selected Applications in Speech Recognition
sarthak shah
No ratings yet
Speaker Recognition Using Matlab
Document14 pages
Speaker Recognition Using Matlab
Sandeep Sreyas
No ratings yet
Journal of Computer and System Sciences: Daniel Hsu, Sham M. Kakade, Tong Zhang
Document21 pages
Journal of Computer and System Sciences: Daniel Hsu, Sham M. Kakade, Tong Zhang
Aqsa
No ratings yet
Speech As A High Level Control For Teleoperated Manipulator Arm
Document6 pages
Speech As A High Level Control For Teleoperated Manipulator Arm
hub23
No ratings yet
Malaysian Journal of Computer Science
Document14 pages
Malaysian Journal of Computer Science
Aadil Muklhtar
No ratings yet
Automated Cryptanalysis of Plaintext Xors of Waveform Encoded Speech
Document8 pages
Automated Cryptanalysis of Plaintext Xors of Waveform Encoded Speech
Eagle Khan
No ratings yet
ST Final Report TOMMOROW 4-4-2011 Report
Document57 pages
ST Final Report TOMMOROW 4-4-2011 Report
sureshkumar_scool
No ratings yet
Speech Recognition
Document265 pages
Speech Recognition
Dinesh Choudhary
No ratings yet
Voice Control of Dual-Drive Mobile Robots Survey of Algorithms
Document6 pages
Voice Control of Dual-Drive Mobile Robots Survey of Algorithms
priti
No ratings yet
DWT and Mfccs Based Feature Extraction Methods For Isolated Word Recognition
Document6 pages
DWT and Mfccs Based Feature Extraction Methods For Isolated Word Recognition
Bouhafs Abdelkader
No ratings yet
A Comparison of Different Support Vector Machine Kernels For Artificial Speech Detection
Document7 pages
A Comparison of Different Support Vector Machine Kernels For Artificial Speech Detection
TELKOMNIKA
No ratings yet
Speech Recognition Using Matlab: Objective
Document2 pages
Speech Recognition Using Matlab: Objective
Anurag Dwivedi
No ratings yet
Automatic Speech Recognition
Document35 pages
Automatic Speech Recognition
Bhem Kumar
No ratings yet
Automatic Speaker Recognition and AI
Document6 pages
Automatic Speaker Recognition and AI
Bhusan Chettri
No ratings yet
NLP Question Paper Solution
Document27 pages
NLP Question Paper Solution
Sruja Koshti
No ratings yet
Speech Recognition
Document16 pages
Speech Recognition
Aditya Sharma
No ratings yet
Mar08 t05 Ucapan Ayub
Document6 pages
Mar08 t05 Ucapan Ayub
Maulana Rifandi
No ratings yet
Voice Operated Wheel Chair
Document17 pages
Voice Operated Wheel Chair
saurabh181092
No ratings yet
Statistical Signal Processing Is The Study of These Questions
Document6 pages
Statistical Signal Processing Is The Study of These Questions
Kaayyoof Fikadu
No ratings yet
EEL6586 Final Project:: A Speaker Identification and Verification System
Document16 pages
EEL6586 Final Project:: A Speaker Identification and Verification System
Ramana Reddy
No ratings yet
Multithreaded Java Approach To Speaker Recognition: Radosław Weychan, Tomasz Marciniak, Adam Dąbrowski
Document6 pages
Multithreaded Java Approach To Speaker Recognition: Radosław Weychan, Tomasz Marciniak, Adam Dąbrowski
Tran Trung
No ratings yet
1408 2873 PDF
Document7 pages
1408 2873 PDF
Muhammet Ali Köker
No ratings yet
Speech Interface Vlsi For Car Applications
Document4 pages
Speech Interface Vlsi For Car Applications
Parijat Basu
No ratings yet
Hybrid HMM/Neural Network Based Speech Recognition in Loquendo ASR
Document7 pages
Hybrid HMM/Neural Network Based Speech Recognition in Loquendo ASR
Anonymous tmtyiZA
No ratings yet
Blah Blah Blah
Document16 pages
Blah Blah Blah
Raphael Argento
No ratings yet
Speech Recognition With Hidden Markov Model: A Review
Document4 pages
Speech Recognition With Hidden Markov Model: A Review
jehosha
100% (1)
A Novel Voice Recognition Model Based On HMM and Fuzzy PPM
Document4 pages
A Novel Voice Recognition Model Based On HMM and Fuzzy PPM
Juan Andres Ruiz
No ratings yet
Google Wakeword Detection 1 PDF
Document5 pages
Google Wakeword Detection 1 PDF
Özgür Bora Gevrek
No ratings yet
Acoustic Modeling Using Deep Belief Networks: Abdel-Rahman Mohamed, George E. Dahl, and Geoffrey Hinton
Document10 pages
Acoustic Modeling Using Deep Belief Networks: Abdel-Rahman Mohamed, George E. Dahl, and Geoffrey Hinton
SaulBerardo
No ratings yet
NLP Assignment 5
Document5 pages
NLP Assignment 5
poorvaja.r
No ratings yet
JAWS (Screen Reader)
Document18 pages
JAWS (Screen Reader)
yiho
No ratings yet
Build Automatic Speech Recognition System: Bachelor of Technology
Document25 pages
Build Automatic Speech Recognition System: Bachelor of Technology
15cse1022 Sriram vinay kumar
No ratings yet
NLP Assignment 5
Document5 pages
NLP Assignment 5
poorvaja.r
No ratings yet
A Tutorial On Hidden Markov Models and Selected Applications in Speech Recognition
Document30 pages
A Tutorial On Hidden Markov Models and Selected Applications in Speech Recognition
azizd15
No ratings yet
Algorithmic Probability: Fundamentals and Applications
From Everand
Algorithmic Probability: Fundamentals and Applications
Fouad Sabry
No ratings yet
Training Feed Forward Networks With The Marquardt Algorithm
Document5 pages
Training Feed Forward Networks With The Marquardt Algorithm
samijaba
No ratings yet
How To Choose A Machine Learning Algorithm
Document12 pages
How To Choose A Machine Learning Algorithm
tanvir anwar
No ratings yet
Kecerdasan Buatan: Artificial Intelligence
Document30 pages
Kecerdasan Buatan: Artificial Intelligence
Wahyu HP
No ratings yet
Name of The SLA Approaches/Theories/Methods Name of The Proponent Concept/Gist of The Theory Strengths and Weaknesses
Document4 pages
Name of The SLA Approaches/Theories/Methods Name of The Proponent Concept/Gist of The Theory Strengths and Weaknesses
Genesis Labor
100% (1)
AI in Healthcare
Document11 pages
AI in Healthcare
Akshara
No ratings yet
Cost Driver Template Word 0715
Document15 pages
Cost Driver Template Word 0715
michael odiembo
No ratings yet
Upgrad Campus - Generative AI Bootcamp
Document9 pages
Upgrad Campus - Generative AI Bootcamp
Dhanu R
No ratings yet
Knowledge Representation
Document65 pages
Knowledge Representation
Rajamaheshwar Mahesh
No ratings yet
Voice Morphing
Document5 pages
Voice Morphing
Naveen Krishnan
100% (4)
Ingenieria de Control Moderna Ogata
Document13 pages
Ingenieria de Control Moderna Ogata
Fabian Aranda
No ratings yet
Report 2
Document52 pages
Report 2
Abhay Pratap
No ratings yet
Soft Computing 0105IT171089
Document17 pages
Soft Computing 0105IT171089
OMSAINATH MPONLINE
No ratings yet
Artificial General Intelligence (AGI) - Becoming Human - Artificial Intelligence Magazine PDF
Document8 pages
Artificial General Intelligence (AGI) - Becoming Human - Artificial Intelligence Magazine PDF
tanya tsekeni
No ratings yet
2 DataModeling RelationalModeling 2012
Document2 pages
2 DataModeling RelationalModeling 2012
Ksatria AFK
No ratings yet
Bidirectional Long Short-Term Memory For Automatic English To Kannada Back-Transliteration
Document11 pages
Bidirectional Long Short-Term Memory For Automatic English To Kannada Back-Transliteration
Big Daddy
No ratings yet
Cognitive Semantics and Structural Semantics
Document38 pages
Cognitive Semantics and Structural Semantics
Marcela Castro W
No ratings yet
The Cricket Winner Prediction With Applications of ML and Data Analytics
Document18 pages
The Cricket Winner Prediction With Applications of ML and Data Analytics
Muhammad Swalih
No ratings yet
Enactive Conference Proceedings
Document251 pages
Enactive Conference Proceedings
schmalan
No ratings yet
3.5 Smoothing (Lowpass) Spatial Filters - Lowpass Gaussian Filter Kernels
Document38 pages
3.5 Smoothing (Lowpass) Spatial Filters - Lowpass Gaussian Filter Kernels
PYC
No ratings yet
Rga PDF
Document84 pages
Rga PDF
Sumi
No ratings yet
Shivanisingh B2019103 Sectionb Assignment4
Document11 pages
Shivanisingh B2019103 Sectionb Assignment4
shivani
No ratings yet
Yegna 1999
Document479 pages
Yegna 1999
Akanksha Singh
No ratings yet
Customers Satisfaction Based On Zomato Ratings and Reviews Using Machine Learning
Document5 pages
Customers Satisfaction Based On Zomato Ratings and Reviews Using Machine Learning
International Journal of Innovative Science and Research Technology
No ratings yet
Improving Myanmar Automatic Speech Recognition With Optimization of Convolutional Neural Network Parameters
Document10 pages
Improving Myanmar Automatic Speech Recognition With Optimization of Convolutional Neural Network Parameters
Darren
No ratings yet
Medical Disease Classification Using Deep Learning: Dr. Shikha Purwar
Document6 pages
Medical Disease Classification Using Deep Learning: Dr. Shikha Purwar
shikha
No ratings yet
Presentation For English... Succesful Conversation and Unsuccessful Conversation
Document18 pages
Presentation For English... Succesful Conversation and Unsuccessful Conversation
m akib wibiyan
No ratings yet
Pid Controller Calculus v320
Document16 pages
Pid Controller Calculus v320
Peter Uhule
No ratings yet
IDIR Imane Thesis
Document82 pages
IDIR Imane Thesis
zaroure
No ratings yet
DL - Quiz 2 - Google Forms
Document10 pages
DL - Quiz 2 - Google Forms
Jithinmathai jacob
No ratings yet