Welcome to Scribd!

Ocr

Uploaded by

0% found this document useful (0 votes)

80 views22 pages

OCR stands for Optical Character Recognition. It is the process of translating scanned images of typewritten text into machine-editable text. The process involves analyzing the image content, recognizing characters, and extracting the text. Key steps in OCR include preprocessing techniques like binarization, skew correction, and segmentation to isolate individual characters before classification and recognition of the text. OCR is useful for converting documents like books, manuscripts, and newspapers into digital formats.

Original Description:

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

80 views22 pages

Ocr

Uploaded by

nishugoel91

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 22

Search inside document

OCR

Optical Character Recognition

OCR
OCR stands for Optical character recognition

It is the process of translating scanned images of typewritten text into machineeditable information
Process involves analyzing the content and

recognizing the identity of any character contained in a digitized image and returning its information.

Block Diagram for OCR

PROCESSES INVOLVED
1.CLASSIFICATION a. Training Preprocessing Feature extraction Model estimation b.Recognition (testing) Preprocessing Feature extraction classification

PREPROCESSING
It involves Binarisation Morphological operators segmentation

BINARISATION
Converts a grey level TIFF (8 bit) image to

binary image.
Histogram based gloproachbal threshold

approach
Helps in segregating background from text.

MORPHOLOGICAL OPERATORS 1.ORIENTATION

ORIENTATION

ORIENTATION PROBLEMS

2. SKEW CORRECTION
Determining the degree of skewness

Use headline or page edges for correction by

rotating the image

SEGEMENTATION
Basic idea:- dissect the image of a line of text

into location between characters, i.e. , character breaks. Character break depends upon: Font Type sizes Printing quality

TYPE OF SEGEMENTATION
Bottom up

Top down

mixed

BOTTOM UP APPROACH
Segmentation starts with individual letters on a page, then based on text layout conventions, groups

letter into words, words into paragraphs, and so on

TOP DOWN APPROACH

Top down approach takes advantage of the fact that formatted documents have

margins surrounding each region. The page can be subdivided into regions depending on white spaces in the document.

PROBLEMS IN SEGMENTATION
OVER SEGMENTATION Dot matrix printing or insufficient inks Characters tend to be fragmental UNDER SEGMENTATION Ink smudging Small fonts Signatures

OVERCOMING SEGMENTATION PROBLEMS

Separation by Valley of Vertical Projection Searches for vertical white space between characters. Projection of character pixels along the vertical direction and detection of valleys.

Cut And Test

This technique dissects the character image at several candidate location s and evaluates the result of the segmented pieces. The candidate locations are determined by considering factors such as the average Break point distances.

BACKGROUND NOISE

Textual Noise

Non-Textual Noise

Extraneous symbols from Black Borders. Speckles. the neighboring page. Hand Written Material.

TEXTUAL NOISE

NON TEXTUAL NOISE

NOISE REMOVAL Page frame Rectangular region enclosing all the foreground pixels in the document image. Parameters : Size Aspect Ratio Limitations: Fail if characters from adjacent page are present.

CONCLUSION
OCR is useful in converting type written text into machine editable format which can be further processed as per requirements. Digitization of Libraries. Digitization of old manuscripts. Helpful for visually challenged .

Optical Character Recognition: Fundamentals and Applications
From Everand
Optical Character Recognition: Fundamentals and Applications
Fouad Sabry
No ratings yet
ePub Stylings
From Everand
ePub Stylings
James LaRoche
No ratings yet
Optical Character Recognition
Document27 pages
Optical Character Recognition
Amit Srivastava
No ratings yet
OCR: Optical Character Recognition Explained
Document10 pages
OCR: Optical Character Recognition Explained
Kartik Katekar
No ratings yet
Multimedia and WS-CS 550-Content Analysis v1
Document27 pages
Multimedia and WS-CS 550-Content Analysis v1
devices.hcs
No ratings yet
Optical Character Recognition: Selected Topics in Computer Science
Document7 pages
Optical Character Recognition: Selected Topics in Computer Science
Haris Shyk
No ratings yet
OCR Process Overview
Document4 pages
OCR Process Overview
Sandeep Manu
No ratings yet
Optical Character Recognition
Document27 pages
Optical Character Recognition
Osama Abbass
No ratings yet
Text Pre-Processing and Text Segmentation For OCR
Document3 pages
Text Pre-Processing and Text Segmentation For OCR
Akai Shuichi
No ratings yet
Jagruthi Institute of Engineering and Technology: Optical Character Recognition
Document28 pages
Jagruthi Institute of Engineering and Technology: Optical Character Recognition
raghavilatha
No ratings yet
Optical Character Recognition
Document25 pages
Optical Character Recognition
sanjoyjena
No ratings yet
Optical Character Recognition - Report
Document33 pages
Optical Character Recognition - Report
sanjoyjena
50% (2)
Main PPT2
Document31 pages
Main PPT2
Shanthi Kishore
No ratings yet
Optical Character Recognition
Document3 pages
Optical Character Recognition
Gopal Savaliya
No ratings yet
Introduction To Optical Character Recognition (OCR)
Document29 pages
Introduction To Optical Character Recognition (OCR)
api-26462544
No ratings yet
IMAGE FEATURES USING WAVELETS AND APPLICATIONS
Document71 pages
IMAGE FEATURES USING WAVELETS AND APPLICATIONS
Mr.Mohammed Zakir B ELECTRONICS & COMMUNICATION
No ratings yet
Handwritten Gujarati Character Recognition Based On Discrete Cosine Transform
Document4 pages
Handwritten Gujarati Character Recognition Based On Discrete Cosine Transform
Ankit Sharma
No ratings yet
4,5,6
Document8 pages
4,5,6
nirmala periasamy
No ratings yet
Optical Character Recognition Using MATLAB: Sandeep Tiwari, Shivangi Mishra, Priyank Bhatia, Praveen Km. Yadav
Document4 pages
Optical Character Recognition Using MATLAB: Sandeep Tiwari, Shivangi Mishra, Priyank Bhatia, Praveen Km. Yadav
جمال سينغ
No ratings yet
Document CHARACTER RECOGNITION
Document3 pages
Document CHARACTER RECOGNITION
Allwin Fernandez
100% (1)
Zone Segmentation and Thinning Based Algorithm For Segmentation of Devnagari Text
Document4 pages
Zone Segmentation and Thinning Based Algorithm For Segmentation of Devnagari Text
Editor IJRITCC
No ratings yet
Ocr Ee301
Document5 pages
Ocr Ee301
Manoj Nanduri
No ratings yet
Optical Character Recognizer: Team Member
Document7 pages
Optical Character Recognizer: Team Member
nancy Poonia
No ratings yet
OCR System Based on Template Matching
Document23 pages
OCR System Based on Template Matching
Smriti Singh
No ratings yet
Optical Character Recognition (OCR) For Printed Devnagari Script UsingArtificial Neural Network
Document5 pages
Optical Character Recognition (OCR) For Printed Devnagari Script UsingArtificial Neural Network
Mario Guillèn
No ratings yet
Text Extraction From Image
Document23 pages
Text Extraction From Image
Mamata Harish
No ratings yet
Document Examination (562051434)
Document16 pages
Document Examination (562051434)
GRAMMAR
No ratings yet
Rapid Manufacturing Process Optimization
Document30 pages
Rapid Manufacturing Process Optimization
Nishant Mayekar
No ratings yet
Number Plate Recognition Using Ocr Techn
Document5 pages
Number Plate Recognition Using Ocr Techn
phamdonhuhuynh11lnhom11.1
No ratings yet
Surface Texture: G Lancaster Marlborough Boys College
Document22 pages
Surface Texture: G Lancaster Marlborough Boys College
Jim Johnson
No ratings yet
Digitization Process
Document57 pages
Digitization Process
Mrutyunjay Sethy
100% (1)
An Intelligent Approach To Recognize Sign Language For Deaf and Dumb People of The World
Document36 pages
An Intelligent Approach To Recognize Sign Language For Deaf and Dumb People of The World
Gurudev Yankanchi
No ratings yet
Ug Consultants Digital Image Processing Course Contents
Document9 pages
Ug Consultants Digital Image Processing Course Contents
Madhusudhana Rao
No ratings yet
5.0 Best Practices For OCR
Document4 pages
5.0 Best Practices For OCR
Sim Simma
No ratings yet
NEW 10 August Feature Extraction Techniques For Handwritten Character Recognition
Document7 pages
NEW 10 August Feature Extraction Techniques For Handwritten Character Recognition
shruti
No ratings yet
Detection of Bold Italic and Underline Fonts For Hindi OCR
Document4 pages
Detection of Bold Italic and Underline Fonts For Hindi OCR
seventhsensegroup
No ratings yet
M.s.c Computer Science OCR Dr. Matheel Ali Abid Husaen Azeez
Document12 pages
M.s.c Computer Science OCR Dr. Matheel Ali Abid Husaen Azeez
عمار طعمة
No ratings yet
Text Color Images
Document6 pages
Text Color Images
vandana
No ratings yet
A C# Project in Optical Character Recognition (OCR) Using Chain Code - CodeProject
Document13 pages
A C# Project in Optical Character Recognition (OCR) Using Chain Code - CodeProject
German Ibarra
No ratings yet
A Survey On Handwritten Character Recognition (HCR) Techniques For English Alphabets
Document12 pages
A Survey On Handwritten Character Recognition (HCR) Techniques For English Alphabets
avcjournal
No ratings yet
Steps Involved in Text Recognition and Recent Research in OCR A Study
Document6 pages
Steps Involved in Text Recognition and Recent Research in OCR A Study
kkarthiks
No ratings yet
Ocr & Cbir
Document13 pages
Ocr & Cbir
عمار طعمة
No ratings yet
Segmentation and Extraction of Text From Curved Text Lines Using Image Processing Approach
Document5 pages
Segmentation and Extraction of Text From Curved Text Lines Using Image Processing Approach
Akai Shuichi
No ratings yet
Raspberry Pi
Document21 pages
Raspberry Pi
Jay Patel
No ratings yet
Hindi OCR
Document12 pages
Hindi OCR
Andrea Griffin
No ratings yet
An Intelligent Approach To Recognize Sign Language For Deaf and Dumb People of The World
Document36 pages
An Intelligent Approach To Recognize Sign Language For Deaf and Dumb People of The World
Gurudev Yankanchi
No ratings yet
Automatically Detect and Recognize Text in Natural Images
Document19 pages
Automatically Detect and Recognize Text in Natural Images
Student 188X1A04D0
No ratings yet
Capstonepres
Document12 pages
Capstonepres
api-444066674
No ratings yet
Automatic Number Plate Recognition System in 40 Characters
Document18 pages
Automatic Number Plate Recognition System in 40 Characters
V
No ratings yet
Offline Signature Verification Using Local Keypoint Features
Document19 pages
Offline Signature Verification Using Local Keypoint Features
rahul
No ratings yet
Optical Character Recognition Implementation Using Pattern Matching
Document3 pages
Optical Character Recognition Implementation Using Pattern Matching
Thanh Nguyen
No ratings yet
Enhancement and Segmentation of Historical Records
Document19 pages
Enhancement and Segmentation of Historical Records
CS & IT
No ratings yet
Recognition of Handwritten Characters A Review: R H Davis and J Lyall
Document11 pages
Recognition of Handwritten Characters A Review: R H Davis and J Lyall
Pradeep
No ratings yet
InTech-Preprocessing Techniques in Character Recognition
Document22 pages
InTech-Preprocessing Techniques in Character Recognition
shivaprasad
No ratings yet
Preprocessing Techniques Improve Character Recognition Rates
Document21 pages
Preprocessing Techniques Improve Character Recognition Rates
Mr.Mohammed Zakir B ELECTRONICS & COMMUNICATION
No ratings yet
System Analysis
Document5 pages
System Analysis
HAREESH V
No ratings yet
Introduction To Optical Character Recognition (OCR) : Madan H R
Document26 pages
Introduction To Optical Character Recognition (OCR) : Madan H R
Madan R Honnalagere
No ratings yet
Automatic Book Reader: Submitted By
Document27 pages
Automatic Book Reader: Submitted By
Aprajita shrivastava
No ratings yet
Digital Signal and Image Processing Using Matlab: Compiled by
Document41 pages
Digital Signal and Image Processing Using Matlab: Compiled by
Xavier Acuña Estrada
No ratings yet
Detection of Bold and Italic Character in Gurmukhi Script: Harjit Singh
Document4 pages
Detection of Bold and Italic Character in Gurmukhi Script: Harjit Singh
International Organization of Scientific Research (IOSR)
No ratings yet
Analysis of Dormancy Breaking and Seed Germination Factors in Clitoria ternatea
Document5 pages
Analysis of Dormancy Breaking and Seed Germination Factors in Clitoria ternatea
nishugoel91
No ratings yet
Analysis of Dormancy Breaking and Seed Germination Factors in Clitoria ternatea
Document5 pages
Analysis of Dormancy Breaking and Seed Germination Factors in Clitoria ternatea
nishugoel91
No ratings yet
1 April Paper Us 4296731
Document9 pages
1 April Paper Us 4296731
nishugoel91
No ratings yet
Licencias Avast
Document22 pages
Licencias Avast
Jeff Cata
No ratings yet
19 Marchslrtrck
Document7 pages
19 Marchslrtrck
nishugoel91
No ratings yet
HUD System Components and Working
Document27 pages
HUD System Components and Working
nishugoel91
No ratings yet
Pininterest Visual Search
Document10 pages
Pininterest Visual Search
dhanan09co28
No ratings yet
1 s2.0 S0957417412006756 Main PDF
Document11 pages
1 s2.0 S0957417412006756 Main PDF
Mustafa Troy Troy
No ratings yet
Exploring Pre-Trained Text-to-Video Diffusion Models For Referring Video Object Segmentation
Document21 pages
Exploring Pre-Trained Text-to-Video Diffusion Models For Referring Video Object Segmentation
xepit98367
No ratings yet
ECognition Reference Book
Document195 pages
ECognition Reference Book
YoniarHufanRamadhani
No ratings yet
Car License Plate Recognition With Neural Networks and Fuzzy Log PDF
Document5 pages
Car License Plate Recognition With Neural Networks and Fuzzy Log PDF
esther
No ratings yet
Object Tracking
Document22 pages
Object Tracking
pradeep B
No ratings yet
Batch 18
Document23 pages
Batch 18
Bhanu Prakash Gangadi
No ratings yet
Instance Segmentation For Autonomous Vehicle
Document6 pages
Instance Segmentation For Autonomous Vehicle
Soulayma Gazzeh
No ratings yet
Querying and Information Retrieval in Multimedia Databases
Document6 pages
Querying and Information Retrieval in Multimedia Databases
nidee_nishok
No ratings yet
Handwritten Character Recognition (HCR) Using Neural Network
Document76 pages
Handwritten Character Recognition (HCR) Using Neural Network
Mohammed Abdulream
No ratings yet
Image Segmentation Using Watershed Transform: Amandeep Kaur, Aayushi
Document4 pages
Image Segmentation Using Watershed Transform: Amandeep Kaur, Aayushi
ashish kumar
No ratings yet
Dip Unit 1
Document75 pages
Dip Unit 1
sheikdavood
No ratings yet
Zhang 2021
Document9 pages
Zhang 2021
yeyes yeyez
No ratings yet
Mask 2 Former
Document20 pages
Mask 2 Former
Yi-Chen Chen
No ratings yet
Computer Vision Pretrained Models: What Is Pre-Trained Model?
Document10 pages
Computer Vision Pretrained Models: What Is Pre-Trained Model?
muhdmunir
No ratings yet
Multiphotonsegmentation2bvasculature 190808162232
Document218 pages
Multiphotonsegmentation2bvasculature 190808162232
GetLyrics
No ratings yet
Handwritten Digit Recognition of MNIST Dataset Using Deep Learning State-Of-The-Art Artificial Neural Network ANN and Convolutional Neural Network CNN
Document7 pages
Handwritten Digit Recognition of MNIST Dataset Using Deep Learning State-Of-The-Art Artificial Neural Network ANN and Convolutional Neural Network CNN
Subramanian Subbu
No ratings yet
A New Integrated Fuzzy QFD Approach
Document13 pages
A New Integrated Fuzzy QFD Approach
Iman Mashayekh
No ratings yet
MRI Segmentation Using Dictionary Learning: - Krishna Dontaraju
Document13 pages
MRI Segmentation Using Dictionary Learning: - Krishna Dontaraju
Krishna Kishore
No ratings yet
Robust Dynamic Radiance Fields
Document11 pages
Robust Dynamic Radiance Fields
Dal Taylor
No ratings yet
Favretto PDF
Document181 pages
Favretto PDF
jfranbripi793335
No ratings yet
Review of Image Segmentation Technique: Er. Anjna Er - Rajandeep Kaur
Document4 pages
Review of Image Segmentation Technique: Er. Anjna Er - Rajandeep Kaur
Manashi Debbarma
No ratings yet
Brain Tumor Dataset
Document17 pages
Brain Tumor Dataset
Rasool Reddy
No ratings yet
Avizo930 UsersGuide
Document850 pages
Avizo930 UsersGuide
Karam Jaradat
No ratings yet
200+ Important MCQ Artificial Intelligence Class 10 - TutorialAI
Document60 pages
200+ Important MCQ Artificial Intelligence Class 10 - TutorialAI
priyashishodia69
No ratings yet
Recycle-GAN Unsupervised Video Retargeting
Document17 pages
Recycle-GAN Unsupervised Video Retargeting
blue fish
No ratings yet
Biomedical Image Processing
Document3 pages
Biomedical Image Processing
farsun
No ratings yet
Prospects of Computer Vision Automated Grading and Sorting Systems in Agricultural and Food Products For Quality Evaluation
Document9 pages
Prospects of Computer Vision Automated Grading and Sorting Systems in Agricultural and Food Products For Quality Evaluation
shaheer
No ratings yet
Digital Image Processing Using Matlab (Gonzalez)
Document302 pages
Digital Image Processing Using Matlab (Gonzalez)
Alex Țîmpău
100% (1)
Digital Image Processing
Document50 pages
Digital Image Processing
Sibgha Israr
No ratings yet