Welcome to Scribd!

A Technical Seminar ON: Presented

Uploaded by

0% found this document useful (0 votes)

21 views16 pages

This technical seminar discusses web clustering engines. It introduces clustering and explains why web clustering engines are useful for ambiguous queries by grouping similar search results. The document outlines some advantages of cluster hierarchies, like providing shortcuts between related topics. It also discusses challenges in implementing clusters, such as determining meaningful labels and similarity measures. An overview is given of the architecture of a web clustering engine, including acquiring search results, preprocessing them, constructing clusters, and visualizing the results.

Original Description:

web clustering

Original Title

Web Clustering

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

21 views16 pages

A Technical Seminar ON: Presented

Uploaded by

Govindaram Rajesh

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 16

Search inside document

A

TECHNICAL SEMINAR
ON

1
Presented By :
K.Shiva Kumar,
16d35a0507 .

DEPARTMENT OF COMPUTER SCIENCE&ENGINEERING

INDEX
 Introduction
 Why web clustering engine
 Advantages of cluster hierarchy
 Issues in implementation of Clusters
 Architecture
 Conclusion

3/23/2019 2
Introduction
 Web Clustering Engine

 Clustering is the act of grouping similar objects into

sets.

3/23/2019 3
3/23/2019 4
Why web clustering engine
 Conventional engines not
much efficient in ‘Ambiguous’
queries.
 The search results returned by
conventional search engines
query will be mixed together in
the list, irrelevant items occurs.

3/23/2019 5
Advantages of cluster hierarchy
 It makes for shortcuts to the items that relate to the
same meaning.

 It allows better topic understanding.

 It favors systematic exploration of search results.

3/23/2019 6
Issues in Implementation of clusters
 Short input data description.
 Meaningful labels.
 Selection of similarity measure.
 Grouping of objects into clusters.
 Over lapping.
 Unknown number of clusters.

3/23/2019 7
Architecture

3/23/2019 8
Search Results Acquisition
 Provides input for the rest of the system.

 Deliver 50 to 500 results.

 Public search engines such as Google , Yahoo.

3/23/2019 9
Preprocessing of Search Results
 Covert the search results into “features”.
 Steps:
 Language Identification
 Tokenization

 Stemming

 Selection features

3/23/2019 10
Cluster Construction and Labeling
 Search results are input to the clustering algorithm.

 Data centric Clustering Algorithm.

 Created cluster should be aptly labeled.

3/23/2019 11
How can represent a Feature/Text
Vector space Model (VSM).
Document d is represented
in the VSM as a vector
[wt0 , wt1 , … , wtn].
 Example:
d->”polly had a dog and
the dog had polly”

3/23/2019 12
Visualization
One prominent approach is based on heirarchical folders
 Clusty , CREDO ,Lingo3G – heirarchical folder
visualization approach.
 Grokker – Nesting , zooming approach.
 KarTOO – Graph based interface.

3/23/2019 13
Conclusion
A number of advances must be made to improve the cluster labels ,
coherence of cluster structure , performance evaluation studies
advanced visualization techniques . Then web clustering engines
entirely fulfills the promise of being the page Rank of the future.

3/23/2019 14
References
 http://clusty.com
 http://credo.fub.it
 www.google.com
 http://credino.demi.uniud.it

3/23/2019 15
Thank You…

3/23/2019 16

Ford Everes PDF
Document584 pages
Ford Everes PDF
Tiến Hồ
100% (6)
Machine Element Design Cheatsheet
Document25 pages
Machine Element Design Cheatsheet
Darien Chia
No ratings yet
Auditing Racf
Document57 pages
Auditing Racf
சிங்கார வேலன்
No ratings yet
Statistical Process Control & Cost of Quality
Document114 pages
Statistical Process Control & Cost of Quality
Ashraf S. Youssef
100% (2)
Motorized Hydraulic Press
Document4 pages
Motorized Hydraulic Press
Dhiraj Shinde
100% (2)
Disc Brake System Report
Document20 pages
Disc Brake System Report
Govindaram Rajesh
100% (1)
Hot Work Procedure
Document10 pages
Hot Work Procedure
Ows Anish
No ratings yet
Menstruum and Rose Quartz Tincture
Document3 pages
Menstruum and Rose Quartz Tincture
travellerfellow
100% (2)
An Introduction To Capella and Arcadia With Tutorial
Document55 pages
An Introduction To Capella and Arcadia With Tutorial
juliancamilo
No ratings yet
BSA D14 175 Bantam Supreme Sports Bushman Maintenance Instruction Manual PDF
Document37 pages
BSA D14 175 Bantam Supreme Sports Bushman Maintenance Instruction Manual PDF
jvdkjdlkk
No ratings yet
G4 Manual
Document64 pages
G4 Manual
froggy12345678910
100% (2)
ST Open Source Data Pipelines Oreilly f22568 202003 en PDF
Document79 pages
ST Open Source Data Pipelines Oreilly f22568 202003 en PDF
Cv
No ratings yet
Cat Reforming Part 2 3 PDF Free
Document68 pages
Cat Reforming Part 2 3 PDF Free
Lê Trường An
No ratings yet
350W Amplifier
Document5 pages
350W Amplifier
moises
No ratings yet
Cybersecurity Capacity Maturity
Document60 pages
Cybersecurity Capacity Maturity
Nayo Verdugo Crespo
No ratings yet
Collective Intelligence in Action
From Everand
Collective Intelligence in Action
Satnam Alag
Rating: 4 out of 5 stars
4/5 (7)
Mobile Wallet
Document6 pages
Mobile Wallet
Govindaram Rajesh
100% (1)
Cloud Computing Csc3206: About The Course Unit
Document7 pages
Cloud Computing Csc3206: About The Course Unit
Ismael Lukwago
No ratings yet
CS6703 Regulation-Lesson plan-CS6703-GRID AND CLOUD COMPUTING - 7th Semester
Document5 pages
CS6703 Regulation-Lesson plan-CS6703-GRID AND CLOUD COMPUTING - 7th Semester
addssdfa
No ratings yet
Distributed Cloud Computing - Take Home Exams
Document3 pages
Distributed Cloud Computing - Take Home Exams
samee Seth
0% (1)
Evolve or Die: High-Availability Design Principles Drawn From Google's Network Infrastructure
Document15 pages
Evolve or Die: High-Availability Design Principles Drawn From Google's Network Infrastructure
Nb A Dung
No ratings yet
Deepthi - Webclustering Report PDF
Document38 pages
Deepthi - Webclustering Report PDF
jyoti
No ratings yet
Technical Seminar ON Web Clustering Engines.: Department of Computer Science and Engineering
Document15 pages
Technical Seminar ON Web Clustering Engines.: Department of Computer Science and Engineering
185G1 Pragna Koneru
No ratings yet
Cloud Computing Csc3206: About The Course Unit
Document10 pages
Cloud Computing Csc3206: About The Course Unit
Ismael Lukwago
No ratings yet
CDBTune PDF
Document19 pages
CDBTune PDF
Vishal Kumar
No ratings yet
Clustering: Pelatihan Data Analytics Specialist 2019
Document24 pages
Clustering: Pelatihan Data Analytics Specialist 2019
Yudi Lesmana
No ratings yet
Memory Based Hybrid Dragonfly Algorithm For Multiple Key Generation Using Cloud Computing
Document11 pages
Memory Based Hybrid Dragonfly Algorithm For Multiple Key Generation Using Cloud Computing
C.Kaleeswari
No ratings yet
Client Clustering For Energy-Efficient Clustered Federated Learning in Wireless Networks
Document6 pages
Client Clustering For Energy-Efficient Clustered Federated Learning in Wireless Networks
Sree Krishna Das
No ratings yet
Eti Part B
Document14 pages
Eti Part B
samarthkadam585
No ratings yet
Cloud Computing Course Code: 4360709
Document11 pages
Cloud Computing Course Code: 4360709
dropyfireservice1
No ratings yet
A Clustering-Based Collaborative Filtering Approach For Big Data Application
Document10 pages
A Clustering-Based Collaborative Filtering Approach For Big Data Application
sk k
No ratings yet
J Jcde 2019 04 002
Document15 pages
J Jcde 2019 04 002
José Manuel Ortiz Rodriguez
No ratings yet
Projection of Constraint Based On Clustering: Jai Sharma. K, Chandra Mouliswara Reddy. P
Document4 pages
Projection of Constraint Based On Clustering: Jai Sharma. K, Chandra Mouliswara Reddy. P
Jai Sharma
No ratings yet
A Language For Manipulating Clustered Web Documents Results
Document11 pages
A Language For Manipulating Clustered Web Documents Results
Alessandro Siro Campi
No ratings yet
Web Based Fuzzy C-Means Clustering Software (WFCM) : January 2014
Document9 pages
Web Based Fuzzy C-Means Clustering Software (WFCM) : January 2014
Raghav Dhanuka
No ratings yet
Maruti Seminar Report
Document29 pages
Maruti Seminar Report
sauravd7774
No ratings yet
Introduction To Cloud Computing
Document36 pages
Introduction To Cloud Computing
Shailaja Karingula
No ratings yet
MEDC Project Report Bhathiya 318282
Document44 pages
MEDC Project Report Bhathiya 318282
Vijayant Panda
No ratings yet
1 Brochure Computer Networks
Document4 pages
1 Brochure Computer Networks
Dr. Suman Rani
No ratings yet
Modelling and Simulation of ElasticSearch Using CloudSim Final
Document9 pages
Modelling and Simulation of ElasticSearch Using CloudSim Final
amira
No ratings yet
CS - 4012 Lab Manual
Document25 pages
CS - 4012 Lab Manual
Lucky Champ
No ratings yet
Manage Internet
Document68 pages
Manage Internet
mule Demissie
No ratings yet
Smart Cloud Federation Simulations With Cloudsim: June 2013
Document18 pages
Smart Cloud Federation Simulations With Cloudsim: June 2013
fall
No ratings yet
Cloud Based Supply Chain Management System Using Blockchain
Document7 pages
Cloud Based Supply Chain Management System Using Blockchain
Clarisse Policios
No ratings yet
A Language For Manipulating Clustered Web Documents Results
Document11 pages
A Language For Manipulating Clustered Web Documents Results
Alessandro Siro Campi
No ratings yet
Preparation For Google Cloud Professional Cloud Database Engineer Certification - by Murli Krishnan - Google Cloud - Community - Medium
Document17 pages
Preparation For Google Cloud Professional Cloud Database Engineer Certification - by Murli Krishnan - Google Cloud - Community - Medium
JAM
No ratings yet
Clustering Techniques in Data Mining
Document7 pages
Clustering Techniques in Data Mining
Dhekk'iiaah Baruu Bangunnt
No ratings yet
PGP Report Sachin t22060
Document20 pages
PGP Report Sachin t22060
sachin
No ratings yet
Csizg527 May04 An
Document1 page
Csizg527 May04 An
Ajay Gowtham
No ratings yet
Deep Multi-View Semi-Supervised Clustering
Document14 pages
Deep Multi-View Semi-Supervised Clustering
juan
No ratings yet
Cloud Basics For RC Wintersession 2022
Document22 pages
Cloud Basics For RC Wintersession 2022
Spidey Mcu
No ratings yet
Paper Web Clustering
Document3 pages
Paper Web Clustering
shital
No ratings yet
A Smart Contract-Based Agent Marketplace For The J-Park Simulator - A Knowledge Graph For The Process Industry
Document16 pages
A Smart Contract-Based Agent Marketplace For The J-Park Simulator - A Knowledge Graph For The Process Industry
Johnny Alvarado
No ratings yet
Report
Document35 pages
Report
tasfia tabassum nayla
No ratings yet
Cambridge Assessment International Education: Information Technology 9626/11 May/June 2019
Document10 pages
Cambridge Assessment International Education: Information Technology 9626/11 May/June 2019
katia
No ratings yet
Azure Fundamentals Notes: Principles of Cloud Computing
Document6 pages
Azure Fundamentals Notes: Principles of Cloud Computing
Clyde Kuraido
No ratings yet
Network Security
Document159 pages
Network Security
Jireh Alido Flavio
No ratings yet
Cloud Computing For Cloud Manufacturing Benefits and Limitations
Document10 pages
Cloud Computing For Cloud Manufacturing Benefits and Limitations
KEERTHIVASAN R S
No ratings yet
Gs Gcse Computer Science
Document66 pages
Gs Gcse Computer Science
Kyle Zhang
No ratings yet
Data Science
Document23 pages
Data Science
a v
No ratings yet
Introduction Cloud Computing
Document55 pages
Introduction Cloud Computing
Mohsin Ali
No ratings yet
Jiang 2019
Document10 pages
Jiang 2019
amir.doudou07
No ratings yet
Unit 1,2 & 3 QB For Focc
Document25 pages
Unit 1,2 & 3 QB For Focc
Pushpavalli Mohan
No ratings yet
1 s2.0 S1877050915020773 Main
Document7 pages
1 s2.0 S1877050915020773 Main
Ashok Jayadar
No ratings yet
Final Year Project Proposals Academic Year 2017-18
Document40 pages
Final Year Project Proposals Academic Year 2017-18
Awlia Khan
No ratings yet
Computer Networking 3 - Module 01
Document13 pages
Computer Networking 3 - Module 01
Joel Manacmul
No ratings yet
1 s2.0 S0278612522001054 Main
Document14 pages
1 s2.0 S0278612522001054 Main
Mann Strong
No ratings yet
Fmore: An Incentive Scheme of Multi-Dimensional Auction For Federated Learning in Mec
Document12 pages
Fmore: An Incentive Scheme of Multi-Dimensional Auction For Federated Learning in Mec
aakash trivedi
No ratings yet
Groove Project Management
Document117 pages
Groove Project Management
Joseph Lim
No ratings yet
A Neural-Based Architecture For Small Datasets Classification
Document9 pages
A Neural-Based Architecture For Small Datasets Classification
José Patrício
No ratings yet
Secure Image Retrival With Different Classification Models: T. Srinivas Reddy, CH. Shekar, J. Prabhakar
Document5 pages
Secure Image Retrival With Different Classification Models: T. Srinivas Reddy, CH. Shekar, J. Prabhakar
Prabhakar Chary
No ratings yet
Blockchain Paperin Manufacturing Letters
Document7 pages
Blockchain Paperin Manufacturing Letters
Pramod Athiyarathu
No ratings yet
Towards Increasing Reliability of Amazon
Document30 pages
Towards Increasing Reliability of Amazon
Arabic Tiger
No ratings yet
Safe Keeping Evolution Pattern
Document25 pages
Safe Keeping Evolution Pattern
Govindaram Rajesh
No ratings yet
Online Meeting With Clients: Project Guide
Document16 pages
Online Meeting With Clients: Project Guide
Govindaram Rajesh
No ratings yet
E-Ball Technology
Document13 pages
E-Ball Technology
Govindaram Rajesh
No ratings yet
E-Ball Technology
Document13 pages
E-Ball Technology
Govindaram Rajesh
No ratings yet
A Seminar Report On VLAN TRUNKING PROTOC PDF
Document17 pages
A Seminar Report On VLAN TRUNKING PROTOC PDF
Govindaram Rajesh
No ratings yet
30 Online Meeting With Clients-12
Document3 pages
30 Online Meeting With Clients-12
Govindaram Rajesh
No ratings yet
Firewalls: Technical Seminar ON
Document19 pages
Firewalls: Technical Seminar ON
Govindaram Rajesh
No ratings yet
E Wallet Report
Document27 pages
E Wallet Report
Govindaram Rajesh
No ratings yet
Presented By:: Head of The Department Project Guide
Document14 pages
Presented By:: Head of The Department Project Guide
Govindaram Rajesh
No ratings yet
This Study Resource Was: Laboratory Exercise 2 Preparation of Disturbed Soil Sample For Test Objective
Document3 pages
This Study Resource Was: Laboratory Exercise 2 Preparation of Disturbed Soil Sample For Test Objective
Bienvenida Ycoy Montenegro
No ratings yet
Size Matters: (Type The Document Subtitle)
Document16 pages
Size Matters: (Type The Document Subtitle)
SamarthGoel
No ratings yet
Issue 1 MMNR Short Dump
Document6 pages
Issue 1 MMNR Short Dump
pookusmas
No ratings yet
Empaque Espirometalicos PDF
Document50 pages
Empaque Espirometalicos PDF
gregorio
No ratings yet
Hino 258Lp Serie S: Truck Chassis Specifications
Document2 pages
Hino 258Lp Serie S: Truck Chassis Specifications
agussulaksana
100% (3)
A Review of Power Electronics Based Microgrids: Josep M. Guerrero, Xiongfei Wang, Zhe Chen, and Frede Blaabjerg
Document5 pages
A Review of Power Electronics Based Microgrids: Josep M. Guerrero, Xiongfei Wang, Zhe Chen, and Frede Blaabjerg
Saksham Gupta
No ratings yet
Wanyiri S K - Traffic Congestion in Nairobi CBD
Document65 pages
Wanyiri S K - Traffic Congestion in Nairobi CBD
1man1book
No ratings yet
One Jan
Document69 pages
One Jan
Deep Patel
No ratings yet
Benq mp510 Level1
Document212 pages
Benq mp510 Level1
Juan Duarte Lopez
100% (1)
Bicycle and Motorcycle Dynamics
Document36 pages
Bicycle and Motorcycle Dynamics
Chanakya Ch
No ratings yet
IGS-NT Application Guide 05-2013 PDF
Document104 pages
IGS-NT Application Guide 05-2013 PDF
Nikita
No ratings yet
Fischer Technical Services Safety Manual
Document15 pages
Fischer Technical Services Safety Manual
Henry Florendo
No ratings yet
Samsung E1272 EN PDF
Document2 pages
Samsung E1272 EN PDF
muhammad aslam
No ratings yet
West Beverly Homes-Boq
Document6 pages
West Beverly Homes-Boq
ERIC
No ratings yet
CDMA APPLICATION FOR Child Name Inclusion-Before 1 Year PDF
Document2 pages
CDMA APPLICATION FOR Child Name Inclusion-Before 1 Year PDF
Anonymous C0pl6h
No ratings yet
Wind Loads - IS 875 - Where Does Our Code of Practice Stand
Document11 pages
Wind Loads - IS 875 - Where Does Our Code of Practice Stand
Ravi Kiran Nandyala
No ratings yet
A Curvature Compensated CMOS Bandgap Voltage Reference
Document4 pages
A Curvature Compensated CMOS Bandgap Voltage Reference
Muhammad_Swilam_2010
No ratings yet
Lhotse Manual E V1.2
Document46 pages
Lhotse Manual E V1.2
vp
No ratings yet
Columns: Advance of Computation Since These Codes Fall
Document2 pages
Columns: Advance of Computation Since These Codes Fall
Abhimanyu Ravindranath
No ratings yet