Elmer Gonzlez Herrera Master of Science in Computer Science USA Master of Science in Computer Science, USA egonzalezh@upao.edu.pe Objetivos Generales Objetivos Generales El objetivo fundamental de este El objetivo fundamental de este curso es: Saber aplicar las tcnicas de p Minera de Datos apropiadas para problemas concretos de extraccin de conocimiento til extraccin de conocimiento til para el anlisis o la toma de decisiones. 2 Objetivos Especficos Objetivos Especficos Reconocer la problemtica del anlisis de grandes volmenes de datos y de los beneficios grandes volmenes de datos y de los beneficios de su uso. Conocer las fases del Descubrimiento de Conocer las fases del Descubrimiento de Conocimiento de Bases de Datos y la impor- tancia de las mismas en el xito del proceso. Conocer bsicamente las distintas tcnicas de aprendizaje automtico y estadsticas utilizadas aprendizaje automtico y estadsticas utilizadas en Minera de Datos (Data Mining), su potencial, su costo computacional y sus limitaciones de representacin y de inteligibilidad 3 representacin y de inteligibilidad. Objetivos Especficos Objetivos Especficos Elegir, para un problema concreto, qu tcnicas de minera de datos son ms apropiadas y utilizarlas, mediante una herramienta o paquete de minera de datos herramienta o paquete de minera de datos. Evaluar la calidad de un modelo, utilizando t i ill d l i ( lid i tcnicas sencillas de evaluacin (validacin cruzada). Conocer la problemtica especial de la Minera Web (documentos textuales e hipertextuales, XML) y las tcnicas ms usuales 4 XML) y las tcnicas ms usuales. Temario Temario 1.IntroduccinalaMineradeDatos(DM) 1.1.Motivacin 1 2 P bl i li i 1.2.Problemastipoyaplicaciones 1.3.RelacindeDMconotrasdisciplinas 2.ElprocesodeKDD 2.1.LasFasesdelKDD 2.2.TipologadeTcnicasdeMineradeDatos 2.3.SistemasComercialesyHerramientasdeMineradedatos 2.4.PreparacinyVisualizacindedatos 3 Tcnicas de Minera de Datos 3.TcnicasdeMineradeDatos 3.1.ElProblemadelaExtraccinAutomticadeConocimiento. 3.2.Evaluacin deHiptesis 3.3.Tcnicasnosupervisadasydescriptivas. 3.4.Tcnicassupervisadasypredictivas. 4.WebMining 4.1.LosProblemasdelaInformacinNoEstructurada. 4 2 Extraccin de Conocimiento a partir de Documentos HTML y texto 5 4.2.ExtraccindeConocimientoapartirdeDocumentosHTMLytexto. 4.3.ExtraccindeInformacinsemiestructurada(XML). 5.Otros Aspectos Material y Organizacin Material y Organizacin Material: Transparencias. Software en el laboratorio: SPSS Clementine 10 1 SPSS Clementine 10.1 Otra Documentacin: http://www.egonzalezh@upao.edu.pe Sesiones de 4 horas: 2 sesiones el sbado y 1 sesin el domingo 50% exposicin 50% prcticas con Clementine 10.1 6 Bibliografa Bibliografa BerryM.J.A.;Linoff,G.S.MasteringDataMiningWiley2000. Berthold,M.;Hand,D.J.(ed)IntelligentDataAnalysis.An Introduction2ndEdition,Springer2002. Dunham,M.H.DataMining.IntroductoryandAdvancedTopics PrenticeHall,2003. Dzeroski, S.; Lavrac, N. Relational Data Mining Springer 2001. Dzeroski,S.;Lavrac,N. RelationalDataMining Springer2001. Etzioni,O.TheWorld WideWeb.QuagmireorGoldMine CommunicationsoftheACM,November1996,Vol.39,n11,1996. Fayyad,U.M.;PiatetskiyShapiro,G.;Smith,P.;Ramasasmy,U. d i l d i d i i / AdvancesinKnowledgeDiscoveryandDataMining,AAAIPress/ MITPress,1996. Fayyad,U.M.;Grinstein,G.;Wierse,A.InformationVisualizationin DataMiningandKnowledgeDiscoveryMorganKaufmann,Harcourt g g y g , Intl.,2001. Han,J.;Kamber,M.DataMining:ConceptsandTechniquesMorgan Kaufmann,2001. 7 Bibliografa Bibliografa Hand,D.J.;Mannila,H.andSmyth,P.PrinciplesofDataMining,TheMIT Press,2000. H d J R MJ F i C I t d i l Mi d D t Hernndez,J.;Ramrez,MJ.;Ferri,C.IntroduccinalaMineradeDatos PearsonPrenticeHall,2004. Kosala,R.;Blockeel,H.WebMiningResearch:ASurveyACMSIGKDD Explorations,NewsletteroftheACMSIGonKnowledgeDiscoveryand p g y DataMining,June2000,Vol.2,n1,pp.115. Mena,JesusDataMiningYourWebsite,DigitalPress,July1999. Mitchell,T.M.MachineLearningMcGrawHill1997. Pyle D Data Preparation for Data Mining Morgan Kaufmann Harcourt Pyle,D. DataPreparationforDataMining MorganKaufmann,Harcourt Intl.,1999. Thuraisingham,B.DataMining.Technologies,Techniques,Tools,and Trends,CRCPress,1999. Witten,I.H.;Frank,E.ToolsforDataMining,MorganKaufmann,2nd Edition,2004. Wong,P.C.VisualDataMining,SpecialIssueofIEEEComputer Graphics and Applications Sep/ Oct 1999 pp 20 46 8 GraphicsandApplications,Sep/Oct1999,pp.20 46. Preguntas? Preguntas?