Professional Documents
Culture Documents
ISSN: 1135-5948
secretaria.sepln@ujaen.es
Sociedad Española para el Procesamiento del
Lenguaje Natural
España
Resumen
En este trabajo presentamos dos heur sticas para tratar p aginas web correspon- dientes a redes sociales en el problema de
desambiguaci on de nombres de persona en la Web. Este problema consiste en agrupar las p aginas web proporcionadas por un
motor de b usqueda al consultar un nombre de persona seg un el individuo al que se refieren. Aunque estas p aginas web
pueden afectar negativamente en la agrupaci on de los resultados, la ma- yor a de sistemas del estado del arte no tienen en
cuenta su papel en este problema. Hemos evaluado nuestras heur sticas con dos colecciones que contienen este tipo de p
aginas web. Para agrupar las p aginas web hemos utilizado una extensi on de un algoritmo del estado del arte. Ambas heur
sticas obtienen mejoras cuando hay un n umero elevado de p aginas socia- les y el algoritmo propuesto es m as independiente
del nivel de ambig uedad de los nombres de persona que otros propuestos por el estado del arte.
Palabras clave
Búsqueda de personas en la web, redes sociales, clusterin.
Número completo
Sistema de Información Científica
Más información del artículo Red de Revistas Científicas de América Latina, el Caribe, España y Portugal
Página de la revista en redalyc.org Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto