jueves, 8 de enero de 2009

TFM sobre web semántica


Pues iba a ponerme a investigar un poco para el Trabajo Fin de Máster (TFM) y he pensado: "Qué mejor que contar en el blog los posibles trabajos que puedo hacer y que la gente me aconseje"; y a eso me dispongo :)

Me propusieron cuatro posibles trabajos sobre web semántica de los cuales rechacé uno porque me parecía un infierno y ahora tengo que investigar sobre los otros tres para decidir cuál haré finalmente. Los trabajos son:

1. Buscador de contexto en resultados de búsqueda. En los resultados de búsqueda de un buscador (i.e. Google) localizar la parte del documento que más tiene que ver con los criterios de búsqueda para acceder a ella directamente. Se aconseja usar un diccionario de sinónimos en inglés como WordNet.

2. Filtro de correo. Filtrar los mensajes de correo según distintos criterios (i.e. tema) sin necesidad de crear filtros por parte del usuario. Por ejemplo, pueden utilizarse criterios como el asunto, contexto del cuerpo del mensaje, destinatarios, etc... Se utilizarán herramientas como GATE y el resultado podría ser una extensión de un cliente de correo (i.e. Thunderbird).

3. Optimización del ranking en búsquedas por palabra clave. Apache Lucene utiliza el criterio TFxIDF para "rankear" los resultados de una búsqueda por palabra clave (keyword). Se propone descargar una copia de la Wikipedia a local y añadir anotaciones que nos permitan mejorar el ranking de los resultados respecto al rankeo de Lucene. Por ejemplo, hay que testear si es mejor tener en cuanta los enlaces del artículo de la Wikipedia o el tema, etc...

Bueno mientras investigo qué puede ser factible hacer para septiembre'09, ¿qué os parece a vosotros?

2 comentarios:

  1. La opción 1 parece un buscador que encuentre realmente lo que buscas que google para contextos....... es bastante malo.

    salu2.

    ResponderEliminar
  2. Pfff... Tras la experiencia de intentar vencer a Google con el contexto me da que todas las opciones que pones son infernales, pero sé que que tú eres uno de esos "raritos" a los que les van estas cosas turbosemanticas :P

    De todos modos el que menos que gusta es el primero, los otros dos parecen más... divertidos?

    En fin, que ya nos iras contando que vas decidiendo, mucho animo!

    ResponderEliminar