NoticIEEEro

  • Inicio
  • Ediciones anteriores
  • Acerca del NoticIEEEro
  • Directorio
  • Calendar
  • CALL FOR PAPERS
  • Categorías
    • Actividades Estudiantiles
    • Anuncios y Noticias
    • Autores
      • Aarón Benitez
      • Ami Reyes
      • Antonio C. Bastos
      • Antonio Ferreira
      • Augusto José Herrera
      • Camilo A. Londoño
      • Clara Mercedes Arruiz
      • Diana Vera Santana
      • Dr. Ing. Gerardo Acosta
      • DR. JAVIER RUIZ DEL SOLAR
      • Dr. Manuel Rodríguez Perazza (SM)
      • Editor
      • Eduardo Bonzi Correa
      • Enrique Álvarez
      • Guillermo Arias Paez (M)
      • Gustavo Giannattasio
      • Ignacio Castillo
      • Juan Jesús González Ávila
      • Luciano Gallon
      • Luis Alberto Arenas
      • M.C. IGNACIO CASTILLO VELAZQUEZ
      • María Susana Centeno
      • Marcelo Palma
      • MSc. Ing. Norberto Lerendegui
      • Oscar Rabasa
      • Salomón Herrera
      • Tania Quiel
      • Victor E. Pacora Suarez
    • call for papers
    • Comunidades Virtuales
    • Conferencias
    • Director Regional
    • Divulgación
    • Ediciones
      • Edición 55
      • Edición 56
      • Edición 57
      • Edición 58
      • Edición 59
      • Edición 60
      • Edición 61
      • Edición 62
      • Edición 63
      • Edición 64
      • Edición 65
    • Editorial
    • Elecciones 2009
    • Enseñanza Media
    • Entrevista
    • IEEE Comsoc LA
    • IEEE Foundation
    • IEEE R9 NEWS sept-oct
    • JOBS
    • Libros
      • Libros y electrotecnología
    • Life Members
    • Opinión de Lectores
    • Perfiles
    • Practitioners
    • Premios
    • Región 9
      • Consejo México
      • Historia del Consejo Andino
      • Nuestras Secciones
      • Ramas Estudiantiles
      • Students Branches
    • REGION 9 DIRECTOR-ELECT
  • Suscribir via RSS

Tendencias en los buscadores: Web semántica

October 25th, 2009  |  Publicado en Divulgación, Edición 65  |  2 Comentarios

Gerson Villa González, Luis Manuel Hernández Simón
Departamento de Ingeniería de Sistemas, ESIME ZACATENCO-IPN, México D.F.

Resumen –– Este artículo pretende explicar desde un punto de vista práctico las limitaciones de la Web actual (por ejemplo, la baja precisión de los motores de búsqueda basados en palabras clave, como Google y Yahoo) y porque necesitamos la Web semántica (una Web ―Inteligente‖). Además de describir los principales buscadores semánticos en la actualidad.

Introducción

Desde un punto de vista técnico, un buscador semántico es una aplicación que comprende las búsquedas de los usuarios y los textos de los documentos de la web mediante el uso de algoritmos que simulan comprensión o entendimiento y que a partir de éstos proporciona resultados correctos sin que el usuario tenga que abrir el documento e inspeccionarlo por sí mismo. Un buscador de este tipo reconoce el contexto correcto para las palabras o sentencias de búsqueda. Google, Yahoo y Live de Microsoft no son buscadores semánticos, pues se basan fundamentalmente en algoritmos que generan estadísticas a partir de palabras y enlaces y no en algoritmos cognitivos que capturen el conocimiento implícito en las palabras y su contexto. Por ejemplo una búsqueda como “¿Quién fue Urano?” en cualquiera de esos buscadores devolverá resultados afines al séptimo planeta del Sistema Solar cuando realmente se requiere buscar información sobre el dios primordial del cielo en la mitología griega.

Buscadores Web

Muchos de los buscadores actuales se basan en palabras clave es decir, el usuario introduce las palabras relevantes de su búsqueda y la aplicación devuelve todos los documentos que contienen esas palabras. Dos de las desventajas más importantes de los buscadores convencionales son las siguientes:

Escasa precisión o relevancia en los resultados (se devuelven muchos documentos poco relevantes para la búsqueda. La presencia de una palabra clave en un documento no implica necesariamente que éste sea relevante).

Excesiva sensibilidad al vocabulario empleado en las búsquedas (y por tanto, imposibilidad de obtener a la primera todos los resultados relevantes disponibles. Muchos documentos de interés pueden no incluir las palabras clave pero sí sinónimos, hipónimos o hiperónimos de ellas).

Un estudio de David Hawking y de varios investigadores evaluó 20 buscadores convencionales (basados en palabras clave) usando 54 búsquedas. El porcentaje de resultados relevantes después de inspeccionar las 20 primeras páginas web devueltas fue del 0,5% para el mejor buscador (Northern Light) y Google fue el segundo buscador más preciso. Así pues, la popularidad de los buscadores basados en palabras clave no tiene mucho que ver con su precisión, sino con la paciencia de los usuarios. Las búsquedas semánticas serían una vacuna para el contagioso virus de la falta de relevancia en los resultados. Una búsqueda semántica es una consulta en la que se tiene en cuenta el contexto y por tanto el significado de aquello por lo que se pregunta (y no solamente las palabras de la consulta), con el objetivo de evitar la ambigüedades tanto de las consultas como del texto de los documentos donde se busca. Los motores de búsqueda funcionan enviando hordas de arañas robóticas (webspiders) que se desplazan a través de la red e indexan las palabras claves en cada página que encuentran a su paso. Si escribes una simple búsqueda y estos analizaran las palabras para saber si son sustantivos, adjetivo y participios y devuelven una lista de referencias que contengan las palabras claves que las arañitas trajeron de la red. La única diferencia significativa entre Google, Yahoo y Microsoft Live están en los rankings estadísticos que utilizan. El fin último de las búsquedas semánticas, radica en que los usuarios puedan formular búsquedas más precisas y expresivas que originen resultados relevantes con la mínima intervención de éste [1].

Buscadores Semánticos

Los buscadores semánticos no siempre pueden acertar a la primera el significado de una palabra polisémica. Por tanto se deben disponer de medios de desambiguación para conocer el sentido exacto que tiene la palabra en la búsqueda. Por ejemplo un buscador semántico que utilice internamente ontologías con conceptos informáticos y medios de transporte, deberá disponer de herramientas para determinar a qué se refiere el usuario cuando hace una consulta específica de un dominio en particular. Para ello puede escoger el significado más probable, preguntar al usuario para que elija entre varias opciones (como hace el buscador Hakia que presenta las opciones extrayéndolas de su ontología) o usar las demás palabras de la búsqueda para inferir el significado exacto.

Como un buscador semántico se basa en algoritmos que simulan la comprensión de las palabras y por ende, establecen relaciones entre ellas y pueden realizar búsquedas de interés para el usuario aunque en los documentos devueltos no figuren las palabras o expresiones de búsqueda. Por ejemplo un buscador semántico en que se introdujera la palabra “marsupial” mostraría documentos donde aparecerían términos como éstos: canguro, koala, satanelo de Nueva Guinea, monito del monte, rata canguro, zarigüeya, tlacuache, demonio de Tasmania. Como demuestra este ejemplo las búsquedas semánticas son muy superiores a las basadas en palabras clave. Además si uno buscara información sobre distintas especies de marsupiales, no necesitaría formular la consulta de distintas maneras con el nombre de cada especie para obtener la información deseada.

La falta de estructura y de anotaciones semánticas en los recursos de la web (documentos Word, PDF, páginas HTML, etc.) obliga a que los buscadores semánticos analicen mediante algoritmos cognitivos los recursos palabra a palabra y oración a oración para asignar las palabras y oraciones a conceptos ontológicos. Estos algoritmos son lentos y requieren supervisión humana. De ahí que los buscadores semánticos no cubran por ahora tantos recursos de la web como los convencionales que emplean algoritmos estadísticos mucho más rápidos y completamente automatizados. Esta limitación desaparecerá cuando se vayan mejorando los algoritmos cognitivos o en cuanto los “islotes semánticos” se unan para formar la web semántica o al menos “continentes semánticos” [2].

Situación de los Buscadores Semánticos en la actualidad

Casi todos los buscadores que presentan como buscadores semánticos o de tercera generación no son más que buscadores ontológicos, es decir, buscan ficheros en RDF, micro formatos y algunos en OWL pero son herramientas inadecuadas para usuarios finales.

Estos buscadores son útiles para expertos y probablemente para una vez procesada toda la información, poder ofrecer servicios nuevos tal y como argumenta Tim Berners en su web. Hay muy pocos buscadores semánticos de propósito general que ya funcionan, tan pocos que después de analizar varios de ellos que se autodefinen como buscadores semánticos, sólo el caso de Hakia nos convence de que es un auténtico buscador de tercera generación de propósito general. Distinguimos dos categorías de buscadores semánticos: los no orientados a usuarios y los que si están orientados a usuarios.

Buscadores semánticos no orientados a usuarios

Como hemos dicho son realmente escasos los buscadores semánticos, entendiendo por buscador semántico aquellos que utilizan técnicas de Web Semántica y lenguaje natural en sus motores internos para ofrecer al usuario los enlaces que desea. Lo que si se encuentra en gran número son buscadores de información ontológica no orientados a usuarios, estos buscadores son interesantes para expertos pero no son útiles para usuarios finales. En esta sección incluimos a la mayoría como son:

NaturalFinder es el complemento esencial de cualquier buscador para Internet e intranets le permite realizar consultas en lenguaje natural (español o inglés) sin necesidad de usar operadores sólo aptos para usuarios avanzados (booleanos, comodines…). Gracias a la tecnología lingüística, el usuario se concentra en redactar la consulta en su propio idioma como si preguntara a otra persona. NaturalFinder devolverá todos los documentos que sean relevantes con la consulta y devolverá más documentos que los buscadores tradicionales basados en palabras claves.

Buscador Experimental del BOPA proyecto en el que trabaja la fundación CTIC con el objetivo de que las personas que no están familiarizados con el lenguaje administrativo puedan buscar y encontrar información en el Boletín Oficial del Principado de Asturias (BOPA).

Lexxe promete dar respuesta con un 50% más de relevancia que cualquier buscador (En inglés).

WebBrain también muestra un mapa de grupos bien relacionados con las palabras que buscas y bastante útiles.

Blinkx es otro de los buscadores más futuristas y con más proyección. Su función es buscar vídeos mediante un proceso de reconocimiento de imagen y voz de los que se encuentran en su base de datos, así como información oculta y escrita de los mismos.

Semanticweb Search desarrollado por Intellidimension Inc. Desde luego los resultados que ofrece son bastante más concretos que los que vemos habitualmente en los buscadores que todos conocemos, aunque por supuesto los criterios de búsqueda son más específicos por lo que se consigue un resultado de mayor calidad. Todavía estamos lejos del buscador semántico ideal, aquel que es capaz de responder a nuestras preguntas cuando son redactadas por el lenguaje natural de los humanos. Pero es uno de los muchos avances que se van produciendo en el campo de la web semántica. Aunque todavía queda camino por recorrer.

El buscador semántico ―Watson‖ implementado por Knowledge Media Institute (KMi) de la Open University (UK) o Falcons del Institute of Web Science Southeast University P.R. China son más ejemplos de buscadores semánticos no orientados a usuarios aunque Falcons dispone de una de las visualizaciones más comodas.

Buscadores Semánticos orientados a usuarios

Buscadores semánticos orientados a usuarios más importantes que están en funcionamiento en la actualidad:
Naveganza es un buscador español de tercera generación desarrollado por iSOCCO se basa en la comprensión de las preguntas tecleadas por los usuarios y en los documentos indexados. Se trata de una línea de productos que facilitan la interacción de las personas con la inmensa cantidad de información no estructurada que se da en un entorno profesional. La arquitectura del sistema distingue componentes que son independientes e interoperables, permitiendo una fácil integración con otras soluciones. Knowledge índex es el componente central de Naveganza, encargado de indexar recuperar los contenidos en diferentes formatos para su posterior recuperación y presentación. La herramienta para la captación de información proveniente de páginas web, Excel u otros formatos es el Knowledge Parser. El componente NL Search se encarga del análisis y procesamiento del lenguaje natural unido al resto de los componentes y permite realizar búsquedas en lenguaje natural aunque también funciona con palabras claves. Finalmente el Knowledge Tagger es el módulo encargado de anotar el contenido indexado y relacionarlo con una ontología de conocimientos específico. Esta anotación y posterior procesado permite realizar una búsqueda o comparación conceptual al establecer un modelo de objetos relacionados. Actualmente este producto se ha implementado como una solución de buscador semántico vertical [3].

Hakia, que comenzó desarrollando varios buscadores semánticos verticales tiene ahora un buscador semántico de propósito general. La calidad de los resultados cumple simultáneamente con tres criterios: fuentes dignas de confianza (verticales), información reciente y relevante para consulta. El motor de búsqueda funciona en modo beta pero el análisis y desarrollo continúa avanzando. Aunque Hakia de momento sólo soporta inglés, está trabajando para dar cobertura al portugués, español, italiano y turco. Hakia es claramente un Buscador Semántico de propósito general. Dirigido por Riza Berkan experto en Inteligencia Artificial y Procesamiento del Lenguaje Natural.

Swootti es un buscador que utiliza tecnologías de la web semántica para extraer las opiniones que realizan los usuarios en blogs y foros sobre empresas o productos.

Ideas Afines buscador de palabras y conceptos relacionados. Muy útil e innovador para realizar escritos. La lista de palabras que proporciona es extensa.

AskWiki y Powerset SW buscadores para la Wikipedia (En inglés).

Kartoo encuentra las páginas donde aparece el contenido de búsqueda y la sitúa de forma gráfica, esparcidas y en tamaño según su importancia.

KoolTorch es uno de los nuevos buscadores más laureados y prometedores. Ofrece 100 resultados por página de una forma visual y ordenada.

Mnemomap además de la web recibe información de diferentes fuentes como Digg, youtube, del.icio.us y de imágenes. También ayuda con otras opciones de búsqueda.

Ujiko un buscador muy cómodo no sólo por su apariencia sino por su modo de búsqueda, ofrece diferentes opciones para encaminar la búsqueda hacia un tema u otro.

Quintura uno de los más perfeccionados y que goza de buenas opiniones. La búsqueda ofrece muy buenos resultados pero además de mostrar palabras relacionadas que con sólo pasar el ratón sobre ellas pueden ayudar a afinar los resultados.

Retrievr un original buscador de imágenes en Flickr. La búsqueda se puede hacer de dos formas: dibujando en una pantallita la forma y colores que se desea o subiendo una fotografía que sirva de modelo.

El buscador Wolfram Alpha el cual utilizará inteligencia artificial para poder identificar la situación en la cual se formulo dicha pregunta y por ende brindar una respuesta especifica a lo que el usuario desea encontrar, el creador de este buscador es el prestigioso científico británico Stephen Wolfram autor del programa de cálculo ‗Mathematica‘. Una herramienta de referencia en el campo de la programación.

El caso de True Knowledge parece muy prometedor pero hoy por hoy es publicidad de lo que hará este buscador utiliza un video que muestra cómo funcionará y desde luego es espectacular. Lo interesante es que no solo proporciona respuestas a una pregunta concreta. El ejemplo del video que muestran es muy clarificador ante la pregunta ―¿esta Jennifer López Soltera‖? el buscador responde que ―no‖ y además nos ofrece un enlace con información relacionada con su matrimonio.

Bing. El nuevo buscador usa ontologías para identificar conceptos y asociaciones entre ellos relacionados con una consulta del usuario. Bing puede entender que “memoria USB”, “pen drive”, “memoria flash USB” y “lápiz USB” son términos relacionados y que designan un mismo dispositivo. Según Microsoft, Bing combina tecnología de búsqueda semántica y minería de datos. Por necesidad esta minería de datos es muy rápida, cuando se realiza una búsqueda por palabras clave hay que determinar los conceptos relacionados con estas palabras (por ejemplo sinónimos), buscar también recursos de la web con esos conceptos y determinar su pertinencia para los resultados de la búsqueda. Según declara Microsoft, Bing no es un sistema completo de búsqueda semántica por cuestiones de velocidad, analizar el contenido completo de todos los recursos de la web haría que la obtención de resultados fuera muy lenta. Con todo, es probable que el desarrollo de nuevos algoritmos o el perfeccionamiento de los actuales hagan posible búsquedas semánticas completas en tiempos muy reducidos. La aparición de este buscador es una buena noticia porque es un paso más hacia la Web semántica (por el momento sólo existen “islotes semánticos”). Cada vez hay más grandes empresas que utilizan ontologías y lenguajes formales para manejar los datos que almacenan en sus servidores y centros de datos y para navegar por ellos. Bing también obligará a la empresa Google a que utilice más y mejores tecnologías semánticas en su buscador. La efectividad de la publicidad así como los ingresos derivados de ésta, será mucho mayor con el uso de tecnologías semánticas que entiendan el significado de las búsquedas y que por ende, permitan encontrar exacta y rápidamente lo que el usuario busca. Lo importante de todos estos buscadores es que proporcionan al usuario enlaces a páginas web que son buscadores orientados a usuarios finales que utilizan técnicas de Web Semántica y procesado del lenguaje natural (PLN).

Transición de la Web

En la Web actual puede localizarse información de cualquier tipo a través de un buscador de una manera cómoda, eficiente y económica sin acudir a un sitio específico. Sin embargo, debido al gran crecimiento a que ha llegado la Web, en ocasiones una persona emplea demasiado tiempo o no obtiene algún resultado al realizar una búsqueda. Es muy complejo por medio de programas sustituir a los usuarios de la Web al efectuar búsquedas porque así de complejo es reproducir ―en una máquina la capacidad de una persona para comprender los contenidos de la Web tal y como están codificados actualmente‖.

El objetivo de utilizar buscadores semánticos es crear una Web más rica denominada por muchos expertos Web 3.0 o Web Semántica. De la Web semántica se pretende clasificar, dar estructura y registrar los recursos, cuya semántica expresa puede ser procesada por las máquinas, manteniendo los principios de la Web actual para descentralizar, compartir y facilitar al máximo el acceso. Así el reto principal de la Web semántica es propiciar un entendimiento entre las partes que lo construyen y utilizan usuarios, desarrolladores, software y una de las ramas de la inteligencia artificial; la ontología [6].

El propósito de las ontologías que provienen del campo de la inteligencia artificial, estriba en proporcionar modelos conceptuales es decir una ontología designa la descripción de un dominio mediante un vocabulario común de representación. Toda ontología modela mediante conceptos y relaciones lo que conocemos sobre un dominio o un área de conocimiento. A menudo las ontologías se representan mediante clases, propiedades, atributos de las clases, relaciones entre clases, restricciones sobre los atributos y propiedades de las clases [8].
Aunque la definición anterior es la más común, debo señalar que se refiere a ontologías formales (aquellas que pueden ser usadas por las máquinas). No todas las ontologías deben ser formales; hay ontologías que se expresan con una forma restringida y estructurada del lenguaje natural e incluso mediante el lenguaje natural (inglés, español, francés, etc.)

En definitiva, una semántica formal usa la lógica de primer orden o un subconjunto de ella (como las lógicas descriptivas). Disponer de una semántica formal resulta indispensable para implementar sistemas de inferencia o de razonamiento automático (esto es sin intervención humana). Las utilidades del razonamiento automático son varias:

  • Se puede comprobar automáticamente si una ontología es consistente con el conocimiento del dominio de interés al cual está asociada.
  • Se puede comprobar automáticamente si las relaciones entre las clases corresponden a los propósitos de la ontología y se pueden detectar relaciones ilegítimas.
  • Permite clasificar automáticamente las instancias en clases.
  • Las ontologías son herramientas para compartir información y conocimiento, es decir, para conseguir la interoperabilidad.

¿Qué aspecto tienen las ontologías? Por lo general, toman la forma de una jerarquía de términos que representan los conceptos básicos de un determinado dominio.

En el entorno de la Web, lo usual es que las ontologías se representan en formato XML. Este hecho no debe de vincularlas indisolublemente con XML pues una ontología representa conocimiento; no es un formato de mensajes. A diferencia de las ontologías, XML carece de una semántica que permite el razonamiento automático. El propósito de la iniciativa de la Web semántica es tan amplio como el de la Web: ―crear un medio universal para el intercambio de datos‖ y así interconectar eficazmente la gestión de la información personal, la integración de las aplicaciones empresariales y compartir globalmente datos comerciales, científicos y culturales. Los servicios para poner datos comprensibles por las máquinas se están convirtiendo rápidamente en una prioridad para muchas organizaciones, individuos y comunidades. La Web sólo puede alcanzar todo su potencial si llega a ser un sitio donde se puedan compartir datos y sean procesados por herramientas automáticas y por personas. Para adaptar la Web los programas del mañana deben ser capaces de compartir y procesar datos incluso cuando estos programas se hayan diseñado de forma completamente independiente. La Web semántica es una iniciativa del consorcio World Wide Web (W3C), diseñada para desempeñar un papel de liderazgo en la definición de la Web.

La transición de la web actual a la web semántica puede implicar un costo altísimo si tenemos en cuenta el volumen de contenidos que ya forman parte de la web. Crear y poblar ontologías supone un esfuerzo extra que puede resultar tedioso cuando se agregan nuevos contenidos pero directamente prohibitivo por lo que respecta a integrar los miles de gigabytes de contenidos antiguos. Las estrategias más viables combinan una pequeña parte del trabajo manual con la automatización del resto del proceso. Las técnicas para la automatización incluyen entre otras, el mapeo de la estructura de bases de datos a ontologías, el aprovechamiento previa conversión de los metadatos y estándares de clasificación presentes en la web (y fuera de ella) y la extracción automática de metadatos a partir de texto y recursos multimedia. Otra dificultad importante a la hora de realizar la web semántica en la práctica es la de consensuar ontologías en una comunidad por poco amplia que sea. Converger a una representación común es una labor más compleja de lo que se puede parecer, ya que típicamente cada parte del sistema conlleva peculiaridades necesarias y un punto de vista propio que a menudo necesitan incidir en la propia ontología. La representación del mundo no es neutra respecto al uso que se le debe dar; tanto a un geólogo como un geofísico tienen conocimiento sobre terremotos pero su representación de esa materia muy distinta y probablemente no sería adecuado imponer la misma representación para ambas perspectivas. Las vías para salvar esta dificultad, consisten en compartir ontologías para las áreas comunes en que pueden tener lugar una interacción o intercambio de información entre las partes y establecer formas de compatibilidad con las ontologías locales mediante extensión y especialización de las ontologías genéricas, o por mapeo y exportación entre ontologías [4].

Aplicaciones de la web semántica

Existen multitud de campos donde son aplicables las tecnologías de web semántica. Muchos de ellos están aún por explorar y descubrir y sin ánimo de ser exhaustivos se puede realizar una clasificación de las aplicaciones de la web semántica que incluirá:
Aplicaciones de búsqueda. Las tecnologías de web semántica permiten desarrollar buscadores avanzados aplicados a distintos dominios. Los dominios con mayor potencial son la administración pública , la medicina, las búsquedas sociales, el empleo, las artes, la ciencia, la política, la economía, la gestión del conocimiento y otros. Los buscadores disponibles en la actualidad (de segunda generación) llevan a cabo el proceso de búsqueda utilizando técnicas clásicas de recuperación de información (IR Information retrival) basadas en ocurrencia de determinadas palabras clave en las páginas (búsqueda sintáctica), combinando con mecanismos de sinonimia denominados genéricamente tesauros. En el caso de los buscadores web estas técnicas se complementan con algoritmos de relevancia basados en el número de enlaces entre páginas (pagerank) [7].

Las tecnologías de la web semántica van a permitir construir buscadores de tercera generación (buscadores semánticos). Estos buscadores van a complementar las soluciones de búsqueda tradicionales, haciéndolas mucho más ricas ya que no sólo se buscarán en el universo web la ocurrencia de ciertas palabras clave, sino también se buscará atendiendo al significado (semántica) de dichas palabras clave en un contexto. Aplicaciones de asistencia al usuario. Estas aplicaciones están relacionadas con los agentes personales de usuario que permiten realizar búsquedas avanzadas en Internet, descubrimiento de servicios, composición de servicios, etc.

Aplicaciones de integración de fuentes de datos heterogéneas. Estas aplicaciones permiten obtener, agrupar y correlacionar información dispersa en Internet sobre un dominio como por ejemplo deportes o noticias.

Aplicaciones de anotación semántica de contenidos multimedia. Estas aplicaciones permiten catalogar los contenidos multimedia de forma semántica, pudiéndose realizar catálogos de contenidos personalizados para los usuarios, descubrimiento de nuevos recursos multimedia de interés para el usuario, etc.

Aplicaciones de adaptación automática de contenidos en base a la anotación semántica de los mismos. La idea que subyace en estas aplicaciones es que los contenidos web son adaptados dinámicamente teniendo en cuenta su semántica y la personalización asociada al usuario. Actualmente existen mecanismos automáticos de adaptación de contenidos pero basados únicamente en aspectos sintácticos de las páginas.

Aplicaciones para las empresas. Bajo este punto aparecen todas aquellas aplicaciones de la web semántica encaminada a mejorar los mecanismos actuales de gestión de las empresas, explotando al máximo el nuevo abanico de posibilidades que ofrecen las tecnologías y plataformas de web semántica [5].

Conclusiones

En principio, los buscadores semánticos podrían evitar las páginas basura que proliferan en la web como malas hierbas en un campo abandonado. Como tienen en cuenta el contexto de las palabras o frases de los documentos podrían descartar esas páginas enseguida. Por ejemplo, una página web que incluya la frase “web semántica” rodeada de frases sobre cómo aumentar la potencia sexual, juguetes eróticos y sexo fácil en algún país lejano de costumbres relajadas sería eliminada de cualquier búsqueda sobre la web semántica o tendría una relevancia muy baja, pues el contexto de estas últimas frases (sexo) no tiene ninguna relación con la web semántica. Por el momento, casi todos los buscadores semánticos permiten solamente búsquedas en inglés, aunque se están ampliando para que admitan otros lenguajes. Aparte del predominio del inglés, la causa de eso se debe también a las dificultades inherentes a reflejar el conocimiento de los lenguajes naturales en estructuras de datos que permitan búsquedas rápidas y escalables (matrices, listas, pilas, colas, árboles, grafos, etc.). Por ejemplo el buscador Hakia utiliza un vocabulario en forma de ontología que incluye unos 100,000 sentidos de palabras inglesas y ese número continuará aumentando según se perfeccione la aplicación. Confeccionar cualquier vocabulario de ese tamaño es una empresa lenta, tediosa y muy cara y que debe ser realizada por un equipo bien coordinado de especialistas en lingüística [8].

Es probable que los buscadores semánticos cambien la manera en que se busca y se muestra la información y que supongan un gran cambio para los usuarios ocasionales. El problema a resolver es como realizar la anotación semántica, lo que permite que el buscador semántico de propósito general o cualquier otra aplicación semántica se encargue de indexar información semántica adecuadamente anotada en OWL. Liberando así a este de una extraordinaria carga de trabajo. Es muy difícil que funcione la web semántica si no se cuida la coherencia de la anotación respecto al contenido.

De nada sirve definir ontologías si no las usa un número significativo de la comunidad de internet. Es por esto, que hay que proporcionar herramientas para que los actores activos de Internet (webmasters, usuarios de blogs, wikis, etc.) puedan ―usar ontologías‖ y en consecuencia ―puedan generar páginas web con semántica‖.

Referencias
[1] Bin Xiu, Po Zhang, Juan-Zi Li and Wen-Jun Yang ―A Semantic Matchmaker for Ranking Web Services,‖ Journal of Computer Science and Technology, vol. 21, pp. 574-581, July 2006.
[2] Brahim Medjahed, Athman Bouguettaya, Ahmed K. Elmagarmid, ―Composing Web services on the Semantic Web,‖ The VLDB Journal, vol. 12, pp. 333-351, November 2003.
[3] Frank van Harmelen, Michael Uschold, ―Where is the Web in the Semantic Web?‖ Web Semantics: Science, Services and Agents on the World Wide Web, vol. 5, pp. 223, December 2007.
[4] Henry M. Kim and Arijit Sengupta ―Estracting Knowledge from XML document repository: a semantic Web-based approach,‖ Information Technology and Management, vol. 8, pp. 205-221, September 2007.
[5] Luis Bermudez and Michael Piasecki ―Metadata Community Profiles for the Semantic Web,‖ Geoinformatica, vol. 10, pp. 159-176, May 2006.
[6] Makoto Nakatsuki, Makoto Yoshida, Toru Ishida, ―Detecting innovate topics based on user-interest ontology,‖ Web Semantics: Science, Services and Agents on the World Wide Web, vol. 7, pp. 107-120, April 2009.
[7] Matthias Klusch, Benedikt Fries, Katia Sycara, ―OWLS-MX: A hybrid Semantic Web service matchmaker for OWL-S services,‖ Web Semantics: Science, Services and Agents on the World Wide Web, vol. 7, pp. 121-133, April 2009.
[8] Saikat Mukherjee and I.V. Ramakrishnan, ―Automated Semantic Analysis of Schematic Data,‖ World Wide Web, vol. 11, pp. 427-464, December 2008.

gerson_gonzalezGerson Villa González recibió una licenciatura en comunicaciones y electrónica, y una Maestría en Sistemas de Información del Instituto Politecnico Nacional. Ha trabajado en diseño editorial de textos a nivel medio superior y superior, en el periodo 2005 – 2006, en el grupo editorial Éxodo, como profesor titular de la Esia Ticomán del Instituto Politécnico Nacional, en el periodo 2005-2009, profesor en la Universidad Tec Milenio, en el periodo 2005 – 2007. Estudia Doctorado en Sistemas de Información en Esime Zacatenco del Instituto Politécnico Nacional. Contacto: gogoyubarismooth@gmail.com


luis_simon
Luis Manuel Hernández Simón recibió una licenciatura en matemáticas, y una Maestría en Ciencias en Sistemas en la Universidad de la Habana Cuba, así como un Doctorado en Ciencias Técnicas en Moscú Rusia. Él ha trabajado como profesor en el departamento de Matemáticas en la Universidad de la Habana, la Facultad de Ingeniería y Arquitectura de la Universidad de Luanda en Angola, la Universidad Panamericana, elaboración de planes y programas de estudio a nivel Licenciatura en Cuba, elaboración de libros de texto a nivel licenciatura en las aéreas de matemáticas en Cuba, asesoría en proyectos en investigación en materia de modelación matemática en el Instituto Politécnico Nacional, fungió como coordinador del postgrado de sistemas de maestría y doctorado en el periodo 2003-2009 en Esime Zacatenco en el Instituto Politécnico Nacional.

Comentarios

Feed Trackback Address
  1. ENRIQUE OSORIO LARA dice:

    November 3rd, 2009 at 2:27 pm (#)

    Estoy empezando a conocer y trabajar en la internet. Entonces los buscadores semanticos o inteleigentes se conocen tambien como ¿de tercera generación? , ¿como los identifico?. Gracias por su valiosa aportación.

    Saludos cordiales

  2. Silvina dice:

    November 9th, 2009 at 3:04 pm (#)

    Enrique

    Son pocos los buscadores, hoy estuve en un evento en Bs As Virtual Educa 2009 donde justamente hice un tutorial sobre Web Semantica, la docente tiene su blog

    Dolors Reig
    elcaparazon.net

    Espero te sea útil

    Li. Silvina Sala
    Bibliotecaria
    Que llegue al este sitio porque si

Dejar un cometario

Links

  • find us in facebook
  • IEEE
  • IEEE Región 9

Archivos

Categorías



webmaster@noticieeero.org

©2010 NoticIEEEro
Powered by WordPress using the Gridline Lite theme by Graph Paper Press.