AGENTES

Hoy en día el paradigma agente constituye uno de los campos de mayor progreso, esto se debe a que permite el desarrollo de aplicaciones complejas. De acuerdo a las aportaciones de múltiples disciplinas, el término agente no mantiene el mismo significado para todos los investigadores del campo.

CONCEPTOS EXISTENTES
A continuación se mencionan tres diferentes enfoques de los agentes propuestos por Bradshaw, Jennings/Wooldridge y Nwana.

  • Bradshaw

Define el término agente en base a la combinación de dos enfoques diferentes: por un lado una visión de los agentes basada en sus atribuciones, mediante el cual un agente software es aquel elemento del que se espera que actúe en representación de otro elemento/persona con el objetivo de cumplir con las responsabilidades que en él se han delegado. Por otro lado un agente puede ser definido de forma descriptiva, indicando que es una entidad software que opera, de forma continua y autónoma en un entorno particular, generalmente habitado por otros agentes (concepto de cooperación).

  • Jennings y Wooldridge

Describen el agente como el sistema que situado dentro de un entorno es capaz de actuar de forma autónoma para alcanzar los objetivos para los que se ha diseñado. Lee el resto de esta entrada »

Anuncios

TÉCNICAS MÁS USADAS EN LA MINERIA DE DATOS

REDES NEURONALES
Esta técnica de inteligencia artificial, en los últimos años se ha convertido en uno de los instrumentos de uso frecuente para detectar categorías comunes en los datos, debido a que son capaces de detectar y aprender complejos patrones, y características de los datos.

Una de las principales características de las redes neuronales, es que son capaces de trabajar con datos incompletos e incluso paradójicos, que dependiendo del problema puede resultar una ventaja o un inconveniente. Además esta técnica posee dos formas de aprendizaje: supervisado y no supervisado.

ÁRBOLES DE DECISIÓN
Está técnica se encuentra dentro de una metodología de aprendizaje supervisado. Su representación es en forma de árbol en donde cada nodo es una decisión, los cuales a su vez generan reglas para la clasificación de un conjunto de datos.

Los árboles de decisión son fáciles de usar, admiten atributos discretos y continuos, tratan bien los atributos no significativos y los valores faltantes. Su principal ventaja es la facilidad de interpretación.

ALGORITMOS GÉNETICOS
Los algoritmos genéticos imitan la evolución de las especies mediante la mutación, reproducción y selección, como también proporcionan programas y optimizaciones que pueden ser usadas en la construcción y entrenamiento de otras estructuras como es el caso de las redes neuronales. Además los algoritmos genéticos son inspirados en el principio de la supervivencia de los más aptos.

CLUSTERING (Agrupamiento)
Agrupan datos dentro de un número de clases preestablecidas o no, partiendo de criterios de distancia o similitud, de manera que las clases sean similares entre sí y distintas con las otras clases. Su utilización ha proporcionado significativos resultados en lo que respecta a los clasificadores o reconocedores de patrones, como en el modelado de sistemas. Este método debido a su naturaleza flexible se puede combinar fácilmente con otro tipo de técnica de minería de datos, dando como resultado un sistema híbrido.

Un problema relacionado con el análisis de cluster es la selección de factores en tareas de clasificación, debido a que no todas las variables tienen la misma importancia a la hora de agrupar los objetos. Otro problema de gran importancia y que actualmente despierta un gran interés es la fusión de conocimiento, ya que existen múltiples fuentes de información sobre un mismo tema, los cuales no utilizan una categorización homogénea de los objetos. Para poder solucionar estos inconvenientes es necesario fusionar la información a la hora de recopilar, comparar o resumir los datos.

APRENDIZAJE AUTOMÁTICO
Esta técnica de inteligencia artificial es utilizada para inferir conocimiento del resultado de la aplicación de alguna de las otras técnicas antes mencionadas.

EXPLOTACIÓN DE DATOS DEL WEB MINING


INTRODUCCIÓN


Hoy en día, la abundancia de datos en Internet y la necesidad de información que tienen las empresas, instituciones y especialmente la UTPL se enfrentan a un entorno caracterizado por niveles crecientes de complejidad, globalidad, y cambios rápidos y profundos como resultado del acelerado avance tecnológico. Para contrarrestar y adaptarse a estos cambios las organizaciones deben prestar atención al término Web Mining, que es una de las extensiones del data mining, consiste en aplicar las técnicas de minería de datos a documentos y servicios para extraer información de la Web.


La mayor ventaja de esta herramienta es que utiliza diversas técnicas avanzadas de exploración de datos, además de permitir la reutilización de procesos ya ejecutados con anterioridad y la combinación de los mismos para su posterior comparación; todo esto llevado a cabo sin un alto grado de complejidad.[1]


Estas técnicas se basan en sistemas independientes de búsqueda que utilizan a la red de redes como medio de recolección de datos, para luego poder analizar y procesar éstos, con el único propósito de producir información significativa y por ende generar estrategias competitivas, para de este modo mantener el estado del arte de la información.


EXPLOTACIÓN DE DATOS DEL WEB MINING: CONTENIDO, ESTRUCTURA Y USO.
El web mining se divide en tres dominios que comprenden el contenido del sitio, la estructura de navegación y el comportamiento de los usuarios:

Categorias_WM

Fig. 1: Categorías de la Minería Web.
Fuente: Román Ulises, Alarcón Luis, 2005

Lee el resto de esta entrada »