Instituto Tecnológico de Tlalnepantla (ITTLA)
Carrera: Ingeniería en Tecnologías de la Información y
Comunicación
Especialidad: Ingeniería de Software
Asignatura: Ingeniería del Conocimiento
Docente: Duarte Hernández Ezequiel Alejandro
Grupo: T81
Nombres de los estudiantes:
Romero Flores Smallael Ian N.º 20250084
Cruz Cruz Juan Manuel N.º 20250065
Romero Alvarado Edgar N.º 20250085
Agosto – Diciembre 2023
TLALNEPANTLA DE BAZ, EDO. DE MÉXICO.
Contenido
Introducción: ....................................................................................................................................... 3
Desarrollo: ........................................................................................................................................... 4
Conclusión......................................................................................................................................... 11
Referencias ........................................................................................................................................ 12
Introducción:
Weka es una plataforma de software de código abierto que se utiliza comúnmente en el campo
de la minería de datos y el aprendizaje automático. Weka proporciona una amplia gama de
herramientas y algoritmos para tareas de procesamiento de datos, análisis, visualización y
modelado predictivo.
Algunas de las características y funcionalidades principales de Weka incluyen:
1. Preprocesamiento de datos: Weka ofrece herramientas para limpiar y transformar datos, lo
que incluye la eliminación de valores atípicos, la imputación de valores faltantes y la
selección de características relevantes.
2. Selección de algoritmos: Weka incluye una variedad de algoritmos de aprendizaje
automático para tareas de clasificación, regresión, clustering y más. Esto permite a los
usuarios probar diferentes algoritmos y enfoques para sus problemas específicos.
3. Evaluación de modelos: Weka proporciona herramientas para evaluar y comparar el
rendimiento de los modelos de aprendizaje automático utilizando métricas como precisión,
recall, F1-score, matriz de confusión, entre otras.
4. Visualización de datos y resultados: Weka ofrece capacidades de visualización que pueden
ayudar a los usuarios a comprender mejor sus datos y los resultados de sus modelos.
5. Interfaz gráfica de usuario (GUI): Weka cuenta con una interfaz gráfica de usuario que
facilita su uso para usuarios que no están familiarizados con la programación. También se
puede utilizar a través de líneas de comando para automatizar tareas.
6. Extensibilidad: Weka es extensible y permite a los usuarios agregar sus propios algoritmos
y funciones personalizadas.
Weka es una herramienta muy útil en el campo de la minería de datos y el aprendizaje
automático, especialmente para aquellos que deseen realizar experimentos y análisis de datos
de manera eficiente y exploratoria. Su interfaz fácil de usar y su amplia gama de algoritmos
hacen que sea una elección popular tanto para principiantes como para profesionales en el
campo de la ciencia de datos.
Desarrollo:
El desarrollo que estás describiendo implica la instalación de Weka y la realización de una
práctica guiada a través de un video proporcionado por el docente. Aquí tienes una
descripción paso a paso de cómo llevar a cabo este proceso:
Paso 1: Instalación de Weka
• Lo primero que debes hacer es descargar la última versión de Weka desde el sitio web
oficial de Weka (https://www.cs.waikato.ac.nz/ml/weka/). Asegúrate de seleccionar la
versión adecuada para tu sistema operativo (por ejemplo, Windows, macOS o Linux).
• Una vez que la descarga se haya
completado, sigue las instrucciones de
instalación proporcionadas en la página de
descarga o en la documentación que
acompaña al archivo de instalación.
Generalmente, esto implicará ejecutar un
instalador y seguir los pasos del asistente de
instalación.
• Durante la instalación, es posible que se te
pregunte sobre las configuraciones específicas,
como la ubicación de la instalación y las opciones
de acceso directo. Ajusta estas configuraciones
según tus preferencias.
• Una vez que la instalación se haya completado con éxito, deberías tener Weka instalado
en tu sistema.
Paso 2: Práctica guiada con un video del docente
o Asegúrate de que tienes acceso al video proporcionado por tu docente para la práctica
guiada con Weka. Puedes utilizar un reproductor de video en tu computadora para
reproducir el video.
o Sigue las instrucciones del video de tu docente, que probablemente incluirán tareas
específicas que debes realizar en Weka. Esto podría involucrar cargar un conjunto de
datos, aplicar algoritmos de minería de datos, realizar análisis de resultados y más.
o A medida que avanzas en la práctica guiada, toma notas y presta atención a los detalles
importantes que el docente destaque en el video.
o Si tienes preguntas o encuentras problemas durante la práctica, asegúrate de anotarlos y
considera hacer preguntas al docente al final del video o en el momento designado para
preguntas y respuestas.
o Asegúrate de completar todas las tareas y ejercicios que se presenten en la práctica
guiada. Esto te ayudará a comprender mejor cómo utilizar Weka para realizar análisis de
datos y minería de datos.
Pasos:
1. Abrir el programa weka, y dar click en explorer
2. Después deberás agregar una base de datos, asi que probaremos suerte.
3. Ahora queda empezar a filtrar los datos, vamos a filtros y seleccionamos la carpeta
supervised, ya que weka los tiene establecidos y a los demás no. Y aplicamos
4. Vemos reflejados los cambios del filtro, ahora clasificamos y seleccionamos el
algoritmo árbol J48, usaremos just training set.
5. El objetivo es determinar si la persona juega o no juega tennis de acuerdo a las
condiciones, generando varias probabilidades que vemos en la parte derecha, todo
eso es el análisis del árbol.
6. El video explica lo que significa cada valor.
7. Dice que en la matriz de confusión la diagonal debe ser mayor. Para saber la
confiabilidad.
8. Haz click en tress j48 para ver un menú con la opción d visualizar el árbol.
9. Pasamos a cluster, para seleccionar el algoritmo SimpleKmeans, y seleccionamos el
modo use training set, y comenzamos, veras que nos arroga en el lado derecho formo
varios cluster.
10. En el cluster 0 se analizaron 71% del total de registro, y el cluster 1 el 29%, recuerda
que el 100% lo conforman los 14 registros que se tiene en la base de datos.
11. Realizaremos la Association que es la parte más importante, ya que da a conocer la
información oculta, que es la información que cuesta visualizar a simple vista.
Elegimos el algoritmo A priori, cerramos, comenzar, y nos muestra que encuentra 10
características que a simple vista no podremos notar.
12. Explica la chica que, si tenemos todos los porcentajes de probabilidad, ocurrirán
ciertos escenarios.
13. Pasamos a Select Attributes, y seleccionamos el primer método mostrado y
seleccionamos Use full Training Set, seleccionamos la variable Play e iniciamos.
14. Vemos que las 2 variables que tienen mayor importancia en la minería de datos son,
apariencia del cielo y viento, ya se a que haga o no. Donde la segunda es la que tiene
importancia.
15. Seleccionamos windy en variable y comenzamos, pero antes esperaríamos a que nos
regrese a jugar porque es donde estamos haciendo el estudio. Damos click en Start y
vemos que en efecto nos regresa a jugar.
16. En este ejemplo podemos ver que la variable mas significativa es la de Play.
17. Vamos a visualize para que nos realice la matriz de todos contra todos, en este caso
las variables. Aumentaremos el tamaño de los puntos para poder apreciar mejor los
indicadores de si (azul) y no (no) para ver si hay relación.
18. Aplicaremos un poco de ruido para ver como se encuentra la relación.
Conclusión
La instalación y el uso de Weka en nuestra práctica han demostrado ser una experiencia
valiosa para el aprendizaje y la aplicación de técnicas de minería de datos y análisis de datos.
Weka, como herramienta de software de código abierto, ofrece una plataforma accesible y
poderosa que facilita la exploración y experimentación con datos de manera efectiva.
Algunos aspectos destacados de nuestra experiencia incluyen:
Facilidad de Instalación: La instalación de Weka resultó ser sencilla y sin problemas. La
plataforma proporciona instaladores intuitivos y documentación útil para guiar a los usuarios
a través del proceso.
Interfaz Amigable: Weka ofrece una interfaz gráfica de usuario (GUI) amigable que permite
a los usuarios interactuar con los datos y los algoritmos de manera visual. Esto hace que la
plataforma sea accesible para aquellos que no tienen experiencia en programación.
Amplia Variedad de Algoritmos: Weka ofrece una amplia gama de algoritmos de aprendizaje
automático y técnicas de minería de datos. Esto nos permitió explorar diferentes enfoques y
modelos para abordar problemas específicos.
Práctica Guiada del Docente: La práctica guiada a través del video proporcionado por nuestro
docente fue esencial para comprender los conceptos y procedimientos específicos
relacionados con Weka. Siguiendo las instrucciones del video, pudimos aplicar los
conocimientos de manera práctica.
Exploración de Datos y Modelado Predictivo: Utilizamos Weka para cargar, explorar y
analizar conjuntos de datos, así como para construir y evaluar modelos predictivos. Esto nos
ayudó a comprender cómo utilizar Weka en escenarios del mundo real.
Resolución de Problemas y Preguntas: Durante la práctica, surgieron preguntas y desafíos,
pero gracias a la orientación del docente y a la comunidad en línea de Weka, pudimos
resolverlos de manera efectiva.
En resumen, la instalación y el uso de Weka en nuestra práctica nos proporcionaron una
introducción sólida a las herramientas de minería de datos y aprendizaje automático. Esta
experiencia nos ha equipado con habilidades valiosas para abordar problemas de análisis de
datos y tomar decisiones informadas basadas en evidencia. Continuar explorando y
practicando con Weka será beneficioso para nuestro desarrollo en el campo de la ciencia de
datos y la minería de datos.
Referencias
https://sourceforge.net/projects/weka/
https://www.youtube.com/watch?v=3vebWrQ_BNc