🐾 Jagua 0.0.6.0

Est. 2025 — Proyecto TFG para IES Aljada

Buscador web con capacidad de indexar y hacer crawling de páginas. Si no encuentra lo que buscas, recurre a la API de DuckDuckGo.

✨ Características

Indexado directo e inverso en base de datos
Crawling automático desde 100 enlaces predeterminados (temas variados)
Si no hay resultados en la base, usa la API de DuckDuckGo y guarda los nuevos enlaces
Templates básicos para mostrar resultados en navegador

🚧 Cosas pendientes

Poder usar el navegador mientras trabaja la carga dinámica
Refactorización general del código
Terminar el "tutorial" de uso
Crear la base funcional del proyecto
Mostrar resultados correctamente
Mejorar los templates
No sé xd

🛠️ Cómo usarlo

Instalar dependencias con pip install -r requisitos.txt
Ejecutar el proyecto con python main.py

🎯 Objetivo

Crear un buscador web que sea capaz de dar resultados lo más cercanos posible a la búsqueda del usuario.
Queremos desarrollar todo lo que podamos por nuestra cuenta y llegar a tantas páginas como podamos con nuestros propios recursos.

🙌 Créditos

Desarrollado por: Javier Jesús y Fernando Medina

🔧 Herramientas y librerías utilizadas

Librería / Herramienta	Versión	Descripción breve
Scrapy	2.13.0	Framework para crawling rápido y escalable de sitios web
BeautifulSoup4	4.13.4	Librería para parsear y navegar documentos HTML de forma sencilla
DuckDuckGo API	-	API que permite realizar búsquedas web sin rastreo
Flask	3.1.1	Micro-framework web para mostrar los resultados en navegador
lxml	5.4.0	Analizador XML/HTML muy rápido y eficiente (usado por BeautifulSoup y Scrapy)
Parsel	1.10.0	Utilidad para extraer datos de HTML/XML (parte de Scrapy)
cssselect	1.3.0	Permite usar selectores CSS en documentos XML/HTML
requests	2.32.3	Librería para hacer peticiones HTTP de forma simple
Jinja2	3.1.6	Motor de plantillas usado en Flask para generar HTML dinámico
Werkzeug	3.1.3	Librería WSGI para aplicaciones web en Flask
Twisted	24.11.0	Librería de red usada por Scrapy para manejo de peticiones asíncronas
w3lib	2.3.1	Utilidades comunes para el scraping web
queuelib	1.8.0	Soporte de colas para Scrapy
service-identity	24.2.0	Verificación de identidad en conexiones seguras

💬 Contacto

Ninguno ✅

📄 Licencia

Este proyecto está licenciado bajo la Licencia DO WHAT THE FUCK YOU WANT TO PUBLIC LICENSE.

Name		Name	Last commit message	Last commit date
Latest commit History 59 Commits
.vscode		.vscode
crawler		crawler
database		database
search		search
security		security
web		web
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
main.py		main.py
requisitos.txt		requisitos.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🐾 Jagua 0.0.6.0

✨ Características

🚧 Cosas pendientes

🛠️ Cómo usarlo

🎯 Objetivo

🙌 Créditos

🔧 Herramientas y librerías utilizadas

💬 Contacto

📄 Licencia

About

Uh oh!

Releases

Uh oh!

Contributors 2

Uh oh!

Languages

License

JaviJGA/Jagua

Folders and files

Latest commit

History

Repository files navigation

🐾 Jagua 0.0.6.0

✨ Características

🚧 Cosas pendientes

🛠️ Cómo usarlo

🎯 Objetivo

🙌 Créditos

🔧 Herramientas y librerías utilizadas

💬 Contacto

📄 Licencia

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Uh oh!

Contributors 2

Uh oh!

Languages