Módulo de Python especializado en la extracción y procesamiento de información desde múltiples formatos de documentos (Excel, PowerPoint, Word y PDF).
Artemisa proporciona una interfaz unificada para extraer y analizar contenido de diversos tipos de documentos, aprovechando diferentes modelos de inteligencia artificial tanto en la nube como localmente.
Artemisa/
├── test/ # Ejemplos y documentación de uso
│ └── ollamatest.py # Guía de implementación con Ollama
└── ...
pip install Artemisa
El módulo integra múltiples proveedores de IA para el procesamiento y consulta de documentos:
- Excelente compatibilidad con modelos no razonadores
- En desarrollo: Soporte expandido para más modelos de OpenAI
- Compatible con el modelo
DeepSeek-R1-Distill-Qwen-32B
- Disponible mientras HuggingFace mantenga su API de inferencia gratuita
- Alta compatibilidad con modelos no razonadores
- Pendiente: Validación con modelos razonadores
- Soporte robusto para modelos de generación de texto
- Nota: Algunos modelos requieren suscripción Pro para acceso API
- Compatibilidad básica
- Estado: Pendiente de pruebas exhaustivas
- Versión estable disponible
- Documentación detallada en
test/ollamatest.py
- Incluye notas de optimización para consultas
- ❌ Transformers: Descartado por ineficiencia para el caso de uso específico
Para comenzar con el procesamiento local usando Ollama, consulte la documentación y ejemplos en test/ollamatest.py
. Los comentarios incluidos proporcionan información crucial para la optimización de consultas.
El proyecto se encuentra en desarrollo activo, con énfasis en:
- Expansión de compatibilidad con modelos OpenAI
- Pruebas exhaustivas con la API de Anthropic
- Optimización de procesamiento local con Ollama
Si deseas apoyar este proyecto, puedes hacer una donación a través de PayPal:
Tu donativo permite mantener y expandir nuestros proyectos de código abierto en beneficio de toda la comunidad.