AI Task Processor

A service that polls NestJS APIs for AI tasks and processes them using OpenAI, local Ollama models. Features OAuth2 authentication, multi-tier rate limiting.

Features

Text embeddings generation using OpenAI API, Ollama (local)
Processing modes: openai, ollama, or hybrid (Ollama first, OpenAI fallback)
OAuth2 authentication via Ory Cloud with automatic token refresh
Multi-tier rate limiting with persistent storage (minute/hour/day/week/month)
Resilience: Circuit breakers, retry logic, graceful shutdown

Processing Modes

openai: Uses OpenAI API for all embeddings. Requires OPENAI_API_KEY. Supports any OpenAI model.
ollama: Uses local Ollama models exclusively. OPENAI_API_KEY not required. Only processes models in SUPPORTED_MODELS. Downloads models on startup.
hybrid: Tries Ollama first, falls back to OpenAI. Requires both Ollama and OPENAI_API_KEY.

Quick Start

1. Configure Environment

cp .env.example .env

Edit .env with required settings:

# API Integration (required)
API_BASE_URL=http://localhost:3000

# OAuth2 Authentication (required)
ORY_PROJECT_SLUG=your-project-slug
OAUTH2_CLIENT_ID=your-client-id
OAUTH2_CLIENT_SECRET=your-client-secret

# Processing Mode
PROCESSING_MODE=openai  # or ollama, hybrid

# OpenAI API Key (required for openai/hybrid, optional for ollama)
OPENAI_API_KEY=sk-your-key

# Ollama Models (for ollama/hybrid modes)
SUPPORTED_MODELS=["nomic-embed-text","dengcao/Qwen3-Embedding-0.6B:Q8_0"]

2. Start Services

docker-compose up -d
docker-compose logs -f ai-task-processor

Ollama models download automatically on first startup when using ollama or hybrid mode.

Configuration

All configuration via environment variables (see .env.example for complete list).

Key Settings

Processing:

PROCESSING_MODE: openai, ollama, or hybrid (default: openai)
OPENAI_API_KEY: OpenAI API key (required for openai/hybrid, optional for ollama)
SUPPORTED_MODELS: JSON array of Ollama models for ollama/hybrid modes (default: ["nomic-embed-text","dengcao/Qwen3-Embedding-0.6B:Q8_0"])

Rate Limiting:

RATE_LIMIT_ENABLED: Enable rate limiting (default: true)
RATE_LIMIT_PER_MINUTE, RATE_LIMIT_PER_HOUR, RATE_LIMIT_PER_DAY, RATE_LIMIT_PER_WEEK, RATE_LIMIT_PER_MONTH: Set to 0 to disable individual limits
RATE_LIMIT_STRATEGY: rolling or fixed (default: rolling)

Advanced:

POLLING_INTERVAL_SECONDS: Task polling frequency (default: 30)
CONCURRENCY_LIMIT: Max parallel tasks (default: 5)
CIRCUIT_BREAKER_THRESHOLD: Failures before circuit opens (default: 5)

API Integration

Integrates with NestJS APIs via OAuth2-protected endpoints:

GET /api/ai-tasks/pending?limit=10 - Fetch pending tasks
PATCH /api/ai-tasks/:id - Update task status/results

Task Format

{
  "_id": "task-id",
  "type": "text_embedding",
  "state": "pending",
  "content": {"text": "Text to embed", "model": "nomic-embed-text"},
  "callbackRoute": "verification_update_embedding",
  "callbackParams": {"targetId": "doc-id", "field": "embedding"},
  "createdAt": "2024-01-01T00:00:00.000Z"
}

Processing Flow

Poll /api/ai-tasks/pending every 30 seconds with OAuth2 Bearer token
Validate model is supported by current processing mode
Generate embeddings via OpenAI or Ollama
Update task via PATCH /api/ai-tasks/:id
Respect rate limits

Model Management

OpenAI (cloud):

Supports any OpenAI embedding model (e.g., text-embedding-3-small, text-embedding-ada-002)
Models hosted by OpenAI, no downloads needed

Ollama (local):

Only processes models in SUPPORTED_MODELS configuration
Auto-downloads on startup (e.g., nomic-embed-text, dengcao/Qwen3-Embedding-0.6B:Q8_0)
Models persist in Docker volumes

Switch modes: Edit PROCESSING_MODE in .env and run docker-compose restart ai-task-processor

Mock Processing: Use OPENAI_API_KEY=your_openai_api_key_here (placeholder) to enable mock embeddings for testing without API costs.

Extending the System

New Task Types:

Add enum to TaskType in ai_task_processor/models/task.py
Create input/output models
Implement processor inheriting from BaseProcessor
Register in ProcessorFactory.__init__()

New AI Providers:

Create provider class inheriting from EmbeddingProvider (see embedding_providers.py)
Implement supports_model() and create_embedding()
Register in EmbeddingProviderFactory.create_provider()

Architecture

OAuth2 authentication with automatic token refresh
Circuit breaker for API resilience
Multi-tier rate limiting with SQLite persistence
Graceful shutdown with signal management
Structured logging with correlation IDs
Docker containerization with health checks

Architecture Diagram

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
ai_task_processor		ai_task_processor
docs		docs
.env.example		.env.example
.gitignore		.gitignore
ARCHITECTURE.md		ARCHITECTURE.md
CLAUDE.md		CLAUDE.md
Dockerfile		Dockerfile
PROCESSORS_IMPLEMENTATION.md		PROCESSORS_IMPLEMENTATION.md
README.md		README.md
docker-compose.yml		docker-compose.yml
prometheus.yml		prometheus.yml
requirements.txt		requirements.txt
run.py		run.py
test_wikidata.py		test_wikidata.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

AI Task Processor

Features

Processing Modes

Quick Start

1. Configure Environment

2. Start Services

Configuration

Key Settings

API Integration

Task Format

Processing Flow

Model Management

Extending the System

Architecture

Architecture Diagram

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

AletheiaFact/ai-task-processor

Folders and files

Latest commit

History

Repository files navigation

AI Task Processor

Features

Processing Modes

Quick Start

1. Configure Environment

2. Start Services

Configuration

Key Settings

API Integration

Task Format

Processing Flow

Model Management

Extending the System

Architecture

Architecture Diagram

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages