Merge pull request #91 from grasp-technologies/release-0.6.20

sergekomarov · web-flow · commit c643ddc2ccb5 · 2025-11-07T16:29:44.000Z
simple LiteLLM fallbacks
diff --git a/pyproject.toml b/pyproject.toml
@@ -1,6 +1,6 @@
 [project]
 name = "grasp_agents"
-version = "0.6.19"
+version = "0.6.20"
 description = "Grasp Agents Library"
 readme = "README.md"
 requires-python = ">=3.11.4,<4"
diff --git a/src/grasp_agents/litellm/lite_llm.py b/src/grasp_agents/litellm/lite_llm.py
@@ -41,6 +41,9 @@ class LiteLLMSettings(OpenAILLMSettings, total=False):
     thinking: AnthropicThinkingParam | None
 
 
+LiteLLMModelName = str
+
+
 @dataclass(frozen=True)
 class LiteLLM(CloudLLM):
     llm_settings: LiteLLMSettings | None = None
@@ -55,6 +58,10 @@ class LiteLLM(CloudLLM):
     allowed_openai_params: list[str] | None = None
     # Mock LLM response for testing
     mock_response: str | None = None
+    # Fallback models to use if the main model fails
+    fallbacks: list[LiteLLMModelName] = field(default_factory=list[LiteLLMModelName])
+    # Mock falling back to other models in the fallbacks list for testing
+    mock_testing_fallbacks: bool = False
 
     router: Router = field(init=False)
 
@@ -71,6 +78,7 @@ def __post_init__(self) -> None:
                 "additional_drop_params": self.additional_drop_params,
                 "allowed_openai_params": self.allowed_openai_params,
                 "mock_response": self.mock_response,
+                "mock_testing_fallbacks": self.mock_testing_fallbacks,
                 # "max_retries": self.max_client_retries,
                 # "timeout": self.client_timeout,
                 # "deployment_id": deployment_id,
@@ -114,13 +122,17 @@ def __post_init__(self) -> None:
                 "Custom HTTP clients are not yet supported when using LiteLLM."
             )
 
+        main_litellm_model = {
+            "model_name": self.model_name,
+            "litellm_params": {"model": self.model_name},
+        }
+        fallback_litellm_models = [
+            {"model_name": fb, "litellm_params": {"model": fb}} for fb in self.fallbacks
+        ]
+
         _router = Router(
-            model_list=[
-                {
-                    "model_name": self.model_name,
-                    "litellm_params": {"model": self.model_name},
-                }
-            ],
+            model_list=[main_litellm_model, *fallback_litellm_models],
+            fallbacks=[{self.model_name: self.fallbacks}],
             num_retries=self.max_client_retries,
             timeout=self.client_timeout,
         )
diff --git a/src/grasp_agents/telemetry/phoenix.py b/src/grasp_agents/telemetry/phoenix.py
@@ -22,7 +22,6 @@ def init_phoenix(
     batch: bool = False,
     use_litellm_instr: bool = True,
     use_llm_provider_instr: bool = True,
-    api_token: str | None = None,
 ):
     collector_endpoint = os.getenv("TELEMETRY_COLLECTOR_HTTP_ENDPOINT")
 
@@ -50,9 +49,7 @@ def init_phoenix(
         LLM_PROVIDER_NAMES if use_llm_provider_instr or use_litellm_instr else set()
     )
     exporter = FilteringExporter(
-        inner=HTTPSpanExporter(
-            endpoint=collector_endpoint, api_token=api_token, headers=None
-        ),
+        inner=HTTPSpanExporter(endpoint=collector_endpoint, headers=None),
         blocklist=blocklist,
     )
     if batch:
diff --git a/uv.lock b/uv.lock