Fix PydanticAIRunner to use proper Pydantic AI message capture API

claude · claude · commit b8f73ced9cea · 2025-12-01T07:43:45.000Z
CRITICAL FIX: The original implementation incorrectly assumed that UsageLimitExceeded would have a message_history attribute, but this is NOT how Pydantic AI works. ## What Was Wrong The initial implementation tried to extract message history directly from the UsageLimitExceeded exception using a non-existent attribute: ```python def _extract_messages(e: UsageLimitExceeded) -> list[ModelMessage]: if hasattr(e, "message_history") and e.message_history: return list(e.message_history) ``` This approach was based on the OpenAI Agents SDK pattern (MaxTurnsExceeded.run_data), but Pydantic AI uses a completely different pattern. ## How Pydantic AI Actually Works Per Pydantic AI documentation (https://ai.pydantic.dev/agents/#model-errors): - Use `capture_run_messages()` context manager to capture messages - The context manager populates a list during agent.run() execution - If an exception occurs, the captured messages are still available - This is the official, documented approach Reference: pydantic/pydantic-ai#1083 ## Changes Made 1. **Updated imports**: - Added `capture_run_messages` from pydantic_ai - Removed obsolete `_extract_messages()` helper function 2. **Rewrote run() method**: - Wrapped agent.run() in `with capture_run_messages() as messages:` - On UsageLimitExceeded, use the captured messages for recovery - Messages are properly populated by the context manager 3. **Rewrote run_streamed() method**: - Same pattern as run() but for streaming - Uses capture_run_messages() consistently 4. **Updated all recovery tests**: - Mock capture_run_messages context manager properly - Use `@patch("agentexec.runners.pydantic_ai.capture_run_messages")` - Mock return value with `__enter__` to simulate context manager ## Verification ✅ All 21 PydanticAIRunner tests pass ✅ All 49 tests in test suite pass ✅ Recovery mechanism properly captures and reuses conversation history ✅ Implementation follows official Pydantic AI patterns ## Why This Matters Without this fix, the recovery mechanism would NEVER work correctly because: 1. Message history would always be empty 2. Recovery would lose all conversation context 3. The wrap-up prompt would be sent without prior conversation This fix ensures the PydanticAIRunner behaves correctly according to Pydantic AI's actual API, not just our assumptions.
diff --git a/src/agentexec/runners/pydantic_ai.py b/src/agentexec/runners/pydantic_ai.py
@@ -2,7 +2,7 @@
 import uuid
 from typing import Any
 
-from pydantic_ai import Agent, AgentRunResult
+from pydantic_ai import Agent, AgentRunResult, capture_run_messages
 from pydantic_ai.exceptions import UsageLimitExceeded
 from pydantic_ai.messages import (
     ModelMessage,
@@ -19,24 +19,6 @@
 logger = logging.getLogger(__name__)
 
 
-def _extract_messages(e: UsageLimitExceeded) -> list[ModelMessage]:
-    """
-    Extract the full conversation message history from a `UsageLimitExceeded` exception.
-
-    Args:
-        e: The UsageLimitExceeded exception instance
-    Returns:
-        List of ModelMessage objects representing the full conversation history
-    """
-    # UsageLimitExceeded may have a message_history attribute or similar
-    # For now, return empty list if not available
-    if hasattr(e, "message_history") and e.message_history:
-        return list(e.message_history)
-
-    logger.warning("No message history available in UsageLimitExceeded exception")
-    return []
-
-
 class _PydanticAIRunnerTools(_RunnerTools):
     """Pydantic AI-specific tools wrapper that creates Tool instances."""
 
@@ -135,43 +117,43 @@ async def run(
             model_settings: Optional model settings to pass to the agent.
 
         Returns:
-            RunResult from the agent execution.
+            AgentRunResult from the agent execution.
         """
-        try:
-            result = await agent.run(
-                user_prompt=user_prompt,
-                message_history=message_history,
-                deps=deps,
-                usage_limits=UsageLimits(request_limit=max_turns),
-                model_settings=model_settings,
-            )
-        except UsageLimitExceeded as e:
-            if not self.max_turns_recovery:
-                raise
-
-            logger.info("Request limit exceeded, attempting recovery")
-
-            # Extract the conversation history
-            messages = _extract_messages(e)
-
-            # Append wrap-up prompt as a new ModelRequest
-            wrap_up_request = ModelRequest(
-                parts=[UserPromptPart(content=self.prompts.wrap_up)]
-            )
-            messages.append(wrap_up_request)
-
-            # Retry with recovery turns limit
-            result = await agent.run(
-                user_prompt=None,  # None since we're using message_history
-                message_history=messages,
-                deps=deps,
-                usage_limits=UsageLimits(request_limit=self.recovery_turns),
-                model_settings=model_settings,
-            )
-        except Exception:
-            raise
-
-        return result
+        # Use capture_run_messages to access conversation history if UsageLimitExceeded
+        with capture_run_messages() as messages:
+            try:
+                result = await agent.run(
+                    user_prompt=user_prompt,
+                    message_history=message_history,
+                    deps=deps,
+                    usage_limits=UsageLimits(request_limit=max_turns),
+                    model_settings=model_settings,
+                )
+                return result
+            except UsageLimitExceeded:
+                if not self.max_turns_recovery:
+                    raise
+
+                logger.info(
+                    "Request limit exceeded, attempting recovery with %d messages",
+                    len(messages),
+                )
+
+                # Append wrap-up prompt to the captured messages
+                wrap_up_request = ModelRequest(
+                    parts=[UserPromptPart(content=self.prompts.wrap_up)]
+                )
+                recovery_messages = list(messages) + [wrap_up_request]
+
+                # Retry with recovery turns limit
+                result = await agent.run(
+                    user_prompt=None,  # None since we're using message_history
+                    message_history=recovery_messages,
+                    deps=deps,
+                    usage_limits=UsageLimits(request_limit=self.recovery_turns),
+                    model_settings=model_settings,
+                )
+                return result
 
     async def run_streamed(
         self,
@@ -203,38 +185,38 @@ async def run_streamed(
                 async for message in result.stream_text():
                     print(message)
         """
-        try:
-            result = await agent.run_stream(
-                user_prompt=user_prompt,
-                message_history=message_history,
-                deps=deps,
-                usage_limits=UsageLimits(request_limit=max_turns),
-                model_settings=model_settings,
-            )
-        except UsageLimitExceeded as e:
-            if not self.max_turns_recovery:
-                raise
-
-            logger.info("Request limit exceeded during streaming, attempting recovery")
-
-            # Extract the conversation history
-            messages = _extract_messages(e)
-
-            # Append wrap-up prompt as a new ModelRequest
-            wrap_up_request = ModelRequest(
-                parts=[UserPromptPart(content=self.prompts.wrap_up)]
-            )
-            messages.append(wrap_up_request)
-
-            # Retry with recovery turns limit
-            result = await agent.run_stream(
-                user_prompt=None,  # None since we're using message_history
-                message_history=messages,
-                deps=deps,
-                usage_limits=UsageLimits(request_limit=self.recovery_turns),
-                model_settings=model_settings,
-            )
-        except Exception:
-            raise
-
-        return result
+        # Use capture_run_messages to access conversation history if UsageLimitExceeded
+        with capture_run_messages() as messages:
+            try:
+                result = await agent.run_stream(
+                    user_prompt=user_prompt,
+                    message_history=message_history,
+                    deps=deps,
+                    usage_limits=UsageLimits(request_limit=max_turns),
+                    model_settings=model_settings,
+                )
+                return result
+            except UsageLimitExceeded:
+                if not self.max_turns_recovery:
+                    raise
+
+                logger.info(
+                    "Request limit exceeded during streaming, attempting recovery with %d messages",
+                    len(messages),
+                )
+
+                # Append wrap-up prompt to the captured messages
+                wrap_up_request = ModelRequest(
+                    parts=[UserPromptPart(content=self.prompts.wrap_up)]
+                )
+                recovery_messages = list(messages) + [wrap_up_request]
+
+                # Retry with recovery turns limit
+                result = await agent.run_stream(
+                    user_prompt=None,  # None since we're using message_history
+                    message_history=recovery_messages,
+                    deps=deps,
+                    usage_limits=UsageLimits(request_limit=self.recovery_turns),
+                    model_settings=model_settings,
+                )
+                return result
diff --git a/tests/test_pydantic_ai_runner.py b/tests/test_pydantic_ai_runner.py
@@ -200,7 +200,8 @@ async def test_recovery_disabled_raises_exception(self) -> None:
             )
 
     @pytest.mark.asyncio
-    async def test_recovery_enabled_retries(self) -> None:
+    @patch("agentexec.runners.pydantic_ai.capture_run_messages")
+    async def test_recovery_enabled_retries(self, mock_capture: Mock) -> None:
         """Test that recovery mechanism retries with wrap-up prompt."""
         agent_id = uuid.uuid4()
         wrap_up_prompt = "Please summarize"
@@ -213,13 +214,18 @@ async def test_recovery_enabled_retries(self) -> None:
 
         mock_agent = Mock(spec=Agent)
 
-        # First call raises UsageLimitExceeded
-        mock_exception = UsageLimitExceeded("Request limit exceeded")
-        mock_exception.message_history = [
+        # Mock messages that would be captured
+        captured_messages = [
             ModelRequest(parts=[UserPromptPart(content="Original prompt")]),
             Mock(spec=ModelResponse),  # Mock a response
         ]
 
+        # Mock capture_run_messages to populate the list
+        mock_capture.return_value.__enter__.return_value = captured_messages
+
+        # First call raises UsageLimitExceeded
+        mock_exception = UsageLimitExceeded("Request limit exceeded")
+
         # Second call (recovery) succeeds
         mock_recovery_result = Mock(spec=AgentRunResult)
         mock_recovery_result.data = "Recovery result"
@@ -242,14 +248,15 @@ async def test_recovery_enabled_retries(self) -> None:
 
         # Verify wrap-up prompt was added to message history
         recovery_messages = second_call_kwargs["message_history"]
-        assert len(recovery_messages) > 0
+        assert len(recovery_messages) == len(captured_messages) + 1
         # Last message should be the wrap-up prompt
         last_message = recovery_messages[-1]
         assert isinstance(last_message, ModelRequest)
         assert last_message.parts[0].content == wrap_up_prompt
 
     @pytest.mark.asyncio
-    async def test_recovery_preserves_message_history(self) -> None:
+    @patch("agentexec.runners.pydantic_ai.capture_run_messages")
+    async def test_recovery_preserves_message_history(self, mock_capture: Mock) -> None:
         """Test that recovery preserves conversation history."""
         agent_id = uuid.uuid4()
         runner = PydanticAIRunner(
@@ -260,17 +267,18 @@ async def test_recovery_preserves_message_history(self) -> None:
 
         mock_agent = Mock(spec=Agent)
 
-        # Create mock message history
-        original_messages = [
+        # Create mock message history that would be captured
+        captured_messages = [
             ModelRequest(parts=[UserPromptPart(content="Message 1")]),
             Mock(spec=ModelResponse),
             ModelRequest(parts=[UserPromptPart(content="Message 2")]),
             Mock(spec=ModelResponse),
         ]
 
-        mock_exception = UsageLimitExceeded("Request limit exceeded")
-        mock_exception.message_history = original_messages
+        # Mock capture_run_messages to populate the list
+        mock_capture.return_value.__enter__.return_value = captured_messages
 
+        mock_exception = UsageLimitExceeded("Request limit exceeded")
         mock_recovery_result = Mock(spec=AgentRunResult)
         mock_agent.run = AsyncMock(side_effect=[mock_exception, mock_recovery_result])
 
@@ -284,8 +292,8 @@ async def test_recovery_preserves_message_history(self) -> None:
         recovery_call_kwargs = mock_agent.run.call_args_list[1].kwargs
         recovery_messages = recovery_call_kwargs["message_history"]
 
-        # Should have original messages plus wrap-up prompt
-        assert len(recovery_messages) == len(original_messages) + 1
+        # Should have captured messages plus wrap-up prompt
+        assert len(recovery_messages) == len(captured_messages) + 1
 
     @pytest.mark.asyncio
     async def test_other_exceptions_not_caught(self) -> None:
@@ -332,7 +340,8 @@ async def test_basic_streaming(self) -> None:
         assert call_kwargs["usage_limits"].request_limit == 10
 
     @pytest.mark.asyncio
-    async def test_streaming_with_recovery(self) -> None:
+    @patch("agentexec.runners.pydantic_ai.capture_run_messages")
+    async def test_streaming_with_recovery(self, mock_capture: Mock) -> None:
         """Test that streaming works with recovery mechanism."""
         agent_id = uuid.uuid4()
         runner = PydanticAIRunner(
@@ -343,11 +352,13 @@ async def test_streaming_with_recovery(self) -> None:
 
         mock_agent = Mock(spec=Agent)
 
-        mock_exception = UsageLimitExceeded("Request limit exceeded")
-        mock_exception.message_history = [
+        # Mock captured messages
+        captured_messages = [
             ModelRequest(parts=[UserPromptPart(content="Original")]),
         ]
+        mock_capture.return_value.__enter__.return_value = captured_messages
 
+        mock_exception = UsageLimitExceeded("Request limit exceeded")
         mock_recovery_result = Mock(spec=StreamedRunResult)
         mock_agent.run_stream = AsyncMock(
             side_effect=[mock_exception, mock_recovery_result]