LLM Model Configuration

LLM (Large Language Model) settings control the AI model used for RAG chat responses in the Playground.

Available Providers

Provider	Models	Notes
OpenAI	GPT-4o, GPT-4o Mini	Most popular, excellent quality
Anthropic	Claude Sonnet 4, Claude 3.5 Sonnet, Claude 3.5 Haiku	Long context, nuanced responses

Each provider requires its own API key:

The settings page shows a status banner indicating whether your API key is configured:

Model	Context	Best For	Quality
GPT-4o	128K tokens	Complex reasoning, detailed responses	Highest (OpenAI)
GPT-4o Mini	128K tokens	Fast, cost-effective responses	High
Claude Sonnet 4	200K tokens	Long documents, nuanced analysis	Highest (Anthropic)
Claude 3.5 Haiku	200K tokens	Fast responses, simple queries	Good