fix(tracing): Show full LLM opts and deltas

richiejp · richiejp · commit 42d0e0e5cc08 · 2026-03-13T16:13:51.000Z
Signed-off-by: Richard Palethorpe &lt;io@richiejp.com&gt;
diff --git a/core/backend/llm.go b/core/backend/llm.go
@@ -84,6 +84,7 @@ func ModelInference(ctx context.Context, s string, messages schema.Messages, ima
 	}
 
 	// in GRPC, the backend is supposed to answer to 1 single token if stream is not supported
+	var capturedPredictOpts *proto.PredictOptions
 	fn := func() (LLMResponse, error) {
 		opts := gRPCPredictOpts(*c, loader.ModelPath)
 		// Merge request-level metadata (overrides config defaults)
@@ -111,6 +112,7 @@ func ModelInference(ctx context.Context, s string, messages schema.Messages, ima
 				opts.LogitBias = string(logitBiasJSON)
 			}
 		}
+		capturedPredictOpts = opts
 
 		tokenUsage := TokenUsage{}
 
@@ -245,29 +247,19 @@ func ModelInference(ctx context.Context, s string, messages schema.Messages, ima
 		trace.InitBackendTracingIfEnabled(o.TracingMaxItems)
 
 		traceData := map[string]any{
-			"prompt":                 s,
-			"use_tokenizer_template": c.TemplateConfig.UseTokenizerTemplate,
-			"chat_template":          c.TemplateConfig.Chat,
-			"function_template":      c.TemplateConfig.Functions,
-			"grammar":               c.Grammar,
-			"stop_words":            c.StopWords,
-			"streaming":             tokenCallback != nil,
-			"images_count":          len(images),
-			"videos_count":          len(videos),
-			"audios_count":          len(audios),
+			"chat_template":    c.TemplateConfig.Chat,
+			"function_template": c.TemplateConfig.Functions,
+			"streaming":        tokenCallback != nil,
+			"images_count":     len(images),
+			"videos_count":     len(videos),
+			"audios_count":     len(audios),
 		}
 
 		if len(messages) > 0 {
 			if msgJSON, err := json.Marshal(messages); err == nil {
 				traceData["messages"] = string(msgJSON)
 			}
 		}
-		if tools != "" {
-			traceData["tools"] = tools
-		}
-		if toolChoice != "" {
-			traceData["tool_choice"] = toolChoice
-		}
 		if reasoningJSON, err := json.Marshal(c.ReasoningConfig); err == nil {
 			traceData["reasoning_config"] = string(reasoningJSON)
 		}
@@ -277,15 +269,6 @@ func ModelInference(ctx context.Context, s string, messages schema.Messages, ima
 			"mixed_mode":        c.FunctionsConfig.GrammarConfig.MixedMode,
 			"xml_format_preset": c.FunctionsConfig.XMLFormatPreset,
 		}
-		if c.Temperature != nil {
-			traceData["temperature"] = *c.Temperature
-		}
-		if c.TopP != nil {
-			traceData["top_p"] = *c.TopP
-		}
-		if c.Maxtokens != nil {
-			traceData["max_tokens"] = *c.Maxtokens
-		}
 
 		startTime := time.Now()
 		originalFn := fn
@@ -299,6 +282,42 @@ func ModelInference(ctx context.Context, s string, messages schema.Messages, ima
 				"completion": resp.Usage.Completion,
 			}
 
+			if len(resp.ChatDeltas) > 0 {
+				chatDeltasInfo := map[string]any{
+					"total_deltas": len(resp.ChatDeltas),
+				}
+				var contentParts, reasoningParts []string
+				toolCallCount := 0
+				for _, d := range resp.ChatDeltas {
+					if d.Content != "" {
+						contentParts = append(contentParts, d.Content)
+					}
+					if d.ReasoningContent != "" {
+						reasoningParts = append(reasoningParts, d.ReasoningContent)
+					}
+					toolCallCount += len(d.ToolCalls)
+				}
+				if len(contentParts) > 0 {
+					chatDeltasInfo["content"] = strings.Join(contentParts, "")
+				}
+				if len(reasoningParts) > 0 {
+					chatDeltasInfo["reasoning_content"] = strings.Join(reasoningParts, "")
+				}
+				if toolCallCount > 0 {
+					chatDeltasInfo["tool_call_count"] = toolCallCount
+				}
+				traceData["chat_deltas"] = chatDeltasInfo
+			}
+
+			if capturedPredictOpts != nil {
+				if optsJSON, err := json.Marshal(capturedPredictOpts); err == nil {
+					var optsMap map[string]any
+					if err := json.Unmarshal(optsJSON, &optsMap); err == nil {
+						traceData["predict_options"] = optsMap
+					}
+				}
+			}
+
 			errStr := ""
 			if err != nil {
 				errStr = err.Error()
diff --git a/core/http/react-ui/src/pages/Traces.jsx b/core/http/react-ui/src/pages/Traces.jsx
@@ -113,8 +113,17 @@ function AudioSnippet({ data }) {
   )
 }
 
-// Expandable data fields for backend traces
-function DataFields({ data }) {
+function isPlainObject(value) {
+  return value !== null && typeof value === 'object' && !Array.isArray(value)
+}
+
+function fieldSummary(value) {
+  const count = Object.keys(value).length
+  return `{${count} field${count !== 1 ? 's' : ''}}`
+}
+
+// Expandable data fields for backend traces (recursive for nested objects)
+function DataFields({ data, nested }) {
   const [expandedFields, setExpandedFields] = useState({})
   const filtered = Object.entries(data).filter(([key]) => !AUDIO_DATA_KEYS.has(key))
   if (filtered.length === 0) return null
@@ -125,32 +134,40 @@ function DataFields({ data }) {
 
   return (
     <div>
-      <h4 style={{ fontSize: '0.8125rem', fontWeight: 600, marginBottom: 'var(--spacing-xs)' }}>Data Fields</h4>
+      {!nested && <h4 style={{ fontSize: '0.8125rem', fontWeight: 600, marginBottom: 'var(--spacing-xs)' }}>Data Fields</h4>}
       <div style={{ border: '1px solid var(--color-border)', borderRadius: 'var(--radius-md)', overflow: 'hidden' }}>
         {filtered.map(([key, value]) => {
-          const large = isLargeValue(value)
+          const objValue = isPlainObject(value)
+          const large = !objValue && isLargeValue(value)
+          const expandable = objValue || large
           const expanded = expandedFields[key]
           return (
             <div key={key} style={{ borderBottom: '1px solid var(--color-border)' }}>
               <div
-                onClick={large ? () => toggleField(key) : undefined}
+                onClick={expandable ? () => toggleField(key) : undefined}
                 style={{
                   display: 'flex', alignItems: 'center', gap: 'var(--spacing-xs)',
                   padding: 'var(--spacing-xs) var(--spacing-sm)',
-                  cursor: large ? 'pointer' : 'default',
+                  cursor: expandable ? 'pointer' : 'default',
                   fontSize: '0.8125rem',
                 }}
               >
-                {large ? (
+                {expandable ? (
                   <i className={`fas fa-chevron-${expanded ? 'down' : 'right'}`} style={{ fontSize: '0.6rem', color: 'var(--color-text-secondary)', width: 12, flexShrink: 0 }} />
                 ) : (
                   <span style={{ width: 12, flexShrink: 0 }} />
                 )}
                 <span style={{ fontFamily: 'monospace', color: 'var(--color-primary)', flexShrink: 0 }}>{key}</span>
-                {!large && <span style={{ fontFamily: 'monospace', fontSize: '0.75rem', color: 'var(--color-text-secondary)' }}>{formatValue(value)}</span>}
-                {large && !expanded && <span style={{ fontSize: '0.75rem', color: 'var(--color-text-secondary)', overflow: 'hidden', textOverflow: 'ellipsis', whiteSpace: 'nowrap' }}>{truncateValue(value, 120)}</span>}
+                {objValue && !expanded && <span style={{ fontSize: '0.75rem', color: 'var(--color-text-secondary)' }}>{fieldSummary(value)}</span>}
+                {!objValue && !large && <span style={{ fontFamily: 'monospace', fontSize: '0.75rem', color: 'var(--color-text-secondary)' }}>{formatValue(value)}</span>}
+                {!objValue && large && !expanded && <span style={{ fontSize: '0.75rem', color: 'var(--color-text-secondary)', overflow: 'hidden', textOverflow: 'ellipsis', whiteSpace: 'nowrap' }}>{truncateValue(value, 120)}</span>}
               </div>
-              {large && expanded && (
+              {expanded && objValue && (
+                <div style={{ padding: '0 0 var(--spacing-xs) var(--spacing-md)' }}>
+                  <DataFields data={value} nested />
+                </div>
+              )}
+              {expanded && large && (
                 <div style={{ padding: '0 var(--spacing-sm) var(--spacing-sm)' }}>
                   <pre style={{
                     background: 'var(--color-bg-primary)', border: '1px solid var(--color-border)',