Inference + Reasoning

18.0

Create an end-to-end framework that turns natural language feedback into model weight updates. This enables LMs to learn from user interaction more efficiently than current fine-tuning pipelines.

+0

emergingimplementation gap

fine-tuninginferencereasoning

Signals (2)

arXiv2h ago

Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Under Equal Thinking Token Budgets

arXiv2h ago

Inference + Reasoning

Signals (2)

Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Under Equal Thinking Token Budgets

SIEVE: Sample-Efficient Parametric Learning from Natural Language