Apr 30, 06:39 PM

$Meta AI Launches ReasonIR-8B Retriever With 36.9 nDCG@10, 200x Efficiency; Qwen2.5-Math-1.5B Scores 73.6% via One-Shot RLVR$

Meta AI Launches ReasonIR-8B Retriever With 36.9 nDCG@10, 200x Efficiency; Qwen2.5-Math-1.5B Scores 73.6% via One-Shot RLVR

Meta AI has introduced ReasonIR-8B, a retriever model specifically trained for reasoning-intensive information retrieval tasks. Developed using LLaMA3.1-8B, ReasonIR-8B employs a synthetic data generation pipeline that creates challenging queries with plausible but misleading negatives, enhancing its reasoning capabilities. The model outperforms existing retrievers and rerankers on the BRIGHT benchmark, achieving a 36.9 nDCG@10 score while being 200 times more compute-efficient than leading large language model rerankers. Additionally, research on reinforcement learning with verifiable reward (RLVR) demonstrates that large language models can significantly improve mathematical reasoning performance using just one training example. For instance, the Qwen2.5-Math-1.5B model's accuracy on the MATH500 benchmark rose from 36.0% to 73.6% with one-shot RLVR. This approach also shows generalizability across tasks. These advancements highlight progress in efficient training methods and retrieval performance for reasoning tasks in AI models.

#Meta AI

Written with ChatGPT (GPT-4).

Sources

Additional media

$Image #1 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #2 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #3 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #4 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #5 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #6 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #7 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #8 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #9 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #10 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #11 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #12 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #13 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #14 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #15 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #16 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #17 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #18 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #19 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #20 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #21 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #22 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #23 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

$Image #24 for story meta-ai-launches-reasonir-8b-retriever-36-9-ndcg-10-200x-efficiency-qwen2-5-math-27445ab6$

Meta AI Launches ReasonIR-8B Retriever With 36.9 nDCG@10, 200x Efficiency; Qwen2.5-Math-1.5B Scores 73.6% via One-Shot RLVR

Sources

Additional media

Similar Stories