2025 年 7 月
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Written by 研究員07/09/2024

Reflection Llama-3.1-70B 模型可以在推理过程中发现自己的错误并进行自我修正

全球最强的开源模型：Reflection 70B。它使用了一种名为“Reflection-Tuning 反思调优”的技术进行训练，该技术教会模型在推理过程中发现自己的错误并进行自我修正。Reflection 70B 在多个基准测试（MMLU、MATH、IFEval、GSM8K）上超越了顶级闭源模型（如 GPT-4o 和 Claude 3.5 Sonnet），并击败了 Llama 3.1 405B。

该模型通过将规划过程分离为独立步骤来提高链式思维（CoT）的效果，并保证输出简洁明了。此外，开发团队确保了数据的去污处理。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。

开通会员

閲讀原文
Author: 小互

Written by 研究員

研究一下自己。

Menu

归档

Calendar

分类

Reflection Llama-3.1-70B 模型可以在推理过程中发现自己的错误并进行自我修正

Support authors and subscribe to content

加入会员

Written by 研究員

归档

Calendar

分类

Menu

归档

Calendar

分类

Reflection Llama-3.1-70B 模型 可以在推理过程中发现自己的错误并进行自我修正

Support authors and subscribe to content

加入会员

You may also like

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

Written by 研究員

归档

Calendar

分类

Reflection Llama-3.1-70B 模型可以在推理过程中发现自己的错误并进行自我修正

Fireworks AI新功能能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本