迈向通用领域的数据评估
这篇工作依旧在施工中。 不一定保持线性更新,可能这篇工作写到一半会更新其他的工作。 这篇文章的主题叫做”迈向通用领域的数据评估”,目前,LLM+RL的方法在许多领域,尤其是数学和代码上都取得了能力上的突破。然而在除了数学和代码这两个具有ground-truth answer的领域外,如何评估通用领域数据的质量,成为了一个重要的问题。在这里,数据质量评估其实有两重含义:1. 在训练时评估数据...
这篇工作依旧在施工中。 不一定保持线性更新,可能这篇工作写到一半会更新其他的工作。 这篇文章的主题叫做”迈向通用领域的数据评估”,目前,LLM+RL的方法在许多领域,尤其是数学和代码上都取得了能力上的突破。然而在除了数学和代码这两个具有ground-truth answer的领域外,如何评估通用领域数据的质量,成为了一个重要的问题。在这里,数据质量评估其实有两重含义:1. 在训练时评估数据...
欢迎阅读我的第一篇博客! 这是我在Jekyll上创建的第一篇博客文章。我使用的是 jekyll-theme-chirpy 主题,感谢@杂然赋流形丶前辈的推荐。 为什么要写博客? 之前弄过很多个博客,这次这个博客的定位其实是“正式一些的QQ空间”,可能会发一些论文笔记、总结、自言自语的感受等,并不会很正式。但是,因为好友非常建议我多写一些(我也确实觉得应该多写一些),所以在这里应该也会坚持...