当前位置:首页>科技资讯>英伟达革新AI微调范式:Llama 3借RankRAG框架力压GPT-4,重写大模型竞争格局

英伟达革新AI微调范式:Llama 3借RankRAG框架力压GPT-4,重写大模型竞争格局

2024-08-13 11:07:57 人气:4 编辑:团团资源网

最近,一场人工智能领域的革新风暴正在悄然兴起,源自佐治亚理工学院与英伟达的杰出华人学者们,他们携手打造了一款革命性的微调框架——RankRAG。

英伟达革新AI微调范式:Llama 3借RankRAG框架力压GPT-4,重写大模型竞争格局

不同于传统RAG(Retrieval-Augmented Generation)流程的繁琐与冗长,RankRAG巧妙地将检索、排名与生成三大核心环节融合于单一的大型语言模型(LLM)之中,极大地提升了模型的工作效率与效能。

RAG(Retrieval-Augmented Generation)是LLM部署中常用的技术,特别适合需要大量事实知识的文本生成任务。通常,RAG的流程是:基于文本编码的稠密模型从外部数据库中检索top-k文本段,然后LLM进行读取和生成。这个流程已经被广泛使用,但也有局限,比如k值选择。如果k值太大,即使是支持长上下文的LLM也难以快速处理;如果k值太小,又需要高召回率的检索机制,而现有的检索器和排名模型各有不足。

基于上述问题,RankRAG框架提出了新思路:通过微调扩展LLM能力,让LLM自己完成检索和排名。实验结果表明,这种方法不仅提高了数据效率,还显著增强了模型性能。特别是在多个通用基准和生物医学知识密集型基准上,RankRAG微调出的Llama38B/70B模型,分别超过了ChatQA-1.58B和ChatQA-1.570B模型。

RankRAG的关键在于其高度的交互性和可编辑性。用户不仅可以实时查看AI生成的内容,还能直接在界面上进行编辑和迭代。这种即时反馈机制大大提高了工作效率,让AI真正成为创作过程中的得力助手。更令人兴奋的是,本次更新让这些Artifacts不再局限于Claude平台内部,用户可以轻松地将它们分享到任何地方。

这次RankRAG微调框架的创新还包括两个阶段的指令微调。第一阶段进行监督微调(SFT),混合多个数据集以提高LLM的指令跟随能力。第二阶段的微调数据集包含多种QA数据、检索增强的QA数据和上下文排名数据,进一步提升LLM的检索和排名能力。

在实验中,RankRAG在九个通用领域数据集上的表现始终优于当前的开源SOTA模型ChatQA-1.5。特别是在具有挑战性的QA任务中,如长尾QA和多跳QA,RankRAG比ChatQA-1.5提高了10%以上的性能。

总的来说,RankRAG不仅在检索和生成任务中表现出色,还在生物医学RAG基准Mirage上展示了其强大的适应性。即使在没有微调的情况下,RankRAG在医学问答任务上的表现也超过了许多专业领域的开源模型。

随着RankRAG框架的提出和不断完善,我们有理由相信,AI与人类协作创作的未来将更加光明。无论是独立开发者还是研究人员,都能利用这一创新框架激发出更多创意和可能性,推动技术和应用的发展。

英伟达正式开源RTX Remix技术,助力开发者重制经典游戏

7月5日,英伟达宣布RTX Remix技术在广泛Beta测试后正式开源,旨在助力开发者革新DirectX 8和9时代的游戏。

英伟达正式开源RTX Remix技术,助力开发者重制经典游戏

该技术依托于Omniverse平台,集成渲染器与工具套件,便于MOD开发者实施光线追踪、DLSS 3.5等升级,为旧游戏增添现代图形效果与物理材质的真实感。

英伟达正式开源RTX Remix技术,助力开发者重制经典游戏

通过RTX Remix REST API与ComfyUI集成,MOD制作者能够轻松利用AI模型为游戏纹理增添细节,甚至仅凭简短文字指令即可变换游戏场景。英伟达计划开放API接口至更多DCC工具(如Blender)、Mod工具及AI应用,同时发布Remix Runtime SDK,以便MOD社区将此渲染技术应用于更广泛的游戏与软件中,推动经典游戏的次世代重生。

英伟达新一代移动显卡曝光:RTX 3050 A笔记本版搭载AD106架构

7月25日消息,依据PCI-ID数据库的最新更新资料,英伟达即将推出一款专为笔记本设计的RTX 3050 A系列独立显卡,此举预示着笔记本市场将迎来性能与图形处理能力的新选项。

英伟达新一代移动显卡曝光:RTX 3050 A笔记本版搭载AD106架构

奇怪的是,RTX 3050 A 采用了基于 Ada Lovelace 架构的 AD106 GPU,也就是 RTX 40 系列同款架构的 GPU,而不是基于 Ampere 的 GPU。

此外,外媒在英伟达最新驱动中发现了“RTX 3050 A Laptop GPU”的字样,目前尚不清楚该 GPU 何时推出。IT之家将跟进后续消息。

目前使用 AD106 GPU 的最低规格是 4352 个 CUDA 核心的 AD106-350,用于 RTX 4060 Ti 显卡。

上一篇:

vivo新品震撼登场:Y37智能手机配备天玑6300芯,水滴屏美学,售价1199元起

下一篇:

漫步者HECATE G2无线游戏耳机预热:经典黑白配色,定档7月12日正式发售

CopyRight©2019 ttuan.com All Right Reserved 渝ICP备20008086号-31