从技术上讲,RAG 通过各种创新方法得到了丰富,解决了诸如“检索什么”、“何时检索”和“如何使用检索到的信息”等关键问题。信息”。对于“检索什么”的研究已经从简单的标记开始取得进展 [Khandelwal 等人.,2019]身份检索[Nishikawa 等人.,2022]更复杂的结构,如块[Ram 等人.,2023]和知识图谱[Kang 等人.,2023],研究重点是检索的粒度和数据结构化的水平。粗粒度带来更多信息,但精度较低。检索结构化文本可提供更多信息,但会牺牲效率。 “何时检索”的问题导致了从单一的策略[Wang et al. ,2023e,Shi 等人.,2023]到自适应[Jiang 等人.,2023b,黄等人.,2023]和多重检索[Izacard 等人.,2022]方法。检索频率高带来的信息较多,但效率较低。至于“如何使用”检索到的数据,已经在模型架构的各个级别上开发了集成技术,包括输入[Khattab 等人,2017].,2022],中级 [Borgeaud 等人.,2022],和输出层[Liang et al.,2023]。虽然“中间层”和“输出层”的效果比较好,但存在需要训练、效率低的问题。