從頭開始,一起研究 RAG

什麼是RAG

檢索增強生成(RAG,全名是 Retrieval-Augmented Generation)是一種結合了檢索與生成模型的技術,主要用來提升語言模型在回應問題時的準確性和可靠性。RAG 的工作方式是將資料檢索(retrieval)與生成模型(generation)結合,使得模型在回答問題時,除了依賴內部的語言生成能力,還能從外部知識庫中檢索相關的資訊來輔助生成更準確的答案。

RAG 的基本流程如下:

  1. 檢索階段(Retrieval): 當系統接收到一個問題後,首先會使用檢索模型從外部的資料庫(例如網頁、文件、知識庫)中找出與問題相關的內容片段。
  2. 生成階段(Generation): 然後,這些檢索到的相關資料片段會被輸入到生成模型中,生成模型依據這些資料來生成更具參考性和準確性的回答。

這種方法的優勢在於它結合了兩個不同技術的長處:檢索模型可以從大量的外部資訊中找到可靠的資料,而生成模型則能依據這些資料,生成自然語言的回答。這樣一來,RAG 模型在應對需要特定領域知識的問題時,能比單純的生成模型更加強大和有效。

RAG 在應用場景中,常見於需要精確回答的任務,如問答系統、知識圖譜生成、文件總結等。

共學團要做什麼?

一起建可以在電腦本機或雲端的知識庫,讓自己的平時整理的資格料或自己的文件,可以用自然語言輸入,透過 RAG,再自然語言輸入,成為自己專屬的 AI

可能會怎麼進行

目前可能分為三組:

  1. Python組:需要一些基礎 python 能力,可能學習時間拉長一些
  2. No-code組(本地端安裝模型):目前找到很多資料,可以透過 LM Studio(https://lmstudio.ai/) 和 Anything LLM(https://useanything.com/) 即可輕易串接完成
  3. No-code組(使用現成雲端服務)

入門概念精選

https://www.inside.com.tw/article/33991-what_is_rag

https://most.tw/posts/ainews/brainfriendlyragexplained/

Python組

No-code組(本地裝模型)

平台 / 工具概覽

(這裡放一些 Breeze經驗)

No-code組(雲端服務)

平台 / 工具概覽