RAG 戰鬥共學團

從頭開始，一起研究 RAG

什麼是RAG

檢索增強生成（RAG，全名是 Retrieval-Augmented Generation）是一種結合了檢索與生成模型的技術，主要用來提升語言模型在回應問題時的準確性和可靠性。RAG 的工作方式是將資料檢索（retrieval）與生成模型（generation）結合，使得模型在回答問題時，除了依賴內部的語言生成能力，還能從外部知識庫中檢索相關的資訊來輔助生成更準確的答案。

RAG 的基本流程如下：

檢索階段（Retrieval）： 當系統接收到一個問題後，首先會使用檢索模型從外部的資料庫（例如網頁、文件、知識庫）中找出與問題相關的內容片段。
生成階段（Generation）： 然後，這些檢索到的相關資料片段會被輸入到生成模型中，生成模型依據這些資料來生成更具參考性和準確性的回答。

這種方法的優勢在於它結合了兩個不同技術的長處：檢索模型可以從大量的外部資訊中找到可靠的資料，而生成模型則能依據這些資料，生成自然語言的回答。這樣一來，RAG 模型在應對需要特定領域知識的問題時，能比單純的生成模型更加強大和有效。

RAG 在應用場景中，常見於需要精確回答的任務，如問答系統、知識圖譜生成、文件總結等。

共學團要做什麼？

一起建可以在電腦本機或雲端的知識庫，讓自己的平時整理的資格料或自己的文件，可以用自然語言輸入，透過 RAG，再自然語言輸入，成為自己專屬的 AI

可能會怎麼進行

目前可能分為三組：

Python組：需要一些基礎 python 能力，可能學習時間拉長一些
No-code組（本地端安裝模型）：目前找到很多資料，可以透過 LM Studio(https://lmstudio.ai/) 和 Anything LLM(https://useanything.com/) 即可輕易串接完成
No-code組（使用現成雲端服務）

入門概念精選

https://www.inside.com.tw/article/33991-what_is_rag

https://most.tw/posts/ainews/brainfriendlyragexplained/

Python組

No-code組（本地裝模型）

平台 / 工具概覽

(這裡放一些 Breeze經驗)

No-code組（雲端服務）

平台 / 工具概覽