首頁電子資訊資訊軟體

Graph RAG-RAG結合知識圖譜之技術解析及應用

免費
字數 3235
頁數 6
出版作者 劉佳苹
出版單位 資策會MIC
出版日期 2024/11/25
出版類型 產業評析
所屬領域 資訊軟體
瀏覽次數 427
評價分數 3人評價/4.7分
加入購物車 直接下載 直接下載 加入最愛

一、前言

大型語言模型(Large Language Models,簡稱LLM)不斷推陳出新,朝往多模態(Large Multimodal Model,簡稱LMM)發展,如Open GPT-4o、Meta Llama 3.2等,市面上也出現不少基於LLM技術的AI工具和解決方案。由於LLM的運作方式是透過語意匹配檢索(Semantic Matching)去預測出現機率最高的下個字詞,並非真正理解語言背後的意涵,加上用於LLM訓練數據有時間範圍和領域之限制,並非即時更新,導致企業內部在使用LLM時,往往會因LLM缺乏產業或業務領域知識,出現幻覺亂回答的狀況。為了讓LLM更理解公司的業務場景和產業知識,以改善出現幻覺的問題,目前企業常見的作法有三種:提示工程、RAG向量檢索和微調模型。

基於成本效益和AI技術能力之考量,多數企業是「提示工程」和「RAG向量檢索」一起搭配使用。其中,檢索增強生成(Retrieval-Augmented Generation,簡稱RAG)是一種結合「索引(將文件做向量編碼,寫入向量資料庫,又稱向量嵌入)」、「檢索(使用相似性查詢)」與「生成(將檢索的結果上下文和接收到的問題一起提交給LLM處理)」的技術。此作法之目的在於讓AI模型生成答案之前,先去檢索相關資料,再根據這些資料進行回答,以確保AI模型基於最新或相關的資訊來產生回應,避免答非所問或編撰錯誤內容的狀況。

 

資料來源:MIC,資策會MIC ITIS研究團隊整理(2024/11)。

圖1 將產業知識整合到大型語言模型,以提升回答品質的三種常見作法

 

二、 Graph RAG定義與核心技術

傳統RAG主要依靠向量資料庫(Embedding)和語義相似度進行檢索,因此在面對多層次、複雜的數據關係時可能會丟失關鍵上下文,而產生與問題無關的結果。而傳統RAG基於相似度檢索的結果也缺乏直接的語義解釋,回應的生成過程較難追溯,可解釋性較差。此外傳統RAG檢索文本塊(Text Chunks)的能力有限,當提供給LLM檢索的資料量過多時,無法涵蓋到所有內容,僅能檢索到與問題相關性較高的部分內容,使得LLM提供的答案不夠完整。而Graph RAG將RAG結合知識圖譜技術,能識別複雜的語義關聯,具備更好的上下文理解能力,可改善上述傳統RAG遇到的瓶頸。

Graph RAG是知識圖譜(Knowledge Graph)加上檢索增強生成(Retrieval-Augmented Generation)的縮寫,是一種利用知識圖譜(也可說是圖形資料庫Graph Databases)來優化RAG的技術。和傳統RAG的主要差異在於Graph RAG會在AI檢索資料的路徑中,基於知識圖譜中的已知關聯進行推理,讓LLM能更具備對資料的全局觀以及深度理解領域知識,減少回應中虛構或不準確的部分。此外,Graph RAG亦能提供知識圖譜中每個節點的來源資訊,透過使用結構化的資料節點追溯回應的邏輯來源,可大幅提升LLM回答的可靠性。

 

資料來源:Linkurious、neo4j、MIC,資策會MIC ITIS研究團隊整理(2024/11)。

圖2 傳統RAG和Graph RAG之差異比較

 

Graph RAG核心技術包含向量檢索和知識圖譜,向量檢索是一種將資料(如文字、圖像等)轉換為數學向量(Vector),並利用向量之間的相似性進行檢索的技術。知識圖譜是一種結構化的知識表示方式,由不同實體(Entities)和它們之間的關係(Relationships)所組成的網絡,讓各種資訊能夠以清晰的方式串連起來;其中,實體通常代表一個具體的概念,如人、地點、產品等,關係則是用來描述不同實體之間的連結,舉例來說「J·K·羅琳」是「哈利波特」的作者、「哈利波特」的出版商「Bloomsbury」、「Bloomsbury」是一家「英國」公司、「J·K·羅琳」為「Bloomsbury」公司工作,就呈現實體之間的連結關係。

 

三、 Graph RAG流程與運作方式

企業若要使用Graph RAG技術,需要先把資料源進行預處理,將資料內容先建構成一個知識圖譜的結構,以有助於LLM從大量未結構化文本中提取出最相關且有用的知識,支援企業獲得更精確地回答和加快決策過程。建置Graph RAG的流程說明如下:

(一) 將資料來源進行切塊(chunks)處理

將長文本分塊有助於在LLM記憶範圍內能保留足夠的上下文,以及LLM在處理大規模的文本資料庫時,可以只搜索相關的文本塊,而非整篇文件,不僅能減少LLM的記憶負荷,亦可大幅提高處理速度,及增加生成回應的準確性和穩定性。

 

(二)從文本塊中擷取「實體(Entities)」和「關係(Relationships)」

每個文本塊(Text Chunks)擷取出用來建構知識圖譜的二大元件:實體和關係。舉例來說,若有個文本塊的內容為「Elon Musk is the CEO of SpaceX and Tesla. And the headquarters of both are in the USA.」,其中的五個基本實體單位(亦稱作Element instances)分別會是Elon Musk、SpaceX、Tesla、USA,而這些實體之間的關係描述會像是「Elon Muskthe CEO ofSpaceX」、「SpaceXheadquarter inUSA」以此類推。

 

(三) 彙整所有「實體(Entities)」和「關係(Relationships)」之描述並進行分類,形成知識圖譜架構

實體和關係以一個比較完整的描述摘要呈現後會形成「Element Summaries」,例如「Elon Musk is the CEO of SpaceX, which is located in the USA」。接著再將多個「Element Summaries」分類分群後,便能構建出一個知識圖譜網絡結構「Graph Communities」。後續當LLM接收到問題後,便會先去檢索知識圖譜中的各個communities獲得局部最相關的答案,再整合成一個整體回答提供給發問者。

 

資料來源:Microsoft、MIC,資策會MIC ITIS研究團隊整理(2024/11)。

圖3  知識圖譜建置流程與Graph RAG運作方式

 

由於Graph RAG能讓LLM有更好的上下文理解力和推理解釋性,企業對於使用Graph RAG技術來強化LLM學習特定領域知識、理解企業業務流程的需求也逐漸增加,三大雲端服務商分別推出Amazon Neptune圖形資料庫、Google Spanner Graph圖形資料庫、Microsoft Graph RAG先進的RAG工具,來支援其客戶能基於自家的LLM平台服務,部署進階的Graph RAG技術,擴展更多生成式AI衍生應用。

此外,圖形資料庫服務商如Neo4j、ArangoDB、TigerGraph等、商業軟體大廠如SAP、Oracle等也積極運用其核心產品優勢,提供客戶可建置Graph RAG的相關工具和輔助功能,輔助客戶創造更多的數據和領域知識商業價值,及運用LLM解決更複雜的業務問題,如強化電商平台推薦系統、提升供應鏈可見度等。

 

四、 Graph RAG應用案例解析

Graph RAG技術目前較常被應用在AI Agent客服機器人,包含服務外部客戶和內部員工。以商業軟體大廠SAP為例,其於2023年所推出AI Agent服務「Joule」,便是以SAP知識圖譜作為問答結構基礎。SAP知識圖譜的資料源涵蓋來自SAP核心產品模組和第三方系統之大量業務數據,約有45萬個核心業務數據表格、8萬個數據分析圖表和730萬個字詞等,讓使用者可以直接在SAP商業平台上解決各種複雜的業務問題。如:當業務想知道台灣各地的產品銷售狀況,Joule可以識別表現不佳的區域,讓業務即時掌握銷售業績狀況;製造商被通知可能會缺貨,想知道供應鏈的現況,Joule會自動連接到供應鏈系統及其他和供應鏈問題有關的資料集,並提供可能的替代方案,讓製造商可快速審查決策等。

SAP AI Agent(Joule)結合Graph RAG的運作方式如下圖4,當SAP使用者向Joule提出查詢需求或問題時,Joule會先將問題進行語義分析,再利用是先定義好的語義關係生成Query,傳送到SAP知識圖譜提取出與問題相關的背景知識和數據,並經由LLM生成答案後回覆給使用者,答案內容更全面、具準確性。

 

資料來源:SAP、MIC,資策會MIC ITIS研究團隊整理(2024/11)。

圖4  SAP AI Agent結合Graph RAG之應用

 

此外,SAP也在SAP Integration Suite和SAP Business Technology Platform開發平台,新增Graph RAG技術框架支援,讓客戶也能在該平台上自行開發其他更符合自身需求的LLM-Based應用程式或AI Agent客服/員工助理,如:開發一個ESG Agent可透過LLM技術來檢測ESG報告書中是否有供應商杜撰的虛假內容,防範廠商漂綠行為(greenwashing)。

微軟於2024年進一步推出「Agentic-GraphRAG」開源框架,它是一種透過函數調用多代理系統(multi-agent systems)和圖形資料庫檢索(Graph RAG)的程式碼集成。微軟將GraphRAG整合至AutoGen(可構建多代理協作的開源框架)、Ollama(用來地端設備運行LLM的開源工具)和Chainlit(用於加速生成式 AI 應用開發的工具平台)等技術工具,建構出一個可支援多代理並驅動地端LLM應用的系統(multi-agent systems)。此系統能在地端環境下執行數據處理與情境回應,無須連網即可完成複雜的互動需求,可避免連網帶來的隱私風險和費用。

 

資料來源:Microsoft、Github、MIC,資策會MIC ITIS研究團隊整理(2024/11)。

圖5 微軟Agentic-GraphRAG技術框架

 

五、 結論

Graph RAG雖然可補強傳統RAG未具備的深層語義和上下文理解能力,但知識圖譜的構建是一個高成本和高技術門檻的工作,需要透過專業語義分析工具來進行。即使現在可利用LLM來輔助,但對應模型所耗用的token費用不容小覷,如:SAP分享其透過GPT-4.0建置知識圖譜的經驗,提到每輸入2,200的英文字詞成本約0.46-0.48美元。此外,知識圖譜也需要定期更新來確保LLM的回應品質,而圖譜的更新過程亦相當耗時又複雜。整體而言,現階段Graph RAG的導入和維護成本比傳統RAG高,是多數企業短期內仍採用傳統RAG之主因,因此Graph RAG在資料更新機制和建置成本方面,未來仍有很大的優化空間。

上一篇從檢索到滲透—AI攻擊利用RA...
下一篇全球鎳金屬生產布局與應用趨勢觀...
熱門點閱
推薦閱讀
推薦新聞

若有任何問題,可使用下方檢索互動介面找解答,或是寫信到客服信箱。

itismembers@iii.org.tw

星期一~五
9:00-12:30/13:30-18:00