前言
在上一篇文章中,我們學會了如何在自己的電腦上使用 TAIDE。這次,我們將透過 Anything LLM,簡單地把你的所有資料當作燃料,啟動 AI 的力量。
本次教學建立在上一篇的基礎之上,如果你還沒跟上,可以參考 AI 焦慮?怕被 AI 淘汰?手把手教你在筆電上使用 TAIDE!(Part 1. LM-Studio)。
相關工具介紹
在開始教學之前,讓我們先了解一下會用到的工具:
- 官方模型 TAIDE-LX-7B-Chat (https://huggingface.co/taide/TAIDE-LX-7B-Chat)
- TAIDE-LX-7B-Chat-GGUF
- 使用 TAIDE 之前必須了解 TAIDE 的使用者規範
- LM Studio: 一個用於開發、微調和部署大型語言模型的平台。
- Anything LLM: 一個強大的工具,可將你的所有資料與大型語言模型連接,實現 RAG (Retrieval-Augmented Generation)。
Anything LLM 操作指南
初始化設置
歡迎介面
順利啟動 Anything LLM 後,你會看到如下的歡迎介面:
後端選擇
本教學採用 LM Studio,故選擇 LM Studio 繼續。
後端設定
主要有三個設置選項:
- 伺服器地址:
http://127.0.0.1:1234/v1
(即上一篇 LM Studio Playground 設定的伺服器)
Embedding 設定
Embedding 是為了建立向量資料庫 (Vector Database) 的編碼工具,能夠以提高搜尋效率和精準度的方式運作。
這裡我們選用 AnythingLLM Embedding
,如果你有其他偏好的 Embedding model,也可以參考如何建置 Embedding Server。
向量資料庫 (Vector Database) 選擇
我們選用 LanceDB
,因為它可以在本機零麻煩地設定一個 Vector Database。
確認設定
在確認頁面,我們可以看到分別選擇了:
- LMStudio 作為大型語言模型的伺服器
- AnythingLLM Embedder 作為詞向量的引擎
- LanceDB 則是向量資料庫,提供比傳統資料庫更高精度的搜尋結果
官方調查問卷
你可以根據自己的意願填寫官方調查問卷,不願意填寫的話可以按 Skip Survey
。
個人工作區操作
建立個人工作空間 (Your Workspace)
這裡可以建立你個人的工作空間,並為其命名。我以 資訊工程學系
為例,你可以根據自己的工作、科系、專題建立不同的工作區。
工作區介面
建立好工作區後,你就可以在此與語言模型直接對話。
你可以在右側點擊工作區名稱,開啟新的聊天階段 (Chat Session)。
聊天功能區介紹
- 綠色區域: 聊天管理區域
- 藍色括弧: 在本工作區建立新的聊天
- +New Workspace: 建立新的工作區
- 粉色區域: 上傳文件 (RAG 的核心區域)
聊天示範
在沒有提供任何文件的情況下,與 AI 對話的效果如下:
-> 在什麼情況下會需要一個機器人像我這樣的來完成這項任務呢?
我沒有刻意修改或引導他說話,結果他說出如此深奧的話語,實在太有趣了! (LOL)
RAG 實戰
還記得剛剛的粉紅色區域嗎?這裡就是 RAG 的魔法展現之處。
上傳檔案或網頁
直接將檔案拖入左下方的工作區塊(綠色勾勾的 taide.html),就可以上傳檔案。接著勾選左上方的 taide.html (橘白色圓圈),就會出現 “Move to Workspace” 的按鈕,點擊它就可以準備將資料移入 Vector Database。
將資料存檔
如果你的畫面如下所示,就代表你即將把上傳的資料轉成詞嵌入並加入到向量資料庫中。
你只需要再按下 Save and Embed 就大功告成了!
示範 Demo
接下來,我們以 TAIDE 官方資料測試它現在知道什麼!
User: TAIDE 有什麼最新動態?
資料連結
如果你有注意到圖中有個 taide.tw/index 的藍色連結,那就是你在這次聊天中用到的資料來源,讓 LLM 能夠給出正確的答案。
儘管提供的資料有限,但 LLM 仍然能夠基於這些資料給出不錯的回答,這正是 RAG 的威力所在。
相關連結資料
如果你有注意到上圖中有個 taide.tw/index 的藍色連結,那就是你在這次聊天中用到的資料來源,讓 LLM 能夠給出正確的答案。
這就是 RAG 的威力所在,正確使用它可以大大節省找資料、看資料甚至是總結資料的時間。
總結
透過 Anything LLM 和 LM Studio 的結合,我們可以輕鬆實現 RAG,讓 AI 直接從我們提供的資料中學習和回答問題。這不僅提高了 AI 回答的精準度,也為我們節省了大量尋找和整理資料的時間。
希望這個教學能幫助你掌握 RAG 的基本操作,讓 AI 成為你學習和工作中得力的助手。在下一篇文章中,我們將深入探討更多 RAG 的進階應用,敬請期待吧!
至於 TAIDE 基於 LLaMA 2 好不好用,就取決於各位客官們了。最近我們也可以期待 TAIDE 基於 LLaMA 3 釋出新的模型吧。無論如何,TAIDE 作為一個本地化的中文大語言模型,在推動 AI 民主化無疑邁出了重要的一步。讓我們拭目以待,見證 TAIDE 和其他開源語言模型的蓬勃發展!