wap織夢(mèng)手機(jī)網(wǎng)站網(wǎng)站建設(shè)模板ppt模板
鶴壁市浩天電氣有限公司
2026/01/24 05:21:27
wap織夢(mèng)手機(jī)網(wǎng)站,網(wǎng)站建設(shè)模板ppt模板,百度app官方下載安裝到手機(jī),discuz和wordpress并發(fā)近年來(lái)#xff0c;大模型的能力讓人驚嘆#xff0c;但它也有致命弱點(diǎn)#xff1a;它并不了解你的私有知識(shí)庫(kù)#xff0c;甚至?xí)槐菊?jīng)地胡說(shuō)八道#xff08;幻覺(jué)#xff09;。
如何讓它像一個(gè)真正的“內(nèi)部知識(shí)專(zhuān)家”呢#xff1f;答案就是——RAG#xff08;Retrieval-…近年來(lái)大模型的能力讓人驚嘆但它也有致命弱點(diǎn)它并不了解你的私有知識(shí)庫(kù)甚至?xí)槐菊?jīng)地胡說(shuō)八道幻覺(jué)。如何讓它像一個(gè)真正的“內(nèi)部知識(shí)專(zhuān)家”呢答案就是——RAGRetrieval-Augmented Generation檢索增強(qiáng)生成。本文通過(guò)一個(gè)貫穿全文的例子從原理到實(shí)現(xiàn)、從流程圖到代碼實(shí)戰(zhàn)帶你真正理解 RAG并能立即應(yīng)用于你的項(xiàng)目中。一、為什么需要RAG用智能客服舉例假設(shè)你在為你們公司構(gòu)建一個(gè)智能客服系統(tǒng)用戶可能會(huì)問(wèn)下面這個(gè) “TwinFun雙人游戲機(jī)旗艦XPro” 是我瞎編的并不真實(shí)存在“TwinFun雙人游戲機(jī)旗艦XPro的保修政策是什么”你把問(wèn)題丟給大語(yǔ)言模型如 GPT / Gemini / 千問(wèn) / 豆包 / DeepSeek 等它會(huì)信心滿滿地回答但……答案不一定是真的。因?yàn)長(zhǎng)LM 并不知道你公司的產(chǎn)品文檔它訓(xùn)練數(shù)據(jù)有限且不包含你的私有內(nèi)容沒(méi)查到的時(shí)候它會(huì)“自動(dòng)編”也就是根據(jù)概率預(yù)測(cè)這就是典型的幻覺(jué)Hallucination。下圖是我在某大語(yǔ)言模型平臺(tái)提問(wèn)的結(jié)果該大模型訓(xùn)練的時(shí)候并沒(méi)有用到 “TwinFun雙人游戲機(jī)旗艦XPro” 的相關(guān)數(shù)據(jù)所以它的回答都是基于概率猜的不一定是準(zhǔn)確的二、RAG 是什么用一句話說(shuō)明白R(shí)AG 全稱為檢索增強(qiáng)生成Retrieval Augmented Generation 即RAG Retrieval檢索 Augmented Generation增強(qiáng)生成核心思想就是用戶提問(wèn)問(wèn)題時(shí)先通過(guò)檢索私有知識(shí)庫(kù)獲取相關(guān)的知識(shí)將其融入Prompt再讓大模型參考相應(yīng)的知識(shí)生成合理的答案先【檢索】再【生成】所以叫【檢索增強(qiáng)生成】。如果你還不明白用一句大白話說(shuō)就是讓大模型在生成答案之前先查資料再回答不瞎編只說(shuō)靠譜的。之前看到過(guò)一張圖比較形象這里貼一下三、RAG的流程落地前一定梳理清楚RAG的流程大致包含兩個(gè)階段索引構(gòu)建數(shù)據(jù)生成。1. 索引構(gòu)建索引構(gòu)建階段需要做的事情有文檔整理通過(guò)任何方式文檔、網(wǎng)頁(yè)、數(shù)據(jù)庫(kù)等多種來(lái)源獲取、收集讓大模型參考的專(zhuān)業(yè)知識(shí)的文檔通常為我們私有的知識(shí)庫(kù)、公司內(nèi)部的產(chǎn)品文檔等數(shù)據(jù)切片將長(zhǎng)文檔按照語(yǔ)義切分成完整的小段如段落或固定大小的文本塊以適配模型的上下文窗口向量化使用嵌入模型將每個(gè)文本塊轉(zhuǎn)換為數(shù)學(xué)向量即“嵌入”embedding語(yǔ)義相似的文本其向量在空間中也更接近存儲(chǔ)將原始文本塊和對(duì)應(yīng)的向量存入向量數(shù)據(jù)庫(kù)如Chroma, Milvus, Pinecone等以便后續(xù)快速檢索2. 數(shù)據(jù)生成數(shù)據(jù)生成階段的流程就是上面第2章節(jié)末尾那張圖中所描述的用戶提問(wèn)使用相同的嵌入模型把用戶問(wèn)題轉(zhuǎn)化為查詢向量相似度檢索在向量數(shù)據(jù)庫(kù)中查找與查詢向量最相似的K個(gè)文本塊重排序可選有時(shí)會(huì)使用更精細(xì)的模型對(duì)初步檢索結(jié)果進(jìn)行重排序以選出最相關(guān)的片段增強(qiáng)將前面步驟檢索到的與問(wèn)題語(yǔ)義相近的文本和原問(wèn)題打包在一起發(fā)送給大模型。通常會(huì)用一個(gè)包含系統(tǒng)指令、參考資料、原始問(wèn)題的提示詞模板比如你是一位知識(shí)助手請(qǐng)根據(jù)用戶的問(wèn)題和參考資料生成準(zhǔn)確的回答用戶問(wèn)題{query}參考資料{context}請(qǐng)嚴(yán)格基于上述內(nèi)容作答不要編造信息如果資料中沒(méi)有答案請(qǐng)回答“文檔中未找到相關(guān)信息”。生成大語(yǔ)言模型基于構(gòu)建好的增強(qiáng)提示生成最終回答。模型在生成時(shí)會(huì)嚴(yán)格依據(jù)提供的上下文信息而非僅依賴其內(nèi)部參數(shù)化知識(shí)。大幅減少了“胡編亂造”并提升了回答的專(zhuān)業(yè)性。實(shí)際落地的時(shí)候也可以要求模型在回答中引用來(lái)源如文檔塊ID提高可信度。評(píng)估與優(yōu)化可選在實(shí)際操作中為確保RAG系統(tǒng)高質(zhì)量運(yùn)行需要持續(xù)的評(píng)估與優(yōu)化。具體評(píng)估指標(biāo)可以參考檢索質(zhì)量檢索到的文本是否相關(guān)、答案相關(guān)性回答是否解決問(wèn)題、事實(shí)準(zhǔn)確性是否與給定的上下文一致等。具體優(yōu)化手段有查詢優(yōu)化對(duì)用戶原始查詢進(jìn)行重寫(xiě)或擴(kuò)展、分塊策略優(yōu)化調(diào)整文本塊的大小和重疊度避免信息被割裂、多路檢索與融合結(jié)合關(guān)鍵詞檢索如BM25與向量檢索等。3. 以智能客服舉例說(shuō)明第1章節(jié)末尾的例子我向大模型提問(wèn)的“TwinFun雙人游戲機(jī)旗艦XPro的保修政策是什么”這個(gè)問(wèn)題它的回答就是胡編的。假如TwinFun雙人游戲機(jī)旗艦XPro真是我公司的產(chǎn)品我想通過(guò)RAG實(shí)現(xiàn)智能客服就需要經(jīng)歷以下步驟1文檔整理收集公司所有需要智能客服回答的知識(shí)比如《TwinFun商貿(mào)有限公司雙十一活動(dòng)優(yōu)惠政策》、《TwinFun雙人游戲機(jī)旗艦XPro的使用說(shuō)明》、《TwinFun雙人游戲機(jī)旗艦XPro的保修政策》等各類(lèi)文檔2數(shù)據(jù)切片把這些文檔的內(nèi)容切分成多個(gè)語(yǔ)義完整的小段比如我把每個(gè)文檔的內(nèi)容按照段落進(jìn)行切片3向量化把切片結(jié)果的每個(gè)小段都通過(guò)向量模型轉(zhuǎn)化為高維向量每個(gè)高維向量可以用一個(gè)數(shù)組來(lái)表示4存儲(chǔ)把文本和對(duì)應(yīng)的向量一塊存入向量數(shù)據(jù)庫(kù)5檢索用戶提問(wèn)的時(shí)候把問(wèn)題通過(guò)相同的向量模型轉(zhuǎn)化為一個(gè)高維向量通過(guò)這個(gè)高維向量在數(shù)據(jù)庫(kù)中查詢與之語(yǔ)義相近的前N個(gè)文本塊。6重排然后對(duì)這N個(gè)文本塊進(jìn)一步篩選排序即通過(guò)cross-encoder模型計(jì)算這N個(gè)文本塊與用戶問(wèn)題的相關(guān)性分?jǐn)?shù)分?jǐn)?shù)越高語(yǔ)義越接近再取分?jǐn)?shù)較高的幾個(gè)文本塊。7增強(qiáng)、生成把分?jǐn)?shù)較高的文本塊和原問(wèn)題打包發(fā)送給大語(yǔ)言模型進(jìn)行提問(wèn)最終大語(yǔ)言模型生成的回答就是我們想要的。RAG 實(shí)戰(zhàn)從文檔到最終答案含可運(yùn)行 Python光說(shuō)不練假把式下面我們從零開(kāi)始來(lái)實(shí)現(xiàn)一套完整的RAG來(lái)幫助你更進(jìn)一步理解RAG的運(yùn)行流程并在實(shí)際業(yè)務(wù)中落地。1. 前期準(zhǔn)備文檔這里我準(zhǔn)備了三個(gè)文檔來(lái)進(jìn)行測(cè)試TwinFun商貿(mào)有限公司雙十一活動(dòng)優(yōu)惠政策.txt、 TwinFun雙人游戲機(jī)旗艦XPro的使用說(shuō)明.txt、 TwinFun雙人游戲機(jī)旗艦XPro的保修政策.txt。這幾個(gè)文件已經(jīng)上傳到Githubhttps://github.com/DannyHoo/PublicRepository/tree/master/AI/RAG/rag_intelligent_customer_service訪問(wèn)Github不方便的朋友也可以在公眾號(hào)“丹尼編程”中回復(fù)“rag”關(guān)鍵字進(jìn)行下載。下載的文件夾中還有一個(gè)名為“RAG實(shí)現(xiàn)智能客服.ipynb”的jupyter notebook的文件文件中包含全部代碼和執(zhí)行結(jié)果。Python環(huán)境和依賴Python版本3.12開(kāi)發(fā)環(huán)境PyCharm或者Jupyter安裝依賴的庫(kù)uv pip install sentence-transformers chromadb google-genai ollamasentence_transformers是一個(gè)基于 Hugging Face Transformers 的 Python 庫(kù)專(zhuān)門(mén)用于將文本尤其是句子或段落轉(zhuǎn)換為高質(zhì)量的語(yǔ)義向量embeddings。這些向量可以用于衡量文本之間的語(yǔ)義相似度常用于自然語(yǔ)言處理NLP的任務(wù)。這里我們主要用于加載embedding模型和cross-encoder模型。chromadbchromadb是一款常用的輕量級(jí)向量數(shù)據(jù)庫(kù)支持內(nèi)存/持久化模式。google-genaiGoogle的AI SDK用于調(diào)用Gemini模型如gemini-2.5-flash。舊版本的庫(kù)為google-generativeai2025年12月之后推薦google-genai。官方建議https://ai.google.dev/gemini-api/docs/libraries?hlzh-cnollama用于通過(guò)Ollama調(diào)用本地運(yùn)行的大模型。2. 代碼實(shí)現(xiàn)2.1 數(shù)據(jù)切片對(duì)文檔的內(nèi)容按照段落的維度進(jìn)行切片from typing import List # 對(duì)單個(gè)文檔按段落切片非空行 def split_doc_into_chunks(doc_file: str) - List[str]: with open(doc_file, r, encodingutf-8) as file: content file.read() # 按換行分割并過(guò)濾掉空白段落 return [chunk.strip() for chunk in content.split(
) if chunk.strip()] # 處理多個(gè)文檔并合并所有段落 def split_multiple_docs_into_chunks(doc_files: List[str]) - List[str]: all_chunks [] for doc_file in doc_files: print(f正在處理文檔: {doc_file}) chunks split_doc_into_chunks(doc_file) all_chunks.extend(chunks) # 合并到總列表 return all_chunks # 為所有文檔分片并保存到chunks變量中 doc_paths [ ./docs/TwinFun商貿(mào)有限公司雙十一活動(dòng)優(yōu)惠政策.txt, ./docs/TwinFun雙人游戲機(jī)旗艦XPro的使用說(shuō)明.txt, ./docs/TwinFun雙人游戲機(jī)旗艦XPro的保修政策.txt ] chunks split_multiple_docs_into_chunks(doc_paths) for i, chunk in enumerate(chunks): print(f[{i1}] {chunk}
)運(yùn)行之后得到了25個(gè)文本片段并保存到了chunks變量中[1] 一年一度的雙十一消費(fèi)狂歡已然開(kāi)啟TwinFun商貿(mào)有限公司秉持“感恩回饋?zhàn)尷M(fèi)者”的核心理念率先推出面向全體新客戶的專(zhuān)屬優(yōu)惠政策活動(dòng)期間2025年10月24日-2025年11月11日首次注冊(cè)成為T(mén)winFun會(huì)員的消費(fèi)者無(wú)需滿足任何消費(fèi)門(mén)檻可直接在會(huì)員中心領(lǐng)取一張價(jià)值50元的無(wú)門(mén)檻現(xiàn)金券券有效期與活動(dòng)周期一致可用于平臺(tái)內(nèi)除定制家具、進(jìn)口奢侈品外的所有品類(lèi)消費(fèi)下單時(shí)直接抵扣。[2] 針對(duì)長(zhǎng)期支持TwinFun的老客戶公司特別定制了體現(xiàn)專(zhuān)屬權(quán)益的優(yōu)惠政策以2025年1月1日-2025年10月23日為統(tǒng)計(jì)周期依托CRM系統(tǒng)分析客戶消費(fèi)數(shù)據(jù)消費(fèi)金額1萬(wàn)元及以上的高活躍客戶直接贈(zèng)送“1000減300”“2000減700”“5000減2000”滿減券各1張消費(fèi)金額3000元-9999元的潛力客戶贈(zèng)送“500減100”滿減券2張15%復(fù)購(gòu)補(bǔ)貼券單筆最高補(bǔ)貼200元消費(fèi)金額3000元以下的復(fù)蘇客戶贈(zèng)送“300減50”滿減券3張所有券種2025年11月1日-2025年11月11日可用。[3] 為簡(jiǎn)化購(gòu)物流程讓消費(fèi)者直觀享受實(shí)惠TwinFun推出“官方直降一件也打折”的優(yōu)惠政策10月24日0點(diǎn)起平臺(tái)內(nèi)1200款熱門(mén)商品直接標(biāo)注雙十一折扣價(jià)無(wú)需湊單、計(jì)算滿減其中冰箱、洗衣機(jī)這幾類(lèi)大家電全場(chǎng)5折空調(diào)、熱水器全場(chǎng)5.5折潮流服飾、鞋帽箱包類(lèi)商品直降30%部分?jǐn)啻a款式直降50%美妝護(hù)膚類(lèi)商品直降20%且支持疊加品牌優(yōu)惠券折扣信息在商品詳情頁(yè)實(shí)時(shí)更新。[4] 聚焦家庭消費(fèi)場(chǎng)景TwinFun精心設(shè)計(jì)了“套餐組合更省錢(qián)”的優(yōu)惠政策針對(duì)家電、家居、母嬰三大品類(lèi)推出8款主題套餐“廚房煥新套餐”包含指定品牌煙機(jī)原價(jià)2999元、灶具原價(jià)1599元、熱水器原價(jià)1899元組合價(jià)4997元比單獨(dú)購(gòu)買(mǎi)立省1500元“親子成長(zhǎng)套餐”包含1-3歲兒童羽絨服2件、益智玩具3套、嬰幼兒洗護(hù)用品4件套餐價(jià)899元較單品總價(jià)直降40%所有套餐支持拆分發(fā)貨下單后48小時(shí)內(nèi)安排出庫(kù)。此處省略……2.2 向量化把文檔的所有的分片都轉(zhuǎn)化為向量這里就需要用到嵌入模型Embedding Model嵌入模型有很多種HuggingFace上列舉了各個(gè)模型的信息 https://huggingface.co/spaces/mteb/leaderboard它的核心作用是將文本、圖片、音頻等非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為一串能被計(jì)算機(jī)理解的 “數(shù)值向量”向量維度通常為幾百到幾千且向量的 “距離” 能反映數(shù)據(jù)的 “語(yǔ)義相似度” 比如“貓” 和 “狗” 的向量距離會(huì)比 “貓” 和 “汽車(chē)” 更近。這里我們用shibing624/text2vec-base-chinese這個(gè)嵌入模型來(lái)進(jìn)行向量轉(zhuǎn)化from sentence_transformers import SentenceTransformer # 創(chuàng)建一個(gè)embedding模型首次加載速度可能較慢需要從Hugging Face上拉取模型 embedding_model SentenceTransformer(shibing624/text2vec-base-chinese) # 定義一個(gè)方法embed_chunk用于將某一段文本轉(zhuǎn)化為對(duì)應(yīng)的多維向量返回這段文字所對(duì)應(yīng)的多維向量的數(shù)組 def embed_chunk(chunk: str) - List[float]: embedding embedding_model.encode(chunk) return embedding; # 把文檔的所有分片結(jié)果chunks依次轉(zhuǎn)化為向量并存到embeddings變量中 embeddings[embed_chunk(chunk) for chunk in chunks] print(f所有片段轉(zhuǎn)化為向量數(shù)組后的數(shù)組數(shù)量{len(embeddings)}) print(f第1個(gè)向量的維度{len(embeddings[0])}) print(f第1個(gè)向量的內(nèi)容{embeddings[0]})運(yùn)行之后可以看到這25段文本被成功轉(zhuǎn)化為25個(gè)向量每個(gè)向量的維度為768向量的內(nèi)容就是一個(gè)長(zhǎng)度為768的數(shù)組所有片段轉(zhuǎn)化為向量數(shù)組后的數(shù)組數(shù)量25第1個(gè)向量的維度768第1個(gè)向量的內(nèi)容[-2.01269060e-01 8.80607814e-02 -2.36491695e-01 3.39772664e-023.34142670e-02 -6.69817388e-01 -4.83846664e-03 7.44304180e-011.19527370e-01 3.21651660e-02 1.63980484e-01 6.63809538e-01此處省略……-3.94228727e-01 4.92302388e-01 -4.49091822e-01 -5.07175863e-01]2.3 數(shù)據(jù)分片把文本和對(duì)應(yīng)的向量存入向量數(shù)據(jù)庫(kù)import chromadb # 創(chuàng)建一個(gè)文件型的數(shù)據(jù)庫(kù)也可以通過(guò)chromadb.EphemeralClient()創(chuàng)建一個(gè)內(nèi)存型的數(shù)據(jù)庫(kù)腳本運(yùn)行結(jié)束之后會(huì)清除數(shù)據(jù) chromadb_clientchromadb.PersistentClient(./db/chroma.db) # chromadb表 chromadb_collection chromadb_client.get_or_create_collection(namedefault) # 把文本及對(duì)應(yīng)的向量保存到向量數(shù)據(jù)庫(kù)也可以根據(jù)collection的upsert方法按照id更新 def save_embeddings(chunks:List[str], embeddings:List[List[float]]) - None: ids [str(i) for i in range(len(chunks))] chromadb_collection.add( documentschunks, embeddingsembeddings, idsids ) # 調(diào)用方法將文本列表及對(duì)應(yīng)的向量列表保存到向量數(shù)據(jù)庫(kù) save_embeddings(chunks,embeddings)初次執(zhí)行完成后會(huì)在db/chroma.db目錄下產(chǎn)生數(shù)據(jù)庫(kù)文件文本片段和對(duì)應(yīng)的向量就保存在這里2.4 檢索當(dāng)用戶提問(wèn)時(shí)需要先把用戶的問(wèn)題轉(zhuǎn)化為一個(gè)向量暫且稱之為“檢索向量”再在向量數(shù)據(jù)庫(kù)中查詢與之語(yǔ)義相近的前k個(gè)向量及文本片段# 定義一個(gè)方法用于檢索指定文本在向量數(shù)據(jù)庫(kù)中語(yǔ)義相近的前k個(gè)片段 def retrieve(query:str,top_k:int) - List[str]: # 把查詢文本也就是用戶提問(wèn)的問(wèn)題轉(zhuǎn)化為檢索向量 query_embedingembed_chunk(query) # 根據(jù)檢索向量在數(shù)據(jù)庫(kù)中查詢語(yǔ)義相近的前k個(gè)片段 results chromadb_collection.query( query_embeddings[query_embeding], n_resultstop_k ) return results[documents][0] #questionTwinFun XPro手柄鏈接不上是什么原因 question哪些渠道購(gòu)買(mǎi)的TwinFun XPro可享受官方保修主機(jī)和無(wú)線手柄的免費(fèi)保修期限分別是多久 retrieve_chunksretrieve(question,5) print(f從向量數(shù)據(jù)庫(kù)中查詢到的與問(wèn)題【{question}】語(yǔ)義相近的前n個(gè)匹配的結(jié)果
) for i, result in enumerate(retrieve_chunks): print(f{i1}. {result}
)執(zhí)行后會(huì)發(fā)現(xiàn)查詢的結(jié)果的確都是和問(wèn)題相關(guān)度高的片段從向量數(shù)據(jù)庫(kù)中查詢到的與問(wèn)題【哪些渠道購(gòu)買(mǎi)的TwinFun XPro可享受官方保修主機(jī)和無(wú)線手柄的免費(fèi)保修期限分別是多久】語(yǔ)義相近的前n個(gè)匹配的結(jié)果保修范圍與期限界定本保修政策僅適用于通過(guò)TwinFun品牌官方商城、線下授權(quán)門(mén)店及天貓、京東官方旗艦店購(gòu)買(mǎi)的XPro正品設(shè)備非授權(quán)渠道購(gòu)買(mǎi)的設(shè)備不享受官方保修服務(wù)。核心部件保修期限差異明確主機(jī)含主板、芯片、散熱模塊享受自購(gòu)買(mǎi)日起2年免費(fèi)保修無(wú)線手柄、雙人搖桿控臺(tái)等標(biāo)配功能性配件保修1年HDMI線、電源線、充電線等易損耗附件保修期限為3個(gè)月。保修起始日期以購(gòu)機(jī)發(fā)票開(kāi)具日期為準(zhǔn)無(wú)發(fā)票時(shí)則以設(shè)備首次激活日期或電商平臺(tái)訂單生成日期中最早者計(jì)算且僅在中國(guó)內(nèi)地不含港澳臺(tái)區(qū)域有效。維修服務(wù)保障與規(guī)范設(shè)備經(jīng)審核符合保修條件后采取“雙向免郵”服務(wù)模式用戶寄回故障設(shè)備的運(yùn)費(fèi)由品牌方承擔(dān)需選擇順豐快遞到付維修完成后寄回的運(yùn)費(fèi)同樣由官方承擔(dān)。維修周期通常為5-7個(gè)工作日若需更換核心部件如主機(jī)主板客服會(huì)提前通過(guò)短信或電話與用戶確認(rèn)部件信息及維修時(shí)長(zhǎng)征得同意后方可操作。維修后的設(shè)備將享受“雙重保障”若原保修未到期延續(xù)剩余保修時(shí)間若原保修已到期自維修完成日起額外提供90天保修服務(wù)維修記錄可在官方客服中心查詢。系統(tǒng)更新與維護(hù)在線更新可在“系統(tǒng)設(shè)置-系統(tǒng)更新”中手動(dòng)觸發(fā)系統(tǒng)會(huì)自動(dòng)檢測(cè)最新固件更新包大小約500MB-1GB建議在WiFi穩(wěn)定環(huán)境下進(jìn)行更新過(guò)程中主機(jī)將自動(dòng)重啟。若在線更新失敗可采用USB手動(dòng)更新在電腦上登錄TwinFun官網(wǎng)下載最新固件將其保存至FAT32格式的USB硬盤(pán)需新建“XPro”文件夾子文件夾命名“UPDATE”固件文件重命名為“XPROUPDATE.PUP”將USB插入主機(jī)USB接口按住主機(jī)背面復(fù)位鍵的同時(shí)開(kāi)機(jī)待指示燈呈橙色閃爍時(shí)松開(kāi)選擇“USB更新”即可。日常維護(hù)需每月用壓縮空氣清理主機(jī)散熱孔灰塵避免積塵導(dǎo)致過(guò)熱。延保服務(wù)與增值保障為延長(zhǎng)設(shè)備保障周期用戶可在原保修到期前30天內(nèi)通過(guò)官方APP或客服熱線購(gòu)買(mǎi)延保服務(wù)。延保費(fèi)用明確定價(jià)主機(jī)單獨(dú)延保1年費(fèi)用199元延保2年費(fèi)用349元全套設(shè)備主機(jī)所有標(biāo)配配件延保1年費(fèi)用299元延保2年費(fèi)用549元。延保服務(wù)與原保修范圍一致購(gòu)買(mǎi)后即時(shí)生效并與原保修無(wú)縫銜接。此外可額外購(gòu)買(mǎi)“意外保障服務(wù)”399元/年覆蓋人為摔落、液體潑濺、意外擠壓等非人為故障購(gòu)買(mǎi)后需在48小時(shí)內(nèi)完成設(shè)備外觀及功能驗(yàn)機(jī)備案未備案則保障無(wú)效。開(kāi)箱與部件識(shí)別TwinFun XPro標(biāo)配含1臺(tái)主機(jī)、2個(gè)無(wú)線手柄、1個(gè)雙人搖桿控臺(tái)、1根HDMI 2.1高清線、1根主機(jī)電源線、1根搖桿控臺(tái)Type-C充電線及1份快速指南。主機(jī)正面為電源鍵帶指示燈和USB 3.0接口背面依次分布HDMI輸出口、電源接口、網(wǎng)線接口及復(fù)位鍵搖桿控臺(tái)頂部設(shè)1P/2P操作鍵、暫停鍵底部有6個(gè)防滑吸盤(pán)手柄則配備方向鍵、動(dòng)作鍵A/B/X/Y及配對(duì)鍵。2.5 重排增強(qiáng)在實(shí)際場(chǎng)景中有時(shí)候根據(jù)向量相似度查詢到的片段可能并不是很準(zhǔn)確因此可以考慮在檢索的時(shí)候多查一些比如正常查3條就夠了但查5條再進(jìn)一步通過(guò)cross-encoder模型對(duì)檢索到的片段進(jìn)行深度匹配和排序然后取分?jǐn)?shù)較高的前3條from sentence_transformers import CrossEncoder # 定義一個(gè)排序方法通過(guò)cross-encoder模型對(duì)用戶問(wèn)題和多個(gè)片段之間的相似度打分、排序 def rerank(query:str, retrieve_chunks: List[str], top_k:int) - List[str]: # 創(chuàng)建cross_encoder模型 cross_encoderCrossEncoder(cross-encoder/mmarco-mMiniLMv2-L12-H384-v1) # 用戶問(wèn)題相似片段 列表 pairs[(query,chunk) for chunk in retrieve_chunks] # 用戶問(wèn)題和每個(gè)相似片段的重排分?jǐn)?shù) scorescross_encoder.predict(pairs) # 用戶問(wèn)題每個(gè)相似片段 重排分?jǐn)?shù)的列表 chunk_with_score_list[ (chunk,score) for chunk,score in zip(retrieve_chunks,scores) ] # 按照分?jǐn)?shù)倒序排序 chunk_with_score_list.sort(keylambda pair:pair[1],reverseTrue) # 取top k return [chunk for chunk,_ in chunk_with_score_list][:top_k] reranked_chunksrerank(question,retrieve_chunks,3) print(f對(duì)匹配結(jié)果增強(qiáng)重排后與問(wèn)題【{question}】語(yǔ)義相近的前n個(gè)匹配的結(jié)果
) for i,chunk in enumerate(reranked_chunks): print(f{i1}. {chunk}
)這里取重排后分?jǐn)?shù)較高的前3條片段看效果是非常符合預(yù)期的對(duì)匹配結(jié)果增強(qiáng)重排后與問(wèn)題【哪些渠道購(gòu)買(mǎi)的TwinFun XPro可享受官方保修主機(jī)和無(wú)線手柄的免費(fèi)保修期限分別是多久】語(yǔ)義相近的前n個(gè)匹配的結(jié)果保修范圍與期限界定本保修政策僅適用于通過(guò)TwinFun品牌官方商城、線下授權(quán)門(mén)店及天貓、京東官方旗艦店購(gòu)買(mǎi)的XPro正品設(shè)備非授權(quán)渠道購(gòu)買(mǎi)的設(shè)備不享受官方保修服務(wù)。核心部件保修期限差異明確主機(jī)含主板、芯片、散熱模塊享受自購(gòu)買(mǎi)日起2年免費(fèi)保修無(wú)線手柄、雙人搖桿控臺(tái)等標(biāo)配功能性配件保修1年HDMI線、電源線、充電線等易損耗附件保修期限為3個(gè)月。保修起始日期以購(gòu)機(jī)發(fā)票開(kāi)具日期為準(zhǔn)無(wú)發(fā)票時(shí)則以設(shè)備首次激活日期或電商平臺(tái)訂單生成日期中最早者計(jì)算且僅在中國(guó)內(nèi)地不含港澳臺(tái)區(qū)域有效。延保服務(wù)與增值保障為延長(zhǎng)設(shè)備保障周期用戶可在原保修到期前30天內(nèi)通過(guò)官方APP或客服熱線購(gòu)買(mǎi)延保服務(wù)。延保費(fèi)用明確定價(jià)主機(jī)單獨(dú)延保1年費(fèi)用199元延保2年費(fèi)用349元全套設(shè)備主機(jī)所有標(biāo)配配件延保1年費(fèi)用299元延保2年費(fèi)用549元。延保服務(wù)與原保修范圍一致購(gòu)買(mǎi)后即時(shí)生效并與原保修無(wú)縫銜接。此外可額外購(gòu)買(mǎi)“意外保障服務(wù)”399元/年覆蓋人為摔落、液體潑濺、意外擠壓等非人為故障購(gòu)買(mǎi)后需在48小時(shí)內(nèi)完成設(shè)備外觀及功能驗(yàn)機(jī)備案未備案則保障無(wú)效。維修服務(wù)保障與規(guī)范設(shè)備經(jīng)審核符合保修條件后采取“雙向免郵”服務(wù)模式用戶寄回故障設(shè)備的運(yùn)費(fèi)由品牌方承擔(dān)需選擇順豐快遞到付維修完成后寄回的運(yùn)費(fèi)同樣由官方承擔(dān)。維修周期通常為5-7個(gè)工作日若需更換核心部件如主機(jī)主板客服會(huì)提前通過(guò)短信或電話與用戶確認(rèn)部件信息及維修時(shí)長(zhǎng)征得同意后方可操作。維修后的設(shè)備將享受“雙重保障”若原保修未到期延續(xù)剩余保修時(shí)間若原保修已到期自維修完成日起額外提供90天保修服務(wù)維修記錄可在官方客服中心查詢。2.6 生成生成階段我們可以依賴不同的大語(yǔ)言模型進(jìn)行生成。如果需要集成多個(gè)不同的大模型可以使用OneAPI等聚合API來(lái)實(shí)現(xiàn)。下面我們用兩種方式來(lái)舉例說(shuō)明通過(guò)Ollama調(diào)用本地運(yùn)行的大語(yǔ)言模型通過(guò)Ollama等方式在本地部署大語(yǔ)言模型如Llama、DeepSeek等、通過(guò)SDK調(diào)用三方大語(yǔ)言模型Gemini、ChatGPT等。通過(guò)Ollama調(diào)用本地大語(yǔ)言模型需要先在本地通過(guò)Ollama運(yùn)行deepseek-r1:1.5b這個(gè)模型# 通過(guò)Ollama的SDK調(diào)用本地大模型生成結(jié)果 # 本地要先通過(guò)Ollama運(yùn)行大模型 import ollama def generate(query:str,chunks:List[str] )-str: prompt f你是一位知識(shí)助手請(qǐng)嚴(yán)格根據(jù)用戶的問(wèn)題和參考資料生成準(zhǔn)確的回答。 用戶問(wèn)題: {query} 參考資料: {
.join(chunks)} 請(qǐng)嚴(yán)格基于上述內(nèi)容作答不要編造信息如果資料中沒(méi)有答案請(qǐng)回答“文檔中未找到相關(guān)信息”。 print(f{prompt}
---
) try: response ollama.chat( modeldeepseek-r1:1.5b, messages[{role: user, content: prompt}], ) return response[message][content] except Exception as e: print(fAPI調(diào)用失敗: {e}) return API調(diào)用失敗; # 生成測(cè)試 answer generate(question,reranked_chunks); print(answer)運(yùn)行結(jié)果如下你是一位知識(shí)助手請(qǐng)嚴(yán)格根據(jù)用戶的問(wèn)題和參考資料生成準(zhǔn)確的回答。用戶問(wèn)題: 哪些渠道購(gòu)買(mǎi)的TwinFun XPro可享受官方保修主機(jī)和無(wú)線手柄的免費(fèi)保修期限分別是多久參考資料: 保修范圍與期限界定本保修政策僅適用于通過(guò)TwinFun品牌官方商城、線下授權(quán)門(mén)店及天貓、京東官方旗艦店購(gòu)買(mǎi)的XPro正品設(shè)備非授權(quán)渠道購(gòu)買(mǎi)的設(shè)備不享受官方保修服務(wù)。核心部件保修期限差異明確主機(jī)含主板、芯片、散熱模塊享受自購(gòu)買(mǎi)日起2年免費(fèi)保修無(wú)線手柄、雙人搖桿控臺(tái)等標(biāo)配功能性配件保修1年HDMI線、電源線、充電線等易損耗附件保修期限為3個(gè)月。保修起始日期以購(gòu)機(jī)發(fā)票開(kāi)具日期為準(zhǔn)無(wú)發(fā)票時(shí)則以設(shè)備首次激活日期或電商平臺(tái)訂單生成日期中最早者計(jì)算且僅在中國(guó)內(nèi)地不含港澳臺(tái)區(qū)域有效。延保服務(wù)與增值保障為延長(zhǎng)設(shè)備保障周期用戶可在原保修到期前30天內(nèi)通過(guò)官方APP或客服熱線購(gòu)買(mǎi)延保服務(wù)。延保費(fèi)用明確定價(jià)主機(jī)單獨(dú)延保1年費(fèi)用199元延保2年費(fèi)用349元全套設(shè)備主機(jī)所有標(biāo)配配件延保1年費(fèi)用299元延保2年費(fèi)用549元。延保服務(wù)與原保修范圍一致購(gòu)買(mǎi)后即時(shí)生效并與原保修無(wú)縫銜接。此外可額外購(gòu)買(mǎi)“意外保障服務(wù)”399元/年覆蓋人為摔落、液體潑濺、意外擠壓等非人為故障購(gòu)買(mǎi)后需在48小時(shí)內(nèi)完成設(shè)備外觀及功能驗(yàn)機(jī)備案未備案則保障無(wú)效。維修服務(wù)保障與規(guī)范設(shè)備經(jīng)審核符合保修條件后采取“雙向免郵”服務(wù)模式用戶寄回故障設(shè)備的運(yùn)費(fèi)由品牌方承擔(dān)需選擇順豐快遞到付維修完成后寄回的運(yùn)費(fèi)同樣由官方承擔(dān)。維修周期通常為5-7個(gè)工作日若需更換核心部件如主機(jī)主板客服會(huì)提前通過(guò)短信或電話與用戶確認(rèn)部件信息及維修時(shí)長(zhǎng)征得同意后方可操作。維修后的設(shè)備將享受“雙重保障”若原保修未到期延續(xù)剩余保修時(shí)間若原保修已到期自維修完成日起額外提供90天保修服務(wù)維修記錄可在官方客服中心查詢。請(qǐng)嚴(yán)格基于上述內(nèi)容作答不要編造信息如果資料中沒(méi)有答案請(qǐng)回答“文檔中未找到相關(guān)信息”。好的我現(xiàn)在需要根據(jù)用戶的問(wèn)題和提供的相關(guān)片段來(lái)回答他們的查詢。用戶的問(wèn)題是關(guān)于購(gòu)買(mǎi)TwinFun XPro產(chǎn)品的渠道如何享受官方保修并且想知道主機(jī)和無(wú)線手柄的免費(fèi)保修期限分別是多久。首先我會(huì)仔細(xì)閱讀用戶的問(wèn)題部分“哪些渠道購(gòu)買(mǎi)的TwinFun XPro可享受官方保修主機(jī)和無(wú)線手柄的免費(fèi)保修期限分別是多久”這表明用戶關(guān)心的是不同的渠道包括官方商城、線下授權(quán)門(mén)店及天貓、京東官方旗艦店購(gòu)買(mǎi)的產(chǎn)品是否都能享受官方保修以及主機(jī)和手柄的保修期有多長(zhǎng)。接下來(lái)我查看相關(guān)片段。保修范圍與期限界定部分明確說(shuō)明本保修政策僅適用于通過(guò)TwinFun品牌官方商城、線下授權(quán)門(mén)店及天貓、京東官方旗艦店購(gòu)買(mǎi)的XPro正品設(shè)備并非授權(quán)渠道的產(chǎn)品不享受保修。因此不同渠道都應(yīng)可以享受官方保修服務(wù)。然后核心部件部分詳細(xì)說(shuō)明了各部件的保修期限主機(jī)含主板、芯片、散熱模塊自購(gòu)買(mǎi)日起2年免費(fèi)保修。無(wú)線手柄、雙人搖桿控臺(tái)等標(biāo)配功能配件1年免費(fèi)保修。HDMI線、電源線、充電線等易損耗附件3個(gè)月保修。這意味著主機(jī)和無(wú)線手柄的保修期分別是2年和1年。此外手柄的保修時(shí)間是1年主機(jī)則是2年。我還需要確?;卮饻?zhǔn)確無(wú)誤并且不涉及編造的信息。根據(jù)片段中的內(nèi)容可以直接引用保修期限的說(shuō)明以保證答案的準(zhǔn)確性。總結(jié)一下購(gòu)買(mǎi)TwinFun XPro的任何渠道均可享受官方保修服務(wù)主機(jī)的保修期為2年手柄的是1年。購(gòu)買(mǎi)TwinFun XPro的產(chǎn)品不論通過(guò)官方商城、線下授權(quán)門(mén)店或京東官方旗艦店均可享受官方保修服務(wù)。主機(jī)的免費(fèi)保修期限是2年無(wú)線手柄的免費(fèi)保修期限是1年。通過(guò)SDK調(diào)用三方大語(yǔ)言模型這里調(diào)用的Google的gemini-2.5-flash模型如果你調(diào)不通比如你遇到諸如這類(lèi)錯(cuò)誤{‘error’: {‘code’: 400, ‘message’: ‘User location is not supported for the API use.’, ‘status’: ‘FAILED_PRECONDITION’}}也可以調(diào)DeepSeek等國(guó)內(nèi)的大模型當(dāng)然都需要提前獲取秘鑰# 調(diào)用Google的Gemini生成結(jié)果依賴google-genai from google import genai client genai.Client(api_keyAIzaSyD-l1J5qt0VhDOmLASJPxaG_7If5BXvm8Q) def generate(query:str,chunks:List[str] )-str: prompt f你是一位知識(shí)助手請(qǐng)嚴(yán)格根據(jù)用戶的問(wèn)題和參考資料生成準(zhǔn)確的回答。 用戶問(wèn)題: {query} 參考資料: {
.join(chunks)} 請(qǐng)嚴(yán)格基于上述內(nèi)容作答不要編造信息如果資料中沒(méi)有答案請(qǐng)回答“文檔中未找到相關(guān)信息”。 print(f{prompt}
---
) try: response client.models.generate_content( modelgemini-2.5-flash, contentsprompt, ) return response.text except Exception as e: print(fAPI調(diào)用失敗: {e}) return API調(diào)用失敗; # 生成測(cè)試 answer generate(question,reranked_chunks); print(answer)運(yùn)行結(jié)果如下你是一位知識(shí)助手請(qǐng)嚴(yán)格根據(jù)用戶的問(wèn)題和參考資料生成準(zhǔn)確的回答。用戶問(wèn)題: 哪些渠道購(gòu)買(mǎi)的TwinFun XPro可享受官方保修主機(jī)和無(wú)線手柄的免費(fèi)保修期限分別是多久參考資料: 保修范圍與期限界定本保修政策僅適用于通過(guò)TwinFun品牌官方商城、線下授權(quán)門(mén)店及天貓、京東官方旗艦店購(gòu)買(mǎi)的XPro正品設(shè)備非授權(quán)渠道購(gòu)買(mǎi)的設(shè)備不享受官方保修服務(wù)。核心部件保修期限差異明確主機(jī)含主板、芯片、散熱模塊享受自購(gòu)買(mǎi)日起2年免費(fèi)保修無(wú)線手柄、雙人搖桿控臺(tái)等標(biāo)配功能性配件保修1年HDMI線、電源線、充電線等易損耗附件保修期限為3個(gè)月。保修起始日期以購(gòu)機(jī)發(fā)票開(kāi)具日期為準(zhǔn)無(wú)發(fā)票時(shí)則以設(shè)備首次激活日期或電商平臺(tái)訂單生成日期中最早者計(jì)算且僅在中國(guó)內(nèi)地不含港澳臺(tái)區(qū)域有效。延保服務(wù)與增值保障為延長(zhǎng)設(shè)備保障周期用戶可在原保修到期前30天內(nèi)通過(guò)官方APP或客服熱線購(gòu)買(mǎi)延保服務(wù)。延保費(fèi)用明確定價(jià)主機(jī)單獨(dú)延保1年費(fèi)用199元延保2年費(fèi)用349元全套設(shè)備主機(jī)所有標(biāo)配配件延保1年費(fèi)用299元延保2年費(fèi)用549元。延保服務(wù)與原保修范圍一致購(gòu)買(mǎi)后即時(shí)生效并與原保修無(wú)縫銜接。此外可額外購(gòu)買(mǎi)“意外保障服務(wù)”399元/年覆蓋人為摔落、液體潑濺、意外擠壓等非人為故障購(gòu)買(mǎi)后需在48小時(shí)內(nèi)完成設(shè)備外觀及功能驗(yàn)機(jī)備案未備案則保障無(wú)效。維修服務(wù)保障與規(guī)范設(shè)備經(jīng)審核符合保修條件后采取“雙向免郵”服務(wù)模式用戶寄回故障設(shè)備的運(yùn)費(fèi)由品牌方承擔(dān)需選擇順豐快遞到付維修完成后寄回的運(yùn)費(fèi)同樣由官方承擔(dān)。維修周期通常為5-7個(gè)工作日若需更換核心部件如主機(jī)主板客服會(huì)提前通過(guò)短信或電話與用戶確認(rèn)部件信息及維修時(shí)長(zhǎng)征得同意后方可操作。維修后的設(shè)備將享受“雙重保障”若原保修未到期延續(xù)剩余保修時(shí)間若原保修已到期自維修完成日起額外提供90天保修服務(wù)維修記錄可在官方客服中心查詢。請(qǐng)嚴(yán)格基于上述內(nèi)容作答不要編造信息如果資料中沒(méi)有答案請(qǐng)回答“文檔中未找到相關(guān)信息”。根據(jù)您提供的信息TwinFun XPro可享受官方保修的渠道包括TwinFun品牌官方商城線下授權(quán)門(mén)店天貓官方旗艦店京東官方旗艦店通過(guò)非授權(quán)渠道購(gòu)買(mǎi)的設(shè)備不享受官方保修服務(wù)。關(guān)于免費(fèi)保修期限主機(jī)含主板、芯片、散熱模塊享受自購(gòu)買(mǎi)日起2年免費(fèi)保修。無(wú)線手柄享受1年免費(fèi)保修。保修起始日期以購(gòu)機(jī)發(fā)票開(kāi)具日期為準(zhǔn)無(wú)發(fā)票時(shí)則以設(shè)備首次激活日期或電商平臺(tái)訂單生成日期中最早者計(jì)算。結(jié)果是不是跟你預(yù)期的一樣呢至此從0到1建造的一套R(shí)AG系統(tǒng)就完成了如果想真正消化這些知識(shí)就快動(dòng)手試一試吧。01為什么要對(duì)文本進(jìn)行切片提問(wèn)的時(shí)候把整個(gè)文檔都丟給大語(yǔ)言模型不行嗎1生成階段給大模型發(fā)送的參考信息不能過(guò)多原因是大語(yǔ)言模型的上下文長(zhǎng)度都有限制信息量太大時(shí)模型可能無(wú)法讀取所有內(nèi)容2信息越多模型推理成本越高模型推理速度越慢因此“直接把所有文檔都一次性丟給大模型”是行不通的同時(shí)為了節(jié)省token成本提升交互速度在后續(xù)提問(wèn)階段要盡可能只把相關(guān)的知識(shí)發(fā)送給大模型而不是讓大模型參考的越多越好。02為什么要把文本轉(zhuǎn)化為向量直接通過(guò)文本搜索比如SQL、ES查詢等不行嗎通過(guò)向量能實(shí)現(xiàn)語(yǔ)義搜索。舉個(gè)例子比如文檔中寫(xiě)的內(nèi)容是“關(guān)于增加新能源汽車(chē)的行駛里程……”但提問(wèn)的時(shí)候問(wèn)的是“如何提高電車(chē)?yán)m(xù)航/如何讓電車(chē)跑的更遠(yuǎn)”這兩段信息字面匹配程度是極低的但意思基本上一樣。向量比文本更能表達(dá)“語(yǔ)義”從而讓模型找到意思相近的內(nèi)容而不是只匹配字面相近的內(nèi)容。傳統(tǒng)搜索只能按詞頻、位置打分很難判斷“哪段內(nèi)容最能回答問(wèn)題”RAG檢索不到正確的知識(shí)最終答案就不準(zhǔn)確。把文本轉(zhuǎn)化成向量后可以按照語(yǔ)義搜索而不是按照關(guān)鍵詞。再舉個(gè)例子比如提問(wèn)“電腦很卡是什么原因”文檔中有“應(yīng)用性能下降通常由內(nèi)存不足引起”、“掉幀卡頓是CPU負(fù)載過(guò)高導(dǎo)致”雖然問(wèn)題中沒(méi)有“程序卡頓”這四個(gè)字向量表示確能把這些內(nèi)容理解成“語(yǔ)義相近”。當(dāng)然有很多embedding模型都支持跨語(yǔ)言比如提問(wèn)“新能源車(chē)怎么充電比較快”但知識(shí)庫(kù)中的文檔寫(xiě)的是“Fast-charging methods for EV vehicles”通過(guò)合適的向量也能匹配到。還有一個(gè)原因在大規(guī)模數(shù)據(jù)下向量搜索速度快。03文本轉(zhuǎn)化為向量的邏輯或者原理是什么呢為什么相似的文本轉(zhuǎn)化為向量后向量相似度也比較高Embedding 模型如 BERT / bge-m3在訓(xùn)練時(shí)學(xué)的是1句子之間的語(yǔ)義關(guān)系2詞與詞之間的上下文3同義、近義、相關(guān)性例如“售后政策”和“保修范圍”經(jīng)常出現(xiàn)在類(lèi)似的場(chǎng)景“退貨規(guī)則”和“退款流程”也經(jīng)常在一起出現(xiàn)。Embedding 模型會(huì)把這些語(yǔ)義相近的句子映射到向量空間中鄰近的位置Embedding 模型訓(xùn)練目標(biāo)本質(zhì)就是“語(yǔ)義相關(guān)的句子 → 向量方向接近”“語(yǔ)義不相關(guān)的句子 → 向量方向分離”。Embedding 不是天然具有“語(yǔ)義相似 → 向量相似”的特性這種能力是在大規(guī)模訓(xùn)練中“學(xué)”出來(lái)的。04上面實(shí)現(xiàn)智能客服例子中用戶提出問(wèn)題后先把根據(jù)問(wèn)題向量從向量數(shù)據(jù)庫(kù)中檢索到5條結(jié)果后又在重排階段選了3條結(jié)果。為什么不在檢索階段直接查3條結(jié)果呢理論上也是可以的我們完全可以直接在檢索階段直接查少量數(shù)據(jù)比如3條結(jié)果給大模型參考或者在干脆檢索階段查多查一些比如5條結(jié)果都扔給大語(yǔ)言模型用來(lái)參考但檢索重排結(jié)合的方式才是最優(yōu)解。在 RAG 中初步檢索通常依賴向量相似度搜索它的優(yōu)勢(shì)是 速度快、成本低能在海量數(shù)據(jù)里迅速找到「大概相關(guān)」的候選片段。但這種方法屬于粗粒度匹配難免會(huì)出現(xiàn)排序不準(zhǔn)的問(wèn)題——例如一些文本詞相似但語(yǔ)義不相關(guān)卻仍然排在前面。因此需要引入 重排Rerank階段 來(lái)做更精細(xì)的語(yǔ)義判斷。重排通常使用更強(qiáng)的模型如 Cross-Encoder、Cross-BERT逐條對(duì)「查詢 文檔片段」進(jìn)行深度語(yǔ)義匹配重新計(jì)算相關(guān)性得分把真正高相關(guān)的片段排到前面。它能顯著提升最終回答的質(zhì)量和可靠性。不過(guò)重排模型的計(jì)算成本比向量檢索高得多速度較慢、單條計(jì)算耗時(shí)更長(zhǎng)因此只用于對(duì)“初檢后的少量候選”進(jìn)行精排而不會(huì)直接對(duì)整個(gè)知識(shí)庫(kù)操作。用個(gè)更形象的例子來(lái)比喻——招聘你可以把檢索階段理解為公司篩選簡(jiǎn)歷把重排階段理解為安排面試和入職。想入門(mén) AI 大模型卻找不到清晰方向備考大廠 AI 崗還在四處搜集零散資料別再浪費(fèi)時(shí)間啦2025 年AI 大模型全套學(xué)習(xí)資料已整理完畢從學(xué)習(xí)路線到面試真題從工具教程到行業(yè)報(bào)告一站式覆蓋你的所有需求現(xiàn)在全部免費(fèi)分享掃碼免費(fèi)領(lǐng)取全部?jī)?nèi)容?一、學(xué)習(xí)必備100本大模型電子書(shū)26 份行業(yè)報(bào)告 600 套技術(shù)PPT幫你看透 AI 趨勢(shì)想了解大模型的行業(yè)動(dòng)態(tài)、商業(yè)落地案例大模型電子書(shū)這份資料幫你站在 “行業(yè)高度” 學(xué) AI1. 100本大模型方向電子書(shū)2. 26 份行業(yè)研究報(bào)告覆蓋多領(lǐng)域?qū)嵺`與趨勢(shì)報(bào)告包含阿里、DeepSeek 等權(quán)威機(jī)構(gòu)發(fā)布的核心內(nèi)容涵蓋職業(yè)趨勢(shì)《AI 職業(yè)趨勢(shì)報(bào)告》《中國(guó) AI 人才糧倉(cāng)模型解析》商業(yè)落地《生成式 AI 商業(yè)落地白皮書(shū)》《AI Agent 應(yīng)用落地技術(shù)白皮書(shū)》領(lǐng)域細(xì)分《AGI 在金融領(lǐng)域的應(yīng)用報(bào)告》《AI GC 實(shí)踐案例集》行業(yè)監(jiān)測(cè)《2024 年中國(guó)大模型季度監(jiān)測(cè)報(bào)告》《2025 年中國(guó)技術(shù)市場(chǎng)發(fā)展趨勢(shì)》。3. 600套技術(shù)大會(huì) PPT聽(tīng)行業(yè)大咖講實(shí)戰(zhàn)PPT 整理自 2024-2025 年熱門(mén)技術(shù)大會(huì)包含百度、騰訊、字節(jié)等企業(yè)的一線實(shí)踐安全方向《端側(cè)大模型的安全建設(shè)》《大模型驅(qū)動(dòng)安全升級(jí)騰訊代碼安全實(shí)踐》產(chǎn)品與創(chuàng)新《大模型產(chǎn)品如何創(chuàng)新與創(chuàng)收》《AI 時(shí)代的新范式構(gòu)建 AI 產(chǎn)品》多模態(tài)與 Agent《Step-Video 開(kāi)源模型視頻生成進(jìn)展》《Agentic RAG 的現(xiàn)在與未來(lái)》工程落地《從原型到生產(chǎn)AgentOps 加速字節(jié) AI 應(yīng)用落地》《智能代碼助手 CodeFuse 的架構(gòu)設(shè)計(jì)》。二、求職必看大廠 AI 崗面試 “彈藥庫(kù)”300 真題 107 道面經(jīng)直接抱走想沖字節(jié)、騰訊、阿里、蔚來(lái)等大廠 AI 崗這份面試資料幫你提前 “押題”拒絕臨場(chǎng)慌1. 107 道大廠面經(jīng)覆蓋 Prompt、RAG、大模型應(yīng)用工程師等熱門(mén)崗位面經(jīng)整理自 2021-2025 年真實(shí)面試場(chǎng)景包含 TPlink、字節(jié)、騰訊、蔚來(lái)、蝦皮、中興、科大訊飛、京東等企業(yè)的高頻考題每道題都附帶思路解析2. 102 道 AI 大模型真題直擊大模型核心考點(diǎn)針對(duì)大模型專(zhuān)屬考題從概念到實(shí)踐全面覆蓋幫你理清底層邏輯3. 97 道 LLMs 真題聚焦大型語(yǔ)言模型高頻問(wèn)題專(zhuān)門(mén)拆解 LLMs 的核心痛點(diǎn)與解決方案比如讓很多人頭疼的 “復(fù)讀機(jī)問(wèn)題”三、路線必明 AI 大模型學(xué)習(xí)路線圖1 張圖理清核心內(nèi)容剛接觸 AI 大模型不知道該從哪學(xué)起這份「AI大模型 學(xué)習(xí)路線圖」直接幫你劃重點(diǎn)不用再盲目摸索路線圖涵蓋 5 大核心板塊從基礎(chǔ)到進(jìn)階層層遞進(jìn)一步步帶你從入門(mén)到進(jìn)階從理論到實(shí)戰(zhàn)。L1階段:啟航篇丨極速破界AI新時(shí)代L1階段了解大模型的基礎(chǔ)知識(shí)以及大模型在各個(gè)行業(yè)的應(yīng)用和分析學(xué)習(xí)理解大模型的核心原理、關(guān)鍵技術(shù)以及大模型應(yīng)用場(chǎng)景。L2階段攻堅(jiān)篇丨RAG開(kāi)發(fā)實(shí)戰(zhàn)工坊L2階段AI大模型RAG應(yīng)用開(kāi)發(fā)工程主要學(xué)習(xí)RAG檢索增強(qiáng)生成包括Naive RAG、Advanced-RAG以及RAG性能評(píng)估還有GraphRAG在內(nèi)的多個(gè)RAG熱門(mén)項(xiàng)目的分析。L3階段躍遷篇丨Agent智能體架構(gòu)設(shè)計(jì)L3階段大模型Agent應(yīng)用架構(gòu)進(jìn)階實(shí)現(xiàn)主要學(xué)習(xí)LangChain、 LIamaIndex框架也會(huì)學(xué)習(xí)到AutoGPT、 MetaGPT等多Agent系統(tǒng)打造Agent智能體。L4階段精進(jìn)篇丨模型微調(diào)與私有化部署L4階段大模型的微調(diào)和私有化部署更加深入的探討Transformer架構(gòu)學(xué)習(xí)大模型的微調(diào)技術(shù)利用DeepSpeed、Lamam Factory等工具快速進(jìn)行模型微調(diào)并通過(guò)Ollama、vLLM等推理部署框架實(shí)現(xiàn)模型的快速部署。L5階段專(zhuān)題集丨特訓(xùn)篇 【錄播課】四、資料領(lǐng)取全套內(nèi)容免費(fèi)抱走學(xué) AI 不用再找第二份不管你是 0 基礎(chǔ)想入門(mén) AI 大模型還是有基礎(chǔ)想沖刺大廠、了解行業(yè)趨勢(shì)這份資料都能滿足你現(xiàn)在只需按照提示操作就能免費(fèi)領(lǐng)取掃碼免費(fèi)領(lǐng)取全部?jī)?nèi)容?2025 年想抓住 AI 大模型的風(fēng)口別猶豫這份免費(fèi)資料就是你的 “起跑線”