<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>LLM on Yen Tsai dev</title>
    <link>https://yentsaidev.com/tags/llm/</link>
    <description>Recent content in LLM on Yen Tsai dev</description>
    <generator>Hugo -- 0.147.0</generator>
    <language>zh-tw</language>
    <lastBuildDate>Wed, 20 May 2026 10:00:00 +0800</lastBuildDate>
    <atom:link href="https://yentsaidev.com/tags/llm/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>理解RAG在幹嘛</title>
      <link>https://yentsaidev.com/blog/rag/</link>
      <pubDate>Wed, 20 May 2026 10:00:00 +0800</pubDate>
      <guid>https://yentsaidev.com/blog/rag/</guid>
      <description>&lt;figure class=&#34;text-center&#34;&gt;
    &lt;img loading=&#34;lazy&#34; src=&#34;https://yentsaidev.com/images/blog/RAG/header.jpg&#34;
         alt=&#34;RAG&#34;/&gt; &lt;figcaption&gt;
            &lt;p&gt;photo by Reed Mok&lt;/p&gt;
        &lt;/figcaption&gt;
&lt;/figure&gt;

&lt;p&gt;LLM有時會產生看似合理、但其實不正確的回答，這種不懂裝懂的答案會讓使用者得到錯誤的資訊，還毫不自覺。&lt;/p&gt;
&lt;p&gt;這種情況常發生在模型缺乏最新的資訊，像是詢問公司內部的東西，如果是沒有公開的事情，LLM根本不會知道，但是他仍然會亂回答一通。&lt;/p&gt;
&lt;p&gt;RAG (Retrieval-Augmented Generation)就是為了解決這類問題而誕生的技術。它的核心概念是: 在LLM回答問題之前，先從指定的資料庫中看一次有沒有相關的文件能參考，讓模型根據可參考內容產生回答。&lt;/p&gt;
&lt;h2 id=&#34;rag的流程&#34;&gt;RAG的流程&lt;/h2&gt;
&lt;ol&gt;
&lt;li&gt;文件準備：收集文件、網頁、FAQ、內部知識庫等資料。&lt;/li&gt;
&lt;li&gt;切分資料：將長文件切成較小的 chunk，方便後續檢索。&lt;/li&gt;
&lt;li&gt;建立索引：使用 embedding model 將 chunk 轉成向量，存入 vector database。&lt;/li&gt;
&lt;li&gt;查詢檢索：使用者提問後，系統將問題轉成向量，找出最相關的資料片段。&lt;/li&gt;
&lt;li&gt;生成回答：把檢索到的資料片段放進 prompt，讓 LLM 根據參考內容回答。&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id=&#34;rag-如何檢索資料&#34;&gt;RAG 如何檢索資料&lt;/h2&gt;
&lt;p&gt;在建立索引時, 使用embedding model將文字轉成向量, 可以想像成就是好多個陣列裡面放著數字, 這些數字代表這段文字的特徵&lt;/p&gt;
&lt;p&gt;當使用者要查詢最&amp;quot;相似&amp;quot;文字資料時, 系統也把使用者的問題轉成向量, 然後一個一個去比對相似度&lt;/p&gt;
&lt;p&gt;常見的比對方式有:cosine similarity, dot product, euclidean distance等, 這些方法會給出一個分數, 分數越高代表越相似&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
