如今,AI早已经走进了我们生活,文心一言、通义千问、豆包、还有最近非常火爆的DeepSeek等大模型让人们意识AI并不是那么神秘,这里,我们用RAG就可以自己搭建一个PG向量数据库AI机器人。 RAG概念 RAG(Retrieval Augmented Generation)顾名思义,通过检索的方法来增强生成模型的能力。 检索(Retrieval ): 根据用户请求从外部知识源检索相关上下文。 增强(Augment): 用户查询和检索到的附加上下文被填充到提示模板中。 生成(Generate): 检索增强提示被馈送到 LLM。 它是一个为大模型提供外部知识源的概念,这使它们能够生成准确且符合上下文的答案,同时能够减少模型幻觉。 使用RAG的优点 提高准确性: 通过检索相关的信息,RAG可以提高生成文本的准确性。 减少训练成本:与需要大量数据来训练的大型生成模型相比,RAG可以通过检索机制来减少所需的训练数据量,从而降低训练成本。 适应性强:RAG模型可以适应新的或不断变化的数据。由于它们能够检索最新的信息,因此在新数据和事件出现时,它们能够快速适应并生成相关的文本。 RAG系统工作流程图解

流程描述: 1. 加载,读取文档 2. 文档分割 3. 文档向量化 4. 用户输入内容 5. 内容向量化 6. 文本向量中匹配出与问句向量相似的 top_k 个 7. 匹配出的文本作为上下文和问题一起添加到 prompt 中 8.提交给 LLM 生成答案 ...... 完整文档链接: 文档:RAG-大模型&向量数据库.pdf 网盘链接: https://pan.baidu.com/s/1b4yXjlyw2uF7K-iOSnpGYQ 提取码: qanz B站在线视频: https://www.bilibili.com/video/BV1WsNZe6EVp/ 元宵特惠! 元宵佳节,CUUG为您献上好礼! 购买信创PostgreSQL管理员认证课程,赠送PGCP和PGCM一次补考机会,活动还有7天,【阅读原文】联系客服报名!

|