编辑
2025-10-15
个人笔记
00

目录

八股

个人收集的八股,简单地总结了一下,欢迎分享讨论。

3f5366e46ff24d669f745f489a31f74a 1.png

3f5366e46ff24d669f745f489a31f74a.png

db96011c50495dfea4005c488ace6511.png

file-20251015155703582.png

file-20251015155806460.png

file-20251015155933605.png

file-20251015160104439.png

八股

  • 索引构建

    • 文本分块,大文本分块处理?
      • 引入 NLP 处理
      • 固定 or 文本段分块
      • 文档结构化分块(标题、段落)
    • 文档解析是怎么做的?
      • 图文文档如何存储检索?
      • 不同领域文档特征和结构不一样,是怎么做的?(看自己的项目领域,客服场景的工单,企业知识库的文档)
    • 向量维度选型?
  • 检索流程

  • 回答生成

    • prompt如何调优?
      • 设定工作流,设置 AI 回答思路,罗列为 TODO