一、第一章:DeepSeek基础知识(题目1、2、4、5、7、14)
题1
题干:关于DeepSeek长文本处理技术的原生可训练设计,以下哪一项是正确的?答案:在训练初期就开始学习最优稀疏模式
原文依据:文档P11 NSA稀疏注意力机制:原生可训练设计:支持端到端学习稀疏模式,避免传统方法「先训练后裁剪」的性能损失。
考点:DeepSeek NSA稀疏注意力三大核心设计之一——原生可训练机制的定义与特点,区分传统注意力后置裁剪与NSA端到端同步学习稀疏模式的差异。
题2
题干:DeepSeek-R1模型训练过程中,以下哪一项是监督微调阶段的起点?答案:DeepSeek-v3-Base(题目给答案描述“冷启动推理数据”为SFT训练数据源)
原文依据:文档P8、P9 R1训练流程:训练起点为DeepSeek-v3-Base,SFT监督微调阶段使用Reasoning推理冷启动数据;R1-Zero可跳过SFT直接强化学习。
考点:DeepSeek-R1双阶段训练链路(SFT监督微调+通用强化学习)、SFT阶段输入数据源与模型基座。
题4
题干:以下哪一项不属于DeepSeek的NSA机制实现突破的关键技术架构?答案:静态特征映射
原文依据:文档P11 NSA三大核心突破:智能信息分层、硬件级GPU Tensor Core优化、原生可训练设计;无静态特征映射相关内容。
考点:NSA稀疏注意力三大核心技术清单,反向排除不属于的干扰项。
题5
题干:通用基准测试中,DeepSeek NSA对比传统全注意力机制优点?答案:首次实现对传统全注意力机制的全面性能反超
原文依据:文档P11:NSA不仅提升64k长文本处理速度,更在通用基准测试中实现了对传统全注意力模型的性能反超。
考点:NSA稀疏注意力机制性能优势,区分速度提升与通用任务效果反超两个核心卖点。
NSA 的硬件级优化针对的是GPU算力架构、显存、解码流程做软件与指令层面优化,不是物理增加 CPU 硬件核心,不属于该机制的优化措施。
题7
题干:开源基座大模型领域知识缺失描述正确的是?答案:大语言模型缺乏企业私有数据支持
原文依据:文档P27 无RAG原生LLM四大缺陷第三条:领域知识缺失——缺乏企业私有数据(内部文档、用户画像),回答通用无针对性。
考点:原生大模型四大痛点(幻觉、时效性不足、领域知识缺失、数据安全风险),聚焦领域知识缺失的成因。
题14
题干:NSA硬件级优化采取哪些措施?答案:设计内存访问优化器降低显存占用、重构指令流水线提升训练加速、采用解码预测器加快解码速度
原文依据:文档P11 NSA硬件级优化:针对GPU Tensor Core设计高效计算内核,64k文本最高9倍训练加速、11倍解码加速;底层优化包含显存、计算流水线、解码流程优化。
考点:NSA三大模块中「硬件级优化」的底层技术细节,区分硬件优化、文本分层、原生训练三类不同维度改进。
二、第二章:基于DeepSeek部署智能小助手(题目8、9、10、6)
题6
题干:LangChain ChatOpenAI初始化配置,哪项不属于?答案:文档分块大小
原文依据:文档P41 ChatOpenAI入参:temperature、model_name、api_key、api_base;文档分块大小是TextSplitter参数,属于RAG数据预处理,不属于LLM初始化配置。
考点:区分LLM模型初始化参数 vs RAG文本分块预处理参数,理清LangChain各组件参数归属。
题8
题干:DeepSeek部署显存不足解决措施?答案:7B降级1.5B、FP4量化、关闭显存占用后台程序
原文依据:文档P24 FAQ显存不足解决方案:降级模型版本、启用FP4量化;响应延迟优化也包含关闭占用显存程序、监控GPU资源。
考点:DeepSeek本地部署故障排查——显存不足的完整优化方案,软硬件双层解决思路。
题目问题是 ** 显存(GPU 显卡的专用显存)** 不足,而电脑内存是 CPU 主存,二者硬件独立,增加普通内存无法扩充显存,不能解决显存不够的问题。
题9
题干:哪些属于昇腾服务器?答案:Atlas 500 Pro、Atlas 800、Atlas 900 A2 POD
原文依据:文档P19 昇腾服务器系列包含全系列Atlas算力硬件,覆盖边缘Atlas500、推理Atlas800、集群Atlas900。
考点:华为昇腾服务器硬件产品线分类,区分昇腾全系列算力机型。
华为昇腾 Atlas 官方产品线里没有 Atlas 700 这个正式型号,属于干扰项。
题10
题干:哪些属于Atlas 800系列昇腾服务器?答案:Atlas 800I A2推理、Atlas 800推理、Atlas 800TA2训练服务器
原文依据:文档P18、P19 华为DeepSeek一体机蒸馏版基于Atlas800,该系列细分推理、训练多型号硬件。
考点:Atlas 800子系列细分机型,区分训练/推理硬件定位。
华为官方 Atlas 800 系列没有这款 A3 推理的正式型号,属于干扰虚构选项。
三、第三章:本地化RAG方案(题目3、11)
题3
题干:RAG核心流程,哪项不属于索引阶段?题干描述“使用嵌入模型将文本块转化为向量表示”属于索引阶段,为本题排除项
原文依据:文档P36 RAG三阶段:
- 索引:数据分块→向量化→存入向量库(嵌入转向量属于索引);
- 检索:query向量化、相似度搜索;
- 生成:注入上下文调用LLM。
考点:RAG完整三段式流程边界划分,精准区分索引/检索/生成各自操作。
题11
题干:ChromaDB向量数据库特点?答案:易于部署、轻量级
原文依据:文档P39 向量数据库工具介绍:ChromaDB(轻量级)、FAISS(高性能)。
考点:主流开源向量数据库选型特征对比,ChromaDB与FAISS定位差异。
四、第四章:构建RAG(题目12、13、15)
题12
题干:RAG技术优势?答案:灵活更新知识、减少LLM幻觉、可使用最新知识回答
原文依据:文档P27原生LLM缺陷+P28 RAG定义:RAG外挂外部知识库,动态加载最新文档无需重训,大幅缓解幻觉、解决知识过时问题。
考点:RAG核心价值,对比无RAG大模型四大痛点反向记忆优势。
题13
题干:RAG Prompt模板减少幻觉的措施?答案:插入检索文档片段、指令约束模型仅依据资料作答
原文依据:文档P41 Prompt模板设计:系统指令强制“基于资料回答,禁止编造”,上下文注入检索到的真实文档块作为约束。
考点:RAG提示词工程幻觉抑制方案,掌握Prompt约束的两大核心手段。
B 直接使用用户提问的问题 ❌
仅保留用户原始提问,没有给模型补充参考约束,模型依然会依靠自身旧知识生成内容,无法抑制幻觉。
题15
题干:RAG技术不能解决LLM的知识时效性问题。判断:错
原文依据:文档P27、P53对比:原生LLM知识截止训练时间;RAG可动态加载本地最新文档,实时更新知识库,完美解决时效性缺陷。
考点:RAG对知识时效性问题的解决能力,区分原生LLM与RAG增强模型的知识更新差异。