从零开始微调大模型，部署智能体在网页-Seo优化-塔城地区网站建设公司

1.收集论文数据

从学术数据库或开放资源平台下载相关领域的PDF论文，确保数据覆盖研究主题的核心内容。常用的数据来源包括arXiv、PubMed、IEEE Xplore等。筛选高质量论文，避免重复或低相关性文献。

2.minerU转换PDF论文为Md文件

MinerU官网直接下载相应版本。

使用工具如minerU将PDF论文转换为Markdown格式，便于后续处理。确保转换后的文本保留关键信息（如标题、摘要、正文、参考文献），并清理无关内容（页眉、页脚、图表描述等）。检查格式一致性，避免转换错误。

3.Easy DataSet调用ollama大模型生成问题

https://github.com/ConardLi/easy-dataset?tab=readme-ov-file可以下载APP版本，或者使用docker部署。

添加模型，可以使用购买的API或者本地部署大模型。

通过Easy DataSet工具调用ollama大模型，基于Markdown内容自动生成问答对。提示词需明确指定问题类型（如事实提取、推理分析等），生成后人工校验问题的准确性和多样性。

`Easy DataSet`导出json训练集

将生成的问答对整理为结构化JSON格式，字段包括question、answer和context。验证数据完整性后导出。

4.在Docker容器下启动LLama微调

可采用conda或者docker部署LLama。

conda

git clone https://github.com/hiyouga/LLaMA-Factory.git conda create -n llama_factory python=3.10 -y conda activate llama_factory cd LLaMA-Factory # 临时使用清华源安装依赖（替换为你需要的安装命令） pip install -r requirements.txt --index-url https://pypi.tuna.tsinghua.edu.cn/simple

docker部署代码：

git clone --branch v0.9.3 https://github.com/hiyouga/LLaMA-Factory.git LLaMA-Factory-0.9.3 cd LLaMA-Factory\docker\docker-cuda docker-compose up –d

创建包含微调环境的Docker镜像，依赖项包括PyTorch、Transformers库等。启动容器。示例命令：

docker run --gpus all -it --rm -p 17860:17860 -v D:\LLaMA-Factory-0.9.3\data:/app/data -v D:\LLaMA-Factory-0.9.3\output:/app/output -v D:\model:/models docker-cuda-llamafactory:latest

llamafactory-cli webui

隧道转发

注意如果是集群部署，GPU计算节点访问直接访问不了，可以通过隧道转发

配置双层端口转发访问 GPU 节点 Web UI

确保 Web UI 在 c001 节点运行
在 c001 GPU节点终端确认 Web UI 服务已启动，输出类似Running on local URL: http://0.0.0.0:7860。若未运行，需先启动服务。

Xshell 隧道转发配置
打开连接至 mn01 的 Xshell 会话，进入属性设置：

导航至文件→属性→隧道→添加
参数配置：
- 类型：本地(Outgoing)
- 源主机：127.0.0.1
- 源端口：7860（本地映射端口）
- 目标主机：192.168.100.1（c001 内网 IP）
- 目标端口：7860（c001 服务端口）
  保存配置后重新连接会话以激活隧道。

本地浏览器访问
在浏览器地址栏输入http://127.0.0.1:7860，流量将通过 Xshell 隧道经 mn01 转发至 c001 的 7860 端口，实现直接访问。

技术原理
Xshell 的本地隧道功能建立了一条加密通道，将本地端口请求逐跳转发至目标内网节点，绕过管理节点的端口限制。此方法适用于集群内网服务的穿透访问，稳定性优于临时端口映射。

下载大模型

下载模型，使用pip或者git

pip install modelscope modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-32B git clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B.git

加载大模型

写入存在共享盘的大模型地址加载模型。

微调大模型

在dataset_info加入file_name。

在LLama上载入数据集，调整参数开始训练。

5.导出微调模型部署

微调完成后保存模型权重和配置文件到指定目录。使用transformers库的save_pretrained方法导出模型，确保包含adapter_config.json和pytorch_model.bin文件。验证模型性能后压缩为.tar.gz便于传输。

6.使用dify部署智能体

在dify平台创建新应用，上传微调模型或通过API连接模型服务。配置智能体的名称、描述和对话流程，设置访问权限和监控指标。测试智能体响应质量后发布，获取API端点或嵌入代码。

7.在网站前端嵌入代码

手工蚀刻Arduino兼容PCB全流程指南：从原理图到点亮LED

1. 项目概述：一块亲手蚀刻的Arduino兼容PCB，到底值不值得折腾？“Arduino PCB蚀刻”这六个字，乍看像一句技术指令，实则藏着一整套微型电子制造的底层逻辑。它不是在讲怎么用Arduino开发板做项目，而是在说——…

李华

终极简单键盘：Android轻量级输入法完整使用指南

终极简单键盘：Android轻量级输入法完整使用指南【免费下载链接】simple-keyboard 项目地址: https://gitcode.com/gh_mirrors/sim/simple-keyboard 在当今应用体积不断膨胀的时代，Simple Keyboard以其小于1MB的极致轻量和纯净无广告的设计理念&…

李华

Apache Airflow 2.x 深度指南：用 Python 编排一切的现代化工作流引擎

一、什么是 Apache AirflowApache Airflow 是一个由 Airbnb 于 2014 年开源、2016 年进入 Apache 孵化器的工作流编排平台。它的核心理念可以用一句话概括：用 Python 代码定义、调度和监控你的工作流。与 shell 脚本或 crontab 定时任务不同，Airflow 将工…

李华

认知神经科学研究报告【20260090】

《文本宇宙》物理分析引擎对外理论报告（含 LLM 关联与能力边界）核心思想：将文本视为可计算的物理系统本引擎将多卷本文本视为一个高维时空中的粒子系统，用几何与场论方法量化文本的“结构力”——包括叙事转折强度、论证核心分…

李华

从零开始微调大模型，部署智能体在网页

1.收集论文数据

2.minerU转换PDF论文为Md文件

3.Easy DataSet调用ollama大模型生成问题

`Easy DataSet`导出json训练集

4.在Docker容器下启动LLama微调

隧道转发

下载大模型

加载大模型

微调大模型

5.导出微调模型部署

6.使用dify部署智能体

7.在网站前端嵌入代码

手工蚀刻Arduino兼容PCB全流程指南：从原理图到点亮LED

Logseq知识管理平台：从本地笔记到实时协作的完整解决方案

终极简单键盘：Android轻量级输入法完整使用指南

技术解析｜GEO 2.0（数据驱动）与 GEO 3.0（模型驱动）代际差异，维策智域GEO引擎技术定位

Apache Airflow 2.x 深度指南：用 Python 编排一切的现代化工作流引擎

认知神经科学研究报告【20260090】

1.收集论文数据

2.minerU转换PDF论文为Md文件

3.Easy DataSet调用ollama大模型生成问题

Easy DataSet导出json训练集

4.在Docker容器下启动LLama微调

隧道转发

下载大模型

加载大模型

微调大模型

5.导出微调模型部署

6.使用dify部署智能体

7.在网站前端嵌入代码

手工蚀刻Arduino兼容PCB全流程指南：从原理图到点亮LED

Logseq知识管理平台：从本地笔记到实时协作的完整解决方案

终极简单键盘：Android轻量级输入法完整使用指南

技术解析｜GEO 2.0（数据驱动）与 GEO 3.0（模型驱动）代际差异，维策智域GEO引擎技术定位

Apache Airflow 2.x 深度指南：用 Python 编排一切的现代化工作流引擎

认知神经科学研究报告【20260090】

`Easy DataSet`导出json训练集