news 2026/7/4 8:47:07

CANN/GE LLM-DataDist CacheDesc API文档

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/GE LLM-DataDist CacheDesc API文档

# CacheDesc

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

函数功能

构造CacheDesc,通常在KvCacheManager的allocate_cache接口中作为参数类型使用。

函数原型

__init__(self, num_tensors: int, shape: Union[Tuple[int], List[int]], data_type: DataType, placement: Placement = Placement.DEVICE, batch_dim_index: int = 0, seq_len_dim_index: int = -1, kv_tensor_format: str = None)

参数说明

参数名称数据类型取值说明
num_tensorsintcache中tensor的个数。
shapeUnion[Tuple[int], List[int]]tensor的shape。
data_typeDataTypetensor的data type。
placementPlacement表示cache所在的设备类型。默认值Placement.DEVICE。
batch_dim_indexint表示shape中batch size所在维度。默认值0,表示在第0维。
seq_len_dim_indexint表示shape中seq_len所在维度。默认值-1,表示未配置。
kv_tensor_formatstr表示cache的format。

调用示例

from llm_datadist import CacheDesc cache_desc = CacheDesc(80, [4, 2048, 1, 128], DataType.DT_FLOAT16)

返回值

正常情况下返回CacheDesc的实例。

传入数据类型错误情况下会抛出TypeError或ValueError异常。

约束说明

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/4 8:45:54

Wireshark实战解析SSL/TLS握手:从密码学原理到网络包诊断

1. 项目概述:为什么我们需要亲手“看见”SSL/TLS握手?如果你是一名开发者、运维工程师或者网络安全爱好者,那么“SSL/TLS”这个词组对你来说一定不陌生。我们每天都在使用它——当浏览器地址栏出现那个小锁图标,当你的手机App与服…

作者头像 李华
网站建设 2026/7/4 8:45:37

Instatic缓存策略:CDN集成与缓存控制头配置

Instatic缓存策略:CDN集成与缓存控制头配置 【免费下载链接】Instatic Instatic is a modern self-hosted visual CMS - get it running in 1 minute 项目地址: https://gitcode.com/GitHub_Trending/in/Instatic Instatic作为现代自托管视觉CMS,…

作者头像 李华
网站建设 2026/7/4 8:44:31

Heya多语言支持:利用I18n实现国际化邮件序列的最佳实践

Heya多语言支持:利用I18n实现国际化邮件序列的最佳实践 【免费下载链接】heya Heya 👋 is a campaign mailer for Rails. Think of it like ActionMailer, but for timed email sequences. It can also perform other actions like sending a text messa…

作者头像 李华
网站建设 2026/7/4 8:44:25

Obsidian智能技能套件:AI驱动的知识管理架构优化与集成实践

Obsidian智能技能套件:AI驱动的知识管理架构优化与集成实践 【免费下载链接】obsidian-skills Agent skills for Obsidian. Teach your agent to use Obsidian CLI and open formats including Markdown, Bases, JSON Canvas. 项目地址: https://gitcode.com/GitH…

作者头像 李华
网站建设 2026/7/4 8:44:05

O3DE架构深度解析:如何通过模块化设计构建下一代3D引擎

O3DE架构深度解析:如何通过模块化设计构建下一代3D引擎 【免费下载链接】o3de Open 3D Engine (O3DE) is an Apache 2.0-licensed multi-platform 3D engine that enables developers and content creators to build AAA games, cinema-quality 3D worlds, and high…

作者头像 李华
网站建设 2026/7/4 8:43:21

Reacord高级技巧:5个提升Discord消息交互性的实用方法

Reacord高级技巧:5个提升Discord消息交互性的实用方法 【免费下载链接】reacord Create interactive Discord messages using React. ⚛ 项目地址: https://gitcode.com/gh_mirrors/re/reacord 在Discord机器人开发中,如何创建真正吸引用户的交互…

作者头像 李华