首页> 中国专利> 基于张量分解的模型压缩方法、装置和服务器

基于张量分解的模型压缩方法、装置和服务器

页面导航

摘要
著录项
法律信息
相似文献

摘要

本申请实施例适用于人工智能技术领域，提供了一种基于张量分解的模型压缩方法、装置和服务器，该方法包括：服务器获取待压缩的模型，模型包括至少一层模型层，模型层具有相应的原始张量，原始张量包括多个维度，多个维度分别具有相应的维度大小；针对模型层中的待分解层，服务器根据待分解层的原始张量中每个维度的维度大小，确定待分解层的原始张量的张量分解形式；以及，服务器根据每个维度的维度大小，确定待分解层的原始张量的张量链分解秩；服务器按照张量分解形式和张量链分解秩，对待分解层的原始张量进行张量分解，得到压缩模型。通过上述方法，可以对深度神经网络模型进行压缩，使得压缩后的深度神经网络模型能够部署在终端设备上。

著录项

公开/公告号CN114077885A

专利类型发明专利
公开/公告日2022-02-22

原文格式PDF
申请/专利权人华为技术有限公司;
展开▼

申请/专利号CN202010849312.5
发明设计人石巍巍;刘华彦;隋志成;周力;刘默翰;
展开▼

申请日2020-08-21
分类号G06N3/04(20060101);G06N3/08(20060101);
代理机构44414 深圳中一联合知识产权代理有限公司;
代理人任敏
地址 518129 广东省深圳市龙岗区坂田华为总部办公楼
入库时间 2023-06-19 14:14:25

法律信息

法律状态公告日

法律状态信息

法律状态
2022-03-11

实质审查的生效 IPC(主分类):G06N 3/04 专利申请号:2020108493125 申请日:20200821

实质审查的生效

相似文献

专利
中文文献
外文文献

1. 基于张量分解的模型压缩方法、装置和服务器 [P] . 中国专利： CN114077885A . 2022-02-22
2. 基于强化学习的深度学习模型安全性保障压缩方法与装置 [P] . 中国专利： CN112766496A . 2021-05-07
3. Method and Apparatus for Compressing Model Based on Tensor Decomposition [P] . 韩国专利： KR20200064348A . 2020-06-08

机译：基于张量分解的模型压缩方法及装置
4. Method and apparatus for repetitive structure discovery based 3D model compression [P] . 美国专利： US9928615B2 . 2018-03-27

机译：基于重复结构发现的3d模型压缩方法和装置
5. Method and apparatus for compressing 3D model based on the discovery of the structure of repeated [P] . BR112014026044A2 . 2017-06-27

机译：基于重复结构发现的3D模型压缩方法及装置