首页> 中国专利> 一种基于复合轮廓骨架的汉字几何结构特征迁移方法

一种基于复合轮廓骨架的汉字几何结构特征迁移方法

摘要

一种基于复合轮廓骨架的汉字几何结构特征迁移方法,通过获取字形间的对应复合轮廓骨架特征点集的几何结构关系,构建不同字体文件的同一目标字的复合轮廓集间的映射关系,构建单个复合轮廓集和其骨架特征点间的映射关系,形成待生成变体字形字体的变体字形的复合轮廓,从而可在格式转换后写入字体文件的相应编码位置,解决了用户在使用文本信息隐藏系统时可以只能利用现有的变体字库的情况。

著录项

  • 公开/公告号CN112733495A

    专利类型发明专利

  • 公开/公告日2021-04-30

    原文格式PDF

  • 申请/专利权人 杭州电子科技大学;

    申请/专利号CN202011637434.4

  • 申请日2020-12-31

  • 分类号G06F40/109(20200101);G06K9/62(20060101);G06K9/68(20060101);

  • 代理机构33246 浙江千克知识产权代理有限公司;

  • 代理人周希良

  • 地址 310018 浙江省杭州市杭州经济技术开发区白杨街道2号大街1158号

  • 入库时间 2023-06-19 10:48:02

说明书

技术领域

本发明属于一种基于复合轮廓骨架的汉字几何结构特征迁移方法领域。

背景技术

目前已有对汉字骨架提取较为完善的方式方法,如基于对称轴获取中心点的骨架线提取算法、基于内切圆定义的骨架线求法等;同时也有多项技术如通过基于骨架、条件生成对抗网络等,已经应用于汉字的生成修改;

目前用于生成汉字的技术多用作造字做字,即根据基础字符集和特征风格数据,提取骨架或应用条件生成对抗网络等生成一个新的字符集,其修改所产生的误差范围普遍超出了修改汉字局部几何结构的所能接受的程度。涉及字体局部几何结构的修改方式则多需要利用字体编辑软件(软件FontForge、FontCreater等)直接逐个修改,需要耗费大量人力和时间。而直接利用字体骨架对字形进行修改则会存在匹配误差较大等诸多问题。

发明内容

针对以上不足,本发明所要解决的技术问题是提供一种基于复合轮廓骨架的汉字几何结构特征迁移方法,使用户可以利用现有的变体字库更便捷地获取基于其他字形的变体字库,节省字体修改所需的人力成本。

为解决以上技术问题,本发明采用的技术方案是,

一种基于复合轮廓骨架的汉字几何结构特征迁移方法,包括以下步骤,

(1)确定目标字,获取目标字在已有变体字形字体中的标准字形、已有变体字形字体中的变体字形、待生成变体字形字体中的标准字形的轮廓点集,组成复合轮廓集;

(2)根据复合轮廓集,计算复合轮廓的特征值,根据特征值进行匹配,形成复合轮廓子集的映射关系;

(3)根据已有变体字形字体的目标字的标准字形、已有变体字形字体的目标字的变体字形、待生成变体字形字体的目标字的标准字形的复合轮廓集绘制各复合轮廓的像素图,根据复合轮廓的像素图提取单像素骨架,并将单像素骨架的特征坐标化,作为各复合轮廓的骨架特征点集;

(4)根据目标字在已有变体字形字体的标准字形和变体字形的复合轮廓间的映射关系,将存在映射关系的复合轮廓子集中各复合轮廓骨架特征点集进行匹配,构建映射关系双方的骨架特征点间的映射关系,对存在明显几何结构变动的骨架特征点所在的复合轮廓,进行标记并记录其几何结构特征;

(5)根据目标字在已有变体字形字体和待生成变体字形字体的标准字形的复合轮廓集间的映射关系,将含有被标记的复合轮廓且存在映射关系的复合轮廓子集中的各复合轮廓骨架特征点集进行匹配,构建映射关系双方的骨架特征点间的映射关系;

(6)根据步骤(4)、步骤(5)对目标字在待生成变体字形字体的标准字形的骨架特征点进行几何结构变动,形成目标字在待生成变体字形字体的变体字形的复合轮廓;

(7)将目标字在待生成变体字形字体的目标字的变体字形的轮廓点集可描述转换成TrueType Font格式汉字字库字形,可在格式转换后写入字体文件的相应编码位置。

进一步的,步骤(1)还包括以下步骤,

(1.1)分别从已有变体字形字体的标准字形字体文件、已有变体字形字体的变体字体文件、待生成变体字形字体的标准字形体文件中获取目标字的具体表现字形的轮廓点集;

(1.2)根据轮廓划分以及轮廓嵌套关系组成复合轮廓集。

进一步的,步骤(2)包括以下步骤,

(2.1)根据已有变体字形字体的目标字的标准字形、已有变体字形字体的目标字的变体字形、待生成变体字形字体的目标字的标准字形的复合轮廓集,计算各复合轮廓的特征值;

(2.2)根据已有变体字形字体的目标字的标准字形、已有变体字形字体的目标字的变体字的复合轮廓集的特征值进行匹配,形成复合轮廓子集的映射关系;

(2.3)对已有变体字形字体的目标字的标准字形、待生成变体字形字体的目标字的标准字形的复合轮廓集,根据其特征值进行匹配,形成复合轮廓子集的映射关系。

进一步的,复合轮廓的特征值包括重心、面积占比、水平方向长度、竖直方向长度。

进一步的,步骤(4)中,存在映射关系的复合轮廓子集中各复合轮廓骨架特征点集,按向量间的欧几里得距离进行匹配。

进一步的,步骤(5)中,将含有被标记的复合轮廓的且存在映射关系的复合轮廓子集中,各复合轮廓骨架特征点集按向量间的欧几里得距离进行匹配。

本发明的有益效果是,(1)解决了用户在使用文本信息隐藏系统时可以只能利用现有的变体字库的情况

(2)节省了文本信息隐藏系统服务方在构建新的变体字库时所需的时间成本和人力成本

(3)相较于直接基于骨架进行字形几何结构特征迁移,基于单个复合轮廓进行字形几何结构特征迁移在匹配时更加准确

附图说明

图1是发明的流程图。

图2是实施例已有变体字形字体的目标字的标准字形图片。

图3是实施例已有变体字形字体的目标字的变体字形图片。

图4是实施例已有变体字形字体的目标字的标准字形矢量化骨架图片。

图5是实施例已有变体字形字体的目标字的变体字形矢量化骨架图片。

图6是实施例已有变体字形字体的目标字的标准字形矢量化骨架和已有变体字形字体的目标字的变体字形矢量化骨架对比图。

图7是实施例待生成变体字形字体的目标字的标准字形图片。

图8是实施例待生成变体字形字体的目标字的标准字形矢量化骨架图片。

图9是实施例待生成变体字形字体的目标字的变体字形图片。

图10是实施例待生成变体字形字体的目标字的标准字形轮廓和待生成变体字形字体的目标字的变体字形轮廓对比图。

具体实施方式

下面结合附图对本发明进行进一步描述。

本发明提供的基于骨架的汉字几何结构特征迁移方法,适用于基于UTF-8编码的TrueType Font格式汉字字库,该方法的主要步骤包括:

标准字形,包含未修改的轮廓数据等属性的某个字符的实例;

变体字形,包含已修改的轮廓数据等属性的某个字符的实例;

已有变体字形字体,已通过其他方式完成修改的字体;

待生成变体字形字体,需要通过本方法完成修改的字体;

标准字形字体文件,包含标准字形的字体文件;

变体字形字体文件,包含变体字形的字体文件;

目标字,需要修改的字形所对应的某个字符。

(1)确定目标字,获取目标字在已有变体字形字体中的标准字形、已有变体字形字体中的变体字形、待生成变体字形字体中的标准字形的轮廓点集,组成复合轮廓集;

(2)根据复合轮廓集,计算复合轮廓的特征值,根据特征值进行匹配,形成复合轮廓子集的映射关系;

(3)根据已有变体字形字体的目标字的标准字形、已有变体字形字体的目标字的变体字形、待生成变体字形字体的目标字的标准字形的复合轮廓集绘制各复合轮廓的像素图,根据复合轮廓的像素图提取单像素骨架,并将单像素骨架的特征坐标化,作为各复合轮廓的骨架特征点集;

(4)根据目标字在已有变体字形字体的标准字形和变体字形的复合轮廓间的映射关系,存在映射关系的复合轮廓子集中各复合轮廓骨架特征点集,按向量间的欧几里得距离进行匹配,构建映射关系双方的骨架特征点间的映射关系,对存在明显几何结构变动的骨架特征点所在的复合轮廓,进行标记并记录其几何结构特征;

(5)根据目标字在已有变体字形字体和待生成变体字形字体的标准字形的复合轮廓集间的映射关系,将含有被标记的复合轮廓的且存在映射关系的复合轮廓子集中,各复合轮廓骨架特征点集按向量间的欧几里得距离进行匹配,构建映射关系双方的骨架特征点间的映射关系;

(6)根据步骤(4)、步骤(5)对目标字在待生成变体字形字体的标准字形的骨架特征点进行几何结构变动,形成目标字在待生成变体字形字体的变体字形的复合轮廓;

(7)将目标字在待生成变体字形字体的目标字的变体字形的轮廓点集可描述转换成TrueType Font格式汉字字库字形,可在格式转换后写入字体文件的相应编码位置。

通过本方法解决了用户在使用文本信息隐藏系统时可以只能利用现有的变体字库的情况;节省了文本信息隐藏系统服务方在构建新的变体字库时所需的时间成本和人力成本;相较于直接基于骨架进行字形几何结构特征迁移,基于单个复合轮廓进行字形几何结构特征迁移在匹配时更加准确。

步骤(1)还包括以下步骤,

(1.1)分别从已有变体字形字体的标准字形字体文件、已有变体字形字体的变体字体文件、待生成变体字形字体的标准字形体文件中获取目标字的具体表现字形的轮廓点集;

(1.2)根据轮廓划分以及轮廓嵌套关系组成已有变体字形字体的目标字的标准字形、已有变体字形字体的目标字的变体字形、待生成变体字形字体的目标字的标准字形的复合轮廓集。

进一步的,步骤(2)包括以下步骤,

(2.1)根据已有变体字形字体的目标字的标准字形、已有变体字形字体的目标字的变体字形、待生成变体字形字体的目标字的标准字形的复合轮廓集,计算各复合轮廓的特征值;

(2.2)根据已有变体字形字体的目标字的标准字形、已有变体字形字体的目标字的变体字的复合轮廓集的特征值进行匹配,形成复合轮廓子集的映射关系;

(2.3)对已有变体字形字体的目标字的标准字形、待生成变体字形字体的目标字的标准字形的复合轮廓集,根据其特征值进行匹配,形成复合轮廓子集的映射关系。

复合轮廓的特征值包括重心、面积占比、水平方向长度、竖直方向长度。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现;因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

尽管本文较多地使用了图中附图标记对应的术语,但并不排除使用其它术语的可能性;使用这些术语仅仅是为了更方便地描述和解释本发明的本质;把它们解释成任何一种附加的限制都是与本发明精神相违背的。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号