首页> 中国专利> 基于西夏文声韵字根输入法的嵌入式软键盘系统

基于西夏文声韵字根输入法的嵌入式软键盘系统

摘要

本发明涉及一种基于西夏文声韵字根输入法的嵌入式软键盘系统,包括基于西夏文声韵编码的文心码键盘和基于西夏文字根编码的雕龙码键盘,所述西夏文输入软键盘系统还包括0到9共十个主键位和一组用于声韵数字键盘和字根数字键盘之间相互切换的功能键,所述声韵数字键盘的每个键位只包含两个声母首字符,所述字根数字键盘由十个西夏文字高频字根组成。与现有相关技术比较,本发明的声韵数字键盘实现了每个数字键位只包含两个声母首字符的独一无二的创新,本发明的字根数字键盘达到了平均码长为4码的优秀指标;在本发明独创的动态对偶组键技术的支撑下,同时达到80%输入为3键中字的卓越指标。

著录项

  • 公开/公告号CN104536590A

    专利类型发明专利

  • 公开/公告日2015-04-22

    原文格式PDF

  • 申请/专利权人 同济大学;

    申请/专利号CN201410836436.4

  • 发明设计人 叶建雄;叶海音;

    申请日2014-12-24

  • 分类号G06F3/023;G06F3/02;

  • 代理机构上海科盛知识产权代理有限公司;

  • 代理人赵志远

  • 地址 200092 上海市杨浦区四平路1239号

  • 入库时间 2023-12-18 08:20:29

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-12-15

    授权

    授权

  • 2015-05-20

    实质审查的生效 IPC(主分类):G06F3/023 申请日:20141224

    实质审查的生效

  • 2015-04-22

    公开

    公开

说明书

技术领域

本发明属于古文字编码及语音仿真领域,尤其涉及一种基于西夏文声韵字根 输入法的嵌入式软键盘系统。

背景技术

西夏语音的研究,历经了整整一个世纪,至今仍未曾解决语音格局的基本问 题。专利公开号为102566904A的西夏文语音仿真平台,采用了计算音韵学和数 据库技术,率先导出了西夏语单元音构型,终结了西夏语音采用斯拉夫语音构型 的尴尬历史,让西夏语音格局终于回归藏缅语的大家庭,为最终导出西夏语音奠 定了坚实的基础。

目前,成熟的西夏文输入方法还停留在四角号码、郑码、唐古码等基于标准 小键盘键位的几种方案之上,这些输入方案比较适用于传统的桌面设备。因此, 专门针对嵌入式操作系统平台上的西夏文输入方案这一块还是空白。然而,单纯 地将桌面系统的输入方案移植到嵌入式系统上,很可能会导致用户输入不便以及 种种技术上的问题。对于IOS、Android等嵌入式平台逐渐成为主流的今天,一种 专门为嵌入式系统平台设计的西夏文输入方案成为该领域的迫切需求。

发明内容

本发明的目的就是为了克服上述现有相关技术存在的缺陷而提供一种基于西 夏文声韵字根输入法的嵌入式软键盘系统。

本发明的目的可以通过以下技术方案来实现:

一种基于西夏文声韵字根输入法的嵌入式软键盘系统,包括基于西夏文声韵 编码的文心码键盘和基于西夏文字根编码的雕龙码键盘,其特征在于,所述西夏 文输入软键盘系统包括0到9共十个主键位和一组用于声韵数字键盘和字根数字 键盘之间相互切换的功能键,所述声韵数字键盘的每个键位只包含两个声母首字 符,所述字根数字键盘由十个西夏文字高频字根组成。

该软键盘还包括动态对偶组键,在初始状态下,被常用标点字符和功能组键 覆盖,当点击主键位区任一键时,瞬时弹出动态对偶组键,实现了一键多码模式 的突破。

所述的声韵数字键盘的主键位具体为:

1.ABC  2.DEF  3.GHI

4.JK   5.LM   6.NOP

7.QR  8.STU  9.VW

0.XYZ

回归拉丁字母的古典表音,实现每个键位只包含两个声母首字符。

在声韵输入模式下,点击所述数字键盘上主键位的任一按键后,弹出动态对 偶组键,与该主键声母合法相拼的韵母全部显示在对偶组键中,每一对偶组键位 对应2个以上码字。

所述的字根数字键盘的主键位由高频字根配置为:

1.横起笔 2.十字关联 3.竖起笔

4.半框关联 5.撇起笔 6.交叉关联

7.点起笔   8.倒八关联   9.折起笔

0.草历关联

其中,所述高频字根之间的频度排序为:5>4>6>2>1>3>8>7>9>0。

起笔关联键1、3、5、7、9对应横、竖、撇、点、折之外,次笔关联键2、 4、6、8、0对应如下:

十字关联,当起笔为横时,次笔分出十字关联,凡是起始两笔形成十字的中 低频字根都归到此类,这就是2号键;

半框关联,当起笔为竖时,次笔分出半框关联,凡是起始两笔形成半框的中 低频字根都归到此类,这就是4号键;

交叉关联,当起笔为撇时,次笔分出交叉关联,凡是起始两三笔有交叉的中 低频字根都归到此类,这就是6号键;

倒八关联,当起笔为点时,次笔分出倒八关联,凡是起始两笔有倒八字的中 低频字根都归到此类,这就是8号键;

草历关联,当起笔为折时,再分出草历关联,凡是起始笔类似草体历字首笔 的中低频字根都归到此类,这就是0号键。

在点击所述字根数字键上主键位的任一按键后,弹出动态对偶组键,与该主 键位字根关联的中低频字根分段显示在对偶组键中,并可通过空格键作组键翻 滚;每个中频字根对偶组键位对应2个码字,每个低频字根对偶组键位对应3个 码字。

该系统还包括全息码交换程序模块、西夏文字体库;所述西夏文字体库用于 存储西夏文字体;

所述全息码交换程序模块用于将基于西夏文声韵编码的声韵码或基于西夏字 根编码的字根码转换为统一的全息码;所述全息码用于在系统中对西夏字体库进 行协同交换操作。

所述嵌入式软键盘系统还包括西夏文语音库,用于保存西夏文语音;所述全 息码在所述西夏文语音库中进行协同交换和同步输出操作。

与现有相关技术比较,本发明具有以下效果:

1)基于西夏文声韵编码的声韵数字键盘恢复了拉丁字母的源音值y元音和j 辅音,纠正了英语读音规则中滥用特定拉丁字母的弊病,实现了每个数字键位只 包含两个声母首字符的独一无二的创新,而韵母则均匀配置在整个键盘的最佳键 位106,其独创的动态对偶组键102、104,在点触首键之后瞬时弹出,对应该键 声母相拼的韵母全部显示一览无遗,动态对偶组合键实现了一键多码模式的突 破,减少了输入过程的触键次数,大幅度提高输入效率。

2)基于西夏文字根编码的字根数字键盘采纳基于字根的全数字编码,其平均 码长达成4码的优秀指标;在动态对偶组键102、104技术的支撑下,同时达到 80%输入为3键中字的卓越指标;其配置以独创的方式实践了人-机工学原理,基 于字根的数字编码在西夏学界也是独一无二的,其编码效率、平均码长、重码 率、一致性等指标都上了一个台阶。

3)西夏文声韵字根输入法及其嵌入式软键盘系统的发明解决了西夏学界长期 未决的种种难题,为西夏文语音仿真平台导出西夏单元音构型、西夏语音格局回 归藏缅语大家庭、最终导出西夏语音奠定了坚实的基础,为计算音韵学在西夏学 研究中的应用提供了便捷友好的移动录入解决方案。

附图说明

图1为西夏文声韵字根输入法的数字键盘图;

图2为主键位点触操作后弹出的动态对偶组键图;

图3为组键点触操作后所显示的单行输入面板图;

图4为展开键点触后所显示的西夏文输入面板图;

图5为西夏文全息码的映射矩阵及其元素配置图。

具体实施方式

下面结合附图和具体实例对本发明进行详细说明。

1.西夏文软键盘系统的总体架构

西夏文软键盘系统的体系架构,设计为三层逻辑模式,通过公共云端链路与 西夏文语音仿真平台联接。本移动交换设备采用通用的移动信息操作系统,具备 经由I/O接口连接多个外围设备,包括触摸屏、扬声器以及外部存储设备等。环 境架构软件保存在存储器中,并在CPU上运行,全息码交换程序在环境架构的支 撑下运行。全息码交换程序模块包含西夏文用户界面、全息码组装交换模块以及 西夏字体语音联动处理模块等等。其中,文本发送和图形、语音接收模块属于调 用支撑环境的标准模块,不作具体说明。

西夏文心雕龙数字键盘的用户界面(GUI)、多码交换程序模块以及西夏字体 语音联动模块一起建成西夏文输入系统的主体架构,完成从点触西夏文面板输入 到西夏文字体及其应语音输出的全过程。西夏文输入系统内部的数据流程可以进 一步解析如下:

{开始}→{点触}→【用户界面GUI】→{生成文心雕龙码}→【多码交换模 块】→{全息交换码}→【SND ROUTINE】→{将文本数据发送到服务器}→【云 端链路】→{接收服务器回传}→【REC ROUTINE】→{字体与语音数据}→【字体 语音联动处理模块】→{传输}→【字体与语音界面】→{显示西夏字体并输出对应 的西夏语音}→{结束}

注:上述流程中,{}表示操作,【】表示相关操作关涉的目标对象,<>表示 流程分支。

2.基于西夏文字根的雕龙码输入法

西夏文雕龙码输入法的全部功能,由西夏文数字键盘100实现,该键盘采用 嵌入式系统设计,嵌入移动操作系统构成移动交换设备。西夏文数字键盘,通过 点击右上方的切换键进行切换,完成从文心码(图示左侧)到雕龙码输入法(图 示右侧)的自由切换。雕龙码输入法界面的主体是西夏字根主键区108,由十个 西夏文的最高频字根组成,按这些高频字根的频度排序,配置于人-机工学测频的 数字键盘,其分布序列如下:中键>左中>右中>中上>左上>右上>中下>左下>右 下>左下下。西夏文字根频度的统计,是伴随西夏文语音仿真平台的构建,历经 十余年才得出的研究成果。按频度分析结果将字根分成三个层次:高频字根10 个、中频字根100个和低频字根358个,其中,频度排序前10个高频字根配置于 主键位:表1为雕龙码主键区十个高频字根按频度配置表。

表1

其余100个中频字根,配置于动态对偶组键位102、104,每点触一个主键 位,都会对应弹出其对偶组键,每屏对偶组键10个键位,总共100个中频字根键 位。最后,358个低频字根配置于动态对偶组键的滚屏键位中,其滚屏操作由点 触空格键实施完成。西夏文数字键盘的空格键110,担负两种操作功能,在未弹 出动态对偶组键时,是普通的空格键110,一旦对偶组键弹出,就自动成为对偶 组键的滚屏操作键,完成西夏文低频字根的检索。

每一个动态对偶组键的键位对应几个码字,中频字根对应2个码字,低频字 根对应3个码字,这样,就颠覆了现存所有触摸输入法点触一次对应一个码字的 现状,减少了点触输入的次数,大幅提高了输入效率。

高频字根与中低频字根之间的关联,要遵循特定的原则,这样见到高频字根 就自然而然联想到中低频字根,以下对关联原则作一简要说明:

起笔关联,大约一半西夏文字根都是按起笔的横、竖、撇、点、折五种分类 笔画关联起来的,这就占去了1、3、5、7、9这5个主键位;

十字关联,当起笔为横时,再分出十字关联,凡是起始两笔形成十字的中低 频字根都归到此类,这就是2号键;

半框关联,当起笔为竖时,再分出半框关联,凡是起始两笔形成半框的中低 频字根都归到此类,这就是4号键;

交叉关联,当起笔为撇时,再分出交叉关联,凡是起始两三笔有交叉的中低 频字根都归到此类,这就是6号键;

倒八关联,当起笔为点时,再分出倒八关联,凡是起始两笔有倒八字的中低 频字根都归到此类,这就是8号键;

草历关联,当起笔为折时,再分出草历关联,凡是起始笔类似草体历字首笔 的中低频字根都归到此类,这就是0号键。

西夏文雕龙码输入过程,其数字键盘的实施模块程序流程可以表述如下:

{开始}→{点触}→【西夏字根主键位】→{弹出}→【西夏字输入面板】→{弹 出}→【动态对偶组键】→①

①→<若面板出现欲选西夏字>→②{点触}→【西夏字输入面板】→{结束}

①→<若面板未现欲选西夏字>→③

③→<若组键出现欲选西夏字的字根>→{点触}→【动态对偶组键】→{弹 出}→【西夏字输入面板】→①

③→<若组键未现欲选西夏字的字根>→{点触}→【空格键】→{滚动}→【动 态对偶组键】→③

注:上述流程中,{}表示操作,【】表示相关操作关涉的目标对象,<>表示 流程分支。

3.基于西夏文声韵的文心码输入法

西夏文心码输入法全部功能,也是由西夏文数字键盘100实现的,通过点触 右上的切换键位完成从雕龙码到文心码的切换。文心码输入法界面的主体是西夏 声韵主键区106,由十个嵌入拉丁字母的数字键组成。通过引入西夏文语音仿真 平台输出的西夏声母和韵母矩阵,构建了独一无二的西夏声韵体系。该声韵体系 恢复了拉丁字母的源音值y元音和j辅音,纠正了英语读音规则中滥用特定拉丁 字母的弊病。同时实现了数字键盘的每个键位只包含两个声母,而韵母则均匀配 置在整个键盘的最佳键位的目标。表2为文心码主键区声母韵母键位配置表

表2

西夏文心码输入法,采用独创的动态对偶组键102、104配置声母和韵母键 位,在点触主键区相应键位之后,瞬时弹出对偶组键,与该主键声母合法相拼的 韵母全部显示在对偶组键中,每一对偶组键位对应2个以上码字,这就颠覆了现 存所有触摸输入法点触一次对应一个码字的现状,实现输入过程的一键多码模 式,减少了点触输入的次数,大幅提高了输入效率。

西夏文心码输入过程,其数字键盘的实施模块程序流程可以表述如下:

{开始}→{点触}→【西夏声韵主键位】→{弹出}→【西夏字输入面板】→{弹 出}→【动态对偶组键】→①

①→<若面板出现欲选西夏字>→②{点触}→【西夏字输入面板】→{结束}

①→<若面板未现欲选西夏字>→③

③→<组键中出现欲选韵母>→{点触}→【动态对偶组键】→{弹出}→【西夏 字输入面板】→①

③→<组键中未现欲选韵母>→{点触}→【西夏声韵主键位】→{弹出}→【西 夏字输入面板】→①

注:上述流程中,{}表示操作,【】表示相关操作关涉的目标对象,<>表示 流程分支。

4.全息码本及其同构映射矩阵配置

西夏文多码及语音交换通道,其主体是全息码本和同构映射矩阵。全息码本 由同构映射矩阵166元素集合组成,共5910个标准西夏字与全息码一一对应,码 字采用拉丁字母a~z,数字2~9共34个字符。全息码本主键域的逻辑接口,一 端联接西夏数字键盘,另一端联接西夏字库和西夏语音库表,实现了从点触西夏 字面板输入到西夏字体、文心码、雕龙码、全息码及其西夏语音的协同交换和同 步输出功能。

全息码同构映射矩阵,按照西夏文字根频度的高低顺序,构建相应的元素格 及其频序次层格,在高频层格每一格对应一个字码,A~Z,2、3、5、7,总共 30个字码;其中频层格,每一格对应2个字码,次字码是a,e,u,2共4个字码; 其低频层格,也是每一格对应2个字符,只是次字码与中频不同,为3,4,5,6,8, 9共6个字码,其具体配置可见图5和表3所示,表3为全息码同构映射矩阵全元 素格与字根频度对应表:

表3

全息码同构映射矩阵的单元素格总共30格,其中26个是以字母为码字的: 同即a~z,以q为例,矩阵单元素格与字根频度的对应关系如表4,其中表4为 全息码映射矩阵单元素格166中的q与字根频度对应表。

表4

全息码矩阵的其余单元素格则以数字为码字:即2、3、5和7共计4个码 字,其与字母码字的区别在于低频层格,见表5。从上表可知,每一个单元素格 中的高频层格对应1个字码,中低频层格则对应2个字码。其中表5为全息码映 射矩阵单元素格166(2)与字根频度对应表

表5

从表4可生成的全息码子串为:q、q2、q3、q5、q4、q6、qa、qe、qu;从表 5可生成的全息码子串则为:2、22、23、25、28、29、2a、2e、2u,按此规则全 息码本即可以通过点触全息码面板由全息码构造程序模块直接生成。

在输入法系统的嵌入式数据库系统中,建立全息码数据库表,其字段结构如 表6所示,导入全息码本,辅以相关的数据库操作,于是,全息码交换程序模块 的源数据库表即告完成。其中表6为全息码嵌入式数据库表的字段结构。

表6

序号 西夏字 全息码 多码交换索引 语音交换索引                                        

全息码交换技术,不仅解决了西夏文输入和互联网交流中存在的难题,更重 要的是构建了西夏字体和语音联动的有效机制,成为西夏文语音仿真平台的关键 技术之一。全息码交换程序模块与文心雕龙数字键盘集成,实现了从点触西夏字 面板输入到西夏字体、文心码、雕龙码、全息码及其西夏语音的协同交换和同步 输出功能。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号