首页> 中国专利> 盲汉对照编辑排版系统及编辑排版方法

盲汉对照编辑排版系统及编辑排版方法

摘要

本发明涉及一种运行于Windows平台的盲汉对照编辑排版系统,同时也涉及该系统使用的编辑排版方法。本盲汉对照编辑排版系统由盲文输入装置,汉盲自动转换器,盲汉自动转换器,语音导航器,打印机,盲文刻印机,显示器,点显器,盲汉对照编辑排版装置所组成。该系统具有多种输入和输出功能,可以实现高准确度的汉语与盲文的自动翻译转换,盲汉对照的“所见即所得”的排版,盲文自动校对,同时针对盲文用户提供自动语音跟随功能,从而大大提高了盲文排版的效率和实用性。本盲汉对照编辑排版方法通过分行、分页和对开等格式化排版、自动对照、同步编辑、智能校对等步骤,实现了盲文编辑排版工作的自动化,为盲文出版工作提供了便利。

著录项

  • 公开/公告号CN1731389A

    专利类型发明专利

  • 公开/公告日2006-02-08

    原文格式PDF

  • 申请/专利权人 华建电子有限责任公司;

    申请/专利号CN200410070161.4

  • 发明设计人 黄河燕;

    申请日2004-08-04

  • 分类号G06F17/21;G06F17/28;

  • 代理机构北京北新智诚知识产权代理有限公司;

  • 代理人陈曦

  • 地址 100083 北京市海淀区北四环中路257号科群大厦西楼

  • 入库时间 2023-12-17 16:55:11

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2007-09-12

    授权

    授权

  • 2006-04-05

    实质审查的生效

    实质审查的生效

  • 2006-02-08

    公开

    公开

说明书

技术领域

本发明涉及一种运行于Windows平台的盲汉对照编辑排版系统,也涉及该系统使用的编辑排版方法,属于计算机文字处理技术领域。

背景技术

我国是世界上盲人最多的国家。广大盲人需要借助盲文这一工具来吸收人类社会的优秀文明成果。但盲文出版工作长期以来以手工操作为主,效率低、排版周期长、工作量大,难以满足广大盲人日益增长的需求。现在虽然也有面向盲人用户的计算机文字编辑系统,但它们普遍是80年代基于DOS操作平台开发的,兼容性差,功能比较弱,检查和校对中需要大量的人工操作,汉字转化为盲文的准确性不是很高,人机交互界面也不友好,容易出现误操作。

中国发明专利01129619.4公开了一种“盲人用的汉语智能计算机系统”。该计算机系统包括普通个人计算机、点显器输出装置、光学字符识别装置、盲人键盘输入及编辑器、语音输入器、打印机输出装置及语音合成输出装置;还包括自动转换的汉盲转换器、综合知识库、语音识别器、自然语言产生装置。光学字符识别装置、盲人键盘输入及编辑器、语音输入器三种输入通道构成统一的输入接口,点显器输出装置、打印机输出装置、语音合成输出装置构成的三种输出通道。该计算机系统的主要目的在于采用多种交互方式,使盲人能够方便地使用计算机。它虽然也具有一些基本的编辑排版功能,但功能有限,不能满足专业的盲文编辑排版工作的需要。

发明内容

鉴于上述情况,本发明的目的是提供一种专业性的盲汉对照编辑排版系统。该系统运行于Windows平台之上,可以实现内容输入、汉盲转换、排版、自动检查和校对、刻印等过程的一体化。

本发明的另外一个目的是提供一种在本盲汉对照编辑排版系统中使用的编辑排版方法。

为实现上述的发明目的,本发明采用下述的技术方案:

一种盲汉对照编辑排版系统,包括盲文输入装置,汉盲自动转换器,盲汉自动转换器,语音导航器,打印机,盲文刻印机,显示器,点显器,其特征在于:

该系统还包括盲汉对照编辑排版装置,所述盲汉对照编辑排版装置分别与所述盲文输入装置,汉盲自动转换器,盲汉自动转换器,语音导航器,打印机,盲文刻印机,显示器,点显器相连接,所述盲文输入装置与计算机键盘相连接,所述语音导航器与音箱相连接。

所述汉盲自动转换器按照汉语的词性将盲文连写规则构建为连写规则库,采用统计方法建立盲文分词连写统计表,根据连写规则库和盲文分词连写统计表实现汉语到盲文的转换。

所述盲汉自动转换器根据输入的盲文字串,查找盲字拼音对照库和盲文拼音一汉语拼音对照库,将盲文字串转换为汉语拼音字串;然后查找拼音汉字对照库、盲文分词词库和用户词库,由汉语拼音字串得到每个盲字的候选汉字矢量,形成候选词网格;最后查找邻接词概率统计库,用维特比算法在候选词网格中搜索一条概率最大的路径,从而生成汉语句子。

所述语音导航器包括屏幕信息获取模块、语音服务器模块和点显器输出模块,所述屏幕信息获取模块采用MSAA技术和HOOK技术获取屏幕文本信息及操作控制信息,所述语音服务器模块通过客户端动态库接口接受客户端进程的请求,将字符流通过语音合成技术合成为语音数据对外输出,从而实现全文光标自动跟随朗读。

一种基于上述盲汉对照编辑排版系统实现的盲汉对照编辑排版方法,其特征在于包括如下步骤:

(1)将盲汉对照文档或纯盲文文档保存为内部存储格式;

(2)根据排版规则自动转换为分页分行格式;

(3)对编辑器中的内容进行同步插入、修改和删除等编辑操作;

(4)在显示器中实时显示盲汉对照排版结果,按照用户要求提供盲汉对照格式;

(5)对编辑结果执行智能校对;

(6)将编辑结果输出到打印机或刻印机。

所述步骤(1)中,所述内部存储格式为盲文文档分解成的文档、节、段、字等不同层次的存储格式,每一部分分别设置该部分在编辑、排版、显示时的格式。

所述步骤(2)中,排版规则是指根据盲文的排版规则把一个盲文文档自动转换成分页分行格式,再根据形成的页行结构进行逐页逐行的显示或刻印等输出。

所述分行格式依据段属性、文档属性和断行规则实现,所述断行规则为:当前位置符合行尾禁则,下一个位置符合行首禁则,则可以断行。

所述分页格式包括对开排版方式,所述对开排版方式通过把排版的内容插入到一张对开的表格中,然后把表格作为对象嵌入到文档中的技术手段实现。

本发明所述的盲汉对照编辑排版系统具有多种输入和输出功能,可以实现高准确度的汉语与盲文的自动翻译转换,盲汉对照的“所见即所得”的排版,盲文自动校对,同时针对盲文用户提供自动语音跟随功能,从而大大提高了盲文排版的效率和实用性。本盲汉对照编辑排版方法通过分行、分页和对开等格式化排版、自动对照、同步编辑、智能校对等步骤,实现了盲文编辑排版工作的自动化,为盲文出版工作提供了便利。

附图说明

下面结合附图和具体实施方式对本发明作进一步的说明。

图1是本发明所述的盲汉对照编辑排版系统的组成示意图。

图2为本系统将盲文文档转换为ASCII码,形成刻印的盲文文件向刻印机输出的使用效果示意图。

图3为本盲汉对照编辑排版系统中使用的盲汉对照编辑排版方法的工作流程示意图。

图4为本盲汉对照编辑排版系统所提供的对开排版方式的使用效果示意图。

图5为本盲汉对照编辑排版系统进行编辑排版工作的使用效果示意图。

图6为本盲汉对照编辑排版系统进行智能校对工作的使用效果示意图。

具体实施方式

图1是本发明所述的盲汉对照编辑排版系统的组成示意图。本盲汉对照编辑排版系统包括供盲人用户使用的盲文输入装置;将汉字文档自动转化为盲文文档的汉盲自动转换器;将盲文文档自动转化为汉文文档的盲汉自动转换器;提供盲汉对照编辑、修改和按照格式实时显示输出功能的盲文编辑排版装置;获取各种操作、编辑状态及文档内容并转化为语音输出到音箱或点显器的语音导航器;将编辑排版的内容输出的打印机和盲文刻印机;将文档内容、编辑结果即时输出的显示器;帮助盲人操作、将各种操作、编辑状态及文档内容转化为ASCII码输出的点显器。其中盲汉对照编辑排版装置是整个系统的核心,它可以是一台配置Windows操作系统的普通个人计算机,上述的盲文输入装置、汉/盲自动转换器、语音导航器、打印机和刻印机、显示器、点显器都通过计算机上通用的接口如串口、并口、打印口等与该盲汉对照编辑排版装置相连接,而该盲文输入装置与计算机键盘相连接,语音导航器与音箱相连接。

上述的盲文输入装置用于解决盲人用户的信息录入问题。在该装置中嵌入了汉语盲文输入法、盲文、盲-汉、英文、盲文-ASCII、盲-英等多种输入法,可以兼容台湾盲文、双拼盲文、现行带调和部分带调盲文。由于汉盲输入法以拼音为基础,可以通过拼音方便地实现盲文点字的输入。

本盲文输入装置在使用汉盲输入法时,一旦用户输入不超过6个字符的拼音,汉盲输入法装置将得到的输入操作回显到写作窗口;一旦用户输入声调(0,1,2,3,4)后,输入法将认为拼音串输入操作结束,此时将查找盲文到拼音的转换库。如果所输入的字母能够组成一个汉语拼音音节,输入法自动将该输入音节转换成盲文并输出到编辑窗口。为方便盲人的使用,该汉盲输入法全程伴有读键盘操作,即时把输入内容转换为声音,供盲人用户选择合适的汉字或盲文,从而极大地方便了用户的使用。

本系统中使用的汉盲自动转换器是本发明人独立研发出来的装置。它基于中国发明专利ZL 96100831.8所揭示的汉语分词技术,按照词性将盲文连写规则构建为连写规则库,采用统计方法建立盲文分词连写统计表,从而实现汉语到四种汉语盲文(现行盲文、双拼盲文、国语点字盲文和粤语盲文)之间的转换。该装置使用的汉盲自动翻译转换方法已申请中国发明专利(专利申请号:200410046066.0),对该技术的详细说明可以在其说明书中找到,在此就不赘述了。

盲文到汉语自动转换器采用基于统计的马尔科夫(Markov)模型,用维特比(Viterbi)算法在候选汉字矩阵中搜索最优路径,从而解决盲文拼音串与多个候选汉字的对应问题,实现盲文到汉字的自动转换。它的工作过程如下:

1)根据输入的盲文字串,查找盲字拼音对照库和盲文拼音—汉语拼音对照库,将盲文字串转换为汉语拼音字串;

2)查找拼音汉字对照库、盲文分词词库和用户词库,由汉语拼音字串得到每个盲字的候选汉字矢量,形成候选词网格;

3)查找邻接词概率统计库,用Viterbi算法在候选词网格中搜索一条概率最大的路径,从而生成汉语句子。

在这里,邻接词概率统计库是采用基于统计的Markov模型对语料库统计而得到的,它视汉语语句服从Markov模型,即下一个汉字状态的发生概率仅与其以前的1个或n-1个汉字有关。而Viterbi算法是一种动态规划算法,它在实现从盲文到汉字的转换过程中体现为从网格中快速搜索一条最佳路径。这一搜索分为前向和后向两个过程,在前向过程中,用它计算由初始结点到每一个结点的最佳路径,并保存这条最佳路径。在后向过程中,用它根据保存的结果反向得出整个网格的最佳路径。

通过上述的汉盲自动转换器和盲汉自动转换器,可以随时将汉文转换为盲文,同时也可以将现行盲文、双拼盲文转换为汉文进行编辑。这就使得对盲文的编辑修改变得相当简单。系统不仅可以全文翻译,还可以通过即时翻译系统来实现文章的局部翻译,这样在修改不多的情况下,不必每次都要全部重新翻译而可以只是翻译修改了的那一部分,节省了时间和精力。翻译的过程是由计算机自动完成的,无需人工参与,这比传统的人工翻译效率提高了数倍,节省了大量的人力物力。

本盲汉对照编辑排版系统还配备有语音导航器。该语音导航器的作用在于将屏幕信息、排版编辑操作内容通过屏幕信息获取模块传送给语音服务器合成相应的语音输出或传送给点显器输出,实现自动语音跟随和语音导航,从而使盲人可以自由地操作计算机和该出版编辑系统。

语音导航器主要由屏幕信息获取模块、语音服务器模块和点显器输出模块三部分组成。屏幕信息获取模块负责获取屏幕文本信息及操作控制信息,它主要采用两种技术:MSAA技术和HOOK技术,HOOK技术将代码映射到其他应用程序的进程中以获得其信息,这需要获取键盘事件和鼠标事件等。MSAA即Microsoft Active Accessibility,是微软针对残疾人士使用Windows系统而提供的一种基于COM的技术接口。此外,针对一些特殊对象,比如Microsoft Word采用COM接口获取文字源,PDF采用Adobe公司提供AcrobatSDK来实现PDF的阅读等。语音服务器模块通过客户端动态库接口接受客户端进程的请求,将字符流通过语音合成技术合成为语音数据,然后通过计算机上的音频设备输出。点显器输出模块将字符流转换为盲文ASCII码,然后在点显器上输出,从而实现在无视觉情况下,对Windows系列计算机操作系统的全方位操作。

该语音导航器不但适合于本发明所述的盲汉对照编辑排版系统,而且适合于Word、Excel、PowerPoint、Internet Explorer、Acrobat等应用软件。它能够朗读计算机屏幕上当前活动窗口的所有或者特定的文字信息,并能对应用程序和窗口进行控制。它读出当前编辑排版装置中的文本、弹出的对话框、提示和激活按钮的内容等,光标移动时,读出新位置的信息如当前行、当前段、当前字等。它还具有全文朗读功能。当盲人需要全文自动朗读时,首先取得当前活动文档,然后将光标移至文首,取得首句文本朗读,当该句读完后,将光标移至下一句,取得下一句内容朗读,这样就可以实现排版装置中全文光标自动跟随朗读。通过屏幕朗读可以使盲人用户方便地操作该系统的排版编辑装置,自由地控制鼠标、键盘,实现盲文的转换、编辑、校对和输出。

本系统中的输出装置包括点显器、打印机和盲文刻印机。点显器是用在编辑排版过程中显示所编辑内容和状态的设备。它将编辑排版的内容和格式转化为标准盲文ASCII码,再在点显器上显示成盲文。盲人用户在听语音提示的同时可以用手摸点显器上显示的盲文,更快地感知编辑信息。盲文刻印机是盲文出版打印所需要的专用盲文打印设备。本系统可以将盲文文档直接转换为ASCII码,形成刻印的盲文文件向刻印机输出,如图2所示。

本盲汉对照编辑排版系统的核心是盲汉对照编辑排版装置。该装置不仅具备普通文本编辑器所具备的一般功能,而且还能够按照盲文的行首禁则、行尾禁则、页首禁则、页尾禁则、转行连号规则等对盲文文本进行自动排版,同时提供盲汉对照文档的同步编辑功能,是一个功能相当完善的、便于操作使用的文本编辑装置。该装置在进行文本编辑时,采用本系统特有的盲汉对照编辑排版方法,可以实现“所见即所得”的排版显示和智能校对。

上述盲汉对照编辑排版方法如图3所示,包括如下步骤:

(1)将盲汉对照文档或纯盲文文档保存为内部存储格式;

(2)根据排版规则自动转换为分页分行格式;

(3)对编辑器中的内容进行同步插入、修改和删除等编辑操作;

(4)在显示器中实时显示盲汉对照排版结果,按照用户要求提供盲汉对照格式;

(5)对编辑结果执行智能校对;

(6)将编辑结果输出到打印机或刻印机。

在上述的步骤(3)、(4)、(5)中,编辑排版的结果在显示器中实时显示出来,并随时可以通过打印机或者刻印机对外输出。在步骤(4)和(5)中,用户可以通过用户界面随时对编辑和校对的过程进行人工干预。

在上述的步骤(1)中,所谓的内部存储格式是根据盲文的特点和编辑器的编辑排版功能要求,同时参考目前流行的编辑器而制定的。该内部存储格式对盲文文档采用了文档、节、段、字等不同层次的存储格式。对于文档、节、段,每个层次都有自己的属性,用于设置该部分在编辑、排版、显示时的格式。

文档的属性主要包括:打印纸大小:主要用于普通打印机和显示,页边距:包括上、下、左、右,文档类型:包括汉文文档、部分带调现行盲文文档、全部带调现行盲文文档、双拼盲文文档、盲汉对照文档,其中盲汉对照文档还包括盲文在上和汉文在上两种方式,页面大小:即页行数和行方数。

节属性主要包括页码设置和断行方式设置,其中页码设置可以设置偶数页是否显示页码、奇数页是否显示页码、页码是否单独占一行、页码的位置、页码的对齐方式、页码的数字格式、该节的起始页码;盲文断行方式可以采用三种方式:空方断行、音节断行,加连词符、音节断行,不加连词符;根据这三种断行方式,在对盲文进行自动排版时会采取不同的方式。

段属性主要包括段的对齐方式、段前是否换行、段后是否换行、首行缩进、回行缩进;同时段属性还包括分页规则。每一段包括具体的文本内容。

上述步骤(2)中,格式规则是指根据盲文的排版规则把一个盲文文档自动转换成分页分行格式,即形成明确的页、行结构,再根据形成的页行结构进行逐页逐行的显示或刻印等输出。

一篇盲文可能包括不同的节,即封面、目录、正文等,这些不同的节分别有不同的页码设置和断行方式。根据正文的排版规则,对于不同的节,实施不同的断行方式和页码设置,就可以得到不同的排版格式。

盲文正文排版规则主要包括页禁则,行禁则。其中详细包括:

页首禁则:

页首出现的空行(软空行),应将其隐含,可选择某处不隐含,默认值为:隐含。隐含的空行不用输出,但应随内容移动,不在行首时,要输出。

居中的十方25点实线(处在页首时,应隐含)。随内容移动,不在行首时,应输出。

居中的十方5点虚线(处在页首时,应隐含),随内容移动,不在行首时,应输出。

文中表示隔界作用的“*”,上下应不空行(在页首时,应隐含),并随内容移动,不在行首时,应输出。

页尾禁则:

所有的居中标题都不能置在页末,若正好赶在页末,应将标题移至下一页。缺位用软回车填充,要输出。但随着内容的移动,软回车的作用将消失,后续标题应跟进。

正文与注释之间的分界线(10个顶格25点)不能置在页末,若正好赶在页末,应将分界线移置下一页。缺位用软回车填充,要输出。但随着内容的移动,软回车的作用将消失,后续内容应跟进。

行首禁则:

后置标点不可出现在行首。其中包括:逗号、顿号、分号、冒号、句号、叹号、后双引、后单引、后书名、后内书名、后圆括号、后方括号、间隔号。若正好赶在行首,应将其标点前的一个词或词中一个音节移置下一行,若将音节移置下一行,应在音节前加连号(36点,软连号),当音节移动时,软连号的作用将消失。

行首不能将音节分开,若后半个音节正好赶在行首,应将其音节的前半部分(即整个音节)移置本行,并在音节前加连号(36点,软连号)。

当文中起分词作用的空格出现在行首(软空格),应将其隐含在上行尾(可选),不占位(可选),不输出(可选),但随其内容移动,离开行首时,系统应将其变回硬空格,占位,输出。

行尾禁则:

前置标点不可出现在行末。其中包括:前双引、前单引、前书名、前内书名、前圆括号、前方括号、范围号、黑体字号、着重号、拉丁字母大写号、字母号、专名号、破折号。若正好赶在行末,应将其移置下行首。

行末不能将音节分开,若前半个音节正好赶在行末,应将其音节的前半部分(即整个音节)移置下行首,并在音节前加连号(36点,软连号)。

版心:

横排默认值为三十方(可调),纵排默认值为二十五行(可调)。每行应尽量排满,不得超方超行。

行末空方,不计行方数(可选),不计数时,不占位,应隐含,不输出。计数时,不占位,不隐含,要输出。

上述格式规则在盲汉对照文档中有特殊的体现。盲汉对照文档是一种特殊的盲文文档格式,每一组对照文本有三行,其中一行是盲文、一行是汉文、一行是用于分隔用的空行。它的特殊之处在于:盲文行和汉文行的每一组词也需要分开并且居中对齐显示输出。因此,文档内部对于盲汉对照文档也需要特殊的处理,每一段都有两个部分组成,其中一段是盲文段、另一段是汉文段,并且盲文段和汉文段都必须用特殊的符号分开每一个词,同时在编辑过程中保证盲文段和汉文段的词语总数一致,这样保证了盲文段和汉文段对照的完整性。

在进行盲文分行处理时,分行的依据包括段的属性、文档属性和用户设置的断行规则。段属性和页面设置在前文中已有说明,在此不再重复。

断行规则与不同盲文类型和不同盲文符号相关,根据现行盲文方案和双拼盲文方案,我们通过总结盲文的排版规则,得出盲文断行规则:当前位置符合行尾禁则,下一个位置符合行首禁则,则可以断行。具体解释如下:

1)当前位置应该符合的行尾禁则:

●当前是空方,可以断行;

●当前位置是前置标点,不可以断行;

●不能将音节分开。

2)下一个位置应该符合的行首禁则:

●不是后置标点;

●不能将音节分开。

在盲文编辑排版的过程中,本盲汉对照编辑排版系统还提供对开排版方式。该对开排版是盲文排版中的特有方式,如图4所示,主要是指盲文出版物中左右相对的两页,左页中的一行与右页中对应的一行内容是连续的,也就是每一整行都被分成相对等的两行。

为了实现这种盲文特有的排版方式,我们采用了面向对象的对开表技术,即把排版的内容插入到一张对开的表格中,然后把表格作为对象嵌入到文档中,从而形成对开排版格式。

本盲汉对照编辑排版方法的步骤(4)中,在对盲汉对照文档进行插入、修改和删除等操作过程中,对汉字或盲文的编辑操作都会影响到其对应的盲文或汉字,系统会自动地修改,实时地显示当前操作结果,如图5显示的那样。

步骤(5)所说的智能校对过程在执行中会生成如表1所示的表格:

序号  原文页号、行号  新文页号、行号12

                    表1

这个表格中自动标出原文和校对更改后文章中的改动内容分别在原文和校对文章中的位置,同时还可以将句子对齐形式的汉盲文对照文件保存到指定目录,这样盲人校对人员就不必再次重新校对全文,从而大大提高校对的效率,降低盲人校对的工作量。

在智能校对的过程中,如图6所示,选定错误位置的内容会自动出现在校对窗口的原文框中,只需要在校改文输入框中输入正确的内容,即可完成一处较改工作。当所有内容校对完成后,校正的全部内容都更新为正确的内容,并且错误内容和更正的内容被保存在一个文档中,并保留了被修改处的原页号、行号和更正后的页号、行号。该功能大大方便了本系统的使用者。

上面对本发明所述的盲汉对照编辑排版系统及编辑排版方法进行了详细的说明,但显然本发明的具体实现形式并不局限于此。对于本技术领域的一般技术人员来说,在不背离本发明所述方法的精神和权利要求范围的情况下对它进行的各种显而易见的改变都在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号