首页> 中国专利> 实现任意方向书写文本行切分的方法及系统

实现任意方向书写文本行切分的方法及系统

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及手写识别技术领域，公开了一种实现任意方向书写文本行切分的方法及系统。该方法包括：将连续笔迹切分为文本片断序列；根据所述文本片断序列中两相邻文本片断的合并概率对所述文本片断序列进行合并处理；获取合并处理完成后的文本片断序列，并将其作为有效文本行序列；将所述有效文本行序列中的各文本片断独立成行。本发明可以在提高文本行切分准确率的同时，实现对用户书写区域内的任意方向随意写的支持。

著录项

公开/公告号CN104809483A

专利类型发明专利
公开/公告日2015-07-29

原文格式PDF
申请/专利权人安徽科大讯飞信息科技股份有限公司;
展开▼

申请/专利号CN201410038222.2
发明设计人胡金水;竺博;王智国;胡郁;刘庆峰;
展开▼

申请日2014-01-26
分类号G06K9/68(20060101);G06K9/00(20060101);
代理机构11252 北京维澳专利代理有限公司;
代理人王立民;吉海莲
地址 230088 安徽省合肥市高新开发区望江西路666号
入库时间 2023-12-18 10:16:50

法律信息

法律状态公告日

法律状态信息

法律状态
2019-04-05

授权

授权
2016-02-10

著录事项变更 IPC(主分类):G06K9/68 变更前: 变更后: 申请日:20140126

著录事项变更
2015-08-26

实质审查的生效 IPC(主分类):G06K9/68 申请日:20140126

实质审查的生效
2015-07-29

公开

公开

说明书

技术领域

本发明涉及手写识别技术领域，具体涉及一种实现任意方向书写文本行切分的方法及系统。

背景技术

作为一种简单方便而又高效的输入方式，手写识别改变了传统的基于复杂编码或拼音输入的键盘模式，为自然人性的人机交互提供了便利条件。近年来，随着各种信息技术的迅猛发展，手写识别应用迎来了大屏幕触摸屏时代，有力地支撑了手写识别软件市场的发展，同时也对识别技术提出了新的要求和挑战。大屏幕设备为用户提供了更优的手写输入模式，允许用户以在线全屏多行手写输入识别方式完成输入。

实现多行手写输入的识别系统通常首先需要将用户输入的文字段切分成单行数据，随后将得到的文本行序列依次入单行连续手写识别引擎进行字符识别或解码。显然文本行切分的准确率对提高多行手写识别系统识别结果的正确性有着重要影响。

传统的文本行切分系统主要基于对连续笔迹的横纵轴投影直方图的分析，具体过程如下：

1.将文本段的笔迹分别向横轴和纵轴进行灰度投影；

2.对所得的横、纵轴灰度投影图分别分析，获取投影直方图包络的各波谷信息；

3.检测整个笔迹波形的特征，如波峰值，波谷长度等，确认所述波形包络波谷作为文本行空白的可能性，进而实现对多行书写字符的切分。

图1展示了对文本行“近几”“年来”的笔迹在纵轴上的投影直方图。从图上可以看到直方图包络存在明显的波谷信息，正对应文本行“近几”“年来” 的行间空白区。

图2展示了基于直方图包络的文本行切分过程。具体地，系统首先获取图中线条21所示的直方图包络，随后根据该包络的最大波峰Max及最低波谷 Min确定波峰波谷的阈值线，所述阈值定义为X=β1*Max+β2*Min（如线条22所示,β1,β2为系统预设的参数）。最后系统在波谷区域搜索全局最小波谷点，如线条23所示，即为文本行切分点。

现有的基于笔迹点投影直方图的方法仅能支持按照特定预设书写方向书写的文本行的切分，如从左到右或从上至下等标准逐行书写方式。该方法对其它更为自由的书写方式，如按照任意角度方向输入或每行书写方向都不一致的书写则无法进行有效切分，而且其切分准确率和实用性尚存在一定差距。

发明内容

本发明实施例提供一种实现任意方向书写文本行切分的方法及系统，在提高文本行切分准确率的同时，实现对用户书写区域内的任意方向随意写的支持。

本发明实施例提供一种实现任意方向书写文本行切分的方法，包括：

将连续笔迹切分为文本片断序列；

根据所述文本片断序列中两相邻文本片断的合并概率对所述文本片断序列进行合并处理；

获取合并处理完成后的文本片断序列，并将其作为有效文本行序列；

将所述有效文本行序列中的各文本片断独立成行。

优选地，所述文本片断序列包括以下任意一种或多种：单行数据、具有空白间隔的词组数据、单个字词。

优选地，所述将连续笔迹切分为文本片断序列包括：

依次计算所述连续笔迹中各样本点的位置偏移度；

选择所有位置偏移度大于设定的第一距离门限的样本点作为文本片断切分点，并将相邻切分点间的连续笔迹作为一个独立的文本片断，得到文本片断序列。

优选地，所述方法还包括：预先设定所述系统距离门限；或者根据当前输入的所有笔迹采样点距离实时确定所述第一距离门限。

优选地，所述将连续笔迹切分为文本片断序列包括：

依次计算所述连续笔迹中各样本点的位置偏移度；

选择所有位置偏移度大于第二距离门限的样本点作为文本片断切分点，得到粗切分文本片断序列；

对所述粗切分文本片断序列中各文本片断进行细切分，得到文本片断序列。

优选地，所述方法还包括：根据当前输入的所有笔迹采样点距离实时确定所述第二距离门限，具体包括：

确定当前输入笔迹中可能的字符大小；

将所述字符大小的整数倍作为所述第二距离门限。

优选地，所述确定当前输入笔迹中可能的字符大小包括：

获取当前输入笔迹中各笔画；

确定各笔画占据区域的外边界；

根据所述外边界的高度和宽度，确定当前输入笔迹中可能的字符大小。

优选地，所述根据所述文本片断序列中两相邻文本片断的合并概率对所述文本片断序列进行合并处理包括：

依次考察所述文本片断序列中的每个文本片断，考察过程如下：

计算待考察文本片断与其前一个文本片断的合并概率；

如果所述合并概率大于设定的合并门限，则将待考察文本片断与其前一个文本片断合并，并将合并后的文本片断作为下一个待考察文本片断的前一个文本片断。

优选地，所述根据所述文本片断序列中两相邻文本片断的合并概率对所述文本片断序列进行合并处理包括：

依次考察所述文本片断序列中两相邻文本片断，考察过程如下：

计算所述两相邻文本片断的合并概率；

如果所述合并概率大于设定的合并门限，则将所述两相邻文本片断进行合并，否则保留原文本片断。

优选地，按以下过程计算两相邻文本片断的合并概率：

分别计算两相邻文本片断各自的成行得分；

计算所述两相邻文本片断合并后的成行得分；

计算所述两相邻文本片断合并后的成行得分与所述两相邻文本片断各自的成行得分总和的差值，得到所述两相邻文本片断的合并概率。

优选地，所述计算所述两相邻文本片断合并后的成行得分包括：

提取所述两相邻文本片断对应的连续笔迹特征；

根据所述连续笔迹特征计算所述两相邻文本片断合并后的成行得分。

优选地，所述提取所述两相邻文本片断对应的连续笔迹特征包括：

提取所述两相邻文本片断对应的连续笔迹各自的中心线、以及所述两相邻文本片断合并后对应的连续笔迹的中心线；

计算各连续笔迹距离其中心线的平均距离、以及所述连续笔迹外部轮廓的中心点距离其心线的距离；

将得到的每个距离作为一个特征；

相应地，所述根据所述连续笔迹特征计算所述两相邻文本片断合并后的成行得分包括：

按以下公式计算所述两相邻文本片断合并后的成行得分Score：

$Score = w_{0} + Σ_{k = 1}^{K} w_{k} f_{k},$

其中，w₀为常数，f_k是第k个特征，K是特征总数，w_k是第k个特征的加权系数。

本发明实施例还提供一种实现任意方向书写文本行切分的系统，包括：

切分模块，用于将用连续笔迹切分为文本片断序列；

合并处理模块，用于根据所述文本片断序列中两相邻文本片断的合并概率对所述文本片断序列进行合并处理；

有效文本行序列获取模块，用于获取合并处理完成后的文本片断序列，并将其作为有效文本行序列；

分行模块，用于将所述有效文本行序列中的各文本片断独立成行。

优选地，所述切分模块包括：

计算单元，用于依次计算所述连续笔迹中各样本点的位置偏移度；

选择单元，用于选择所有位置偏移度大于设定的第一距离门限的样本点作为文本片断切分点，并将相邻切分点间的连续笔迹作为一个独立的文本片断，得到文本片断序列。

优选地，所述系统还包括：

设置模块，用于预先设定所述系统距离门限；或者

第一距离门限确定模块，用于根据当前输入的所有笔迹采样点距离实时确定所述第一距离门限。

优选地，所述切分模块包括：

计算单元，用于依次计算所述连续笔迹中各样本点的位置偏移度；

粗切分单元，用于选择所有位置偏移度大于第二距离门限的样本点作为文本片断切分点，得到粗切分文本片断序列；

细切分单元，用于对所述粗切分文本片断序列中各文本片断进行细切分，得到文本片断序列。

优选地，所述系统还包括：

第二距离门限确定模块，用于根据当前输入的所有笔迹采样点距离实时确定所述第二距离门限；

所述第二距离门限确定模块包括：

字符大小确定单元，用于确定当前输入笔迹中可能的字符大小；

门限计算单元，用于将所述字符大小的整数倍作为所述第二距离门限。

优选地，所述字符大小确定单元包括：

笔画获取子单元，用于获取当前输入笔迹中各笔画；

外边界确定子单元，用于确定各笔画占据区域的外边界，并根据所述外边界的高度和宽度，确定当前输入笔迹中可能的字符大小。

优选地，所述合并处理模块包括：

第一待考察文本片断提取单元，用于依次考察所述文本片断序列中的每个相邻文本片断，提取所述待考察文本片断与其前一个文本片段传送给合并概率计算单元；

所述合并概率计算单元，用于计算两相邻文本片断的合并概率；

判断单元，用于判断所述合并概率是否大于设定的合并门限；

合并单元，用于在所述合并概率大于设定的合并门限时，将所述两相邻文本片断进行合并；

所述第一待考察文本片断提取单元，还用于将所述合并单元合并后的文本片断作为下一个待考察文本片断的前一个文本片断。

优选地，所述合并处理模块包括：

第二待考察文本片断提取单元，用于依次考察所述文本片断序列中两相邻文本片断，提取所述两相邻片段传送给合并概率计算单元；

所述合并概率计算单元，用于计算所述两相邻文本片断的合并概率；

判断单元，用于判断所述合并概率是否大于设定的合并门限；

合并单元，用于在所述合并概率大于设定的合并门限时，将所述两相邻文本片断进行合并。

优选地，所述合并概率计算单元包括：

第一计算单元，用于分别计算两相邻文本片断各自的成行得分；

第二计算单元，用于计算所述两相邻文本片断合并后的成行得分；

第三计算单元，用于计算所述两相邻文本片断合并后的成行得分与所述两相邻文本片断各自的成行得分总和的差值，得到所述两相邻文本片断的合并概率。

优选地，所述第二计算单元包括：

特征提取子单元，用于提取所述两相邻文本片断对应的连续笔迹特征；

成行得分计算子单元，用于根据所述连续笔迹特征计算所述两相邻文本片断合并后的成行得分。

优选地，所述特征提取子单元包括：

中心线提取子单元，用于提取所述两相邻文本片断对应的连续笔迹各自的中心线、以及所述两相邻文本片断合并后对应的连续笔迹的中心线；

距离计算子单元，用于计算各连续笔迹距离其中心线的平均距离、以及所述连续笔迹外部轮廓的中心点距离其心线的距离；

特征输出子单元，用于将得到的每个距离作为一个特征；

所述成行得分计算子单元，具体用于按以下公式计算所述两相邻文本片断合并后的成行得分Score：

$Score = w_{0} + Σ_{k = 1}^{K} w_{k} f_{k},$

其中，w₀为常数，f_k是第k个特征，K是特征总数，w_k是第k个特征的加权系数。

本发明实施例提供的实现任意方向书写文本行切分的方法及系统，首先从在线输入文本笔迹中依次提取文本片断形成文本片断序列；随后根据计算得到的两相邻文本片断的合并概率对所述文本片断序列进行相邻片断合并处理，获得有效文本行序列，有效文本行序列中的各文本片断即对应了一个独立行。本发明不仅可以提高文本行切分的准确率，而且支持用户在书写区域内的任意方向的书写输入。所述任意方向是指不限定为从上到下，或从左到右的方向，可以是从左上到右下，从右上到左下等，且不限定多行数据的书写方向一致性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是多行汉字书写笔迹点序列向纵轴投影获得的直方图；

图2是现有技术中基于纵轴直方图的多行切分过程示意图；

图3是本发明实施例实现任意方向书写文本行切分的方法的流程图；

图4是本发明实施例中实时确定距离门限的流程图；

图5是本发明实施例中对文本片断序列进行合并处理的一种流程图；

图6是本发明实施例中对文本片断序列进行合并处理的另一种流程图；

图7是本发明实施例中计算两相邻文本片断的合并概率的流程图；

图8是本发明实施例中文本行中心线估计结果示意图；

图9是本发明实施例中连续笔迹书写区域中心点到中心线距离示意图；

图10是本发明实施例实现任意方向书写文本行切分的系统的结构示意图；

图11是本发明实施例中合并概率计算单元的一种具体实现结构示意图；

图12是本发明实施例中合并概率计算单元的另一种具体实现结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明实施例的方案，下面结合附图和实施方式对本发明实施例作进一步的详细说明。

针对现有的基于笔迹点投影直方图的方法的局限性以及文本行切分准确率低的问题，本发明实施例提供一种实现任意方向书写文本行切分的方法及系统，首先从在线输入文本笔迹中依次提取文本片断形成文本片断序列；随后对文本片断序列进行相邻片断合并获得有效文本行序列，进而确定所述有效文本行序列中各文本行的方向，实现对书写文本行的切分。

进一步地，还可以从每个文本行对应的笔迹分布中确定该行数据对应的倾斜角度以实现对该文本行的规整，提高后续手写识别的准确率。

如图3所示，是本发明实施例实现任意方向书写文本行切分的方法的流程图，包括以下步骤：

步骤301，将连续笔迹切分为文本片断序列。

所述文本片断可以是单行数据，或者是具有较大空白间隔的词组数据，甚至是单个字词等。

在本发明实施例中，可以根据连续笔迹中相邻样本点间的坐标偏移度进行文本片断的切分。具体地，可以有多种实现方式，比如：

第一种切分方式如下：

（1）依次计算所述连续笔迹中各样本点的位置偏移度，以确定样本点的相对位置变化，具体可以通过计算各样本点的坐标差值来描述。

比如，对考察样本点P_o=(x_i,y_i)，其样本点位置偏移度为ΔP_i=(Δx_i,Δy_i)，其中，Δx_i=x_i-x_i-1,Δy_i=y_i-y_i-1。

（2）根据所述位置偏移度切分所述连续笔迹，得到一个有顺序的笔迹段序列集合，即前面所述的文本片断序列。

具体地，可以选择所有位置偏移度大于设定的第一距离门限的样本点为文本片断切分点，并将相邻切分点间的连续笔迹作为一个独立的文本片断。

需要说明的是，在实际应用中，上述第一距离门限可以预先设定，也可以由系统根据当前输入的所有笔迹采样点距离实时确定，其实现过程将在后面详细描述。

第二种切分方式如下：

（1）依次计算所述连续笔迹中各样本点的位置偏移度，以确定样本点的相对位置变化，具体可以通过计算各样本点的坐标差值来描述。

比如，对考察样本点P_o=(x_i,y_i)，其样本点位置偏移度为ΔP_i=(Δx_i,Δy_i)，其中，Δx_i=x_i-x_i-1,Δy_i=y_i-y_i-1。

（2）对所述连续笔迹进行粗切分，得到粗切分文本片断序列。

在该步骤中，可以选择所有位置偏移度大于第二距离门限的样本点作为文本片断切分点，所述第二距离门限可以根据用户当前输入的所有笔迹采样点距离设置，第二距离门限的确定过程将在后面详细描述。

（3）对所述可能的文本片断序列中各文本片断进行细切分，得到文本片断序列。

具体地，可以对每个粗切分文本片断分别根据当前考察的文本片断中用户笔迹特点设定相应的距离门限（该距离门限可以与前面所述的第一距离门限相同，也可以不同），并选择该文本片断中所有位置偏移度大于所设定的距离门限的样本点为切分点。

步骤302，根据所述文本片断序列中两相邻文本片断的合并概率对所述文本片断序列进行合并处理。

在实际应用中，所述合并概率可以有多种计算方式，对此将在后面详细描述。

另外，可以预先设定一个合并门限，如果所述合并概率大于设定的门限值，则将所述两相邻文本片断进行合并，否则保留原文本片断。

步骤303，获取合并处理完成后的文本片断序列，并将其作为有效文本行序列。

步骤304，将所述有效文本行序列中的各文本片断独立成行。

前面提到，本发明实施例中，第一距离门限和第二距离门限都可以根据用户输入的笔迹进行实时确定，下面对此进行详细说明。

如图4所示，是本发明实施例中实时确定距离门限的流程图，包括以下步骤：

步骤401，确定用户当前输入笔迹中可能的字符大小。

所述字符大小可用字符的宽度、高度像素值来表示。首先，获取用户当前输入笔迹中各笔画，即落笔点到抬笔点之间的书写笔迹。然后，确定各笔画占据区域的外边界，即各笔画以其所有有效笔迹点中的最左上点与最右下点连线为对角线的矩形的边框区域。根据所述外边界的高度和宽度，确定用户当前输入笔迹中可能的字符大小。

比如，可以统计用户当前输入笔迹中所有笔画的外边界的高度和宽度，并取平均值作为字符大小。

进一步地，为了提高鲁棒性，还可以对所有笔画外边界的高度和宽度按照从大到小（或从小到大）顺序排列，并选择其中一定比例（比如50%）的最大数据进行平均值的计算，将计算得到的平均值作为优选的字符大小。

步骤402，将所述字符大小的整数倍作为距离门限。

即假设字符大小记为charSize，则第二距离门限为k*charSize，其中，参数k（正数）用于控制分块的大小。

根据不同的应用环境，距离门限可以有不同的设置准则。比如在上述第一种切分方式中，考虑到相邻行之间虚笔段（用户抬笔点到下一个落笔点之间的笔段）的样本点位置偏移度一般远大于相邻字或字内相邻笔段间的虚笔段的位置偏移度，为了尽可能将所有文本行分离，可以设定k为一个较大的值，如 k=2。而在上述第二种切分方式中,在粗切分时通常需要设置一个更大的门限，如k=4，以实现对文本行的可靠切分。而在细切分中，可以根据新的charSize 参数计算新的门限，如k=1/2或1/3等。

当然，需要说明的是，上述描述只是对本发明实施例中不同距离门限进行实时确定的举例，在实际应用中，还可以采用不同的确定方式，尤其是为了降低计算的复杂度，上述第一距离门限也可以预先根据经验值来确定，对此本发明实施例不做限定。

在本发明实施例中，对文本片断序列进行合并处理也可以采样多种方式，下面对此分别进行详细说明。

如图5所示，是本发明实施例中对文本片断序列进行合并处理的一种流程图。在该实施例中，通过迭代方式依次考察文本片断中的每个文本片断，即对于可以合并的两个相邻文本片断，在将其合并后，对于下一个待考察的文本片段，会将合并后的文本片断作为所述下一个待考察文本片断的相邻文本片断，而不是直接将未合并前的文本片断作为所述下一个待考察文本片断的相邻文本片断。

该流程包括以下步骤：

步骤501，获取文本片断序列中的待考察文本片断；

步骤502，计算待考察文本片断与其前一个文本片断的合并概率；

步骤503，判断所述合并概率是否大于设定的合并门限；如果是，则执行步骤504；否则，执行步骤505；

步骤504，将待考察文本片断与其前一个文本片断合并，并将合并后的文本片断作为下一个待考察文本片断的前一个文本片断；

步骤505，判断是否已全部考察完毕；如果是，则结束；否则，返回步骤 501，继续获取下一个待考察的文本片断。

如图6所示，是本发明实施例中对文本片断序列进行合并处理的另一种流程图。

与图5所示实施例不同的是，在该实施例中，将文本片断序列中每两个相邻文本作为一组，依次考察每组中两相邻文本片断是否可以合并。

该流程包括以下步骤：

步骤601，获取文本片断序列中待考察的两相邻文本片断；

步骤602，计算所述两相邻文本片断的合并概率；

步骤603，判断所述合并概率是否大于设定的合并门限；如果是，则执行步骤604；否则，执行步骤605；

步骤604，将所述两相邻文本片断合并；

步骤605，判断是否已全部考察完毕；如果是，则结束；否则，返回步骤 601，继续获取下一组待考察的两相邻文本片断。

如图7所示，是本发明实施例中计算两相邻文本片断的合并概率的流程图，包括以下步骤：

步骤701，分别计算两相邻文本片断各自的成行得分。

步骤702，计算所述两相邻文本片断合并后的成行得分。

在本发明实施例中，可以提取两相邻文本片断对应的连续笔迹特征，综合这些特征计算得到两相邻文本片断合并后的成行得分，具体过程将在后面举例详细说明。

步骤703，计算所述两相邻文本片断合并后的成行得分与所述两相邻文本片断各自的成行得分总和的差值，得到所述两相邻文本片断的合并概率。

显然，上述成行得分对文本片断是否可以合并有着直接的指导意义，两相邻文本片断合并后的成行得分的一种计算方式如下：

（1）提取两相邻文本片断对应的连续笔迹各自的中心线、以及所述两相邻文本片断合并后对应的连续笔迹的中心线。

具体地，可以采用样本回归方法估计文本行的中心线，将文本行中心线记为：y=a*x+b。

首先计算连续笔迹上所有样本点和文本行中心线y=a*x+b的误差函数，然后利用最小二乘对所述文本行中心线的参数a，b进行参数优化，确定文本行中心线。

图8展示了中心线估计结果：其中上下两条线分别是对应第一文本片断（“一年一度秋风劲”）及第二文本片断（“不似春光胜似春光”）的中心线，中间一条线是对应两文本片断合后的中心线。

（2）计算各连续笔迹距离其中心线的平均距离、以及所述连续笔迹外部轮廓的中心点距离其心线的距离。

显然，对于多行样本，其连续笔迹距离其中心线的平均距离D3要远远大于其中各文本片断对应的连续笔迹距离各自中心线的平均距离D1和D2的总和。

为了提高计算的鲁棒性，还可以进一步将部分距离中心线较远的采样点距离中心线的平均距离作为优化的成行特征，比如，可以选择所有采样点中距离最远的20%的数据，计算这些数据距离其中心线的平均距离，以此来度量文本行的直线性。

另外，在本发明实施例中，还可计算各连续笔迹外部轮廓的中心点距离其心线的距离，如图9所示。

（3）将得到的每个距离作为一个特征。

（4）基于所述特征计算两相邻文本片断合并后的成行得分，具体公式如下：

$Score = w_{0} + Σ_{k = 1}^{K} w_{k} f_{k},$

其中，w₀为常数，f_k是第k个特征，K是特征总数，w_k是第k个特征的加权系数，均由系统预先在开发集上训练得到（即通过已知样本统计其数据分布特征，作为初始值预设在系统中），也可以根据经验值设定。

需要说明的是，上面计算文本片断序列中两相邻文本片断的合并概率的方法仅是一种具体举例，在实际应用中，还可以有其它计算方式，比如，将其转换为灰度图图片再依据灰度直方图投影寻找切分点进行切分合并等操作，对此本发明实施例不做限定。

另外，文本片断各自的成行得分的计算也可以采用与上述类似的方法，在此不再赘述。

可见，利用本发明实施例实现任意方向书写文本行切分的方法，不仅可以提高文本行切分的准确率，而且支持用户在书写区域内的任意方向的书写输入。所述任意方向是指不限定为从上到下，或从左到右的方向，可以是从左上到右下，从右上到左下等，且不限定多行数据的书写方向一致性。

相应地，本发明实施例还提供一种实现任意方向书写文本行切分的系统，如图10所示，是该系统的一种结构示意图。

在该实施例中，所述系统包括：

切分模块1001，用于将用户输入的连续笔迹切分为文本片断序列；

合并处理模块1002，用于根据所述文本片断序列中两相邻文本片断的合并概率对所述文本片断序列进行合并处理，比如，在所述合并概率大于设定的合并门限时，将所述两相邻文本片断进行合并，否则保留原文本片断；

有效文本行序列获取模块1003，用于获取合并处理完成后的文本片断序列，并将其作为有效文本行序列；

分行模块1004，用于将所述有效文本行序列中的各文本片断独立成行。

所述文本片断可以是单行数据，或者是具有较大空白间隔的词组数据，甚至是单个字词等。在本发明实施例中，切分模块801可以根据连续笔迹中相邻样本点间的坐标偏移度进行文本片断的切分，而且有多种实现结构，比如：

切分模块1001的一种具体实现结构包括：计算单元和选择单元。其中：

计算单元，用于依次计算用户输入的连续笔迹中各样本点的位置偏移度；

切分模块1001的另一种具体实现结构包括：计算单元、粗切分单元、以及细切分单元。其中：

计算单元，用于依次计算用户输入的连续笔迹中各样本点的位置偏移度；

粗切分单元，用于选择所有位置偏移度大于第二距离门限的样本点作为文本片断切分点，得到粗切分文本片断序列；

细切分单元，用于对所述粗切分文本片断序列中各文本片断进行细切分，得到文本片断序列。

需要说明的是，上述第一距离门限可以预先设定，也可以由系统根据用户当前输入的所有笔迹采样点距离实时确定。

为此，相应于切分模块1001上述第一种实现结构，所述系统中还可进一步包括：设置模块或第一距离门限确定模块，其中：

设置模块，用于预先设定所述系统距离门限；

第一距离门限确定模块，用于根据用户当前输入的所有笔迹采样点距离实时确定所述第一距离门限。

相应于切分模块1001上述第二种实现结构，所述系统中还可进一步包括：第二距离门限确定模块，用于根据用户当前输入的所有笔迹采样点距离实时确定所述第二距离门限。

另外，需要说明的是，在实际应用中，上述第一距离门限和第二距离门限可以采用相同的方法进行实时确定，也可以采用不同的方法进行实时确定。相应地，上述第一距离门限确定模块和第二距离门限确定模块可以是同一物体实体，也可以是不同的物理实体，对此本发明实施例不做限定。

比如，距离门限确定模块的一种结构可以包括：

字符大小确定单元，用于确定用户当前输入笔迹中可能的字符大小；

门限计算单元，用于将所述字符大小的整数倍作为所述第二距离门限。

所述字符大小可用字符的宽度、高度像素值来表示。在本发明实施例中，可以根据用户当前输入笔迹中所有笔画的外边界的高度和宽度，并取平均值作为字符大小。

为此，上述字符大小确定单元可以包括：笔画获取子单元和外边界确定子单元。其中：笔画获取子单元用于获取用户当前输入笔迹中各笔画；外边界确定子单元用于确定各笔画占据区域的外边界，并根据所述外边界的高度和宽度，确定用户当前输入笔迹中可能的字符大小。

假设字符大小记为charSize(字符等高等宽)，则第一距离门限可以记为 k1*charSize，第二距离门限可以记为k2*charSize。

根据不同的应用环境，距离门限可以有不同的设置准则。为此，在上述第一种切分方式中，考虑到相邻行之间虚笔段（用户抬笔点到下一个落笔点之间的笔段）的样本点位置偏移度一般远大于相邻字或字内相邻笔段间的虚笔段的位置偏移度，为了尽可能将所有文本行分离，可以设定k1为一个较大的值，如k1=2。而在上述第二种切分方式中，在粗切分时通常需要设置一个更大的门限，如k2=4，以实现对文本行的可靠切分。而在细切分中，可以根据新的 charSize参数计算新的门限，如倍数k=1/2或1/3等。

在实际应用中，合并处理模块1002可以有多种实现结构，如图11所示，合并处理模块1002的一种具体结构包括：第一待考察文本片断提取单元1101、合并概率计算单元1102、判断单元1103及合并单元1104。其中：

第一待考察文本片断提取单元1101，用于依次考察所述文本片断序列中的每个相邻文本片断，提取所述待考察文本片断与其前一个文本片段传送给合并概率计算单元；

合并概率计算单元1102，用于计算两相邻文本片断的合并概率；

判断单元1103，用于判断所述合并概率是否大于设定的合并门限；

合并单元1104，用于在所述合并概率大于设定的合并门限时，将所述两相邻文本片断进行合并。

在该实施例中，第一待考察文本片断提取单元1101还用于将所述合并单元1104合并后的文本片断作为下一个待考察文本片断的前一个文本片断。

在实际应用中，可以由合并单元1104将合并后的文本片断直接传送给合并单元1104，当然，合并单元1104将合并后的文本片断写到一个文件或存储区，由第一待考察文本片断提取单元1101从该文件或存储区中读取获得合并后的文本片断，对此本发明实施例不做限定。

如图12所示，合并处理模块1002的另一种具体结构包括：第二待考察文本片断提取单元1201、合并概率计算单元1102、判断单元1103和合并单元 1104。其中，合并概率计算单元1102、判断单元1103和合并单元1104与图 10中所示的各相应单元功能相同，不同的是，在该实施例中，第二待考察文本片断提取单元1201，用于依次考察所述文本片断序列中两相邻文本片断，提取所述两相邻片段传送给合并概率计算单元。

其中，合并概率计算单元1102可以根据两相邻文本片断的成行得分计算其合并概率，合并概率计算单元1102的一种具体实现结构包括：

第一计算单元，用于分别计算两相邻文本片断各自的成行得分；

第二计算单元，用于计算所述两相邻文本片断合并后的成行得分；

在本发明实施例中，可以综合两相邻文本片断对应的连续笔迹特征计算得到两相邻文本片断合并后的成行得分。

为此，上述第二计算单元可以包括：

特征提取子单元，用于提取两相邻文本片断对应的连续笔迹特征；

成行得分计算子单元，用于根据所述特征计算所述两相邻文本片断合并后的成行得分。

上述特征可以包括各连续笔迹距离其中心线的平均距离、以及所述连续笔迹外部轮廓的中心点距离其心线的距离。

相应地，上述特征提取子单元可以包括：

中心线提取子单元，用于提取两相邻文本片断对应的连续笔迹各自的中心线、以及所述两相邻文本片断合并后对应的连续笔迹的中心线；

距离计算子单元，用于计算各连续笔迹距离其中心线的平均距离、以及所述连续笔迹外部轮廓的中心点距离其心线的距离；

特征输出子单元，用于将得到的每个距离作为一个特征。

相应地，上述成行得分计算子单元可以按以下公式计算所述两相邻文本片断合并后的成行得分Score：

$Score = w_{0} + Σ_{k = 1}^{K} w_{k} f_{k},$

其中，w₀为常数，f_k是第k个特征，K是特征总数，w_k是第k个特征的加权系数。

需要说明的是，在实际应用中，计算文本片断序列中两相邻文本片断的合并概率还可以有其它计算方式，比如，将其转换为灰度图图片再依据灰度直方图投影寻找切分点进行切分合并等操作。相应地，上述各模块及单元或子单元也可以有其它实现结构，对此本发明实施例不做限定。

本发明实施例实现任意方向书写文本行切分的系统，不仅可以提高文本行切分的准确率，而且支持用户在书写区域内的任意方向的书写输入。所述任意方向是指不限定为从上到下，或从左到右的方向，可以是从左上到右下，从右上到左下等，且不限定多行数据的书写方向一致性。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的，其中所述作为分离部件说明的模块或单元可以是或者也可以不是物理上分开的，作为模块或单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器（DSP）来实现根据本发明实施例的系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序（例如，计算机程序和计算机程序产品）。这样实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

以上对本发明实施例进行了详细介绍，本文中应用了具体实施方式对本发明进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及设备；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 实现任意方向书写文本行切分的方法及系统 [P] . 中国专利： CN104809483B . 2019.04.05
2. 实现任意方向书写文本行切分的方法及系统 [P] . 中国专利： CN104809483A . 2015-07-29
3. 2 2 APPARATUS AND METHOD FOR IMPLEMENTING MULTI-DISPLAY OF MPEG2 FILE IN MPEG2 FILE REPRODUCING SYSTEM [P] . 韩国专利： KR20010102899A . 2001-11-17

机译： 2 2在MPEG2文件再现系统中实现MPEG2文件的多显示的装置和方法
4. Automated method of construction of semantic HUMAN SERVICES SYSTEM AND METHOD FOR THE IMPLEMENTATION OF THIS [P] . 俄罗斯专利： RU2008107604A . 2009-09-10

机译：语义人文服务系统的自动化构建方法及其实现方法
5. Method of manufacture of a support for the printing / writing personalized, support thus obtained and computer system for implementing said method [P] . 法国专利： FR2812106B1 . 2003-01-10

机译：用于个性化打印/书写的支架的制造方法，由此获得的支架以及用于实现所述方法的计算机系统