audiovisual integration; correlation; lip motion; news videos; speech scene extraction;
机译:基于动画融合模型的视频目标检测与全局运动场景的研究
机译:使用嘴唇运动,嘴唇纹理和音频的多模式说话者/语音识别
机译:MultiView监控视频的运动方向基于不一致的战斗检测
机译:基于嘴唇运动和语音并发的新闻视频语音场景提取,检测主题和说话者之间的不一致
机译:通过基于运动的检测,跟踪和聚类进行决策的视频状态提取
机译:基于纹理图像信息的语音情感特征提取
机译:利用VQ失真进行广播新闻语音识别的扬声器变化检测和扬声器聚类