Speaker diarization; graph neural networks; deep speaker embedding;
机译:使用自联想神经网络进行说话人区分
机译:NIST SRE18中具有神经网络嵌入功能的最先进的说话人识别功能,Wild评估中的说话人功能
机译:基于扬声器/风格嵌入的扬声器/型依赖神经网络语音合成
机译:基于图神经网络的会话级说话人嵌入细化算法
机译:说话者识别:对GMM-UBM和3D卷积神经网络系统的评估
机译:使用深度神经网络的说话人相关多音高跟踪
机译:使用深度递归卷积神经网络的扬声器二值化 用于扬声器嵌入