首页> 外国专利> IMAGE MANIPULATION BY TEXT INSTRUCTION

IMAGE MANIPULATION BY TEXT INSTRUCTION

机译:图像操作文本指令

摘要

A method for generating an output image from an input image and an input text instruction that specifies a location and a modification of an edit applied to the input image using a neural network is described. The neural network includes an image encoder, an image decoder, and an instruction attention network. The method includes receiving the input image and the input text instruction; extracting, from the input image, an input image feature that represents features of the input image using the image encoder; generating a spatial feature and a modification feature from the input text instruction using the instruction attention network; generating an edited image feature from the input image feature, the spatial feature and the modification feature; and generating the output image from the edited image feature using the image decoder.
机译:描述从输入图像生成输出图像的方法和指定使用神经网络应用于应用于输入图像的编辑的位置和修改的输入文本指令。 神经网络包括图像编码器,图像解码器和指令注意网络。 该方法包括接收输入图像和输入文本指令; 从输入图像中提取输入图像特征,该输入图像特征表示使用图像编码器表示输入图像的特征; 使用指令注意网络从输入文本指令生成空间特征和修改功能; 从输入图像功能,空间特征和修改功能生成编辑的图像特征; 并使用图像解码器从编辑图像特征生成输出图像。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号