欢迎来到人工智能与机器人产业平台!
智迎未来
数据资产登记
人工智能生成服装图像,以匹配文本查询 | 智能技术
时间:2020-03-12 来源:章鱼通

生成式对抗网络(GANs)由两部分组成的人工智能模型组成,其中包括一个生成样本的生成器和一个鉴别器,该鉴别器试图区分生成的样本和真实世界的样本,已应用于从视频、艺术品和音乐合成到药物发现和误导性媒体检测的任务中。正如亚马逊在一篇博客文章中透露的那样,它们也进入了电子商务领域。这家科技巨头的科学家们描述了一种GAN,它可以生成与产品描述相匹配的服装样本,他们说,这种样本可以用来完善客户的文本查询。例如,购物者可以搜索“女性的黑色裤子”,然后添加“petite”和“capri”两个单词,屏幕上的图像就会根据每个新单词做出相应的调整。


这与初创公司Vue商业化的GAN模式并无不同。人工智能可以分析衣服的特点,学会制作逼真的姿势、肤色和其他特征。从衣服的快照中,它可以生成各种尺寸的模型图像,比传统的照片拍摄快五倍。



亚马逊提出的ReStGAN系统是对现有系统StackGAN的改进,该系统将图像分成两部分生成。使用GAN,它首先直接从文本生成一个低分辨率的图像,然后用GAN将图像提升到一个具有纹理和自然色彩的高分辨率版本。GANs通过一个长期短期记忆AI模型进行训练,该模型按顺序处理顺序输入,使他们能够在输入中添加连续的单词时细化图像。为了简化从描述中进行综合的任务,系统被限制在三个产品类中,分别是裤子、牛仔裤和短裤,它们的训练图像是标准化的(即,背景被删除,图像被裁剪和调整大小,使他们在形状和比例上是一样的)。


研究团队以一种无人监督的方式对系统进行培训,这意味着培训数据由产品名称和图像组成,不需要任何额外的人工标注。他们使用一个辅助分类器来增加其稳定性,该分类器根据服装类型(裤子、牛仔裤或短裤)、颜色,以及它们是否描绘了男性、女性或男女通用的服装来对模型生成的图像进行分类。他们将颜色分组在一个叫做LAB的表征空间中,这个空间的设计是为了让点之间的距离与感知到的颜色差异相对应,从而形成一个查找表的基础,这个查找表将视觉上相似的颜色映射到文本描述的相同特征上。


研究人员表示,在添加新功能的同时保留旧的视觉功能是该系统的创新之处之一,另一个创新之处是颜色模型,它生成的图像颜色与文本输入更匹配。在实验中,该团队报告说,与之前基于StackGAN架构的性能最佳的模型相比,ReStGAN分别将产品类型和性别划分为22%到27%,这两个分类的准确率更高。在颜色方面,它提高了100%。


赞(0)
标签
相关动态
·
秀技能、展风采!2022年广东省人工智能工程应用职业技能竞赛开始报名啦!
·
天价芯片速成班能上吗?
·
自动驾驶汽车撞人,撞了白撞?
·
学了人工智能,饭碗就稳了?
·
关于开展广东省第十一届“省长杯”工业设计大赛新一代电子信息类专项赛作品征集的通知
·
用光远程遥控大脑?科技树点亮到奇怪的方向?
·
搞农业,一点也不土!
·
深度学习“撞到南墙”了?