会员登录密码注册 登录

投稿请发至邮箱:news@swcjw.com.cn

您当前的位置:首页 > 名家专栏 > 专访

专访VersaCTO赵维杰:专注于人工智能研发 打造视觉体验黑科技

时间:2018-04-09 22:16    来源:全景网  

  伴随着Prisma的爆红,市场上逐渐涌现出一批功能相近的软件,他们都拥有着神奇的风格转换能力,瞬间可以为普通照片添加名画风格。Versa也是这其中的一员,但又区别于这些类似的软件。Versa利用自己独特的人景分离、风格迁移能力被誉为视觉体验的黑科技产品。关于Versa的黑科技,一直是VersaCTO赵维杰专攻的方向,赵维杰表示未来会用更强的人工智能打造更优秀的产品来为创作者赋能。

  2017年四月上线的 Versa 目前可以提供 40 多种风格模版,并于成立5个月的时候上线了人景分离功能。在 Versa 的三年路线图中,还有很多与图像风格迁移、人景分离类似的小节点正等待逐一上线。

  Versa 的二位创始人 CEO 蔡天懿与 CTO 赵维杰是大学时代的室友,大学毕业后,蔡天懿赴巴黎深造,并专攻产品方向,曾是格瓦拉的产品合伙人;而赵维杰加入华为,专攻人工智能技术。

  目前,Versa 注册用户已超 200 万。其中不乏专业摄影师的身影,他们使用 Versa 的技术设计海报。

  除 Versa APP 外,在今年乌镇的世界互联网大会上,Versa 发布了其面向企业的 OpenAPI,试图通过企业合作的方式向 C 端用户赋能。

  「说到底我们还是希望能赋能整个行业的。」赵维杰说,「我们希望每一个用户,不论是艺术家还是对艺术不那么敏感的用户,都能通过我们的技术创造出艺术作品来。」

  目前,Versa 正在接触的企业包括苹果、B612、美图等。赵维杰表示,产业尚处初期,因此合作也还处在摸索未知的可能性的阶段。

  B 端 和 C 端 Versa 都不放过。「C 端产品是我们永不落幕的发布会。」赵维杰说。Versa 希望通过路线图中一个一个小节点的上线持续引发用户的关注,最终以社区的形式维持用户粘性,并将这个社区当做 Versa 技术的舞台,吸引 B 端合作伙伴。

  图像风格迁移软件在深受用户喜爱的同时,也是昙花一现的应用。公众在好奇心被满足后,便很少再继续使用这些 APP。就连这股浪潮的领路人 Prisma 也被迫谋求新的出路。赵维杰认为,这一问题是两个原因共同导致的。

  其一,Prisma 等 APP 的底层技术适用于风景而非人脸,画作风格迁移至人脸后会出现面部斜纹以及网格,效果不佳。

  其二,Prisma 等 APP 在推出图像风格迁移功能后,没有其他新的功能持续吸引用户眼球,只能靠运营维持用户粘性。

  赵维杰表示,Versa 并不担心昙花一现的问题,因为以上两个导致该问题的原因,都能从底层技术加以解决。

  

 

  训练更快、更少数据依赖的 ConceptNet

  据赵维杰介绍,Versa 与市面上现存的大多数风格迁移软件的不同之处在于,驱动 Versa 的底层技术是其亲自操刀设计的表示理论框架 ConceptNet,而其他 APP 的底层技术是基于李飞飞在 ECCV 2016 上发表的论文「Perceptual Losses for Real-Time Style Transfer and Super-Resolution」。

  赵维杰表示,李飞飞的算法更适合于风景照,而中国人更愿意自拍。将李飞飞的方法原封不动地应用在自拍中,效果并不好。「人脸上有一道道的斜纹,有网格状的东西。我们一看这种应用在中国根本火不起来,就想要自己做一个。」赵维杰说。

  ConceptNet 基于表示理论,而表示理论着眼于对世界的理解。在表示理论的支持下,ConceptNet 能够认清人物鼻子、眼睛、嘴巴所在何处。

  「同样一种风格下,眼镜有眼睛的画法,鼻子有鼻子的画法,背景有背景的画法。背景我们用三分抽象七分写实的方法去画,有详有略才是人类画画的手法。」赵维杰曾将 Prisma 的风格迁移技术比做一把大刷子,将照片全部涂抹上某一种风格。「Prisma 只是做全局的纹理替换,我们能做得更好。」赵维杰说。

  除图像处理效果外,ConceptNet 在训练速度以及对数据的依赖方面也有优势。在 Prisma 等其它 APP 的算法下,实现一种风格的迁移需要至少 8 万张图片,8 个小时左右的学习。但 Versa 整个产品的训练过程中只用了 100 张训练图片,40 分钟便可收敛,即它将图片深度学习样本数量降低了800倍。

  ConceptNet 的诸多优势得益于其发源地华为的场景限制。在华为手机的场景下,开发人员面临两个问题。首先,由于用户隐私保护条例,华为不能搜集用户信息,因此华为的数据收集能力相对较弱;其次,华为的算法需要在终端手机芯片上落地,因此算法需要适应计算能力有限的场景。

  

 

  2012 年,赵维杰加入华为,任算法科学家。在华为的前两年,赵维杰和同事共同设计出一套表示理论,并将其发展成了一套完整的框架,即 ConceptNet。

  这两个限制被赵维杰称为两个「紧箍咒」,也正是由于这两个「紧箍咒」的存在,ConceptNet 才得以被仔细打磨。

  2014 年,赵维杰在华为海思麒麟芯片部门内部建立了一个人工智能能力中心,以 ConceptNet 为基础研发了语音、视频、自然语言理解相关产品,希望为芯片本身以及各个产品线交付 AI 应用。

  对于 ConceptNet,机器之能提出了对知识产权方面的担忧。赵维杰表示,不存在知识产权的问题:「我们在华为做的事情是这套理论的初级想法,有一部分东西确实落实了。从华为离开了之后,我们把这套理论重新整理了一遍,称之为 ConceptNet。整个这些东西是从华为出来之后才做的。所以说不存在知识产权相关的问题。」

  40 分钟拿到徐小平投资,三年路线图是关键

  依靠李飞飞的论文,相应技术就只能止步在 2016 年论文发布当时。而作为 ConceptNet 创造者的赵维杰能够为 Versa 提供源源不断的技术驱动。

  赵维杰打趣地说道:「为什么 Prisma 做不下去,因为李飞飞不在他们公司啊。」赵维杰观察到,Prisma 在发布名画风格迁移功能之后,便没有新的产出,只能依靠运营吸引用户。

  与之相比,赵维杰眼中的 Versa 有着源源不竭的生命力。在上线风格迁移技术后,Versa 又上线了人景分离技术,是指将人物与背景区分开来的像素级技术。

  据赵维杰介绍,物体的像素级识别是图像处理领域挑战较大的部分。他表示,Versa 的人景分离技术一经上线,便引发了业内的关注。「所有做深度学习方向人都知道这个东西难,当大家看到我们能把头发丝都分出来的这个时候都很惊讶,都觉得我们在这个方向又往前走了一步。」赵维杰说。

  在人景分离技术之外,Versa 具有明晰的三年规划路线图,图上包含很多例如图像风格迁移、人景分离这样的小的任务节点。赵维杰表示,这些小的节点都是在技术层面稍微一踮脚就碰得到的。这些小节点会逐一上线,间隔在几周到几个月之间。

  「对于小公司来说,速度快非常重要。以理论作发动机,让它不断地产生新的应用点,这些应用点再通过产品打出去,是小公司能在这个时代赢的最重要的原因。」赵维杰说。

  事实上,这个三年路线图在 Versa 创立初期就已经初见雏形。也正是靠着 ConceptNet 加路线图,Versa 才碰到了真格基金创始人徐小平的燃点,并在 40 分钟的时间内拿下徐的投资。

  故事转回到 Versa 创立初期。大学毕业后,蔡天懿与赵维杰始终保持联络,并希望基于双方所在领域,找到「人工智能+娱乐」的跨界融合方式,赵维杰称二人的关系为「月活用户」。在做了多年月活用户后,今年三月,二人终于在一次聊天中达成了共识,兴奋到相谈整夜。

  二人看到了人工智能与娱乐相结合的突破口,正是 Versa 及其三年路线图。赵维杰谈到了当时的情况:「我们都非常兴奋,但是告诉自己要冷静。我们给自己一周的时间,分别去请教自己信任的人,让他们去评估这个项目。一周后再决定是不是要做这件事。」

  有趣的是,他们得到了几乎身边所有人的支持,大家都对这个项目抱有很大的期待。于是,二人决定创业,Versa 的生命就此开始。

  在 Versa 开始寻找投资的第四天,二人在北京国贸的真格基金办公室中见到了徐小平,并向徐小平演示了 ConceptNet 在图像方面能够达到的种种能力。赵维杰回忆,徐小平在他们的演示过程中非常兴奋。演示结束后,徐小平让二人在旁边的会议室中稍等片刻,随即开门对二人说:「我们决定投你们了。」

  「徐老师看了之后,就明显地感受到这是一个颠覆性的东西。真格基金每周二都有一个投委会,当时投委会在场的所有人也被我们惊艳到了。」赵维杰说。

  关于未来,赵维杰表示:会继续致力于人工智能的研发,不断地提升产品的质量,让用户获得更加流畅丰富的体验。同时Versa也会继续扩大团队规模,打造优质的服务团队,让Versa更好地为创作者赋能。 

█请返回商务财经网新闻首页>>>>>

标签:专访VersaCTO赵维杰

免责声明:本文仅代表作者个人观点,与商务财经网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

相关文章

无相关信息
栏目更新
栏目热门

商务财经网介绍|投资者关系 Investor Relations|联系我们|法律义务|意见反馈|版权声明

商务财经网Copyright©《中国工业和信息化部网站备案许可证》编号:京ICP备17060845-2