“Turk 机器人”与电商网站的“预测性配送”

日期: 2014-10-12 作者:Nicole Laskowski翻译:陈晓诚 来源:TechTarget中国 英文

利用机器学习和预测模型,纽约高端时尚和家居用品零售商Gilt 集团的数据科学家Igor Elbert为Gilt网站构建一种预测性递送方式。点击这里查看第一部分访谈,在访谈的第二部分,Elbert 解释了亚马逊公司“Turk 机器人”是如何发挥作用的,该平台众包难以自动执行的任务,亚马逊公司将这种方法称为人工化人工智能。Elbert介绍了他是如何评估“机器人”对于产品来帮助建立Gilt网站的预测性递送计划的指导模型。
  
  问:你如何在客户还不知道产品前,就预测他们需要什么呢?
  
  Igor Elbert:我正在做的一件事情,就是评估各种属性,基本上可分成三个类别:
  
  首先是客观的参数,比如产品的元数据。我们就拿一条黑色的裙子来说。我们没有卖过这条裙子, 但是我们卖过别的黑色的裙子,也卖过知名品牌的黑色裙子。然后,我评估季节,价格,我们的销售价格,和原始价格之比;我评估我们可以获得多少利润。我也评估主观因素:谁采购了这个产品 – 谁销售这个产品。我把这一切都建立在我的模型里。
  
  第二个类别的参数涉及发售日:这个特殊的日子将如何进行?我评估销售的数量和种类,库存的深度和广度,所提供的品牌。这些都是重要的,因为强大的产品会带来“连锁”效应,并帮助其他正在销售的产品。对于Gilt网站而言,这些参数每天都显著不同,因为我们每天销售的产品都在变化。 

  

  第三个类别是纯主观的:我通过turk机器人向一组随机人员展示产品的图像,然后我请他们告诉我对于产品的感受。 



      

      问:什么是Turk机器人?

  
  Elbert:亚马逊有一个平台被称为“Turk机器人”,这基本上就是众包任务。所以,我创建一个模板,我把我们所有销售的裙装都包含在内。然后,我会说,对于每条裙子,我想听到三个不同的人的意见。亚马逊称他们为“机器人”。我还提供了一些特性,所以我会说,他们应该生活在美国;在这个特殊的范围下,我感兴趣的是女性的意见。我说我愿意为每条裙子的意见付费10美分。亚马逊基本上就是向三个不同的人,展示这条裙子,然后他们回答我的问题,亚马逊再把结果发送给我。这和调查非常类似。
  
  亚马逊称之为 “人工化人工智能”,因为它是为那些难以实现自动化的任务设计的。很难设计一个算法,可以看一眼图像,就告诉你裙子是难看或者性感。 但是,人们看一眼就知道了。
  

  问:你具体给机器人设计哪些什么问题?

       

Elbert:我会要求他们将形容词分配给产品。就拿一条裙子来说。我会问,是不是漂亮的,难看的,奇怪的,不常见的,性感的,正式的 – 使用15个不同的形容词。我会问他们裙子适用的场合——一个晚宴,舞会或其他场合。我会问他们裙子是否会畅销。我会问,裙子看起来是不是很贵,价格合适,或者便宜。

  
  我将展示的只是产品的一张照片,并告诉他们它是由何种材料制成的,但我不告诉他们品牌或其他信息。我这样做,本质上是为了辨认出有风险的单品。如果很多人说这条裙子,是奇怪的,或不常见的,或难看的,但这并不意味着它不会畅销,也并不意味着这条裙子真的难看。它只是意味着这个特定的单品,可能比很多其他人们不认为难看的单品而言,有较高的风险。我会在我的模型内加入这个因素。
  

  我在我的客观因素中补充主观因素,以获取有关风险的意见。对于某条裙子而言,如果三个人中的三个人都说它难看的话,也许我不应该冒风险,而让它在这个区域销售。因为基本上我是在下注:我打赌这条裙子将在这一地区畅销。如果这条裙子是有风险的,那么我就不会下这个赌注,在任何人购买它之前,就开始送货,对于我,风险也更大。



      问:Gilt网站销售的每个产品你都使用机器人吗?

  
  Elbert:现在我们把它用于一部分产品,但我们将在未来不断扩大,用于所有产品。除了预测性递送,它给了我们很多关于我们产品的信息,而且它有很多用途。
  
  问:你为什么信任机器人的判断呢?
  
  Elbert:对于机器人,有一个预先审核的概念。所以,你可以通过他们运行一系列任务。如果你一遍又一遍执行同一个(任务),你可以挑选表现良好的机器人。我问他们的其中一件事,就是仅仅通过查看图像, 告诉我产品的价格区间。你认为这条裙子要花多少钱?有些很精确。有些预测的价格误差在1美元内。其他的裙子,有些说裙子看起来价值200美元,但其实我们想要以2,000美元的价格出售。这并不意味着他们是错误的;也许是我们价格太高了。他们获得的信息是有限的。他们并不知道,这是一个非常高档的品牌。但是,当预测的价格和实际价格之间有很大的差距,这就增加了风险。 

  
  所以,如果你不考虑时尚因素,我正在试图做的,就是为我们销售的时尚单品量化风险。我用不同的方式来确定, 结合客观参数与主观参数,我试图去预测哪些单品,在哪些特定区域,会有较高的购买倾向。 

  
  问:在即将举行的Strata Conference + Hadoop World大会上,在你的演讲描述中,你将这称之为“主观因素”。还有其他哪些主观因素是你必须考虑的? 

  
  Elbert:有两个部分:第一,我从机器人获得的信息。第二,我评估谁为Gilt网站采购了该商品- 这个人是谁 – 因为采购员其实是高度可预测性的。因此,我们网站的某些采购员购买的商品似乎更受西海岸顾客的喜爱。我不知道他们是不是有意识的这样做。他们挑选的单品,服装,或品味都与“西海岸”顾客相吻合。所以,我会整体评估谁采购了该商品。 

  
  在未来,我也将评估是谁对产品进行拍摄,因为我们基本上拍摄所有我们销售的产品。我现在还没有这样做,是因为数据还不可用,但我打算这样做。如果我持有这些数据,我也会将我们为每个单品,所使用的模特包含其中——只是为了给我的算法一个机会来检测,是否在某些特定模特和某些购买产品的顾客之间有一定关联性。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

Nicole Laskowski
Nicole Laskowski

Nicole Laskowski is a senior news writer for SearchCIO.com and SearchCIO-Midmarket.com. She covers CIO strategies for analytics, business intelligence and data management. Prior to joining TechTarget, she worked as the news editor for a community newspaper in Arlington, Mass., overseeing the news content of both the weekly print publication and the newspaper’s website. Nicole also has worked for two other community newspapers in Oregon and Michigan and brings 10 years of writing and editing expe

相关推荐