极客众包吧 关注:100贴子:175
  • 0回复贴,共1

为什么需要众包(Crowd-Sourcing)?

只看楼主收藏回复

其实这个问题不如反过来问,比如为什么不用半监督学习呢?为什么不用杉山将的弱监督学习呢?为什么不用Dr. Fei-Sha 多任务学习(multi-task learning)、领域适应(domain adaptation)和零样本学习(zero-shot learning)解决小数据问题呢?
周博士的回答是:基于众包的标注可以做到既省时间又省钱,而且引用了ML领域的经典Remark:“更多的数据可以打败聪明的算法”,并举了一个10倍数据量+SVM性能超过1倍数据量+深度学习的例子。
个人注解:周博士的举例说明数据可以打败算法是正确的,但是需要认真考察上述说法所考虑的语境(context)。用一句话说:基于大规模标注数据集的监督学习不会被淘汰,但需要新的学习模式予以搭配,才能从根本上突破现有人工智能的范式和水平。


IP属地:湖南1楼2018-12-30 17:03回复