java吧 关注:1,267,074贴子:12,772,901
  • 1回复贴,共1

有大佬在学hive或者spark这方面的东西吗?求教。学习中

取消只看楼主收藏回复

有大佬在学hive或者spark这方面的东西吗?求教。学习中遇到的问题,左边为会员号,右边是会员对应购买的商品编号,我已经按照日期分区存储在hive中,下一步想求出一段时间内哪两件商品的关联度最高,也就是想把右边那个array数组里面的商品编号一一组合成一个键值对并记为一,然后按照分区统计出每天,继而统计出一段时间内哪两件商品的关联度最高,大佬们给个思路,应该怎么搞,用什么办法或者用什么算子来解决


IP属地:山东来自iPhone客户端1楼2019-12-15 21:33回复
    我自己顶一顶


    IP属地:山东来自iPhone客户端2楼2019-12-15 21:35
    回复