能力中心 > 论坛 > 能力讨论版 > 全网历史数据 > 评论 > 在使用海量平台回

开发者论坛

海量大数据分析平台

 找回密码
 立即注册
搜索
查看: 19462|回复: 0
打印 上一主题 下一主题

在使用海量平台回

[复制链接]
昵称
陈畅

注册会员

Rank: 2

积分
106
跳转到指定楼层
楼主
发表于 2018-3-21 19:51:18 | 只看该作者 回帖奖励 |倒序浏览
评分 :
在使用海量平台回溯时,可以通过限定比较小的采集时间范围来提高回溯效率;那么【全网历史数据】能力能否设置采集时间范围?
回复

使用道具 举报

昵称
车女士

中级会员

Rank: 3Rank: 3

积分
404
沙发
发表于 2018-3-21 19:51:18 | 只看该作者

在使用海量平台回

采集时间范围可在配置中的“起始发布时间”中填写起始发布时间不是数据的发帖时间吗?有时候跟采集时间是不一样的,如果都用发布时间来限定的话,库里存在多版本怎么办?输出哪个结果?
回复 支持 反对

使用道具 举报

昵称
常毅

高级会员

Rank: 4

积分
579
板凳
发表于 2018-3-21 19:51:18 | 只看该作者

在使用海量平台回

采集时间范围可在配置中的“起始发布时间”中填写起始发布时间不是数据的发帖时间吗?有时候跟采集时间是不一样的,如果都用发布时间来限定的话,库里存在多版本怎么办?输出哪个结果?这个问题源于用老平台的思路来处理新平台问题,对于新平台,历史任务只有发布时间这一个维度进行限定,采集时间这一信息是被隐藏的;考虑到有部分老用户的需求,我们提供了隐藏参数来解决老平台用户的问题,操作方式为:老用户用户可以将界面的“发布时间”视为“采集时间”,然后通过隐藏参数填入真正需要的发布时间,即可达到老平台效果
回复 支持 反对

使用道具 举报

昵称
车女士

中级会员

Rank: 3Rank: 3

积分
404
地板
发表于 2018-3-21 19:51:18 | 只看该作者

在使用海量平台回

采集时间范围可在配置中的“起始发布时间”中填写起始发布时间不是数据的发帖时间吗?有时候跟采集时间是不一样的,如果都用发布时间来限定的话,库里存在多版本怎么办?输出哪个结果?这个问题源于用老平台的思路来处理新平台问题,对于新平台,历史任务只有发布时间这一个维度进行限定,采集时间这一信息是被隐藏的;考虑到有部分老用户的需求,我们提供了隐藏参数来解决老平台用户的问题,操作方式为:老用户用户可以将界面的“发布时间”视为“采集时间”,然后通过隐藏参数填入真正需要的发布时间,即可达到老平台效果好的,谢谢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则