学习hadoop遇到的问题(当kafka集群中的topic的数据过大的时,清除时需要注意的问题)

1.在kafka集群中的topic存储旧数据总量过大时,要使用./kafka-topics.sh --zookeeper node1:2181 --delete --topic log4oa命令删除

(特别注意:如果手动删除的话,要把涉及到kafka集群的topic的信息全部删除,例如storm整合kafka,zk中的topic的信息删除,否则会有问题)

2.在删除kafka集群的topic时,要特别注意偏移量的问题,例如之前手动清理过kafka集群和kafka集群的zookeeper的数据,而storm的zk中还记录着数据的消费偏移量,就会报错

3.在搭建kafka框架时,要设置好清除策略。

4.关于storm提交的Topology日志的查找,可以参考这个网址https://blog.51cto.com/xpleaf/2097682

 

你可能感兴趣的:(学习大数据遇到的问题(bug))