网易高性能分布式存储系统Curve已在github开源,开源以来受到了业界的广泛关注,现招募在校学生贡献者加入我们的开发。
Who?任何对分布式存储系统,Curve感兴趣的在校生,不限年级不限专业。
Why? Curve是新一代开源高性能分布式存储系统,通过参与Curve的开发,你可以收获:大型分布式系统开发经验,和业界大牛协作学习的机会,表现优异者可以获得在网易实习的机会(人数不限),特别优异者有机会直接获得校招offer。
How?添加opencurve微信号联系我们,加微信号记得注明[报名C计划]。我们会提供分布式系统学习的Roadmap供大家参考,基于分布式存储系统的理论基础之上进行选题。另外我们会有定期线上会议,了解大家的想法并为为大家答疑解惑。近期12.25左右会有C计划启动会,具体时间我们会在微信群中公布。
因为缺乏专业背景知识,很多小伙伴看到Curve是一头雾水,看完Curve的简介后也许还是一头雾水,那我们该如何打怪升级呢?在开始C计划的选题之前,我们给参加C计划的小伙伴们一个分布式系统的学习的Roadmap,该Roadmap是Curve团队的新人培养实践沉淀,大家可以根据自身需要自行学习。
了解分布式存储系统的基本知识
目标:知道为什么需要分布式存储?分布式存储的难点在哪里?都有哪些解决方法
参考资料:
熟悉分布式系统设计
目标:了解分布式系统一般架构,了解部分解决方案的技术细节
参考资料:
了解Curve
目标:掌握Curve总体设计,各模块的设计
参考资料:
掌握代码开发/测试工具
目标:掌握代码开发流程,熟练使用代码开发、调试、测试过程中所需要的工具
参考资料:
难易级别:选题共有三个级别:easy,medium,hard
发放规则:这三个级别的选题我们会分三个阶段发布,第一阶段发布easy,第二阶段发布medium,第三阶段发布hard,其中一二阶段间隔一个月左右,二三阶段间隔2个月左右,具体的时间会在微信群里通知。对选题的任何疑问或者需要帮助的都可以在群里咨询我们。
任务提交:
选题一:清理代码中的TODO
任务说明
任务描述
curve的代码在开发的过程中遗留了一些TODO,可以对这些TODO进行一些清理。清理范围,include,src,test目录下,排除thirdparties目录下的第三方组件的TODO。用“// TODO”作为关键字,搜索代码中的TODO。这些TODO有些比较简单,有些难度比较大。建议先从简单的开始修复,熟悉代码的修复合入流程,再慢慢挑战比较复杂的TODO。
参考资料
github的使用,google c++编程规范,curve文档,编译工具bazel的使用,测试工具gtest的使用
这里举例几个简单的TODO任务,也可以自己搜索代码中的TODO。
curve/include/chunkserver/chunkserver_common.h,把kOpRequestAlignSize放到配置文件中。
// TODO(wudmeiao): 是否需要考虑可配置
const uint32_t kOpRequestAlignSize = 4096;
curve/src/chunkserver/copyset_node.cpp,Init copyset对应的raft node options放到nodeOptions的init中。
/**
* Init copyset对应的raft node options
*/
nodeOptions_.initial_conf = conf_;
nodeOptions_.election_timeout_ms = options.electionTimeoutMs;
nodeOptions_.fsm = this;
nodeOptions_.node_owns_fsm = false;
nodeOptions_.snapshot_interval_s = options.snapshotIntervalS;
nodeOptions_.log_uri = options.logUri;
nodeOptions_.log_uri.append("/").append(groupId)
.append("/").append(RAFT_LOG_DIR);
curve/src/client/libcbd_libcurve.cpp,cbd_libcurve_filesize调用StatFile4Qemu接口时,判断StatFile4Qemu的返回值。
int64_t cbd_libcurve_filesize(const char* filename) {
struct FileStatInfo info;
memset(&info, 0, sizeof(info));
// TODO(wuhanqing): 判断返回值
StatFile4Qemu(filename, &info);
return info.length;
}
curve/src/mds/nameserver2/curvefs.cpp,RenameFile接口,把oldFileName改成sourceFileName,newFileName改成destFileName。
// TODO(hzchenwei3): change oldFileName to sourceFileName
// and newFileName to destFileName)
StatusCode CurveFS::RenameFile(const std::string & oldFileName,
const std::string & newFileName,
uint64_t oldFileId, uint64_t newFileId)
选题二:捉虫计划
任务说明
任务描述
金无足赤,人无完人,代码也没有不存在bug的代码。在代码开发过程中,虽然工程师们采用了各种方式来减少bug,但是总有一些漏网之鱼。各位小伙伴,一起撸起袖子来捉虫吧。在curve部署、使用、阅读代码过程中,如果发现了bug,请通过issue的方式记录下来,如果有解决方案,欢迎向我们提交代码。
参考资料
RoadMap中「了解Curve」所列出的资料
选题三:代码翻译
任务说明
任务描述
针对curve github仓库中的Curve各模块的代码注释进行中文到英文的翻译,注意翻译的完整性和准确性。Curve代码中的mds模块已经都是英文注释,剩下的为 curve/src/chunkserver 、curvesrc/client、curve/nebd/part1、curve/nebd/part2。大家可以按照一个头文件和cpp对应实现为单位进行翻译,比如common.h、common.cpp。
选题四:代码解读
任务说明
任务描述
在阅读Curve代码的过程中写一些源码解读或者自己的心得体会,一方面作为自己学习的沉淀,另一方面可以供他人参考
参考资料
建议在了解Curve的整体架构基础上去看代码,代码可以从梳理client流程入手
选题五:单元测试
任务说明
任务描述
目前Curve很多代码的单元测试覆盖率不够,(具体情况见59.111.93.165:8080/job/curve_untest_job/HTML_20Report/),希望大家在现有单元测试代码(位于Curve代码的test目录)基础上,添加测试用例,使其覆盖率达到CI标准,代码行覆盖85%及以上,代码分支覆盖75%及以上。
参考资料
RoadMap中「掌握代码开发/测试工具」所列出的资料
表现优异者可以获得在网易实习的机会(人数不限),特别优异者有机会直接获得校招offer。我们会根据整个计划过程中提交任务的质量、参与度、提交任务的数量等为依据进行评估。