标签:MapReduce

数据库schema迁移数据最佳实践
后端存储

数据库schema迁移数据最佳实践

11月22日

如何进行大规模在线数据迁移 工程团队常面临一项共同挑战:重新设计数据模型以支持清晰准确的抽象和更复杂的功能。这意味着,在生产环境中,需要迁移数以百万计的活跃数据对象,并且重构上千行...
MapReduce 常见的排序
综合技术

MapReduce 常见的排序

09月22日

【MR】MapReduce 常见的排序 一,Hadoop默认的排序算法, 只会针对key值进行排序 ,按照字典顺序排序。 直接上代码 Map端 package Hadoop.M...
分布式数据库的存储设计改进
综合技术

分布式数据库的存储设计改进

09月14日

背景 在一次游泳的时候,想起一个问题,为什么 hdfs 的 namenode 没有存储块的对应节点信息,导致启动 hdfs 的时候,datanode 需要扫描所有的数据块,再将该 ...
大数据实践学习总结(3)--MapReduce
综合技术

大数据实践学习总结(3)--MapReduce

08月16日

关于纠结,曾经很纠结搞大数据的人是否要学习代码,更何况自己是售前方向的。理解原理就可以了,后来发现,纠结的时间越来越多。就明白了,与其纠结是否要去搞代码,不如自己实际操作一下代码,...

专业 x 专注 x 聚合 x 分享 CC BY-NC-SA 4.0

使用声明 | 英豪名录