spark3.0教程:RDD转换算子takeSample()、sample()区别 作者:马育民 • 2025-12-08 20:56 • 阅读:10000 - sample():返回 RDD/DataFrame(分布式),参数是「抽样比例」,适合大数据集; - takeSample():返回本地数组(Driver 端),参数是「样本数量」,适合小样本抽取。 原文出处:http://www.malaoshi.top/show_1GW2N2h534sW.html