hive load data inpath 会直接移动 HDFS 上源文件,相当于删除源文件,所以要重复导入的话,最好先 cp 一份。load data local 从本地磁盘加载数据的话,不会对源文件产生影响。
hdfs dfs -cp -r /source /dest
hdfs dfs -cp -r /source /dest