我有一个奇怪的要求,我必须从 FTP(假设为 FTP1)位置获取文件并将其放置在我当前的 FTP(假设为 FTP2)位置。问题是,这些是日常文件(采用 Sales_YYYYMMDD_report.csv 模式)并且每天都放在 FTP1 上,我的流程通常在星期一(例如 2013 年 9 月 9 日)运行,它必须使用前一周开始的文件从周日(例如 2013 年 9 月 1 日)到周六(例如 2013 年 9 月 7 日)将它们放在 FTP2 位置,然后运行 Informatica 进程。例如,如果我在 2013 年 9 月 9 日星期一运行该过程,我必须从 FTP1 中提取所有文件名如
Sunday file --> Sales_20130901_report.csv
Monday file --> Sales_20130902_report.csv
Tuesday file --> Sales_20130903_report.csv
Wednesday file --> Sales_20130904_report.csv
Thursday file --> Sales_20130905_report.csv
Friday file --> Sales_20130906_report.csv
Saturday file --> Sales_20130907_report.csv
如何在 shell 脚本中实现此目的?我知道从另一个 FTP 获取文件的部分,但我不确定如何获取这 7 个文件。
P.S:我无法使用文件创建/上次修改时间戳来获取文件。无论创建的时间戳和我运行 Informatica 进程的日期如何,我都必须获取文件名中包含上周日期的文件并将其放入我的 FTP2 位置,然后继续处理它们。
请帮忙...
最佳答案
以下脚本应包含您需要的所有元素:
#!/bin/bash
# assuming this is run from the directory where you want the files
# to end up
function getIt {
echo "ftp-ing " $1
# here comes the heart of the ftp session
ftp -inv << _EOF_
open home.machine.com
user myname mypassword
cd /the/path/where/the/file/lives
get $1
bye
_EOF_
}
# generate the seven file names for the previous seven days:
for d in {1..7}
do
theCmd="/bin/date -v -"$d"d +%Y%m%d"
theDate=`$theCmd`
fileName="Sales_"$theDate"_report.csv"
getIt $fileName
done
它应该大部分是不言自明的:但要特别注意 heredoc
(“封装的 ftp 脚本”,如果你愿意的话)的末尾必须在行的开头,前面没有空格,后面也没有空格。另外 - 根据这台机器上的安全性有多重要,您可能想对密码做一些不同的事情;也许您甚至想使用“vanilla”ftp 以外的东西。但我认为这应该会让您朝着正确的方向前进。
测试到实际的 ftp
位本身...当我注释掉脚本正确调用 getIt()
七次,用一个字符串代表你的文件名指定的。显然我不能轻易地测试 ftp...
另请注意,这只会复制到您启动脚本的目录;如果您需要它在其他地方结束,您可能需要第二个 ftp
脚本。不过,我相信您可以解决这个问题。
关于linux - 使用 Linux 从文件名中包含前一周日期的 FTP 位置获取所有文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18690709/