我需要使用 cmd(Windows 命令行)执行以下操作。
我有一个名为 DDD.CLI026.WK0933.DDDMR45.001.head 的文件。
文件中的数据如下(一长行)
HEAD HEALTHDMD Weekly DDD.CLI026 Centocor W200908021012
TRAIL0101 000000000581 00000CKSUM00000223680
我需要从 000000000581 中提取 581 并将其复制到另一个文件 IMS_FILE_to_LND.par 中, 使用 Windows 命令行或 DOS。
我该怎么做?
最佳答案
Irveen,对于输入文件(一行),你可以有以下文件:
infile.txt (the inputfile on one line):
HEAD HEALTHDMD Weekly DDD.CLI026 Centocor W200908021012
TRAIL0101 000000000581 00000CKSUM00000223680
pre.txt (the first half of your desired file):
[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
post.txt (the second half of your desired file):
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149
go.cmd (the command file to create your desired file):
@echo off
setlocal enableextensions enabledelayedexpansion
for /f "tokens=8" %%i in (infile.txt) do (
set num=%%i
:loop1
if "!num!"=="0" goto :skip1
if not "!num:~0,1!"=="0" goto :skip1
set num=!num:~1!
goto :loop1
:skip1
type pre.txt >outfile.txt
echo $$DRM45_RowCount=!num!>>outfile.txt
type post.txt >>outfile.txt
)
endlocal
这会生成文件:
outfile.txt:
[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=581
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149
我相信这就是您希望从这一系列问题中得到的。
作为解释,for 循环处理您的一行,提取第 8th 字段 (000...00581)。循环跳过部分只是删除前导零,直到你有一个 0 本身或一个实数(Windows 将带有前导零的数字视为八进制,这对我们这里没有好处)。
提取数字后,您只需从前位和后位以及要修改的行构建文件。
我知道,这比我之前提供的 awk 解决方案有点麻烦,但它可以在 Windows 中实现这一点,而无需添加第三方软件(您在其他问题中指出这不是一个选项).
更新 1:这是一个根据要求使用单个模板文件创建输出文件的版本。模板文件必须包含以 "pre:"
或 "post:"
开头的行,以指示它们是在要插入的行之前还是之后。根本不使用没有标记的行,因此您可以插入空白行或注释到您的心脏内容。所以你的文件将是:
pre:[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
pre:$$Cust_RowCount=72648
pre:$$Sales_RowCount=5235998
pre:$$OuletChangeLog_RowCount=931
post:$$Control_RowCount=4495
post:$$Outl_Subcat_RowCount=105
post:$$Fac_Subcat_RowCount=149
这是将为您提供所需内容的命令脚本。我只是使用了一个技巧来临时创建前文件和后文件,以尽量减少所需的更改。
@echo off
setlocal enableextensions enabledelayedexpansion
del /q /q pre.txt post.txt >nul: 2>nul:
for /f "delims=" %%j in (template.txt) do (
set ln=%%j
if "!ln:~0,4!"=="pre:" echo !ln:~4!>>pre.txt
if "!ln:~0,5!"=="post:" echo !ln:~5!>>post.txt
)
for /f "tokens=8" %%i in (infile.txt) do (
set num=%%i
:loop1
if not "!num!"=="0" (
if "!num:~0,1!"=="0" (
set num=!num:~1!
goto :loop1
)
)
)
type pre.txt >outfile.txt
echo $$DRM45_RowCount=!num!>>outfile.txt
type post.txt >>outfile.txt
del /q /q pre.txt post.txt >nul: 2>nul:
endlocal
输出:
[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=581
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149
就像上面的前/后解决方案一样,但满足您的新要求。
更新 2:如果您可以说服他们采用 Cygwin 解决方案,这就是您所需要的:
x=$(expr 0 + $(awk '{print $8}' infile))
sed "s/^\$\$DRM45_RowCount=.*$/\$\$DRM45_RowCount=$x/" cfgfile >cfgfile_new
cfgfile
包含:
[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=whatever
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149
和 infile
包含(更短但字段数量相同):
HD HLTHDMD Wkly DDD.CLI Cntcr W200908021012 TRAIL0101 00581 00000CKSUM680
您将获得以下 cfgfile_new
:
[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=581
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149
瞧!如此简单。随意使用 cmd 脚本和 Cygwin 脚本来说服您的管理层他们应该使用更好的工具:-)
关于windows - 如何使用 Windows 批处理文件从文本文件中提取数字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1426146/