windows - 如何使用 Windows 批处理文件从文本文件中提取数字?

标签 windows command-line cmd

我需要使用 cmd(Windows 命令行)执行以下操作。

我有一个名为 DDD.CLI026.WK0933.DDDMR45.001.head 的文件。

文件中的数据如下(一长行)

HEAD HEALTHDMD Weekly  DDD.CLI026 Centocor  W200908021012 
TRAIL0101 000000000581 00000CKSUM00000223680

我需要从 000000000581 中提取 581 并将其复制到另一个文件 IMS_FILE_to_LND.par 中, 使用 Windows 命令行或 DOS。

我该怎么做?

最佳答案

Irveen,对于输入文件(一行),你可以有以下文件:

infile.txt (the inputfile on one line):
    HEAD HEALTHDMD Weekly  DDD.CLI026 Centocor  W200908021012
     TRAIL0101 000000000581 00000CKSUM00000223680

pre.txt (the first half of your desired file):
    [WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
    $$Cust_RowCount=72648
    $$Sales_RowCount=5235998
    $$OuletChangeLog_RowCount=931

post.txt (the second half of your desired file):
    $$Control_RowCount=4495
    $$Outl_Subcat_RowCount=105
    $$Fac_Subcat_RowCount=149

go.cmd (the command file to create your desired file):
    @echo off
    setlocal enableextensions enabledelayedexpansion
    for /f "tokens=8" %%i in (infile.txt) do (
        set num=%%i
    :loop1
        if "!num!"=="0" goto :skip1
        if not "!num:~0,1!"=="0" goto :skip1
        set num=!num:~1!
        goto :loop1
    :skip1
        type pre.txt >outfile.txt
        echo $$DRM45_RowCount=!num!>>outfile.txt
        type post.txt >>outfile.txt
    )
    endlocal

这会生成文件:

outfile.txt:
    [WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
    $$Cust_RowCount=72648
    $$Sales_RowCount=5235998
    $$OuletChangeLog_RowCount=931
    $$DRM45_RowCount=581
    $$Control_RowCount=4495
    $$Outl_Subcat_RowCount=105
    $$Fac_Subcat_RowCount=149

我相信这就是您希望从这一系列问题中得到的。

作为解释,for 循环处理您的一行,提取第 8th 字段 (000...00581)。循环跳过部分只是删除前导零,直到你有一个 0 本身或一个实数(Windows 将带有前导零的数字视为八进制,这对我们这里没有好处)。

提取数字后,您只需从前位和后位以及要修改的行构建文件。

我知道,这比我之前提供的 awk 解决方案有点麻烦,但它可以在 Windows 中实现这一点,而无需添加第三方软件(您在其他问题中指出这不是一个选项).

更新 1:这是一个根据要求使用单个模板文件创建输出文件的版本。模板文件必须包含以 "pre:""post:" 开头的行,以指示它们是在要插入的行之前还是之后。根本不使用没有标记的行,因此您可以插入空白行或注释到您的心脏内容。所以你的文件将是:

pre:[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
pre:$$Cust_RowCount=72648
pre:$$Sales_RowCount=5235998
pre:$$OuletChangeLog_RowCount=931

post:$$Control_RowCount=4495
post:$$Outl_Subcat_RowCount=105
post:$$Fac_Subcat_RowCount=149

这是将为您提供所需内容的命令脚本。我只是使用了一个技巧来临时创建前文件和后文件,以尽量减少所需的更改。

@echo off
setlocal enableextensions enabledelayedexpansion
del /q /q pre.txt post.txt >nul: 2>nul:
for /f "delims=" %%j in (template.txt) do (
    set ln=%%j
    if "!ln:~0,4!"=="pre:" echo !ln:~4!>>pre.txt
    if "!ln:~0,5!"=="post:" echo !ln:~5!>>post.txt
)
for /f "tokens=8" %%i in (infile.txt) do (
    set num=%%i
:loop1
    if not "!num!"=="0" (
        if "!num:~0,1!"=="0" (
            set num=!num:~1!
            goto :loop1
        )
    )
)
type pre.txt >outfile.txt
echo $$DRM45_RowCount=!num!>>outfile.txt
type post.txt >>outfile.txt
del /q /q pre.txt post.txt >nul: 2>nul:
endlocal

输出:

[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=581
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

就像上面的前/后解决方案一样,但满足您的新要求。

更新 2:如果您可以说服他们采用 Cygwin 解决方案,这就是您所需要的:

x=$(expr 0 + $(awk '{print $8}' infile))
sed "s/^\$\$DRM45_RowCount=.*$/\$\$DRM45_RowCount=$x/" cfgfile >cfgfile_new

cfgfile 包含:

[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=whatever
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

infile 包含(更短但字段数量相同):

HD HLTHDMD Wkly DDD.CLI Cntcr  W200908021012 TRAIL0101 00581 00000CKSUM680

您将获得以下 cfgfile_new:

[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=581
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

瞧!如此简单。随意使用 cmd 脚本和 Cygwin 脚本来说服您的管理层他们应该使用更好的工具:-)

关于windows - 如何使用 Windows 批处理文件从文本文件中提取数字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1426146/

相关文章:

Android Runtime.getRuntime().exec() 通过目录导航

maven - 如何在命令行中获取Maven groupId,artifactId和项目版本

python - 如何在 Python 中美化 JSON?

c# - 在 C# 中解压缩存档

windows - 如果 Windows 批处理文件中的 A 和 B 和 C 等于 1 怎么办?

c++ - Ogre SDK 出现异常

c++ - 为什么 RegCloseKey 存在(当 CloseHandle 似乎执行相同的功能时)?

windows - ANT 构建脚本如何终止 Windows 进程?

windows - FFmpeg 在 "-to"指定的时间后继续处理

batch-file - 如何在 Windows 上使用 cmd 找到屏幕亮度?