我正在访问有关 wiki 页面浏览量的公共(public)数据集,其格式如下:
projectcode, pagename, pageviews, bytes
文件名如下所示:
pagecounts-20090430-230000.gz
我想处理这个文件,以便文件名中的日期信息位于数据文件中......所以我会寻找类似这样的内容:
date, projectcode, pagename, pageviews, bytes
我想我必须使用 SED 功能?我用它来处理字符串,但不是数据文件本身......如何做到这一点?
最佳答案
提取日期 - 第一次剪切返回第一个“.”之前的部分,第二次返回第一个“-”之后的部分:
DATEPART=$(echo $FILENAME| cut -d"." -f1| cut -d"-" -f2-)
使用 sed 您可以替换所有行的开头:
sed -i 's/^/'$DATEPART' /g' $FILENAME
关于linux - 如何向平面文件添加日期列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28127735/