java - 将一个文件剪切成多个文件(Java)

标签 java split apache-camel bufferedreader

我需要你的帮助。 我使用 Talend ESB,我想制作 java bean。

例如,我有这个平面文件:

11886 1855 0000004309000
11886 1855 0000057370000
11886 1856 0000057374001    
11886 1856 0000057375000     

在我的示例中,我想要 2 个文件(消息),过滤器“1855”和“1856”(这是订单数)。

第一个文件:

11886 1855 0000004309000
11886 1855 0000057370000

第二个文件:

11886 1856 0000057374001     
11886 1856 0000057375000

编辑: 但是我不知道每个文件的订单数。

如果我的原始文件中有三个订单(每个订单三行)==> 我想要三个文件,每个订单有 3 行。

如果我的原始文件中有四个订单 ==> 我想要四个文件。

如果我的原始文件中有五个订单 ==> 我想要五个文件。

等等 .....................................


这是我的开始代码。 我想分成多个文件。 我真的不知道该怎么做。

package beans;

import java.io.BufferedReader;
import java.io.ByteArrayInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.util.HashMap;
import java.util.LinkedHashMap;
import java.util.Map;
import org.apache.camel.*;


public class bean_test implements Processor{

    private static final String ENDPOINT_NAME = "Endpoint";
    private static final String END_TAG_ENDPOINT_NAME = "endEndpoint";
    private static final int NUMERO_SITE_START_POSITION = 6;
    private static final int NUMERO_SITE_END_POSITION = 11;


    @Override
    public void process(Exchange exchange) throws Exception {

        ProducerTemplate producerTemplate = exchange.getContext().createProducerTemplate();
        String ropEndpoint = exchange.getIn().getHeader(ENDPOINT_NAME, String.class);
        String endRopEndpoint = exchange.getIn().getHeader(END_TAG_ENDPOINT_NAME, String.class);
        InputStream is = new ByteArrayInputStream(exchange.getIn().getBody(String.class).getBytes());
        aggregateBody(producerTemplate, is, ropEndpoint, endRopEndpoint, new HashMap<String, Object>(exchange.getIn().getHeaders()));

    }

    private void aggregateBody(ProducerTemplate producerTemplate, InputStream content, String ropEndPoint, String endRopEndpoint, Map<String, Object> headers){
        BufferedReader br = new BufferedReader(new InputStreamReader(content));
        String line;
        Map<String, StringBuilder> articles = new LinkedHashMap<String, StringBuilder>();
        StringBuilder aggregateFile = new StringBuilder();
        try {
            String lineId = null;
            while((line = br.readLine()) != null){
            lineId = line.substring(NUMERO_SITE_START_POSITION, NUMERO_SITE_END_POSITION);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
        finally{
            try {
                if(br != null)br.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
}

提前谢谢你。

路易莎。

编辑:我的新代码,但我不知道如何返回文件。

package beans;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.ByteArrayInputStream;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
import java.util.Set;
import java.util.TreeSet;

import org.apache.camel.*;


public class bean_test implements Processor{

    private static final String ENDPOINT = "aggregateEndpoint";
    private static final int NUMERO_SITE_START_POSITION = 46;
    private static final int NUMERO_SITE_END_POSITION = 55;


    @Override
    public void process(Exchange exchange) throws Exception {

        ProducerTemplate producerTemplate = exchange.getContext().createProducerTemplate();
        String endpoint = exchange.getIn().getHeader(ENDPOINT, String.class);
        InputStream is = new ByteArrayInputStream(exchange.getIn().getBody(String.class).getBytes());
        aggregateBody(producerTemplate, is, endpoint, new HashMap<String, Object>(exchange.getIn().getHeaders()));

    }

    private void aggregateBody(ProducerTemplate producerTemplate, InputStream content, String endpoint, Map<String, Object> headers){
        BufferedReader br = new BufferedReader(new InputStreamReader(content));
        String line;
        Set<String> order=new TreeSet<String>();

        try {
            String lineId = null;   
            while((line = br.readLine()) != null){
                lineId = line.substring(NUMERO_SITE_START_POSITION, NUMERO_SITE_END_POSITION);
                order.add(lineId);
            }

            for(int i=0;i<order.size();i++){
                String key = "file" + i;
                File F = new File(key);
                Iterator it = order.iterator();
                FileWriter fw = new FileWriter(F.getAbsoluteFile());
                BufferedWriter bw = new BufferedWriter(fw);

                while((line = br.readLine()) != null){
                    while(it.hasNext()){
                        lineId = line.substring(NUMERO_SITE_START_POSITION, NUMERO_SITE_END_POSITION);
                        if (lineId.equals(it.next())) {
                            bw.write(line);
                        }
                    }

                }
            }


        } catch (IOException e) {
            e.printStackTrace();
        }
        finally{
            try {
                if(br != null)br.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
}

最佳答案

这个答案真的是用户Ranxfrom the Camel list ,不是我自己的;但是,我认为它值得复制,因为它很优雅并且保持了 Camel 习语。

概念上,您想要拆分文件中的记录。然后,对于每条记录,您想使用一些值来选择目标输出文件。 enter image description here

用户 Ranx 在 Camel 列表中提供的特定于 Camel 的解决方案使用了 Camel 功能:目标文件名可以从消息中的值(这是您的规范的一部分)派生而来。

enter image description here 您拆分为记录,然后将字符串解码为某种格式,提取所需字段并将其设置为标题,将其编码回字符串,最后写入文件(追加),使用文件名中的标题值。

这是在片段中表达的:

from("file:/inbox")
 .split(body())
 .unmarshal(dataFormat)
 .setHeader("fileName",simple("${body.identifier}"))
 .marshal(dataFormat)
 .to("file:/outbox/?fileName=${header.fileName}.txt&fileExist=Append") 

或者,您可能可以避免编码和解码,并使用一个简单的处理器,它按原样读取字符串主体,并设置一个 header ,如上所示。这将是: enter image description here

关于java - 将一个文件剪切成多个文件(Java),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38688772/

相关文章:

powershell - 根据一列的值分割一个csv文件

java - 如何使用正则表达式将字符串按最后一个字符拆分?

java - Apache Camel : Build a CXF consumer and call the service

java - Camel Spring DSL 未按预期工作

java - 为什么 Java 的行为不像 "Pass-By-Value"一样?

java - 图表上的 setFont 问题 (JFreeChart)

python - 如何使用定界符将一个字符串拆分为 2 个字符串

java - 如何在 Apache Camel 中循环

java - 无法使用 Git Bash 运行 Java 应用程序

java - 单线程应用程序的 GC 设置