我必须用一些文本的独特单词来创建词汇表。我已将文本转换为字符串数组。现在我想要仅包含唯一单词的数组列表。所以第一步,将第一个字符串数组转换为 List<Strings>
(我猜?)所有双字都被过滤掉。这是我的第一步,我该如何做到这一点,以及我是否使用 List<String>
或另一个String[]
?
其次,我“读入”的下一个 String[] 应该更新词汇表 List<String>
但仅从文本中添加新单词。
它必须看起来像:
public List<String> makeVocabulary(String[] tokens){
List<String> vocabulay = new ArrayList<>;
//add unique words from 'tokens' to vocabulary
return vocabulary;
}
TL;DR:我如何转换一大堆String[]
到一List<String>
仅包含 String[]
中的独特单词的?
最佳答案
检查您的代码后,您似乎每次运行此命令都会清除词汇表,因此只能执行一次。如果您想让它更加模块化,请执行以下操作:
public class yourClass
{
private List<String> vocabulary = new ArrayList<String>();
public List<String> makeVocabulary(String[] tokens)
{
for( int i = 0; i < tokens.length; i++ )
if( !vocabulary.contains( tokens[i] ) )
vocabulary.add(tokens[i]);
return vocabulary;
}
}
关于java - 如何从字符串数组创建词汇表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34164788/