java - 读入一个没有标点符号的文件

标签 java string io

我正在逐行阅读文件，然后分析每个单词。然后我使用 PrintWriter 将文字打印到一个新文件中。如果单词有标点符号，我需要读入没有标点符号的单词，因为我将标点符号直接写入输出文件。如果字符在单词的中间，我需要将它拆分成两个单词。

例子:

let's应该是两个词，“let”和“s”
你的，应该只是“你的”

除了检查每种标点符号的 word.contains() 然后将其拆分之外，我想不出任何其他方法。有什么建议吗？

最佳答案

您可以使用 \p{Punct} , 这是 !"#$%&'()*+,-./:;<=>?@[\]^_`{|}~ 之一, 以及 \s这是一个空白 [ \t\n\x0B\f\r] :

line.split("[\\s\\p{Punct}]+");

例如:

"let's. your!".split("[\\s\\p{Punct}]+");
> ["let", "s", "your"]

关于java - 读入一个没有标点符号的文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35324047/

上一篇：java - 标志为假时如何延迟和循环？

下一篇：java - 在 Java 中，如何在方法参数中正确使用抽象类？

相关文章：

vb.net - Shell命令使用字符串确定文件名

java - 按长度分割字符串，保持子字符串完整

java - iso 的 pig UDF 到 yyyy-mm-dd hh :mm:ss. 000

java - 将数组移位 k

java - Wicket - AjaxFormComponentUpdatingBehavior 和退格键

c - 原始终端模式 - 如何接受输入？

C - 字符数组的数组

java - 了解所有线程何时完成并处理异常

string - Lua中计算字符串转换为int

java - 无法使用扫描仪读取 Double

©2024 IT工具网联系我们