javascript - Javascript 希腊语音节库

标签 javascript formal-languages

有人知道用 Javascript 编写的希腊语音节库或脚本吗?我尝试使用 Hyphenator.js 但结果很差...

<script src="Hyphenator.js" type="text/javascript"></script>
<script src="patterns/grc.js" type="text/javascript"></script>

<script type="text/javascript">
    var hyphenchar = '|';
    Hyphenator.config({hyphenchar:hyphenchar});
    var t = 'αποκαλυψις ιησου χριστου ην εδωκεν αυτω ο θεος δειξαι τοις δουλοις αυτου α δει γενεσθαι εν ταχει και εσημανεν αποστειλας δια του αγγελου αυτου τω δουλω αυτου ιωαννη'.split(" ").map(function(word){return Hyphenator.hyphenate(word, 'grc')});
    console.log(t);
</script>

将输出:

["απο|κα|λυ|ψις", "ιησου", "χρι|στου", "ην", "εδω|κεν", "αυτω", "ο", "θεος", "δει|ξαι", "τοις", "δου|λοις", "αυτου", "α", "δει", "γε|νε|σθαι", "εν", "ταχει", "και", "εση|μα|νεν", "απο|στει|λας", "δια", "του", "αγ|γε|λου", "αυτου", "τω", "δουλω", "αυτου", "ιω|αν|νη"]

这显然表明连字不能完美地用于音节化目的。也许对于连字符来说还可以......

评论后添加:

我预计库会将“iesou”和“theos”连字符,但事实证明连字符有一个 minwordlength 设置。将其设置为 2 可提供更好的结果。一些消息来源称,由于多种原因,自动连字/音节化并不是 100% 准确。但目前这对我来说已经足够了。

最佳答案

正如评论中所说,默认情况下短单词不会连字符(因为它没有打印意义)。但是,它可以被强制:

Hyphenator.config({hyphenchar:hyphenchar, minwordlength:1});

关于javascript - Javascript 希腊语音节库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39115034/

相关文章:

javascript - 更改对 vue 实例的引用

javascript - 使用 Google Apps 脚本执行提取时选择一个选项

regex - Perl 正则表达式可以用于什么类型的语言?

automata - PDA 接受包含 a 多于 b 的字符串语言

以字符串形式读取数字

turing-machines - 有两个堆栈的 PDA 可以接受 RE 语言吗?

turing-machines - 证明这种语言是不可判定的

javascript - 根据数据选择元素

javascript - 对象 [object Object] 没有方法 'FixedScroll' Wordpress

javascript - 如何使用 JQuery 在 2 个元素之间画一条线并刷新该线?