uima ruta 评分条件

标签 uima ruta

我尝试了一个脚本来使用分数条件来标记日志。

   W{REGEXP("Journal",true)->MARK(ONLY_Journal)};
   W{REGEXP("Retraction|Retracted")->MARK(RETRACT)};
   W{REGEXP("Suppl")->MARK(SUPPLY)}; 
   NUM {->MARK(VOLUMEISSUE,1,6)}LParen NUM  SPECIAL?{REGEXP("-")} NUM? RParen; 

   Reference{CONTAINS(ONLY_Journal)->MARKSCORE(10,JOURNAL_MAYBE)};
   Reference{CONTAINS(JournalVolumeMarker)->MARKSCORE(5,JOURNAL_MAYBE)};    
   Reference{CONTAINS(VOLUMEISSUE)->MARKSCORE(15,JOURNAL_MAYBE)};   
   Reference{CONTAINS(JOURNALNAME)->MARKSCORE(10,JOURNAL_MAYBE)};     
   Reference{CONTAINS(RETRACT)->MARKSCORE(10,JOURNAL_MAYBE)};    
   Reference{CONTAINS(SUPPLY)->MARKSCORE(5,JOURNAL_MAYBE)}; 
   JOURNAL_MAYBE{SCORE(20,55)->MARK(JOURNAL)};

示例文本

1.劳伦斯RA。美国母乳喂养的医学 342–340 益处和禁忌症综述 [互联网]。阿灵顿 (VA):国家母婴健康教育中心; 1997 年 10 月 [引自 2000 年 4 月 24 日]。 p. 40. 可从以下网址获取:www.ncemch.org/pubs/PDFs/Welcometojungle.pdf。

2.Shishido A. 撤回通知:铂化合物对小鼠淋巴细胞有丝 split 的影响 [Alsabti EA、Ghalib ON、Salem MH 的撤回。在:Jpn J Med Biol 1979 Apr; 32(2):53-65]。 Jpn J Med Sci Biol 1980 Aug;33(4):235-237.

3.Leist TP,Zinkernagel RM。用 IL-2 受体特异性单克隆抗体治疗小鼠的效果 [信件] [Leist TP、Kohler M、Eppler M、Zinkernagel RM 的撤稿。在:J Immunol 1989 年 7 月 15 日; 143(2):628-32]。 J Immunol 1990 年 4 月 1 日;144(7):2847。

4.Chen, L.、James, N.、Barker, C.、Busam, K. 和 Marghoob, A.(2013 年)。促纤维增生 黑色素瘤:综述。美国皮肤病学会杂志,68(5),825-833。 doi: 10.1016/j.jaad.2012.10.041.

但是上面的脚本不工作。任何人都可以找到解决方案吗? 提前致谢。

最佳答案

这应该可以正常工作,但当然取决于 ONLY_Journal、JournalVolumeMarker 等类型存在的注释数量......

这是一个简单的 ruta 项目的测试脚本:

ENGINE utils.PlainTextAnnotator;
TYPESYSTEM utils.PlainTextTypeSystem;

Document{->EXEC(PlainTextAnnotator, {Paragraph})};

DECLARE Reference, ONLY_Journal, JOURNAL_MAYBE, JournalVolumeMarker, VOLUMEISSUE, JOURNALNAME, RETRACT, SUPPLY;
DECLARE JOURNAL;

Paragraph{-> Reference};
"Jpn J Med Biol" -> JOURNALNAME;
"32\\(2\\)" -> VOLUMEISSUE;

Reference{CONTAINS(ONLY_Journal)->MARKSCORE(10,JOURNAL_MAYBE)};
Reference{CONTAINS(JournalVolumeMarker)->MARKSCORE(5,JOURNAL_MAYBE)};    
Reference{CONTAINS(VOLUMEISSUE)->MARKSCORE(15,JOURNAL_MAYBE)};   
Reference{CONTAINS(JOURNALNAME)->MARKSCORE(10,JOURNAL_MAYBE)};     
Reference{CONTAINS(RETRACT)->MARKSCORE(10,JOURNAL_MAYBE)};    
Reference{CONTAINS(SUPPLY)->MARKSCORE(5,JOURNAL_MAYBE)}; 
JOURNAL_MAYBE{SCORE(20,55)->MARK(JOURNAL)};

...应用示例文本,第二个引用文献用 JOURNAL 注释。

免责声明:我是 UIMA Ruta 的开发者。

关于uima ruta 评分条件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36711572/

相关文章:

java - UIMA 鲁塔 : set feature with MARKONCE action

基于注释的JavaDoc

java - Spark 上下文中的 Uima Ruta 内存不足问题

uima - 匹配 UIMA RUTA 中一行中同一字典中的所有匹配项

uima - 在 UIMA Ruta 中设置特征值为包含注解的计数

java - 在 UIMA Ruta Workbench 中添加 HeidelTime 作为分析引擎

java - 如何使用 IBM Content Analytics 访问自定义 uima 注释器中的文档文件名或 URL?

uima - 是否可以使用 UIMA 创建注释层次结构?

UIMA 鲁塔 : Check if feature is empty/undefined