c# - 使用自然语言处理在 .Net 框架中进行简历解析

标签 c# .net nlp

我正在尝试比较两份简历。我有一个标准,如果某些字段匹配它是重复的。如您所知,简历风格各不相同。我如何理解 name 字段是一个 name 字段,以便我可以将它存储在某个地方并与另一个简历中的相同字段进行比较?

截至目前,我已经使用了 Interop 方法,并且我正在获取一个字符串中的所有文档内容。从字符串中,我拆分所有的\t、\r 和空格,并得到一个数组。从数组中,我怎样才能得到我自己的标准 xml 格式,如下所示:

XML 格式:

 <CANDIDATE_FULL_NAME>CandidateName here</CANDIDATE_FULL_NAME>
 <CANDIDATE_FIRST_NAME>CandidateFirstName here</CANDIDATE_FIRST_NAME>
 <CANDIDATE_LAST_NAME>CandidateLastName here</CANDIDATE_LAST_NAME>
 <PRIMARY_EMAI`enter code here`L_ID>name@gmail.com</PRIMARY_EMAIL_ID>
 <PHONE_BASIC>+919720018454155</PHONE_`enter code here`BASIC>
 <DOB>8/2/1987</DOB>
 <STREET1></STREET1>
 <STREET2></STREET2>
 <CITY></CITY>
 <REGION></REGION>
 <COUNTRY></COUNTRY>
 <PIN></PIN>

在回顾我的问题后,我很明显不知道自己在做什么,非常感谢一个起点。

最佳答案

象头神, 我建议建立自己的逻辑。 这是您可以使用的内容。

  1. 将所有简历按字段划分。
  2. 然后你可以给每个字段赋予权重-年龄。

    Email - 80
    Phone - 80 
    Name - 20 
    Highest Education - 20
    Home city   -  20 
    Last companies worked - 20 
    DOB - 30 
    and others
    
  3. 然后将数字相加,看看它们的总和是否为 80 或更高。
  4. 如果不止于此,那么你可以说同样的简历。
  5. 但如果不是,那你就知道了。
  6. 挑战在于有多少个字段,以及如何拆分它们。我建议使用一些简历解析器并在其之上构建逻辑。

关于c# - 使用自然语言处理在 .Net 框架中进行简历解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16338513/

相关文章:

nlp - 制作棕色簇

python - Keras 关于数组形状的错误,但形状似乎是正确的

python - 如何在 NLTK 中对二元语言模型进行单词级别的 Kneser-Ney 平滑?

c# - 分布式窗口服务

c# - 将 google 凭据用于生产应用程序的最佳方式是什么?

.net - UI线程访问外部控制

c# - 如何在 Entity Framework 中设置两个相同类型的导航属性

c# - ServicePointManager.ReusePort 和 SO_REUSE_UNICASTPORT 如何缓解临时端口耗尽?

c# - 创建操作 head 标签的处理程序

c# - U-SQL 随机行样本