php - PHP 中的简历/CV 解析

标签 php parsing lamp text-parsing

<分区>

我们正在使用 LAMP 开发基于需求的社交媒体网站。

为此,我们想用 PHP 进行简历/简历解析。

我们能够解析电子邮件 ID 和电话,但不确定如何从简历中解析其他信息,如全名、地址、教育、就业等。

此外,resume/CV 可以是各种格式,如 doc、html、rtf、txt 等。

任何人都知道 PHP 脚本,我们可以从中获取数据。或任何启动的开发想法。

提前致谢。

最佳答案

我会看看现有的简历解析器是否有一个您可以使用的 API 或一个可以添加到您的框架的自定义 Hook 。查看SovrenTextKernel

根据 Sovren 的网站,他们引用:

Once your instance of the SovrenConvertAndParse Web Service is running, you will access it via SOAP. Almost all programming environments have the ability to auto-create a web service client or web service proxy automatically from the web service’s WSDL. We also have sample clients for some environments such as PHP. In any case, creating the web service client should be a very quick task: usually a few minutes, maybe a few hours.

Once you have created your web service client, you can call a single method on the web service to convert and parse a resume in one operation, receiving HR-XML output in return.

http://www.sovren.com/sovren-products-parser-implementation.php

http://www.sovren.com/sovren-products-web-service.php

TextKernel 引述:

Document processing for all types of documents (DOC, DOCX, PDF, RTF, HTML, TIFF, TXT, XML, MSG, and EML type documents). Textkernel offers the following 11 languages out of the box: English, German, French, Dutch, Spanish, Swedish, Danish, Polish, Romanian, Italian, Slovak.

他们的网络界面似乎叫做 Sourcebox:

Sourcebox is fully configurable with Extract!, Textkernel's CV Parsing software.

Sourcebox has a multilingual web interface for staff to manage the CV queue and manually check and correct exceptions.

Sourcebox can be used as an interface to many leading CRM, ATS, Matching engines, HRMS systems and your own website or recruitment portal.

http://www.textkernel.com/hr_solutions.php?nav=sourcebox

它们似乎都有足够的前景可以使用,而不必在这里重新发明轮子,尤其是在 PHP 方面。

关于php - PHP 中的简历/CV 解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6913165/

相关文章:

php - 来自两个表的SQL中的求和列

php - 非常简单的 SQL 函数返回 bool 值 1 (true) 而不是资源

php - php中日语字符的编码问题

json - 使用 Json.Net 解析两个语义相同的层次结构文档并失败

mysql - 全新 MYSQL 安装,用户 'root' 拒绝访问

php - 创建时间戳会在构造函数中设置动态表名的模型引发错误

java - 是否有用于 BER-TLV 的 Java 解析器?

Python:SGMLParser 无法获取行号

php - MySQL每日RESET自增值

php - 如何确保变量是从 PHP 中的特定 JavaScript 页面发布的