如果没有雇主网站提供的一些 xml/api,我认为这是不可能的?
基本上我可以从 html 页面中提取和识别信息吗?
最佳答案
理论上你可以,但是从雇主网站上抓取招聘广告是徒劳的,徒劳的努力需要非常复杂的编程、模式识别、(很多)系统会出错的手动后处理,以及不断更新。
此外,还有法律问题。虽然抓取过程通常是允许的,但大多数网站禁止自动处理它们的数据,因此当您重新发布以这种方式获取的任何工作机会时,您可能会遇到很多麻烦。
您需要使用 XML 或其他类型的结构化、标准化、合法的数据。
如果你做不到,我会说忘记它,做一些更快乐的事情。
关于php - 是否可以创建一个搜索引擎来索引来自许多公司网站的新职位?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2829788/