python - 在线求职很乏味。帮我自动化

标签 python ruby regex perl nlp

许多求职网站都存在错误搜索,无法让您按经验水平缩小求职范围。即使他们这样做了,通常也是错误的。这需要你费力地浏览数百个你申请不到的帖子,然后才能找到相关的帖子,相当乏味。由于我宁愿专注于写求职信等,我想编写一个程序来浏览大量的帖子,并只保存那些不需要多年经验的工作的 URL。

我不需要帮助编写爬虫来获取可能相关的工作职位的 html 正文。问题在于准确检测工作所需的经验水平。这应该不会太难,因为职位发布通常对此非常明确(“必须在……方面有 5 年的经验”),但过于简单的解决方案可能会出现一些问题。

就我而言,我正在寻找入门级职位。他们通常不会说“入门级”,但包含这些词可能意味着应该保住这份工作。

接下来,我可以安全地排除一份工作,它说它需要“5 年”的经验,所以像/\d\syears/这样的正则表达式排除工作似乎是合理的。但后来,我意识到有些工作说他们需要 0-2 年的经验,匹配排除正则表达式,但显然是我想看一看的工作。嗯,我可以用另一个正则表达式来处理。但也有人说“不到2年”或“不到2年”。也可以处理,但这让我想知道我没有想到的其他模式,并且可能排除许多工作。这就是让我来到这里的原因,以找到一种比正则表达式更好的方法来做到这一点,如果有的话。

我想尽量减少漏报率,并保留所有看起来不需要多年经验的工作。排除匹配/[3-9]\syears|1\d\syears/的任何内容是否合理?或者,还有更好的方法?也许训练贝叶斯过滤器?

编辑:有一个类似但更难的问题,解决起来可能更有用。有很多工作只需要“工程学位”,因为你只需要了解一些技术知识。但是搜索“工程”会为您提供数以千计的工作,其中大部分都是无关紧要的。

我如何将范围缩小到只需要任何工程学位而不是特定学位的工作,而不是亲自查看每一个?

最佳答案

好吧,这个答案可能不会有帮助——我会在前面说。但是,在我看来,仅仅以这种方式思考问题就足以让你在我工作过的大多数地方被录用。我的建议?在您感兴趣的任何职位上联系招聘经理,告诉他们这就是您的工作。笼统地告诉他们到目前为止您编写的代码,并寻求帮助以了解他们在编写广告时使用的模式。

如果我是这封信的收件人,我想我会邀请来访的人。

关于python - 在线求职很乏味。帮我自动化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3048268/

相关文章:

python - 如何在 Tornado 中创建多个 websocket 聊天?

python - 在 Python 中使用类作为命名空间是个好主意吗

javascript - jQuery 中的正则表达式

javascript - 正则表达式:捕获组不是从一开始就进行否定前瞻

javascript - 从父级中删除标签,但不从子级中删除标签

python - 在 python 中简单连续运行 XMPP 客户端

ruby-on-rails - 启动 Ruby 应用程序

mysql - gem安装mysql2 windows native 扩展等问题

mysql - 将用户连接到 Rails 中的数据库条目

python - 学校垄断作业的一部分不会输出任何内容(初学者,Python)