无论我们喜欢与否,在规划职业道路时,工资都扮演着重要的角色。因此,对CareerExplorer来说,尽可能准确地报告薪水是很亚博怎么才能提现重要的。通常,当一个人研究某一职业的薪水时,他们可能会访问多个来源,以便尽可能准确地了解情况。在当今环境下,整合来自多种资源的信息变得越来越重要,这也是CareerExplorer计算薪资的核心。亚博怎么才能提现本文详细介绍了CareerExplorer如何将我亚博怎么才能提现们自己的内部数据与来自公共资源的外部数据相结合。
CareerExp亚博怎么才能提现lorer如何计算薪水?
在CareerExplorer亚博怎么才能提现的整个评估过程中,当用户告诉我们他们过去的职业生涯时,就会收集他们的薪资数据。我们将这些数据合并到薪资信息中,然后向其他用户报告,但在尝试这样做时存在一些困难。当Care亚博怎么才能提现erExplorer向我们的用户报告每个职业的薪水时,一个选择是取这些收集数据的平均值。然而,这是有问题的,因为我们可能没有收集到每个职业足够的数据点,以便有信心地报告某些职业的工资。因此,我们分两步执行计算:
- 我们首先过滤掉那些我们认为是虚假或不小心的数据。这一步骤在本文中没有涉及。
- 接下来,我们将自己的数据与来自劳工统计局(BLS)。这篇博文详细介绍了这个计算是如何进行的。
贝叶斯统计:
为了执行这个计算,需要调用贝叶斯统计。简而言之,贝叶斯统计使我们能够系统地平衡专家意见(来自美国劳工统计局的外部薪酬数据)等等我们自己的数据告诉我们(由CareerExplorer收集的薪资数据)。亚博怎么才能提现
为了证明这一点,让我们从一个说明性的场景开始,在这个场景中,我们用收集到的以下数据比较演员和焊工的工资:
职业生涯 | 接受调查的人数 | 平均工资 |
---|---|---|
演员 | 3人 | 350000美元 |
焊机 | 500人 | 85000美元 |
哪一种职业的平均工资更高?单从收集到的数据来看,我们不得不说演员的平均收入比焊工高。
然而,大多数人会直觉地不同意这个结果。报告上述结果是值得怀疑的,主要有两个原因:
- 被调查的人数。由于我们只调查了三个人,所以我们不太确定演员的平均工资。也许其中一名受访者是一位著名的名人,年收入为100万美元,而另外两名受访者的年收入为2.5万美元,比较合理和适中。相比之下,我们应该对焊工报告的价值感到更舒服,因为我们有更多的受访者
- 大多数人的直觉会告诉他们,一般的焊工比一般的演员有更高的收入。即使没有看到被调查的人数,上述结果仍然值得怀疑。
如果其他数据来源或“薪酬专家”告诉我们,薪酬应该是这样的,那么结果就会进一步受到质疑:
职业生涯 | 关于工资的专家意见 |
---|---|
演员 | 35000美元 |
焊机 | 120000美元 |
如果我们在第一个表格中报告我们自己的“平均工资”数据,那将是不负责任的。或者,我们不应该纯粹依赖专家的意见,因为我们已经收集了大量的焊工数据,并觉得我们有一个相当好的想法,关于他们赚多少钱。就像生活中的大多数事情一样,“正确答案”可能介于这两个选项之间。现在,问题变成了如何将“专家意见”与我们收集到的数据结合起来?
方法论背后的直觉:
虽然上面的例子是人为的,但它很好地说明了这个问题。在专家的意见和我们收集的数据之间取得平衡是很好的。以下是我们使用的方程的鸟瞰图:
该方法的核心是在AverageSalary我们的数据告诉我们ExpertOpinionOfSalary这是外部来源告诉我们的。根据上面的等式,W数据控制着我们对平均工资的重视程度收集的数据。W越高数据我们越是重视数据。W的情况也是如此专家而且ExpertOpinionOfSalary.随着我们收集到更多的数据,W数据和W专家相应地改变。
让我们试着获得一些关于W数据和W专家随着我们收集更多的数据而改变:
如果数据点的数量(被调查的人数)增加,W数据增加和W专家减少
如果收集到的数据的“扩散”很高,W数据减少和W专家增加
上面的第一点已经讨论过了。随着数据点的增加,我们对得出的平均工资有了更多的信心。这是有道理的!
第二点提出了“数据扩散”的新概念。为了测量收集到的数据的分布情况,我们使用了一个称为“方差”的统计概念。在上面的例子中,有三个演员,其中一个演员的工资高得多,数据非常分散。因此,该数据被称为具有高方差。方差高的结果是,我们对知道平均工资在哪里不太有信心,我们更多地依赖专家的意见。
导致的工资:
现在让我们看看使用这种方法的一些结果:
职业生涯 | 数量的调查 | 平均工资 | 关于工资的专家意见 | 综合工资 |
---|---|---|---|---|
演员 | 3. | 350000.0 | 35000 | 37800.0 |
焊机 | 500 | 85000.0 | 120000 | 85100.0 |
从上面的表格中,我们可以看到,对于演员来说,最终的“综合工资”非常倾向于专家的意见。这个结果很好,因为37800美元的平均工资比35万美元的平均工资要合理得多。正如前面所讨论的,由于我们收集的数据很少,方差很大,所以结果是严重倾斜的。
相比之下,焊工严重倾向于“平均工资”下收集的实际数据,因为有足够的数据支持该结果。
现在,如果我们询问另外497位演员的薪水,他们都说自己的年薪是2.5万美元,我们的数据会发生什么变化呢?:
职业生涯 | 数量的调查 | 平均工资 | 关于工资的专家意见 | 综合工资 |
---|---|---|---|---|
演员 | 500 | 26950.0 | 35000 | 27000.0 |
焊机 | 500 | 85000.0 | 120000 | 85100.0 |
首先要注意的是,在考虑了额外的数据后,演员的“平均工资”发生了巨大的变化。其次,“综合工资”已经变得更倾向于“平均工资”,因为我们已经收集了足够的数据来改变我们对专家意见的看法。
事实上,我们已经收集了如此多的数据,以至于专家的意见几乎显得无关紧要。这是伟大的!我们相信专家的意见,直到收集到足够的证据证明不是这样。
进一步讨论:
到目前为止,我们已经看到了收集到的数据和专家意见之间的平衡背后的直觉。为了清楚地看到这种方法的好处,让我们想象大卫·罗宾逊在他的博客.在这里,我们假设棒球招聘者的角色是比较这两名球员:
球员 | 本垒打次数 | 击球次数 | 全垒打百分比 |
---|---|---|---|
新秀莱恩 | 1全垒打 | 2次 | 50% |
经验丰富的维多利亚 | 400个本垒打 | 1000年的尝试 | 40% |
以上两位球员中,谁更愿意招募?
此外,让我们用这样一个事实武装自己:我们认识一位棒球分析专家,他告诉我们,任何球员的典型本垒打率都是5%,这是历史数据显示的。我认为大多数人会选择老兵维多利亚,因为她已经测试了更多,我们有更多的证据来支持她报告的全垒打百分比。相比之下,对于新秀瑞恩,我们只是还没有看到他足够的发挥。
在我们的大脑中,我们一开始就对一个典型的球员有一个先入为主的想法(5%的本垒打率)。除非我们收集了足够多的数据让我们改变想法,否则我们往往会坚持自己的信念。在老兵维多利亚的例子中,我们有足够的证据去说服自己她比一般的玩家更优秀。但新手瑞恩却不是这样。这正是贝叶斯统计允许我们在数学上做的。
贝叶斯方法的最后一个组成部分是“先验/专家方差”的概念。这个参数控制着我们在专家意见中有多“确定”,以及我们必须拿出多少证据才能改变我们先前的信念。先验方差越高,我们对自己的先验信念就越不确定,我们改变想法所需的数据就越少。
有趣的是,任何球员在一个赛季内的最高本垒打率记录是15.34%巴里·邦兹2001年的作品。有了这些额外的知识,我们不选择老兵维多利亚将是特别愚蠢的。
结论
在本文中,我们讨论了CareerExplorer如何使用贝叶斯统计数据将从用户和外部来源收集的亚博怎么才能提现薪资数据结合起来。这种方法在我们没有大量数据的情况下特别有用。在一个人没有很多“经验”或数据的情况下,依赖他人的意见是有意义的。随着我们收集的数据越来越多,我们开始对收集的数据更加信任,对专家输入的依赖也越来越少。有趣的是,这种数学方法与人们思考问题的方式非常相似。不管怎样,这种方法使我们对所报告的工资有了更高的信心。
在未来的博客文章中,我们计划提供CareerExplorer用于为用户提供职业匹配的数学模型的细节。亚博怎么才能提现
本文于2019年11月29日更新了我们的新产品名称。