一句话总结
Amazon数据科学家面试不是考你会不会写代码,而是考你能不能用数据讲故事。面试官手里拿的不是评分表,而是14条领导力原则——你每一轮回答都在被暗中对照“创新者”、“决策者”、“传递者”这三个原型做匹配。300份简历里,能进onsite的不超过15个,但真正拿到offer的人,在technical round平均只回答对70%的技术问题——他们赢在把每一个答案都变成了对领导力原则的侧面印证。
这行做久了你会发现一个悖论:答得最完美的那个人,往往第一个被拒。Amazon要找的不是会考试的人,是在模糊信息下还能做出好决策的成年人。
适合谁看
这篇文章写给三类人:
第一类是正在准备Amazon数据科学家岗位面试的候选人,你可能已经通过了简历筛选或者猎头推荐,正在第一轮或第二轮technical screen阶段,感觉自己技术还行但不知道Amazon到底要什么。
第二类是想要内部转岗到数据科学家方向的Amazon员工,你可能在其他岗位做了1-2年,对数据分析有兴趣,想要利用内部转岗的机会进入DS团队,但不清楚内部面试和外部招聘有什么区别。
第三类是刚开始准备硅谷数据科学家岗位的求职者,Amazon只是你的目标公司之一,你想了解头部科技公司的面试套路,建立一个可迁移的准备框架。
如果你是刚毕业的硕士/博士生,目标岗位是L4 Data Scientist,这篇文章的直接适用度最高。如果你是资深从业者瞄准L5-L6,文中关于leadership principles的权重需要你自行上调——级别越高,behavioral round的淘汰率越高,不是技术不重要,而是技术过了门槛之后,大家差不都多。
面试流程拆解:从简历发出去到offer谈下来
第一关: recruiter screen(30分钟)
这不是走过场。Amazon的recruiter手里有一份岗位匹配度清单,他们会对照你的简历问三个问题:你做的是描述性分析还是预测性建模?你有没有把模型结果产品化的经验?你简历上写的项目里, business impact能不能量化?
一个典型对话是这样的:recruiter会问你“你简历里提到做了客户流失预测模型,这个模型上线了吗?上线之后流失率降了多少?”如果你说“我们做了ab test,显示对照组转化率高3个点”,这题就过了。如果你说我只是做了模型没上线,recruiter会在系统里标注“缺少production经验”——这不是死刑,但会影响后续技术面的问题难度设置。
这一关的淘汰率在40%左右,淘汰原因不是你不优秀,而是你的简历描述没有踩中关键词。Amazon的ATS系统会把简历做关键词匹配,“Python”、“SQL”、“ML”这些硬技能词出现频率低于阈值,直接进人才库。所以投简历之前,把你的JD翻译成技能词列表,一个一个对照检查。
第二关: technical screen(两轮,每轮45-60分钟)
这是很多人最紧张的环节,但也是误解最多的环节。
Amazon的技术面不是考你背算法。L4的technical screen通常考三块:SQL查询、数据分析/统计推断、机器学习基础。每块大概15分钟,难度相当于medium-hard LeetCode+一道开放性分析题。
SQL那一轮不是让你写一个复杂的window function,而是让你从一张订单表里算出“每个用户第一次购买和第二次购买之间间隔天数的中位数”。听起来简单?但面试官会随着你的解答不断加条件——“如果用户只买了一次呢?”“如果我们排除促销订单呢?”这一轮考的不是你会不会写SQL,是你有没有考虑边界条件的习惯。Amazon的数据科学家每天面对的是脏数据,你能不能在写query的时候脑子里同时跑着“这里可能有null”、“这个join可能产生笛卡尔积”这些念头,比你最终写出的code是不是elegant重要得多。
统计推断那一轮会给你一个业务场景,让你设计实验或者分析结果。一个经典问题是:“Amazon想要测试一个新的推荐算法,之前的转化率是5%,你预计新算法能提升到5.5%,要多少样本量才能在95%置信度下检测到这个差异?”这不是背公式就能答对的——你得解释为什么用two-sided test而不是one-sided,为什么power设成80%,以及如果业务方说“我们只能跑两周,最多10万用户”,你应该怎么调整预期。
机器学习那一轮不考你手写backpropagation或者推导SVM对偶问题。Amazon喜欢问的是:“你做的模型里最重要的feature是什么?如果让你去掉它,模型表现会降多少?你怎么验证这个重要性?”或者“你的模型在test set上accuracy是85%,业务方说他们想要95%,你会怎么办?”第二个问题的陷阱在于:候选人通常立刻开始讲ensemble、feature engineering,但正确的思路是先问清楚“85%的错误里,哪些是false positive哪些是false negative,业务方真正在意的是哪个类型的错误”——这才是Amazon想要的答案:先理解问题,再动手。
两轮technical screen都通过之后,recruiter会安排onsite。
第三关: onsite面试(4-5轮,每轮45分钟)
Amazon的onsite流程不是标准化的,不同团队、不同级别会有差异。但L4 Data Scientist的典型配置是:
Loop 1: Leadership Principles + Technical Deep Dive(60分钟)
这一轮由Hiring Manager亲自面。前面30分钟behavioral,HM会围绕你的简历问4-5个Leadership Principles问题,用的是STAR format追问法。你说“我带领团队完成了一个项目”,HM会追问“你做这个决定的时候,其他团队成员有不同意见吗?你是怎么协调的?”“如果让你重新做一次,你会改变什么?”这就是Amazon版本的“你的弱点是什么”——他们不问那个蠢问题,但他们用追问来达到同样的目的。
后面30分钟是技术深度挖掘,通常会让你讲解一个你做过的最复杂的项目,从问题定义讲到你怎么建模、怎么验证、怎么产品化。HM会不断challenge你的假设——“你确定这个feature和用户行为真的有因果关系吗?”“你的validation set和test set分布一致吗?”这一轮不是要难倒你,而是要看看你在被质疑时的反应:你是会防御性地解释,还是会openly承认“当时确实没考虑到这个”?
Loop 2: Technical + Problem Solving(45分钟)
这一轮通常是Senior DS或者Tech Lead来面。开场会有一道45分钟的coding/analysis问题,典型形式是给你一个数据集(可能是Amazon真实业务场景的简化版),让你现场做分析、提出假设、设计实验。面试官不会告诉你“你应该用什么方法”,他们会看你会不会问问题——“这个数据集的时间跨度是多久?”“用户ID是唯一的吗?”“我们关注的是短期指标还是长期指标?”
这一轮的关键不是你的分析有多sophisticated,而是你展示的思考过程。正确的做法是:先问业务背景,再做探索性数据分析(EDA),再提出假设,再设计验证方法,最后给出recommendation。Amazon不要那种一上来就套模型的候选人,他们要的是会问“为什么要解决这个问题”的人。
Loop 3: Leadership Principles Deep Dive(45分钟)
这一轮全是behavioral,由两位面试官共同完成。他们会问你6-8个Leadership Principles问题,覆盖创新、决策、协作、传递等不同维度。每个问题追问到2-3层STAR。
一个典型问题:“告诉我一个你发现了一个被其他人忽略的问题的经历。”你说“在之前的公司,我发现我们的日志系统有一个数据丢失的bug,导致我们低估了某功能的使用率”。面试官会追问:“你是怎么发现的?别人为什么没发现?你发现之后做了什么?你是怎么说服团队去修复这个问题的?修复之后的impact是什么?”
这一轮的淘汰率最高,因为技术可以通过训练提高,但behavioral的真实性很难假装。Amazon的面试官接受过识别“canned answer”的训练——那种听起来排练过的、完美无缺的story反而会引起怀疑。真正加分的答案是你在叙述中自然带出的犹豫、自我怀疑、后来的反思。
Loop 4: Bar Raiser(45分钟)
Bar Raiser是Amazon特有的角色——一个经过专门训练的面试官,他的唯一职责是确保candidate meets the bar,不是为了团队招人,而是为了公司整体人才标准。这一轮通常是Senior Level的人来担任,可能是其他团队的LM。
Bar Raiser问的问题不一定更难,但一定更抽象。“告诉我一个你必须在信息不完整的情况下做决策的经历”“你如何定义工作中的‘好’?”“如果你和你的manager对一个问题有不同看法,你会怎么处理?”这些问题没有标准答案,Bar Raiser在评估的是你的思考深度和价值观是否和Amazon契合。
Loop 5: Presentation(可选,45分钟)
有些团队会让候选人做一个15分钟的presentation,介绍你过去做的一个项目,然后15分钟Q&A。这一轮不是所有岗位都有,但如果有了,通常是最后一轮或者倒数第二轮。
第四关: hiring committee decision
Onsite结束之后,你的所有面试反馈会汇总到一个 Hiring Committee。HC不是由面试你的那些人组成的——通常是3-4位没见过的senior leader,他们会读每一位面试官的书面反馈,然后做go/no-go的决定。
这里有一个 insider 场景:HC开会的时候,每个面试官会先简要陈述自己的评估,然后列出“concerns”。如果有任何一位面试官写了“strong no”,即使其他人都写了“strong yes”,这个case大概率会进入“讨论”而不是直接通过。HC的讨论通常围绕concerns展开——如果concerns可以被其他面试官的positive feedback抵消,candidate才能拿到offer。
一个常见的被拒场景是:技术面全通过,但Leadership Principles面有一位面试官写了“candidate展示了技术能力,但在描述团队协作时回避了冲突细节,无法判断其在复杂协作环境中的表现”。这种模糊的concern反而比明确的“技术不行”更致命,因为它意味着“无法判断”,而HC不喜欢无法判断。
> 📖 延伸阅读:Amazon TPM系统设计面试准备攻略
准备清单
- 把简历翻译成Leadership Principles语言
你的每一段项目经历都应该能对应到至少一条Leadership Principles。“我独立完成了X”对应的是“Ownership”;“我在资源有限的情况下找到了creative solution”对应的是“Think Big”或者“Invent and Simplify”。不是让你改简历内容,而是在面试中讲述项目时,主动把故事框架往LP上靠。
- 准备20个STAR故事,覆盖所有14条LP
你不需要每个LP准备20个,但至少准备15-20个故事,确保每个故事能灵活复用到不同问题。一个故事应该能回答“你遇到的最大挑战是什么”、“你是怎么带领团队度过难关的”、“你有什么遗憾的决定”这几个不同的问题,只是开头的frame不同。
- SQL和数据分析要练到“自动化”程度
不只是会做LeetCode medium,而是要能在15分钟内写出一个正确的、考虑了edge case的query。推荐练习:LeetCode database category刷完medium,StrataScratch的Amazon真题做一遍。重点不是解法,是速度——technical screen只有45分钟,你要用20分钟解决SQL才有足够时间应对追问。
- 统计推断和实验设计要能现场推导
不用背公式,但要理解背后的逻辑。sample size calculation、p-value、confidence interval、type I/II error这些概念要能用自己的话解释,并且能应用到具体场景。推荐复习:AB testing design、causal inference basics、常见statistical pitfalls(如simpson's paradox)。
- Machine Learning要能讲清楚trade-off
不用背paper,但要能回答“你为什么选这个模型而不是那个模型”、“你这个模型的limitation是什么”、“如果数据量增加10倍你会改什么”。这些问题的答案不在教科书里,在你对项目的反思里。
- mock interview至少做3次
找有Amazon DS经验的人做mock,或者用Pramp、Exponent这些平台。mock的重点不是让你练习答案,而是让你习惯被追问、被打断、被challenge的感觉。真实面试里,面试官说“你确定吗”的时候不是在质疑你,是在测试你的defensive reaction。
- 了解你申请的团队的业务
Amazon的数据科学家分布在AWS、Retail、Advertising、Kindle等不同业务线。面试前花30分钟了解你申请的团队做什么产品、主要的数据挑战是什么、他们最近在招人说明团队在扩张还是补位。面试官如果发现你对他们团队的business有基本了解,印象分会加很多。
- 准备问面试官的问题
每一轮结束前面试官会问你“你有什么问题问我”。不要问“工作生活平衡怎么样”这种网上一搜就有答案的问题。好的问题是:“你们团队目前最大的数据挑战是什么?”“这个岗位日常会用到哪些工具和语言?”“团队最近在做的项目里,你最excited的是哪个?”这些问题展示的是你对业务的genuine interest。
- 系统性拆解面试结构
PM面试手册里有完整的[数据科学家面试实战复盘]可以参考,里面有真实的面试录音转写和反馈分析,能帮助你理解面试官的评估维度。
常见错误
错误一:把技术面当成算法考试来准备
BAD版本:候选人把LeetCode刷了三遍,Hard题做了50道,面试官问“你知道Transformer的attention mechanism吗”立刻开始背公式,结果面试官只是想问“你有没有处理过序列数据”。
GOOD版本:候选人准备了三个项目故事,每个故事都能从业务问题讲起,讲到数据处理、讲到建模选择、讲到产品化、讲到business impact。技术问题答对了加分,答错了也能通过解释思考过程拿到partial credit。面试官最后给的反馈是“虽然有些技术细节不完美,但他展示的problem solving approach是我们想要的”。
一个真实场景:某位候选人在technical screen被问到“你怎么处理imbalanced dataset”,他直接说“用SMOTE”。面试官追问“为什么SMOTE比random undersampling好?”他说不出来。如果他换一个说法:“我会先看imbalance的程度,如果只是轻微不平衡(比如1:10),我可能直接用class weight;如果严重不平衡(比如1:100),我会考虑resampling或者改用precision/recall而不是accuracy作为metric”——这展示的不是你知道多少technique,是你理解不同方法的适用场景。
错误二:behavioral问题准备得太完美
BAD版本:候选人准备了5个完美无缺的STAR故事,每个故事都有清晰的Situation、Task、Action、Result,Result还有具体的数字。面试官问“你遇到过最大的失败是什么”,候选人讲了一个“项目延期但我从中学到了很多”的故事,叙事流畅、反思深刻、结尾升华。
面试官的反应:皱眉,在feedback里写“故事听起来像准备过的,无法判断真实性”。
GOOD版本:候选人准备了15个故事,但不是每个都完美。有些故事讲到自己当时的错误判断,有些故事的结果是“项目失败了,我们后来分析是因为X”。被问到“最大的失败”时,候选人讲了一个真实的故事,中间有犹豫、有当时的自我怀疑,最后说“我现在还在想当时有没有更好的做法”。
Amazon的LP评估标准里有一条隐含的维度叫“intellectual humility”——你能不能承认自己不知道、不能、错了。那些故事听起来太完美的人会被判定为“可能没遇到过真正的挑战”或者“在掩盖什么”。
错误三:忽视business impact的重要性
BAD版本:候选人讲了一个建模项目,用了复杂的模型,accuracy提升了5个点,面试官问“然后呢”,候选人愣住了。
GOOD版本:候选人讲了一个项目,背景是“我们的推荐系统在用户首次访问时的转化率很低,我们做了X分析发现原因是冷启动问题,然后用Y方法解决了,部署后首访转化率提升了2%,相当于Q3增加了Z百万美元的收入”。面试官追问“如果让你重新做一次,你会改变什么”,候选人说我会早点和product团队对齐metric定义——因为当时我们用accuracy但业务方真正在意的是coverage。
Amazon的数据科学家不是学术研究员,你的模型再elegant,如果不能translate to business impact,就没用。面试官不是在考你能不能发paper,是在考你能不能让数字变成钱。
一个insider场景:HC讨论时,一位面试官说“candidate的技术能力没问题,但他描述项目的语言里全是模型、accuracy、loss function这些东西,没有提任何business language”。另一位面试官同意:“他说他提升了model performance 10%,但没说这10%对应的是什么业务指标。”最后这个candidate被拒了,理由是“无法判断candidate是否有business sense”。
> 📖 延伸阅读:Amazon项目经理面试真题与攻略2026
FAQ
Q1: Amazon的数据科学家和别的公司(比如Google、Meta)有什么区别?
不是岗位title的区别,是工作方式的区别。Amazon的文化是“you build it, you run it”——你做的模型你要负责上线、监控、维护。Google的数据科学家可能更多做的是analysis和insight,product team去落地;Meta的数据科学家和product team紧密合作,但实验环境相对标准化。Amazon的特点是业务线极其多元,从电商到云服务到内容推荐,每个业务线的数据基础设施成熟度不一样,你可能需要自己搭pipeline、自己定义metric、自己和engineer协商productionization。
准备面试的时候,Google候选人要重点准备system design和large-scale data processing,Meta候选人要重点准备product sense和experimentation,Amazon候选人要重点准备end-to-end的项目经验——从问题定义到模型上线到impact measurement的完整故事。如果你没有完整的end-to-end经验,面试前要想清楚怎么描述你参与过的项目里接近这个纬度的部分。
Q2: 如果我没有机器学习PhD,是不是竞争力很差?
不是。Amazon的数据科学家岗位里,需要PhD的是少数(通常是L5+或者某些research-heavy的团队)。L4的岗位更看重的是你能不能解决问题,而不是你用什么方法解决。一个硕士毕业生,如果能清晰讲清楚自己用logistic regression解决了一个实际业务问题,比一个PhD但讲不清楚自己deep learning研究的应用价值的人,竞争力高得多。
具体来说:如果你是硕士或者本科背景,重点准备的是SQL、AB testing、基础ML、business sense这四个板块。LeetCode刷到medium足够。Behavioral preparation要更充分——因为你没有paper或者thesis可以聊,你要用项目经验来展示你的thinking depth。
Q3: Amazon的薪资大概是什么范围?如果被压价怎么应对?
L4 Data Scientist在Seattle或者Austin的package通常是:Base $130K-$160K,RSU(四年)$40K-$80K,Bonus(10-15%)$15K-$25K,第一年total大概 $190K-$265K。SF/Bay Area的location adjustment会让base高20-30K。L5的话base $160K-$200K,RSU $80K-$150K,bonus 15-20%,第一年total $260K-$380K。
关于压价:Amazon的comp team有明确的band,如果你在面试中展示了strong performance(尤其是bar raiser给了strong yes),你是有议价空间的。一个真实的谈判场景:candidate拿到了另一个大厂的offer,package是$230K,Amazon initial offer是$210K。Candidate的recruiter说“我们不能match”,但candidate提供了另一个厂的书面offer之后,Amazon最终提到了$235K。关键不是“你能不能”,而是你有没有alternative。Amazon不喜欢candidate“只拿了我们一家offer”的情况,因为这意味着候选人没有market signal。所以如果你有多个offer,或者哪怕只是一个strong interest,可以用来做leverage。
还有一点:RSU的vesting schedule是可以谈的。标准是四年 vesting,第一年25%,后三年每半年12.5%。如果你有sign-on bonus的竞争offer,可以尝试让Amazon把sign-on转成RSU front-loading(比如第一年多给一些)。这些细节谈不谈得成取决于你的competing offer有多strong,但至少要知道这些是可以聊的。
Q4: 面试中如果遇到不会的问题,应该怎么办?
不是A(立刻说自己不会然后道歉),而是B(展示你的思考过程)。一个具体的对话场景:面试官问“你知道怎么计算KL divergence吗?”如果你真的不知道,正确答案是:“我不太确定KL divergence的完整公式,但我知道它的用途是衡量两个分布之间的差异,通常在information theory和modeling里用来做distribution matching。如果需要精确计算,我可以推导或者查文档。”然后你可以主动说“你能给我一点提示吗”或者“我们能不能先假设我知道基本定义,继续往下走”——这展示的是你不会因为一个知识点不会就卡住,你有能力在部分信息下继续推进。
Amazon的technical interview不是高考,没有“不得分”的惩罚。你不会一道题不会死,但你不展示思考过程会死。
Q5: Leadership Principles到底怎么准备才不会被当成背诵?
不是A(背14条原则的定义和例子),而是B(把原则内化成你说话的方式)。一个测试方法:让你的朋友听你讲项目故事,不提示任何LP,看他们能不能自己说出来“这个人很有ownership”、“这个人会invent and simplify”。如果需要你主动说“我这个体现了LP的X”,说明你的storytelling还不够自然。
准备的时候不要对着14条原则一条一条凑故事。正确的做法是:先想清楚你真正做过的有挑战的项目,然后事后分析这些项目里你展现了什么品质——这些品质大概率自然对应某几条LP。面试的时候用正常的语言讲你的故事,LP会在你的语言里自然浮现,不需要你刻意标注。
准备好系统化备战PM面试了吗?
也可在 Gumroad 获取完整手册。