Amazon数据科学家面试怎么准备

Amazon数据科学家面试不是考你会不会写代码，而是考你能不能用数据讲故事。面试官手里拿的不是评分表，而是14条领导力原则——你每一轮回答都在被暗中对照“创新者”、“决策者”、“传递者”这三个原型做匹配。300份简历里，能进onsite的不超过15个，但真正拿到offer的人，在technical round平均只回答对70%的技术问题——他们赢在把每一个答案都变成了对领导力原则的侧面印证。

一句话总结

这行做久了你会发现一个悖论：答得最完美的那个人，往往第一个被拒。Amazon要找的不是会考试的人，是在模糊信息下还能做出好决策的成年人。

适合谁看

这篇文章写给三类人：

第一类是正在准备Amazon数据科学家岗位面试的候选人，你可能已经通过了简历筛选或者猎头推荐，正在第一轮或第二轮technical screen阶段，感觉自己技术还行但不知道Amazon到底要什么。

第二类是想要内部转岗到数据科学家方向的Amazon员工，你可能在其他岗位做了1-2年，对数据分析有兴趣，想要利用内部转岗的机会进入DS团队，但不清楚内部面试和外部招聘有什么区别。

第三类是刚开始准备硅谷数据科学家岗位的求职者，Amazon只是你的目标公司之一，你想了解头部科技公司的面试套路，建立一个可迁移的准备框架。

如果你是刚毕业的硕士/博士生，目标岗位是L4 Data Scientist，这篇文章的直接适用度最高。如果你是资深从业者瞄准L5-L6，文中关于leadership principles的权重需要你自行上调——级别越高，behavioral round的淘汰率越高，不是技术不重要，而是技术过了门槛之后，大家差不都多。

面试流程拆解：从简历发出去到offer谈下来

第一关： recruiter screen（30分钟）

这不是走过场。Amazon的recruiter手里有一份岗位匹配度清单，他们会对照你的简历问三个问题：你做的是描述性分析还是预测性建模？你有没有把模型结果产品化的经验？你简历上写的项目里， business impact能不能量化？

一个典型对话是这样的：recruiter会问你“你简历里提到做了客户流失预测模型，这个模型上线了吗？上线之后流失率降了多少？”如果你说“我们做了ab test，显示对照组转化率高3个点”，这题就过了。如果你说我只是做了模型没上线，recruiter会在系统里标注“缺少production经验”——这不是死刑，但会影响后续技术面的问题难度设置。

这一关的淘汰率在40%左右，淘汰原因不是你不优秀，而是你的简历描述没有踩中关键词。Amazon的ATS系统会把简历做关键词匹配，“Python”、“SQL”、“ML”这些硬技能词出现频率低于阈值，直接进人才库。所以投简历之前，把你的JD翻译成技能词列表，一个一个对照检查。

第二关： technical screen（两轮，每轮45-60分钟）

这是很多人最紧张的环节，但也是误解最多的环节。

Amazon的技术面不是考你背算法。L4的technical screen通常考三块：SQL查询、数据分析/统计推断、机器学习基础。每块大概15分钟，难度相当于medium-hard LeetCode+一道开放性分析题。

SQL那一轮不是让你写一个复杂的window function，而是让你从一张订单表里算出“每个用户第一次购买和第二次购买之间间隔天数的中位数”。听起来简单？但面试官会随着你的解答不断加条件——“如果用户只买了一次呢？”“如果我们排除促销订单呢？”这一轮考的不是你会不会写SQL，是你有没有考虑边界条件的习惯。Amazon的数据科学家每天面对的是脏数据，你能不能在写query的时候脑子里同时跑着“这里可能有null”、“这个join可能产生笛卡尔积”这些念头，比你最终写出的code是不是elegant重要得多。

统计推断那一轮会给你一个业务场景，让你设计实验或者分析结果。一个经典问题是：“Amazon想要测试一个新的推荐算法，之前的转化率是5%，你预计新算法能提升到5.5%，要多少样本量才能在95%置信度下检测到这个差异？”这不是背公式就能答对的——你得解释为什么用two-sided test而不是one-sided，为什么power设成80%，以及如果业务方说“我们只能跑两周，最多10万用户”，你应该怎么调整预期。

机器学习那一轮不考你手写backpropagation或者推导SVM对偶问题。Amazon喜欢问的是：“你做的模型里最重要的feature是什么？如果让你去掉它，模型表现会降多少？你怎么验证这个重要性？”或者“你的模型在test set上accuracy是85%，业务方说他们想要95%，你会怎么办？”第二个问题的陷阱在于：候选人通常立刻开始讲ensemble、feature engineering，但正确的思路是先问清楚“85%的错误里，哪些是false positive哪些是false negative，业务方真正在意的是哪个类型的错误”——这才是Amazon想要的答案：先理解问题，再动手。

两轮technical screen都通过之后，recruiter会安排onsite。

第三关： onsite面试（4-5轮，每轮45分钟）

Amazon的onsite流程不是标准化的，不同团队、不同级别会有差异。但L4 Data Scientist的典型配置是：

Loop 1: Leadership Principles + Technical Deep Dive（60分钟）

这一轮由Hiring Manager亲自面。前面30分钟behavioral，HM会围绕你的简历问4-5个Leadership Principles问题，用的是STAR format追问法。你说“我带领团队完成了一个项目”，HM会追问“你做这个决定的时候，其他团队成员有不同意见吗？你是怎么协调的？”“如果让你重新做一次，你会改变什么？”这就是Amazon版本的“你的弱点是什么”——他们不问那个蠢问题，但他们用追问来达到同样的目的。

后面30分钟是技术深度挖掘，通常会让你讲解一个你做过的最复杂的项目，从问题定义讲到你怎么建模、怎么验证、怎么产品化。HM会不断challenge你的假设——“你确定这个feature和用户行为真的有因果关系吗？”“你的validation set和test set分布一致吗？”这一轮不是要难倒你，而是要看看你在被质疑时的反应：你是会防御性地解释，还是会openly承认“当时确实没考虑到这个”？

Loop 2: Technical + Problem Solving（45分钟）

这一轮通常是Senior DS或者Tech Lead来面。开场会有一道45分钟的coding/analysis问题，典型形式是给你一个数据集（可能是Amazon真实业务场景的简化版），让你现场做分析、提出假设、设计实验。面试官不会告诉你“你应该用什么方法”，他们会看你会不会问问题——“这个数据集的时间跨度是多久？”“用户ID是唯一的吗？”“我们关注的是短期指标还是长期指标？”

这一轮的关键不是你的分析有多sophisticated，而是你展示的思考过程。正确的做法是：先问业务背景，再做探索性数据分析（EDA），再提出假设，再设计验证方法，最后给出recommendation。Amazon不要那种一上来就套模型的候选人，他们要的是会问“为什么要解决这个问题”的人。

Loop 3: Leadership Principles Deep Dive（45分钟）

这一轮全是behavioral，由两位面试官共同完成。他们会问你6-8个Leadership Principles问题，覆盖创新、决策、协作、传递等不同维度。每个问题追问到2-3层STAR。

一个典型问题：“告诉我一个你发现了一个被其他人忽略的问题的经历。”你说“在之前的公司，我发现我们的日志系统有一个数据丢失的bug，导致我们低估了某功能的使用率”。面试官会追问：“你是怎么发现的？别人为什么没发现？你发现之后做了什么？你是怎么说服团队去修复这个问题的？修复之后的impact是什么？”

这一轮的淘汰率最高，因为技术可以通过训练提高，但behavioral的真实性很难假装。Amazon的面试官接受过识别“canned answer”的训练——那种听起来排练过的、完美无缺的story反而会引起怀疑。真正加分的答案是你在叙述中自然带出的犹豫、自我怀疑、后来的反思。

Loop 4: Bar Raiser（45分钟）

Bar Raiser是Amazon特有的角色——一个经过专门训练的面试官，他的唯一职责是确保candidate meets the bar，不是为了团队招人，而是为了公司整体人才标准。这一轮通常是Senior Level的人来担任，可能是其他团队的LM。

Bar Raiser问的问题不一定更难，但一定更抽象。“告诉我一个你必须在信息不完整的情况下做决策的经历”“你如何定义工作中的‘好’？”“如果你和你的manager对一个问题有不同看法，你会怎么处理？”这些问题没有标准答案，Bar Raiser在评估的是你的思考深度和价值观是否和Amazon契合。

Loop 5: Presentation（可选，45分钟）

有些团队会让候选人做一个15分钟的presentation，介绍你过去做的一个项目，然后15分钟Q&A。这一轮不是所有岗位都有，但如果有了，通常是最后一轮或者倒数第二轮。

第四关： hiring committee decision

Onsite结束之后，你的所有面试反馈会汇总到一个 Hiring Committee。HC不是由面试你的那些人组成的——通常是3-4位没见过的senior leader，他们会读每一位面试官的书面反馈，然后做go/no-go的决定。

这里有一个 insider 场景：HC开会的时候，每个面试官会先简要陈述自己的评估，然后列出“concerns”。如果有任何一位面试官写了“strong no”，即使其他人都写了“strong yes”，这个case大概率会进入“讨论”而不是直接通过。HC的讨论通常围绕concerns展开——如果concerns可以被其他面试官的positive feedback抵消，candidate才能拿到offer。

一个常见的被拒场景是：技术面全通过，但Leadership Principles面有一位面试官写了“candidate展示了技术能力，但在描述团队协作时回避了冲突细节，无法判断其在复杂协作环境中的表现”。这种模糊的concern反而比明确的“技术不行”更致命，因为它意味着“无法判断”，而HC不喜欢无法判断。

> 📖 延伸阅读：Amazon TPM系统设计面试准备攻略

准备清单

把简历翻译成Leadership Principles语言

你的每一段项目经历都应该能对应到至少一条Leadership Principles。“我独立完成了X”对应的是“Ownership”；“我在资源有限的情况下找到了creative solution”对应的是“Think Big”或者“Invent and Simplify”。不是让你改简历内容，而是在面试中讲述项目时，主动把故事框架往LP上靠。

准备20个STAR故事，覆盖所有14条LP

你不需要每个LP准备20个，但至少准备15-20个故事，确保每个故事能灵活复用到不同问题。一个故事应该能回答“你遇到的最大挑战是什么”、“你是怎么带领团队度过难关的”、“你有什么遗憾的决定”这几个不同的问题，只是开头的frame不同。

SQL和数据分析要练到“自动化”程度

不只是会做LeetCode medium，而是要能在15分钟内写出一个正确的、考虑了edge case的query。推荐练习：LeetCode database category刷完medium，StrataScratch的Amazon真题做一遍。重点不是解法，是速度——technical screen只有45分钟，你要用20分钟解决SQL才有足够时间应对追问。

统计推断和实验设计要能现场推导

不用背公式，但要理解背后的逻辑。sample size calculation、p-value、confidence interval、type I/II error这些概念要能用自己的话解释，并且能应用到具体场景。推荐复习：AB testing design、causal inference basics、常见statistical pitfalls（如simpson's paradox）。

Machine Learning要能讲清楚trade-off

不用背paper，但要能回答“你为什么选这个模型而不是那个模型”、“你这个模型的limitation是什么”、“如果数据量增加10倍你会改什么”。这些问题的答案不在教科书里，在你对项目的反思里。

mock interview至少做3次

找有Amazon DS经验的人做mock，或者用Pramp、Exponent这些平台。mock的重点不是让你练习答案，而是让你习惯被追问、被打断、被challenge的感觉。真实面试里，面试官说“你确定吗”的时候不是在质疑你，是在测试你的defensive reaction。

了解你申请的团队的业务

Amazon的数据科学家分布在AWS、Retail、Advertising、Kindle等不同业务线。面试前花30分钟了解你申请的团队做什么产品、主要的数据挑战是什么、他们最近在招人说明团队在扩张还是补位。面试官如果发现你对他们团队的business有基本了解，印象分会加很多。

准备问面试官的问题

每一轮结束前面试官会问你“你有什么问题问我”。不要问“工作生活平衡怎么样”这种网上一搜就有答案的问题。好的问题是：“你们团队目前最大的数据挑战是什么？”“这个岗位日常会用到哪些工具和语言？”“团队最近在做的项目里，你最excited的是哪个？”这些问题展示的是你对业务的genuine interest。

系统性拆解面试结构

PM面试手册里有完整的[数据科学家面试实战复盘]可以参考，里面有真实的面试录音转写和反馈分析，能帮助你理解面试官的评估维度。

常见错误

错误一：把技术面当成算法考试来准备

BAD版本：候选人把LeetCode刷了三遍，Hard题做了50道，面试官问“你知道Transformer的attention mechanism吗”立刻开始背公式，结果面试官只是想问“你有没有处理过序列数据”。

GOOD版本：候选人准备了三个项目故事，每个故事都能从业务问题讲起，讲到数据处理、讲到建模选择、讲到产品化、讲到business impact。技术问题答对了加分，答错了也能通过解释思考过程拿到partial credit。面试官最后给的反馈是“虽然有些技术细节不完美，但他展示的problem solving approach是我们想要的”。

一个真实场景：某位候选人在technical screen被问到“你怎么处理imbalanced dataset”，他直接说“用SMOTE”。面试官追问“为什么SMOTE比random undersampling好？”他说不出来。如果他换一个说法：“我会先看imbalance的程度，如果只是轻微不平衡（比如1:10），我可能直接用class weight；如果严重不平衡（比如1:100），我会考虑resampling或者改用precision/recall而不是accuracy作为metric”——这展示的不是你知道多少technique，是你理解不同方法的适用场景。

错误二：behavioral问题准备得太完美

BAD版本：候选人准备了5个完美无缺的STAR故事，每个故事都有清晰的Situation、Task、Action、Result，Result还有具体的数字。面试官问“你遇到过最大的失败是什么”，候选人讲了一个“项目延期但我从中学到了很多”的故事，叙事流畅、反思深刻、结尾升华。

面试官的反应：皱眉，在feedback里写“故事听起来像准备过的，无法判断真实性”。

GOOD版本：候选人准备了15个故事，但不是每个都完美。有些故事讲到自己当时的错误判断，有些故事的结果是“项目失败了，我们后来分析是因为X”。被问到“最大的失败”时，候选人讲了一个真实的故事，中间有犹豫、有当时的自我怀疑，最后说“我现在还在想当时有没有更好的做法”。

Amazon的LP评估标准里有一条隐含的维度叫“intellectual humility”——你能不能承认自己不知道、不能、错了。那些故事听起来太完美的人会被判定为“可能没遇到过真正的挑战”或者“在掩盖什么”。

错误三：忽视business impact的重要性

BAD版本：候选人讲了一个建模项目，用了复杂的模型，accuracy提升了5个点，面试官问“然后呢”，候选人愣住了。

GOOD版本：候选人讲了一个项目，背景是“我们的推荐系统在用户首次访问时的转化率很低，我们做了X分析发现原因是冷启动问题，然后用Y方法解决了，部署后首访转化率提升了2%，相当于Q3增加了Z百万美元的收入”。面试官追问“如果让你重新做一次，你会改变什么”，候选人说我会早点和product团队对齐metric定义——因为当时我们用accuracy但业务方真正在意的是coverage。

Amazon的数据科学家不是学术研究员，你的模型再elegant，如果不能translate to business impact，就没用。面试官不是在考你能不能发paper，是在考你能不能让数字变成钱。

一个insider场景：HC讨论时，一位面试官说“candidate的技术能力没问题，但他描述项目的语言里全是模型、accuracy、loss function这些东西，没有提任何business language”。另一位面试官同意：“他说他提升了model performance 10%，但没说这10%对应的是什么业务指标。”最后这个candidate被拒了，理由是“无法判断candidate是否有business sense”。

> 📖 延伸阅读：Amazon项目经理面试真题与攻略2026

FAQ

Q1: Amazon的数据科学家和别的公司（比如Google、Meta）有什么区别？

不是岗位title的区别，是工作方式的区别。Amazon的文化是“you build it, you run it”——你做的模型你要负责上线、监控、维护。Google的数据科学家可能更多做的是analysis和insight，product team去落地；Meta的数据科学家和product team紧密合作，但实验环境相对标准化。Amazon的特点是业务线极其多元，从电商到云服务到内容推荐，每个业务线的数据基础设施成熟度不一样，你可能需要自己搭pipeline、自己定义metric、自己和engineer协商productionization。

准备面试的时候，Google候选人要重点准备system design和large-scale data processing，Meta候选人要重点准备product sense和experimentation，Amazon候选人要重点准备end-to-end的项目经验——从问题定义到模型上线到impact measurement的完整故事。如果你没有完整的end-to-end经验，面试前要想清楚怎么描述你参与过的项目里接近这个纬度的部分。

Q2: 如果我没有机器学习PhD，是不是竞争力很差？

不是。Amazon的数据科学家岗位里，需要PhD的是少数（通常是L5+或者某些research-heavy的团队）。L4的岗位更看重的是你能不能解决问题，而不是你用什么方法解决。一个硕士毕业生，如果能清晰讲清楚自己用logistic regression解决了一个实际业务问题，比一个PhD但讲不清楚自己deep learning研究的应用价值的人，竞争力高得多。

具体来说：如果你是硕士或者本科背景，重点准备的是SQL、AB testing、基础ML、business sense这四个板块。LeetCode刷到medium足够。Behavioral preparation要更充分——因为你没有paper或者thesis可以聊，你要用项目经验来展示你的thinking depth。

Q3: Amazon的薪资大概是什么范围？如果被压价怎么应对？

L4 Data Scientist在Seattle或者Austin的package通常是：Base $130K-$160K，RSU（四年）$40K-$80K，Bonus（10-15%）$15K-$25K，第一年total大概 $190K-$265K。SF/Bay Area的location adjustment会让base高20-30K。L5的话base $160K-$200K，RSU $80K-$150K，bonus 15-20%，第一年total $260K-$380K。

关于压价：Amazon的comp team有明确的band，如果你在面试中展示了strong performance（尤其是bar raiser给了strong yes），你是有议价空间的。一个真实的谈判场景：candidate拿到了另一个大厂的offer，package是$230K，Amazon initial offer是$210K。Candidate的recruiter说“我们不能match”，但candidate提供了另一个厂的书面offer之后，Amazon最终提到了$235K。关键不是“你能不能”，而是你有没有alternative。Amazon不喜欢candidate“只拿了我们一家offer”的情况，因为这意味着候选人没有market signal。所以如果你有多个offer，或者哪怕只是一个strong interest，可以用来做leverage。

还有一点：RSU的vesting schedule是可以谈的。标准是四年 vesting，第一年25%，后三年每半年12.5%。如果你有sign-on bonus的竞争offer，可以尝试让Amazon把sign-on转成RSU front-loading（比如第一年多给一些）。这些细节谈不谈得成取决于你的competing offer有多strong，但至少要知道这些是可以聊的。

Q4: 面试中如果遇到不会的问题，应该怎么办？

不是A（立刻说自己不会然后道歉），而是B（展示你的思考过程）。一个具体的对话场景：面试官问“你知道怎么计算KL divergence吗？”如果你真的不知道，正确答案是：“我不太确定KL divergence的完整公式，但我知道它的用途是衡量两个分布之间的差异，通常在information theory和modeling里用来做distribution matching。如果需要精确计算，我可以推导或者查文档。”然后你可以主动说“你能给我一点提示吗”或者“我们能不能先假设我知道基本定义，继续往下走”——这展示的是你不会因为一个知识点不会就卡住，你有能力在部分信息下继续推进。

Amazon的technical interview不是高考，没有“不得分”的惩罚。你不会一道题不会死，但你不展示思考过程会死。

Q5: Leadership Principles到底怎么准备才不会被当成背诵？

不是A（背14条原则的定义和例子），而是B（把原则内化成你说话的方式）。一个测试方法：让你的朋友听你讲项目故事，不提示任何LP，看他们能不能自己说出来“这个人很有ownership”、“这个人会invent and simplify”。如果需要你主动说“我这个体现了LP的X”，说明你的storytelling还不够自然。

准备的时候不要对着14条原则一条一条凑故事。正确的做法是：先想清楚你真正做过的有挑战的项目，然后事后分析这些项目里你展现了什么品质——这些品质大概率自然对应某几条LP。面试的时候用正常的语言讲你的故事，LP会在你的语言里自然浮现，不需要你刻意标注。

准备好系统化备战PM面试了吗？

获取完整面试准备系统 →

也可在 Gumroad 获取完整手册。