Goldman Sachs数据科学家简历与作品集指南2026

Goldman Sachs的数据科学家招聘不是在找会写代码的统计师，而是在找能用数据讲故事的商业翻译官。你的简历不是技能清单，而是一份证明你能把原始数据转化为交易策略、风险决策或客户洞察的证据。这里的面试官不关心你的TensorFlow版本号，关心的是你在金融场景下如何用数据说服一个怀疑论的trader——而90%的候选人在简历里只会列技术栈，不会讲商业影响。

一句话总结

适合谁看

这篇文章是给那些已经有2-5年量化、风控或金融数据经验，但还在用学术思路写简历的候选人看的。如果你现在的简历里充满"构建了X模型，准确率达到Y%"，而没有"帮交易台避开了$Z million的损失"，那你在Goldman的HR系统里会被自动归类到"技术储备"，而不是"业务贡献者"。Goldman的hiring manager在debrief会议上常说的一句话是："这个孩子会算，但不知道为什么算。" adapt或die。

为什么Goldman的DS简历和别的公司不一样

不是因为Goldman的技术要求更高，而是因为它的业务上下文更残酷。在FAANG，你可能花6个月优化一个推荐算法的AUC从0.85到0.86；在Goldman，你可能需要在2小时内用市场数据验证一个trader的直觉，错误的模型可能意味着当天损失$10M。这里的面试官不是看你的模型多复杂，而是看你的模型多快能变成Money。一个真实的hiring committee对话："Candidate A的模型用了LSTM+Attention，Candidate B用了线性回归，但B能解释为什么系数是这个值，并且告诉trader什么时候应该ignore这个模型。我们要B。"

具体到简历， Goldan的DS简历考察的是：

商业语言优先：不是"Improved model accuracy by 15%"，而是"Reduced false positives in fraud detection, saving $2.3M in manual review costs"
金融场景具体：不是"Worked on NLP projects"，而是"Built sentiment analysis for FX trading desk, correlated with EUR/USD movements with 0.78 Pearson r"
风险意识体现：不是"Deployed model to production"，而是"Implemented circuit breaker that halted model when volatility exceeded 2σ, preventing $800K potential loss"

简历结构：不是技能栈，而是业务叙事

Goldman的HR系统会先用ATS筛选关键词，但真正决定生死的是hiring manager的6秒扫描。他们看的是：

头两行：你的title和company。如果你现在在对冲基金做quant，直接写"Quantitative Researcher"，别写"Data Scientist"——Goldman的hiring manager更信任金融背景。
每个bullet point的动词：用"Spearheaded"而不是"Participated in"，用"Drove"而不是"Helped"。Goldman的文化崇尚ownership。
数字的上下文：不是"处理了1TB数据"，而是"处理了1TB的tick data，覆盖了S&P500成分股的5年历史"

错误版本：

Developed machine learning models for risk assessment
Worked with Python, SQL, and TensorFlow

正确版本：

Built VaR model for equity derivatives desk, reduced capital reserve requirements by $12M (approved by Fed stress tests)
Automated trade surveillance using NLP on chat logs, caught 3 cases of potential front-running in Q2 2023

作品集：不是GitHub链接，而是金融用例

Goldman的数据科学家作品集不是用来证明你会写代码的，而是用来证明你理解金融问题的。一个好的作品集应该包含：

一个end-to-end的金融用例：从数据获取到业务决策的完整故事。比如，"如何用order book data预测流动性枯竭"。
风险管理的视角：即使是做alpha信号的模型，也要解释你如何考虑tail risk。Goldman的hiring manager会特别问："如果你的模型在2008年会怎样？"
可解释性：别指望用"black box"模型打动他们。一个真实的面试对话：

Candidate: "我用XGBoost做了信用风险评分。"
Interviewer: "哪个feature最重要？为什么？"
Candidate: "...不太记得了。"
Interviewer: "Next candidate, please."

具体案例：

BAD：Jupyter notebook里全是代码，没有business context

GOOD：一个5页的PDF，第一页是问题定义（"为什么交易台需要这个模型"），第二页是数据探索（"order book data的特性"），第三页是模型架构（"为什么用random forest而不是deep learning"），第四页是backtest结果（"在2022年3月的极端市场表现"），第五页是production部署方案（"如何和现有风控系统集成"）

面试流程拆解：每一轮的生死关

Goldman Sachs的DS面试流程通常包括5轮，每轮的考察重点和时间如下：

HR筛选 (30分钟)

不是在看你的技术能力，而是在验证你的背景和动机。常见问题：

"为什么要离开现在的公司？"（如果你现在在对冲基金，说"想接触更广泛的金融产品"比"想换环境"好）
"你对Goldman的哪个部门感兴趣？"（如果你不知道Goldman有Asset Management, Consumer Banking, Investment Banking,和Securities，那你已经输了）

一个真实的HR反馈："Candidate said he wants to 'do more impactful work' but couldn't name a single Goldman product. Reject."

技术电话面 (45分钟)

这轮通常由一个senior DS或quant来面。考察的是：

统计基础：贝叶斯vs频率学派的区别，p-value的局限性
编程能力：用Python写一个Monte Carlo simulation，或者用SQL解一个window function的问题
金融知识：什么是VaR？什么是Greeks？什么是basis risk？

常见陷阱：面试官会故意问一个没有唯一正确答案的问题，看你如何结构化思考。比如："你如何设计一个模型来预测下一次金融危机？"

案例分析 (60分钟)

这轮会给你一个真实的商业问题，让你现场分析。比如：

"我们的一个交易员注意到，当某个宏观指标发布时，特定股票的价格会有异常波动。你如何验证这个观察，并设计一个交易策略？"

考察的是：

问题分解能力：你如何把一个模糊的观察分解成可量化的部分
数据思维：你会用什么数据？如何获取？如何清洗？
商业意识：你的解决方案如何产生P&L？

一个真实的案例分析题目：

"Client wants to hedge currency risk for a $50M portfolio. Current approach uses 3-month forwards, but they're expensive. Propose an alternative using options, and explain the trade-offs."

好的回答会包括：

具体的option strategy（比如risk reversal）
成本对比（forward vs option premium）
风险分析（what if volatility spikes?）

深度技术面 (90分钟)

这轮通常由一个team的lead来面，会深入探讨你的项目和技术选择。常见问题：

"你在项目X中用了LSTM，为什么不用更简单的模型？"
"你的模型在production中如何监控？"
"如果数据分布突然改变，你如何处理？"

这里的关键不是要证明你的技术多牛，而是要证明你的技术选择是合理的。一个真实的对话：

Candidate: "我用了deep learning来做时间序列预测。"
Interviewer: "为什么不用ARIMA？"
Candidate: "因为deep learning能捕捉更复杂的模式。"
Interviewer: "但你的数据只有2年的历史，deep learning会overfit。Reject."

合伙人面 (30-45分钟)

这轮通常由MD或partner来面，考察的是：

商业直觉：你如何看待当前的市场环境？什么是最大的风险？
沟通能力：你能否用非技术语言解释一个复杂的概念？
文化匹配：Goldman的文化是high pressure, high reward。你如何应对压力？

薪资结构：base/RSU/bonus的真实数字

Goldman Sachs的DS薪资在硅谷和纽约有所不同，但总体上：

Base Salary: $150K - $220K（取决于级别和经验）
Bonus: $50K - $200K（通常是base的30%-100%，取决于表现和公司业绩）
RSU: $100K - $300K（通常是4年vest，第一年可能只有25%）

总包范围：$300K - $700K

具体例子：

入职1-2年的DS：base $160K, bonus $60K, RSU $120K（总包$340K）
3-5年的senior DS：base $190K, bonus $120K, RSU $250K（总包$560K）
5年以上的lead DS：base $220K, bonus $200K, RSU $300K（总包$720K）

注意：Goldman的bonus和RSU有很大的不确定性，受市场环境和个人表现影响很大。2022年，由于市场低迷，很多team的bonus只有base的20%。

准备清单

重写简历的每个bullet point，确保每个都包含：动作（Drove, Built, Led）+ 方法（what you did）+ 结果（business impact + 数字）
准备3-5个end-to-end的项目故事，每个故事都要能回答：问题是什么？为什么重要？你做了什么？结果如何？学到了什么？

系统性拆解面试结构（PM面试手册里有完整的行为面试实战复盘可以参考）

复习金融基础知识：VaR, Greeks, yield curve, basis risk, option pricing（Black-Scholes, binomial model）
准备案例分析的框架：如何分解问题？如何设计解决方案？如何评估结果？
模拟高压环境下的沟通：练习用1分钟解释一个复杂的技术概念给非技术人员
研究Goldman的最新动态：比如Marcus（消费者银行业务）的发展，或者Asset Management在ESG投资上的布局
准备行为面试的问题：比如"Tell me about a time when you had to convince a stakeholder to change their mind."（用STAR方法）

常见错误

错误1：简历里充满技术细节，没有业务影响

BAD：

Developed a deep learning model for time series forecasting using LSTM
Improved model accuracy from 85% to 90%

GOOD：

Built LSTM model to predict liquidity crunches in corporate bonds, reducing trading slippage by $1.2M/year
Implemented model monitoring that caught 2 data drift events in 2023, preventing $500K potential loss

错误2：作品集里没有金融上下文

BAD：

GitHub链接到一个Kaggle比赛的notebook，没有解释为什么这个项目和金融相关

GOOD：

一个PDF报告，标题是"Predicting S&P500 Volatility Using VIX Futures"，包含：

问题定义：为什么预测波动率重要？
数据来源：VIX期货和S&P500历史数据
方法：用random forest预测VIX，并回测在S&P500上的表现
结果：模型在2020年3月的极端市场表现如何
业务应用：如何用这个模型做交易策略

错误3：面试时无法解释技术选择

BAD：

Candidate: "我用了XGBoost因为它准确率高。"

Interviewer: "但你的数据只有1000个样本，XGBoost会overfit。你考虑过logistic regression吗？"

Candidate: "...没有。"

GOOD：

Candidate: "我试了logistic regression和XGBoost。Logistic regression的AUC是0.82，XGBoost是0.85。但XGBoost的overfitting风险更高，所以我用了regularization，并且通过cross-validation验证了模型的稳定性。最终选择XGBoost是因为它在tail events上的表现更好，这是我们business最关心的。"

FAQ

Q1: 我没有金融背景，如何申请Goldman的DS岗位？

结论：可能，但难度很大。Goldman偏好有金融背景的候选人，尤其是在quant、风控或交易相关的岗位上。如果你没有金融背景，需要在简历和面试中特别强调你的学习能力和对金融的兴趣。具体建议：

自学金融基础：Coursera上的"Financial Markets"（Yale），或者读《A Random Walk Down Wall Street》
在作品集中包含金融相关的项目：比如用公开数据分析股票价格，或者建一个简单的portfolio optimization模型
在面试中展示你的金融好奇心：比如"我最近在读关于Fed利率政策的文章，我想理解它如何影响市场..."

Q2: Goldman的DS面试会问哪些编程问题？

结论：不会问Leetcode硬题，但会问实用的编程和统计问题。常见类型：

数据处理：用Pandas处理一个dirty dataset（比如处理missing values, outliers）
统计问题：解释p-value, confidence interval, Bayes' theorem
算法问题：实现一个简单的机器学习算法（比如linear regression from scratch）
SQL：写一个复杂的query，比如用window function计算rolling average

具体例子：

"给你一个DataFrame，包含股票价格和交易量，如何计算每10分钟的VWAP（Volume Weighted Average Price）？"
"如何检测一个时间序列中的anomalies？"

Q3: 如何在面试中展示"商业影响"？

结论：用数字+上下文+决策。Goldman的hiring manager想听的是：你的工作如何直接或间接地影响了P&L、风险或客户体验。具体方法：

量化结果：不是"提高了效率"，而是"减少了$2M的手动审核成本"
解释上下文：不是"建了一个模型"，而是"为FX交易台建了一个情绪分析模型，帮助他们预测EUR/USD的短期波动"
联系决策：不是"模型准确率高"，而是"模型的预测被交易员用来调整headings，避开了一个潜在的损失"

具体例子：

BAD: "我优化了一个风险模型。"

GOOD: "我重新校准了VaR模型，使其更准确地反映tail risk。在2023年3月的银行危机中，这个模型帮助交易台避免了$5M的潜在损失，因为它提前触发了circuit breaker。"

准备好系统化备战PM面试了吗？

获取完整面试准备系统 →

也可在 Gumroad 获取完整手册。