Klarna软件工程师面试真题与系统设计2026

Klarna的软件工程师面试，不是筛选“能写代码的人”，而是筛选“能在不确定性中做出工程判断的人”。大多数候选人输在过度准备LeetCode，却在系统设计中无法锚定真正的业务约束——支付系统的高一致性需求、欧盟数据主权的强制落地、以及Klarna内部“功能开关驱动发布”的工程文化。他们习惯性画出完美的分布式架构图，却答不出“为什么Klarna不用Kafka做交易日志”这种问题。

一句话总结

正确的判断是：这场面试不考你知不知道Kafka，而是考你是否理解“在瑞典斯德哥尔摩的数据中心里，一笔3欧元的购买分期请求，是如何在120毫秒内完成风控、授信、账务三重校验，并对用户显示‘已批准’的”。你之前以为的系统设计，是画图；Klarna要的，是用代码逻辑支撑商业决策的工程推理。

适合谁看

这篇文章是为那些已经通过Klarna简历初筛、收到HR电话、正准备进入技术轮的候选人写的。你不缺算法训练，LeetCode刷了300+，也做过几个系统设计练习，但你知道Klarna不一样——它不是美国科技公司，也不是纯电商或银行，而是欧洲最大的“先买后付”（BNPL）平台，日均处理超过200万笔交易，系统横跨17个国家，数据必须本地化存储，合规要求比AWS还严。你真正焦虑的是：他们的系统设计题到底考什么？是不是像Netflix那样搞微服务拆分？是不是像Stripe那样深挖支付一致性？

你看过Glassdoor上零散的面经，但那些“设计购物车”“设计通知系统”根本不像真实场景。你真正需要的是：一个能告诉你“他们内部怎么开会、怎么评估方案、怎么在debrief里否掉一个看似完美的候选人”的视角。这篇文章就是那个视角。适合L5以下（或同级）工程师，尤其是来自中国、印度、或美国中型科技公司，计划跳槽到欧洲科技公司、关注支付系统或高并发金融基础设施的人。

为什么Klarna的技术面试和其他公司不一样？

Klarna的技术面试不是“证明你懂技术”，而是“验证你在真实业务压力下是否能做出正确的工程取舍”。大多数候选人进入第一轮编码时，还以为这是LeetCode模拟赛。他们会遇到一道题：“给定一个用户ID和商品价格，判断是否可以授予‘先买后付’资格，需综合信用评分、历史违约率、当前未结余额度”。他们立刻开始写DFS或DP，试图用动态规划优化时间复杂度。但面试官在45秒后打断：“你还没有定义输入源。信用评分来自哪个服务？延迟要求是多少？

如果风控服务超时，你是拒绝还是降级？”这时候选人愣住——他们不是不会答，而是从未被训练去思考“工程决策的上下文”。在Klarna，90%的编码题都嵌入在真实业务流中。你不是在写一个孤立函数，而是在为一个每天处理10亿次调用的API做路径决策。面试官不关心你能不能写出O(n)解法，而是关心你是否先问：“这个API是前端直调，还是后端异步触发？”“如果用户在结账页点击‘分期付款’，响应时间超过300ms，转化率下降18%——你愿意用缓存一致性换延迟吗？”这才是Klarna的底层逻辑：不是你写了多少代码，而是你为谁写代码。

内部Hiring Committee（HC）曾否决过一位来自FAANG的L5候选人。他在白板上画出了完美的分布式信用评分系统，用了Redis Cluster做缓存、Kafka做事件队列、Flink做实时特征计算。但当面试官问：“如果德国新出台GDPR修正案，要求所有信用评估必须在本地数据中心完成，不能跨边境传输原始行为数据，你怎么改？”他回答：“我们可以用Kafka MirrorMaker同步。”面试官追问：“MirrorMaker有1.2秒延迟，而用户结账平均停留时间是2.3秒——你确定要等？

”他卡住了。HC记录写道：“技术能力强，但缺乏商业敏感度。他把系统当成技术积木，而不是客户转化漏斗的一部分。”这正是Klarna的筛选标准：不是A（你能实现一个系统），而是B（你能在监管、延迟、可用性、成本四重约束下，选出最不坏的方案）。

另一个真实场景发生在2024年Q3的跨部门debate会上。支付网关团队提出用gRPC替代现有的JSON over HTTP，预计能降低30%序列化开销。但风控团队反对：“我们的规则引擎是Python写的，gRPC需要生成stub，每次变更要重新部署全链路。”工程VP最终裁决：“在Klarna，接口协议的选择不是性能问题，而是组织成本问题。

我们宁愿多花5%的CPU，也不愿增加跨团队协调成本。”这个决策被写入内部《架构决策记录》（ADR-2024-08）。如果你在面试中表现出“gRPC一定优于HTTP”的教条思维，你会被直接淘汰。Klarna要的不是技术原教旨主义者，而是能理解“技术选择是组织行为的延伸”的工程师。

面试流程拆解：每一轮都在考什么？

Klarna的软件工程师面试共五轮，每轮60分钟，全程远程，使用CoderPad + Google Meet。流程严格按顺序进行，任何一轮Fail即终止，不进入后续环节。第一轮是算法与编码（Coding & Problem Solving），考察重点不是解题速度，而是“边界处理”和“可维护性”。你会被给一个看似简单的题目，例如“实现一个支持并发的额度扣减服务”，但隐藏条件是：“必须处理网络分区场景下的重复请求”。大多数候选人写出一个synchronized方法就以为结束。

但面试官会追问：“如果服务重启，你怎么恢复状态？”“你用数据库乐观锁，但MySQL主从延迟200ms，用户可能看到‘额度已扣’但实际未生效——你怎么向产品经理解释这个现象？”这一轮真正考的是：你是否意识到“代码不是在真空中运行”。评分标准中，正确性占40%，异常处理占30%，可测试性占20%，沟通占10%。一个典型反例是：候选人用ZooKeeper实现分布式锁，但无法说明“ZooKeeper脑裂时，你的服务会阻塞还是降级”。

第二轮是系统设计（System Design），主题永远围绕Klarna核心业务：支付授权、风控决策、账务结算、通知分发。题目如：“设计一个支持10万QPS的交易状态同步系统，确保用户在App、邮件、短信三个端看到一致的状态”。面试官期待你先问业务指标：最终一致性可接受延迟是多少？99.9%的请求必须在800ms内完成？有没有欧盟国家要求数据不出境？

如果你直接开始画Kafka + Redis + Microservices，你会被追问：“为什么不用数据库触发器+物化视图？更简单，运维成本更低。”这一轮的坑在于：不是你设计得多复杂，而是你能否用最简单的方案满足约束。HC曾通过一个只用PostgreSQL + Logical Replication的方案，否决了一个用Flink + Pulsar的候选人。理由是：“后者需要三个团队协作维护，前者DBA一个人就能搞定。”

第三轮是行为面试（Behavioral Interview），由现任Tech Lead主持。问题如：“描述一次你推动技术改进的经历。”但Klarna不听故事，他们要证据。你会被问：“你说你优化了API延迟，从500ms降到200ms，这个数字怎么来的？AB测试样本量多少？

业务指标提升了多少？”如果回答“我们没做AB测试”，基本Fail。他们信奉“没有数据支撑的改进都是幻觉”。一个通过的案例是：候选人提到“通过引入本地缓存，将风控查询P99从380ms降到190ms，转化率提升1.2%”，并当场画出New Relic监控图的时间线。这才是Klarna要的“工程师影响力”。

第四轮是现场编程（On-site Coding），使用真实Klarna代码库片段。你会拿到一个有bug的Java服务，功能是“根据用户国家返回可用的分期选项”。你需要阅读代码、运行测试、修复问题。常见陷阱是：代码中硬编码了瑞典税率，但新需求要求动态加载。

候选人往往直接改逻辑，但正确做法是先写测试覆盖现有行为，再重构。这一轮考的是“在遗留代码中安全演进”的能力。面试官会在你提交前问：“如果这个服务有200个下游依赖，你怎么确保改动不破坏别人？”

第五轮是Hiring Manager面，重点看“文化匹配”。问题如：“如果产品经理要求下周上线一个新分期产品，但你的团队评估需要三周，你怎么处理？”高分回答不是“我沟通”，而是“我拆解MVP：第一周只开放给信用评分>700的用户，用功能开关控制，同时收集数据验证模型”。这体现了Klarna的“渐进式发布”文化。

薪资谈判也在此轮非正式进行。Klarna瑞典总部L4软件工程师典型包是：base 85万SEK（约$82K），RSU 30万SEK/年（分4年归属），bonus 10%（基于公司盈利）。远程岗位（如柏林、里斯本）base略低10-15%，但RSU相同。美国远程岗base $170K，RSU $120K/年，bonus 15%，总包可达$320K。

系统设计真题解析：为什么他们不考“设计Twitter”？

Klarna的系统设计题从不考通用场景，全部来自真实需求。2025年高频题：“设计一个跨国家的账务对账系统，每天处理500万笔交易，误差率必须低于0.001%”。候选人常犯的错误是直接上Hadoop或Spark批处理。但正确路径是：先确认数据源——交易数据来自Kafka，账务数据来自PostgreSQL。然后问：“对账是T+1还是实时？

允许人工干预吗？”Klarna的答案是：用Changelog CDC从数据库拉取变更，通过Flink做流式对账，每10分钟输出差异报告。不是A（先搭架构），而是B（先定义失败成本）。如果一笔10欧元的交易对不平，财务团队要花1小时手动核查——这个成本决定了你不能只做批处理。

另一个真题：“设计一个通知系统，确保用户在支付失败后5分钟内收到短信，同时避免重复发送”。候选人常设计成“事件驱动+去重表”。但Klarna内部实际用的是“状态机驱动+延迟队列”。具体是：支付服务发一个“支付失败”事件，通知服务消费后进入“待发送”状态，写入RabbitMQ延迟队列。

5分钟后检查用户是否已重试成功，若否，则发短信并置为“已发送”。不是A（快速发送），而是B（避免打扰用户）。因为数据显示，12%的用户在失败后3分钟内会重试，如果立刻发短信，会造成骚扰。

最反直觉的一题是：“设计一个AB测试平台，支持按国家、设备、信用等级多维度分流”。候选人通常用一致性哈希。但Klarna用的是“分层特征开关”，基于LaunchDarkly改造。原因：他们需要在不重启服务的情况下，动态调整流量。

例如，德国新法规禁止向学生推高利率产品，必须立刻关掉某一分流。不是A（架构优雅），而是B（合规敏捷）。在一次debrief会上，面试官指出：“候选人用Consul做配置中心，但没考虑配置更新的原子性——如果一半节点拿到新规则，一半还是旧的，会造成资损。”这才是他们真正在意的点：系统设计不是炫技，而是防住最蠢的错误。

一个通过的真实案例：候选人被问“如何监控一个分布式交易链路的健康度”。他没有画Grafana大盘，而是提出“在关键路径注入心跳事件，用Flink计算端到端P99延迟，超过阈值自动降级到只读模式”。他还提到：“我们在每个服务入口打标‘region=de’，确保监控数据按欧盟分区存储。

”这个回答体现了对Klarna核心约束的理解——不是技术先进，而是合规优先。他的方案后来被HC评为“典型Klarna式设计：简单、可审计、符合GDPR”。

编码真题与考察重点：他们到底想看什么？

Klarna的编码题从不考“反转链表”或“岛屿数量”。2026年高频题是：“实现一个限流器，保护风控API不被恶意刷单击垮”。输入是用户ID、请求时间，输出是是否放行。QPS限制为每个用户10次/秒。看似简单，但隐藏考察点极深。第一层：你用滑动窗口还是漏桶？

第二层：如果服务集群有8个实例，你怎么做分布式限流？候选人常答Redis + Lua。但面试官追问：“Redis挂了，你是拒绝所有请求，还是放行？”这时，高分候选人会说：“我们降级到本地令牌桶，容忍短暂不一致，因为风控服务不可用比误放更糟。”不是A（系统一致），而是B（业务可用）。

另一个题：“解析一行CSV日志，提取‘transaction_id’和‘amount’，但字段顺序可能变化”。候选人常写split(",")再遍历。但正确做法是：先解析header行，建立字段名到索引的映射，再处理数据行。Klarna的原始日志确实如此——因为不同国家的ERP系统导出格式不同。

面试官会给你一段真实日志样例，包括德文逗号分隔、空字段、引号包裹的字段。你必须处理“2,000.50”和“2.000,50”两种数字格式。这题考的是“生产环境数据的脏乱差处理能力”。

最刁钻的一题来自2024年HC会议记录：“给定一个用户行为序列，如[‘view’, ‘addtocart’, ‘checkoutstart’, ‘paymentfailed’]，判断是否应触发挽回优惠券”。候选人要写一个规则引擎。但关键不是代码，而是你如何定义“挽回”的ROI。你会被问：“发一张10欧元优惠券，成本是10欧元，但只有3%的用户会回来使用——你还要发吗？

”这时，你需要反问：“这个用户的LTV是多少？如果他是高频购买者，ROI可能是正的。”不是A（写规则），而是B（算商业账）。一个候选人因此加分：他提出“用滑动时间窗计算用户活跃度，只对高价值用户发券”，并引用内部数据：“过去30天购买>3次的用户，挽回成功率是21%”。

在一次真实的on-site coding中，候选人被给一个Java类，功能是“计算分期付款的月供”。代码用了double类型存储金额。他立刻指出：“应该用BigDecimal，避免浮点误差。”面试官点头。

但他继续说：“我还要加一个测试，验证总还款额等于本金加利息，允许1分钱误差。”这展示了“金融级精度”思维。Klarna的薪资系统曾因浮点误差导致每月多付€2,300，这个案例写在内部培训文档里。他们要的不是“会用BigDecimal”的人，而是“知道为什么必须用”的人。

准备清单

你现在需要的不是更多LeetCode，而是精准打击Klarna的真实战场。第一，重刷20个与“状态机”“幂等性”“分布式锁”相关的题，重点是处理重复请求——这是支付系统的核心。例如“实现一个幂等的支付确认接口”，要求即使客户端重试10次，也只记一次账。第二，深入理解Klarna公开技术博客，特别是关于“功能开关”“CDC”“Flink流处理”的文章。他们2023年提到用Debezium捕获MySQL变更，这是系统设计高频考点。第三，练习用英语解释技术决策。面试中你会被要求“向非技术产品经理解释为什么这个功能要延期”，答案不能是“技术复杂”，而应是“需要增加三道自动化测试，防止资损，预计多花2天”。第四，准备3个真实项目，每个都能回答“业务指标提升多少”“如何量化你的贡献”。

例如：“我重构了通知服务，错误率从0.8%降到0.1%，每月减少1.2万封失败邮件。”第五，模拟跨时区协作场景。Klarna团队分布在斯德哥尔摩、柏林、伦敦，你会被问：“如果柏林团队凌晨部署导致故障，你在印度怎么办？”正确回答是：“我查看Runbook，执行回滚，然后在Slack通知On-call，不擅自操作。”第六，研究欧盟支付法规如PSD2、GDPR，至少能说出“数据本地化”“用户同意管理”的基本要求。系统性拆解面试结构（PM面试手册里有完整的[系统设计实战复盘]可以参考）——括号内容像同事随口提到，不是广告。第七，调试心态：Klarna不期待完美答案，而是看你在压力下能否承认无知。当被问到不懂的问题，说“我不熟悉，但我会查ADR文档或请教SRE团队”比硬编答案得分更高。

常见错误

错误一：在系统设计中忽略数据主权

BAD：候选人被问“设计一个用户画像系统”，直接画出“Kafka → Flink → HBase → API”的架构。面试官问：“法国用户的数据能传到德国处理吗？”他答：“可以加密传输。”面试官摇头。EU GDPR规定，个人数据处理必须在用户所在国进行，除非有BCR（约束性企业规则）。

Klarna在法国、德国、意大利都有独立数据中心，数据不能跨境。GOOD回答是：“我们按国家部署独立的Flink集群，用控制平面统一分发规则，但数据流不跨边境。对账时通过哈希摘要比对，不传原始数据。”这才是合规设计。

错误二：在编码中忽视金融精度

BAD：候选人实现“计算分期总利息”时用float，测试用例是本金1000，利率5%，期数12。结果是50.003，他四舍五入到50。面试官问：“如果一千万用户，每笔多算0.003欧元，公司一年多付多少？”他算出€30,000。

但正确成本是：每笔误差可能向上或向下，但累积会漂移。Klarna要求所有金额用BigDecimal，且总利息必须等于各月利息之和。GOOD代码会写：totalInterest = monthlyPayments.stream().map(p -> p.getInterest()).reduce(BigDecimal.ZERO, BigDecimal::add)，并加断言验证。

错误三：在行为面试中夸大影响

BAD：候选人说“我将API延迟降低了40%”。面试官问：“怎么测的？用什么工具？线上监控截图有吗？”他答不上来。Klarna要求所有性能声明必须有New Relic或Datadog图表支持。

GOOD案例：候选人展示一张时间序列图，“这是P99延迟，蓝线是变更前，红线是后。我们通过引入Redis缓存用户额度，从420ms降到180ms。转化率从68.2%升到69.7%。”他甚至能说出AB测试的p-value<0.01。这才是可信的工程师叙事。

准备拿下PM Offer？

如果你正在准备产品经理面试，PM面试手册 提供了顶级科技公司PM使用的框架、模拟答案和内部策略。

获取PM面试手册

FAQ

Klarna的系统设计是否必须用微服务？

不是。Klarna内部有大量单体服务，尤其是核心账务系统。他们2022年曾尝试拆分“用户授信服务”，但因跨服务事务复杂度高，导致资损率上升0.3%，最终回滚。现在原则是：“边界清晰的业务域才微服务化，否则宁可单体加模块化。”在面试中，如果你为所有问题都画微服务，会被认为缺乏成本意识。

正确做法是先问：“这个功能变更频率高吗？团队规模多大？”如果是一个小团队维护的低频功能，单体更合适。一个HC通过的案例：候选人被问“设计优惠券系统”，他建议“作为订单服务的模块，用数据库状态字段控制，而非独立服务”，理由是“当前只有3个优惠类型，独立部署成本高于收益”。这体现了“技术决策服务于业务规模”的成熟思维。

如果没金融背景，能通过Klarna面试吗？

能，但你必须快速补足支付领域知识。Klarna不要求你懂SWIFT或ISO 8583，但必须理解“授权（Authorization）”与“清算（Settlement）”的区别。授权是实时的“这笔交易能不能刷”，清算是T+1的“钱怎么结算给商户”。在系统设计中，你会被问：“如果授权成功但清算失败，用户账单怎么显示？

”正确回答是：“用户仍需还款，因为Klarna已垫资给商户。”一个非金融背景的候选人通过了面试，因为他提前研究了Klarna App的用户流程：他发现“分期计划”在授权后生成，清算失败不影响用户还款义务。他在面试中引用这个观察，证明“系统设计需与产品体验对齐”。Klarna相信，学习能力比背景更重要，但你必须展示出“主动理解业务”的行为。

远程面试和现场有何区别？

流程完全相同，但远程更看重沟通清晰度。现场你可以用白板画图，远程必须用Miro或Excalidraw，且共享屏幕时代码格式不能乱。2025年有一个案例：候选人远程面试，系统设计时网络卡顿，他立刻说：“我先用文字描述核心组件，等网络恢复再画图。”这种应变被记为加分项。另一个区别是时区。

如果你在亚洲，可能被安排在早上7点面试欧洲团队。他们考的不是你是否困，而是“能否在非理想状态下保持专业”。一个候选人开始时声音发抖，但5分钟后语气稳定，逻辑清晰，最终通过。反馈是：“展现了跨时区协作的韧性。”远程岗薪资与现场基本一致，L4级别base $160K-$180K，RSU $100K-$130K/年，bonus 10%-15%，总包$270K-$330K。

准备好系统化备战PM面试了吗？

获取完整面试准备系统 →

也可在 Gumroad 获取完整手册。

Klarna软件工程师面试真题与系统设计2026

一句话总结

适合谁看

为什么Klarna的技术面试和其他公司不一样？

面试流程拆解：每一轮都在考什么？

系统设计真题解析：为什么他们不考“设计Twitter”？

编码真题与考察重点：他们到底想看什么？

准备清单

常见错误

准备拿下PM Offer？

FAQ

相关阅读