Klarnaのカスタマーサポートは、年間$40M(約60億円)分のCSコストを削減しました。従業員数百人分の工数に相当します。やったことは特別ではありません。問い合わせを「AIが解決できるもの」と「人間でないと対処できないもの」に分けて、前者を自動化しただけです。
この記事では、そのKlarna型の設計——問い合わせの60〜70%をAIで完結処理しながら、感情的・複雑なケースは人間が引き受けるハイブリッドCS——を自社に実装する5ステップを解説します。SaaS・EC・フィンテックを問わず、月300件以上の問い合わせがあれば再現できる構造です。
関連ケーススタディ「KlarnaがAIで年間$40M相当のコスト削減を達成した構造——顧客問い合わせの67%を自動化しながら品質を守る「AI+人間ハイブリッドCS」設計」もあわせて確認すると、設計判断の背景をより深く理解できます。
なぜ「全自動」でも「全人力」でもないのか
CSの問い合わせをよく見ると、内容の7割前後が繰り返しパターンです。「注文状況を教えてほしい」「パスワードをリセットしたい」「返金はいつ来るか」——定型化できる情報があればAIが完全に処理できます。人間のエージェントが介在する必要はありません。
問題は残り3割にあります。怒りや不満を持つ顧客、複数の問題が絡み合った案件、過去の対応に不信感があるケース。ここにAIを当てると状況が悪化します。「定型の返答が返ってきた」と感じた顧客は、不満を引っ込めるどころかさらに炎上させます。
Klarnaが設計したのは、この二種類を最初から分けて振り分ける仕組みです。コストと品質を同時に追うための、現実的な落とし所がハイブリッドCSです。
実装前に揃えておくもの
前提条件が3つあります。まず、過去の問い合わせデータ。最低500〜1000件の実際のチケット(内容・解決方法・解決時間)が必要です。このデータなしには分類ルールを設計できません。まだ溜まっていない場合は、最初の1〜2ヶ月は人間対応でデータを蓄積することを優先してください。
次にチケット管理ツール。ZendeskかIntercomかFreshdeskが動いていれば理想的です。これらがなくても実装は可能ですが、エスカレーションのルーティングが手作業になり、スケールしません。
最後に、CS担当者への事前説明。「AIが仕事を奪う」という懸念は必ず出ます。「複雑ケースとエスカレーション対応は人間の担当領域」という役割の再定義を、実装前に伝えておくことが、プロジェクト失敗の最大のリスクを回避することになります。
Klarna型ハイブリッドCSを実装する5ステップ
準備が整ったら実装に入ります。
ステップ1:問い合わせの分類タグ設計と自動化可否の仕分け(1〜2週間)
まず過去チケット500件を手動でタグ付けします。「配送確認」「返金依頼」「ログイン問題」「契約変更」など、20〜30種類のカテゴリを作ります。次に各カテゴリについて「AIが完結できるか、人間が必要か」を判断します。
判断基準はシンプルです。「定型の情報提供で解決するか?」がYesならAI対象。感情・例外・個別判断が絡むならNG。このステップを省いて実装に進むと、AIが怒った顧客にマニュアル通りの返答を送り続けて信頼を損ないます。
ステップ2:エスカレーション判定ルールを設計する(1週間)
AIが一次受けするすべての問い合わせに対して、人間にパスすべきかどうかを判定するルールを作ります。最低限必要なシグナルは3つです。感情語(「怒っています」「最悪」「二度と使いません」など)を含む場合は即エスカレーション。同じ問題での問い合わせが3回以上繰り返されているケースも自動で人間に回します。そして複数の問題が混在していて問い合わせ文が長くなっている場合も、AIには渡しません。
このルールはスプレッドシートで先に設計して、実装前にCS担当者にレビューしてもらうことをすすめます。現場でしか気づけないエスカレーションパターンが必ずあります。
ステップ3:AIエージェントを構築してCS基盤に組み込む(2〜4週間)
Anthropic Claude APIかOpenAI APIを使ってAIエージェントを実装します。プロンプトには「対応可能な問い合わせカテゴリ一覧」「エスカレーション判定条件」「返答トーンのガイドライン」を含めます。ZendeskかIntercomのWebhookと連携して、チケット作成時にAIが応答草案を生成——自動送信か担当者確認かを切り替えられる構造にします。
最初の2週間は「自動送信なし」でスタートして、AIの返答品質を人間がレビューする形にしてください。品質を確認してから段階的に自動化の範囲を広げます。いきなり自動化すると問題発生時の原因特定が難しくなります。
ステップ4:モニタリング指標を設計して計測を始める(設計1週間、継続)
何を測るかを先に決めておかないと、AI導入の成果が見えなくなります。最低限追うべき指標は3つ:CSAT(顧客満足度スコア)、解決1件あたりのCS費用、再問い合わせ率(同じ問題での翌週以内の再接触)。PostHogかDatadogにダッシュボードを作り、AI対応と人間対応のチケットを分けて集計できるようにします。
この比較データがないと「AIが本当に機能しているか」が主観の議論になります。数字で見えることで、次のステップの判断が正確にできます。
ステップ5:AI担当範囲を月次で見直して動的に調整する(継続)
最初に設定した自動化対象のカテゴリは、そのまま固定してはいけません。CSATが下がったカテゴリはAI担当から外す。人間が対応しているカテゴリで「これはAIで十分」と判断できるものは自動化に追加する。月次でこのレビューを行うことで、稼働しながら精度が上がるCSが作れます。
レビュー会議は30分で十分です。ダッシュボードの数字を見ながらカテゴリの移動を判断するだけなので、特別な技術スキルは不要です。
ツールの選び方:3段階で考える
メイン構成は「Anthropic Claude API + Zendesk」です。Claude APIは指示追従性が高く、日本語のトーン調整がしやすいため顧客対応向きです。Zendeskはエスカレーションルーティングとチケット管理機能が成熟していて、APIも充実しています。
代替構成として「OpenAI API + IntercomまたはFreshdesk」も機能します。IntercomはSaaSプロダクトでの採用が多く、チャットUIとの統合がスムーズです。Freshdeskは中小企業向けのコストパフォーマンスが良い。
まず概念実証をしたい場合は「Intercom Fin」が最短経路です。Intercomに組み込まれたAIエージェントで、既存チケットにそのまま適用できます。カスタマイズ性は限られますが、試してみる段階には十分です。
向いてる組織・向いてない組織
月間問い合わせが300件以上あって、かつ問い合わせ内容が繰り返しパターンを持っているなら機能します。ECサイト、SaaS、フィンテックアプリはほぼ当てはまります。件数が多いほど自動化によるコスト削減効果が大きくなります。
向いていないのは、問い合わせのほぼ全件が個別判断を要するサービスです。高額の受注生産品、医療・法律相談、複雑なB2B契約交渉——こうした領域にAI一次対応を入れると、最初の返答がズレて顧客の信頼を失いかねません。コスト削減以上の損失になります。
CS担当が1〜2人でまだ件数が少ない段階も、実装コストに見合いません。月300件未満なら、まずデータを蓄積することを優先してください。
最初の一週間でやること
過去チケット500件をCSVでエクスポートして、スプレッドシートに貼り付ける。それだけです。カテゴリ分類もエスカレーション判定ルールも、そのデータがあれば誰でも始められます。ツール選定や実装はその後でいい。データを眺めると「これはAIで全然いける」という問い合わせの塊が必ず見つかります。それを確認してから動き始めると、最初の成功体験が作りやすくなります。
AI編集部コメント
ハイブリッドCS設計で一番重要なのは「どこを自動化するか」ではなく「何をエスカレーションするか」の設計です。AIに任せない領域を先に決めることが、品質を守りながらコストを下げる鍵になります。ステップ2を最初にしっかりやっておくと、後から設計し直す手間が大幅に減ります。
Klarnaのリサーチで印象的だったのは、解決速度の変化です。AI対応では平均2分以内での解決が実現していて、従来の約11分から大幅に短縮されています。コスト削減だけでなく顧客体験の向上も同時に起きているという点は、記事に書ききれませんでした。ハイブリッド設計がうまく機能すると「速くなった」と顧客が先に感じます。
過去チケットを分析すると、自社のCSがどれほど繰り返しの問い合わせで占められているかがわかります。そこに気づくと、実装のモチベーションが変わります。